DeepSeek发布新项目Engram,提升模型上下文记忆能力
DeepSeek最近发布了一个名为Engram的新项目,旨在提升大型语言模型的上下文记忆能力。Engram通过可扩展的查找机制实现条件记忆,为大型语言模型引入了新的稀疏性维度。这个项目在GitHub上拥有自己的页面,用户可以通过以下链接访问以获取更多信息:Engram GitHub页面。此外,关于这个项目的讨论也可以在的论坛中找到,讨论主题名为“Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”,你可以通过这个链接。该项目似乎得到了一定的关注,目前已有14个帖子,11位参与者。该项目还附有相关的图片,展示了其工作原理和效果。
评论已关闭