DeepSeek开源大模型记忆模块，梁文锋署名新论文，下一代稀疏模型提前剧透

• 2026年1月13日下午3:54 • • 阅读 0

DeepSeek提出全新范式“条件记忆”，通过Engram模块显著提升大模型推理能力，让27B参数模型在多项基准测试中超越同规模MoE模型。此方法回归查表机制，高效处理静态知识检索，释放更多计算资源用于复杂推理任务。研究发现，当约20%-25%的稀疏参数预算分配给Engram时，模型性能最佳。

🔗 [战略白皮书]：https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源：36氪

主题测试文章，只做测试使用。发布者：，转转请注明出处：https://uxwork.cn/archives/ai-news/deepseek%e5%bc%80%e6%ba%90%e5%a4%a7%e6%a8%a1%e5%9e%8b%e8%ae%b0%e5%bf%86%e6%a8%a1%e5%9d%97%ef%bc%8c%e6%a2%81%e6%96%87%e9%94%8b%e7%bd%b2%e5%90%8d%e6%96%b0%e8%ae%ba%e6%96%87%ef%bc%8c%e4%b8%8b%e4%b8%80