AI新闻

11:50

“几乎所有大模型，视觉能力都不如3岁小孩”

最新研究揭示，多数顶尖多模态大模型的视觉处理能力远逊于3岁儿童。UniPatAI团队发布的BabyVision评测集显示，即使是最强大的Gemini3-Pro-Preview模型，在视觉任务上也仅勉强超过3岁基线。这一发现凸显了现有大模型在精细辨别、视觉追踪等关键领域的系统性缺失，表明未来模型需从根本上重建视觉能力，而非依赖语言推理。

来源：36氪

11:50

AI for Science：中国AI大爆发的底层密码

AI for Science正悄然重塑中国科技发展逻辑，推动科研从试错驱动转向数据+模型驱动。中国企业已在新材料、生物医药、芯片三大硬核产业扎根AI4S，破解基础研究效率瓶颈。如方大炭素与晶泰科技合作，将新材料研发周期缩短至3-6个月；美迪西重构AI药物发现全链条，降低新药研发成本；道氏技术布局原子级科学计算芯片，填补国内空白。AI4S为中国科技突破‘卡脖子’困境提供了前所未有的机遇。

来源：36氪

09:29

OpenAI以1亿美元收购人工智能医疗健康应用程序Torch

OpenAI已同意以约1亿美元的股权对价，收购成立仅一年的人工智能医疗健康应用程序公司Torch。Torch这款应用能够帮助用户查看并分析来自不同渠道的健康数据，包括凯撒医疗集团等医疗体系、普雷努沃等医学影像公司，以及苹果健康等运动监测类应用。收购这家初创公司，或将助力OpenAI自身的研发计划，即在智能聊天机器人ChatGPT中推出个性化健康助手功能。Torch方面表示，其产品部分依托OpenAI的人工智能模型，基于用户数据生成个性化医疗建议。目前尚不清楚这款聊天机器人形态的应用拥有多少用户，该应用现阶段仅对特定私密用户群体开放。(第一财经)

来源：钛媒体

09:29

DeepSeek发布梁文锋署名新论文，开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》（基于可扩展查找的条件记忆：大型语言模型稀疏性的新维度）。该论文为北京大学与DeepSeek共同完成，合著作者署名中出现梁文锋。论文提出条件记忆（conditional memory），通过引入可扩展的查找记忆结构，在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时，DeepSeek开源相关记忆模块Engram。（广角观察）

来源：钛媒体

09:28

为什么90%的AI产品都会失败？来自OpenAI和Google的50+项目血泪教训

来源：36氪

09:27

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文，提出条件记忆（conditional memory）以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块，实现了 O(1) 时间复杂度的知识检索，显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系，为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]：https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]：https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源：36氪

09:27

企业 Agent 为何多半是玩具？差的不是模型，是品味

Replit CEO Amjad Masad 指出，当前AI Agent看似全能却低效，真正的突破在于建立以‘品味’为核心的工程标准。这不仅包括预设业务框架、限定可信数据范围，还涉及闭环验证流程。Replit通过制定规则、限定答案范围和增加资源投入，确保生成内容的可靠性。最终，AI的竞争将从模型能力转向严谨的工程交付力。

来源：36氪