AI新闻

已选标签:
1月 13日
20 条新闻
15:54

Anthropic筑墙,DeepSeek修路

Anthropic筑墙,DeepSeek修路

Anthropic突然封禁了大量第三方工具对Claude的访问权限,背后是其新产品Cowork的战略布局。Cowork不仅支持代码编写,还能处理非编程任务,直接读写本地文件。此次行动旨在打击套壳工具滥用订阅服务的行为,将用户引导至官方API按量付费模式,以保护利润率。此举引发开发者社区不满,但也是Anthropic上市前证明盈利模式可持续性的必要手段。

来源:36氪

15:54

DeepSeek开源大模型记忆模块,梁文锋署名新论文,下一代稀疏模型提前剧透

DeepSeek开源大模型记忆模块,梁文锋署名新论文,下一代稀疏模型提前剧透

DeepSeek提出全新范式“条件记忆”,通过Engram模块显著提升大模型推理能力,让27B参数模型在多项基准测试中超越同规模MoE模型。此方法回归查表机制,高效处理静态知识检索,释放更多计算资源用于复杂推理任务。研究发现,当约20%-25%的稀疏参数预算分配给Engram时,模型性能最佳。

🔗 [战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

15:54

大模型独角兽:从持续亏损到市值千亿,押注未来逻辑何在?

大模型独角兽:从持续亏损到市值千亿,押注未来逻辑何在?

AI大模型时代,OpenAI及国内‘六小虎’如智谱AI、MiniMax等正引领新一轮产业智能化浪潮。尽管营收增长迅猛,但巨额亏损与高市值形成鲜明对比,揭示了技术落地与变现的紧迫性。资本追逐背后,如何避免重蹈‘AI四小龙’覆辙,成为当前大模型企业亟待解决的问题。

来源:36氪

15:54

从洗碗工到“AI教母”,她又预言了下一个十年

李飞飞,被誉为‘AI教母’,在2025年底发表万字长文,预言AI的下一个十年将是‘空间智能’时代。她认为,若AI不能理解物体的深度、距离等,就无法真正‘具身’。李飞飞创立的World Labs于2025年末发布了首款商用‘世界模型’Marble。她的自传《我看见的世界》揭示了从计算机图像到具身智能的成长历程,以及为何对空间智能如此笃定。掌握空间智能,将为职场人士提供效率跃迁和防替代的关键优势。

来源:36氪

11:51

钉钉前副总裁AI项目K2 Lab获数千万投资,云时资本独家投资

阿里钉钉前副总裁王铭创立的攀峰智能(K2 Lab)宣布完成数千万元的种子轮融资,由云时资本独家投资。本轮融资资金将主要用于产品和AI能力打造、用户增长和AI Native团队的加速构建,快速推进全球首个面向超级个体的内容电商Agent基建。据悉,K2 Lab的首款产品Moras是全球首个全自动帮达人赚钱的商业Agentic AI,通过“洞察-创作-分析”,实现内容电商、行业洞察到选品推荐、脚本生成等端到端自动化闭环。(创投家CLUB)

来源:钛媒体

11:50

让AI成为你的最强助手,该怎么做?

AI不再只是搜索引擎,而是提升工作效率、支持决策的利器。亚历山德拉·塞缪尔建议通过训练AI助手来定制专属工具,不仅能够简化项目管理,还能提供战略建议。她强调了如何有效与AI沟通以避免常见误区,并指出即使是水管工也能从中受益。对于初学者,从日常对话中提炼出有效的互动方式是启动个性化AI助手的好方法。

来源:36氪

11:50

“几乎所有大模型,视觉能力都不如3岁小孩”

“几乎所有大模型,视觉能力都不如3岁小孩”

最新研究揭示,多数顶尖多模态大模型的视觉处理能力远逊于3岁儿童。UniPatAI团队发布的BabyVision评测集显示,即使是最强大的Gemini3-Pro-Preview模型,在视觉任务上也仅勉强超过3岁基线。这一发现凸显了现有大模型在精细辨别、视觉追踪等关键领域的系统性缺失,表明未来模型需从根本上重建视觉能力,而非依赖语言推理。

来源:36氪

11:50

英伟达,筑起新高墙

英伟达通过一系列策略性收购,如Groq、Bright Computing及Run:ai等,不仅在硬件层面巩固其地位,更是在系统与集群控制上构筑了难以逾越的壁垒。特别是对Groq的吸纳,标志着英伟达正从单纯追求算力向重视推理效率与系统级优化转变,这直接回应了AI行业日益增长的对延迟敏感应用的需求。此举揭示了英伟达对未来AI生态布局的深远考量——构建一个集训练、推理、网络、软件与生态于一体的全方位防御体系。

来源:36氪

11:50

AI for Science:中国AI大爆发的底层密码

AI for Science:中国AI大爆发的底层密码

AI for Science正悄然重塑中国科技发展逻辑,推动科研从试错驱动转向数据+模型驱动。中国企业已在新材料、生物医药、芯片三大硬核产业扎根AI4S,破解基础研究效率瓶颈。如方大炭素与晶泰科技合作,将新材料研发周期缩短至3-6个月;美迪西重构AI药物发现全链条,降低新药研发成本;道氏技术布局原子级科学计算芯片,填补国内空白。AI4S为中国科技突破‘卡脖子’困境提供了前所未有的机遇。

来源:36氪

09:29

OpenAI以1亿美元收购人工智能医疗健康应用程序Torch

OpenAI已同意以约1亿美元的股权对价,收购成立仅一年的人工智能医疗健康应用程序公司Torch。Torch这款应用能够帮助用户查看并分析来自不同渠道的健康数据,包括凯撒医疗集团等医疗体系、普雷努沃等医学影像公司,以及苹果健康等运动监测类应用。收购这家初创公司,或将助力OpenAI自身的研发计划,即在智能聊天机器人ChatGPT中推出个性化健康助手功能。Torch方面表示,其产品部分依托OpenAI的人工智能模型,基于用户数据生成个性化医疗建议。目前尚不清楚这款聊天机器人形态的应用拥有多少用户,该应用现阶段仅对特定私密用户群体开放。(第一财经)

来源:钛媒体

09:29

DeepSeek发布梁文锋署名新论文,开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时,DeepSeek开源相关记忆模块Engram。(广角观察)

来源:钛媒体

09:27

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文,提出条件记忆(conditional memory)以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块,实现了 O(1) 时间复杂度的知识检索,显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系,为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]:https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

09:27

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic 的 Claude Code 超越了编程助手的角色,成为多任务数字同事。基于这一发现,Anthropic 推出了 Cowork,一款面向日常工作的智能协作工具,支持文档整理、报告生成等非编码工作。Cowork 引入了虚拟机隔离和浏览器自动化等功能,旨在提供更安全且高效的用户体验。它不仅标志着从‘对话助手’到‘数字同事’的转变,还强调了用户在实际工作环境中的协同需求。

🔗 [Cowork 研究预览版介绍]:https://claude.com/blog/cowork-research-preview
🔗 [Boris Cherny X 发帖]:https://x.com/bcherny/status/2010809450844831752
🔗 [Reddit 讨论串]:https://www.reddit.com/r/singularity/comments/1qb6qv1/introducing_cowork_claude

来源:36氪

09:27

企业 Agent 为何多半是玩具?差的不是模型,是品味

Replit CEO Amjad Masad 指出,当前AI Agent看似全能却低效,真正的突破在于建立以‘品味’为核心的工程标准。这不仅包括预设业务框架、限定可信数据范围,还涉及闭环验证流程。Replit通过制定规则、限定答案范围和增加资源投入,确保生成内容的可靠性。最终,AI的竞争将从模型能力转向严谨的工程交付力。

来源:36氪

09:27

云厂商的AI决战

云厂商的AI决战

AI云的竞争已从单一的算力供给,升级为涵盖训练、推理、部署等全生命周期的AI Infra较量。忽视多维度竞争要素,仅关注Token使用量将导致战略短视。头部云厂商正通过自研芯片与模型、优化Infra来构建核心竞争力,形成难以逾越的技术壁垒。这不仅关乎成本控制,更是决定未来市场格局的关键。

来源:36氪

09:26

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

DeepSeek联合北大发布新论文,直击Transformer缺乏原生知识查找机制的痛点。通过引入Engram模块,实现了O(1)时间复杂度的知识检索,显著提升了模型在推理、代码及数学任务上的表现。这一创新不仅解决了计算效率问题,还为稀疏化LLM提供了新的方向。研究发现MoE与Engram之间存在U形scaling law,表明两者间需找到最优资源配比以实现性能最大化。

🔗 [认知原点]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

08:21

字节AI出海进入新阶段

字节AI出海进入新阶段

字节跳动正加速布局海外AI市场,2025年末其C端与B端产品如Dola、AnyGen等在东南亚、南美等地取得显著进展。特别是AnyGen,作为对标Manus的工作场景Agent,强调专业任务执行能力及生成内容的复用性,采用强付费模式。此举不仅提升了字节在全球AI市场的竞争力,还标志着从输出快乐到出售效率的战略转型。

来源:36氪

08:00

亲身体验Bee:亚马逊最新的人工智能可穿戴设备

亲身体验Bee:亚马逊最新的人工智能可穿戴设备

Amazon新推AI可穿戴设备Bee,一键录音转录,智能分段摘要,助你轻松回顾日常对话。不同于专业转录工具,Bee旨在成为生活助手,通过与Google服务集成,将对话关联至具体任务。尽管存在隐私顾虑,但其便捷性及未来潜力不容小觑。对于追求高效生活的职场人士来说,这可能是一个值得尝试的防替代利器。

来源:TechCrunch AI