AI新闻

已选标签:
1月 14日
3 条新闻
15:35

新型人工智能模型可通过睡眠数据预测疾病

许多疾病在身体出现明显症状之前会在睡眠状况中有所体现。美国科研人员日前开发出一个人工智能模型,可仅根据一晚上的睡眠情况预测约130种疾病的发病风险,包括心脏病、痴呆症和部分癌症等。该模型名为SleepFM,由美国斯坦福大学研究人员开发,用来自6.5万名参与者、总时长近60万小时的多导睡眠图数据进行了训练,整合不同的生理信号并梳理其中的关系。这是首个使用人工智能分析如此大规模睡眠数据的研究,相关论文发表在英国《自然-医学》杂志上。(新华社)

来源:钛媒体

14:49

刚刚,智谱和华为搞波大的:中国首个国产芯片训练出的SOTA多模态模型!

刚刚,智谱和华为搞波大的:中国首个国产芯片训练出的SOTA多模态模型!

国产芯+国产模型迎来重大突破!智谱与华为联手发布GLM-Image,中国首个全程在国产芯片上完成训练的SOTA多模态模型。该模型在文字渲染和长文本生成方面表现卓越,尤其擅长处理汉字,一举拿下CVTG-2K和LongText-Bench双榜单第一。此外,API调用成本极低,每张图仅需0.1元,为中小企业和开发者提供了高性价比的AI生图方案。

🔗 [开源武器库]:https://github.com/THUDM/GLM-Image
🔗 [战略白皮书]:https://arxiv.org/abs/2601.07845

来源:量子位

14:09

不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍

不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍

英伟达联合多所顶尖大学推出TTT-E2E记忆压缩方案,无需额外缓存即可处理128K上下文,速度提升至全注意力模型的2.7倍。该技术通过实时学习将关键信息压缩进模型权重中,避免了冗余数据存储,且在长文本场景下性能更优。为开发者提供了一种高效处理超长文本的新途径,是构建高性能AI应用的必备利器。

🔗 [开源武器库]:https://github.com/test-time-training/e2e
🔗 [战略白皮书]:https://arxiv.org/abs/2512.23675

来源:量子位

1月 13日
9 条新闻
15:54

DeepSeek开源大模型记忆模块,梁文锋署名新论文,下一代稀疏模型提前剧透

DeepSeek开源大模型记忆模块,梁文锋署名新论文,下一代稀疏模型提前剧透

DeepSeek提出全新范式“条件记忆”,通过Engram模块显著提升大模型推理能力,让27B参数模型在多项基准测试中超越同规模MoE模型。此方法回归查表机制,高效处理静态知识检索,释放更多计算资源用于复杂推理任务。研究发现,当约20%-25%的稀疏参数预算分配给Engram时,模型性能最佳。

🔗 [战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

15:54

从洗碗工到“AI教母”,她又预言了下一个十年

李飞飞,被誉为‘AI教母’,在2025年底发表万字长文,预言AI的下一个十年将是‘空间智能’时代。她认为,若AI不能理解物体的深度、距离等,就无法真正‘具身’。李飞飞创立的World Labs于2025年末发布了首款商用‘世界模型’Marble。她的自传《我看见的世界》揭示了从计算机图像到具身智能的成长历程,以及为何对空间智能如此笃定。掌握空间智能,将为职场人士提供效率跃迁和防替代的关键优势。

来源:36氪

11:50

“几乎所有大模型,视觉能力都不如3岁小孩”

“几乎所有大模型,视觉能力都不如3岁小孩”

最新研究揭示,多数顶尖多模态大模型的视觉处理能力远逊于3岁儿童。UniPatAI团队发布的BabyVision评测集显示,即使是最强大的Gemini3-Pro-Preview模型,在视觉任务上也仅勉强超过3岁基线。这一发现凸显了现有大模型在精细辨别、视觉追踪等关键领域的系统性缺失,表明未来模型需从根本上重建视觉能力,而非依赖语言推理。

来源:36氪

11:50

英伟达,筑起新高墙

英伟达通过一系列策略性收购,如Groq、Bright Computing及Run:ai等,不仅在硬件层面巩固其地位,更是在系统与集群控制上构筑了难以逾越的壁垒。特别是对Groq的吸纳,标志着英伟达正从单纯追求算力向重视推理效率与系统级优化转变,这直接回应了AI行业日益增长的对延迟敏感应用的需求。此举揭示了英伟达对未来AI生态布局的深远考量——构建一个集训练、推理、网络、软件与生态于一体的全方位防御体系。

来源:36氪

09:29

DeepSeek发布梁文锋署名新论文,开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时,DeepSeek开源相关记忆模块Engram。(广角观察)

来源:钛媒体

09:27

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文,提出条件记忆(conditional memory)以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块,实现了 O(1) 时间复杂度的知识检索,显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系,为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]:https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

09:27

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic 的 Claude Code 超越了编程助手的角色,成为多任务数字同事。基于这一发现,Anthropic 推出了 Cowork,一款面向日常工作的智能协作工具,支持文档整理、报告生成等非编码工作。Cowork 引入了虚拟机隔离和浏览器自动化等功能,旨在提供更安全且高效的用户体验。它不仅标志着从‘对话助手’到‘数字同事’的转变,还强调了用户在实际工作环境中的协同需求。

🔗 [Cowork 研究预览版介绍]:https://claude.com/blog/cowork-research-preview
🔗 [Boris Cherny X 发帖]:https://x.com/bcherny/status/2010809450844831752
🔗 [Reddit 讨论串]:https://www.reddit.com/r/singularity/comments/1qb6qv1/introducing_cowork_claude

来源:36氪

09:26

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

DeepSeek联合北大发布新论文,直击Transformer缺乏原生知识查找机制的痛点。通过引入Engram模块,实现了O(1)时间复杂度的知识检索,显著提升了模型在推理、代码及数学任务上的表现。这一创新不仅解决了计算效率问题,还为稀疏化LLM提供了新的方向。研究发现MoE与Engram之间存在U形scaling law,表明两者间需找到最优资源配比以实现性能最大化。

🔗 [认知原点]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

04:48

Anthropic宣布推出医疗版Claude,继OpenAI发布ChatGPT健康版之后

Anthropic宣布推出医疗版Claude,继OpenAI发布ChatGPT健康版之后

Anthropic紧随OpenAI的步伐,推出Claude for Healthcare,专为医疗提供者、支付方及患者设计。相较于ChatGPT Health侧重于患者端聊天体验,Claude通过连接至CMS数据库等关键资源,显著加速了研究过程与报告生成,尤其在预授权审查方面展现优势。这不仅解放了医生的时间,让他们能更专注于诊疗,同时也为医疗机构提供了前所未有的效率提升。

🔗 [TechCrunch报道原文]:https://techcrunch.com/2026/01/12/anthropic-announces-claude-for-healthcare-following-openais-chatgpt-health-reveal/

来源:TechCrunch AI

1月 12日
8 条新闻
17:20

中国高校屠榜2026 CSRankings,上交清华并列第一,北大AI封神

中国高校屠榜2026 CSRankings,上交清华并列第一,北大AI封神

中国高校在2026 CSRankings全球计算机科学排名中大放异彩,清华与上交并列第一,北大AI领域独占鳌头。中国高校不仅在总榜上占据七席,在AI领域更是包揽前八名,展现出强大的科研实力和国际竞争力。这标志着中国计算机科学教育和研究进入新时代,对于追求学术卓越的职场人来说,是不可错过的趋势信号。

🔗 [CSRankings开源武器库]:https://github.com/emeryberger/CSrankings
🔗 [全球CSRankings战略白皮书]:https://csrankings.org/#/fromyear/2025/toyear/2026/index?all&world

来源:36氪

17:20

时薪千元挖大厂前员工教会AI后一脚踹开,“多少数据公司正在把高级牛马当饲料榨干”

时薪千元挖大厂前员工教会AI后一脚踹开,“多少数据公司正在把高级牛马当饲料榨干”

高薪AI数据标注工作背后隐藏着对个人经验和知识的‘一次性买断’。看似光鲜的时薪,实则是在榨取打工人的职业生涯精华。一旦经验耗尽,便被无情抛弃。这种现象揭示了AI发展中的伦理困境:打工人正成为AI成长的‘饲料’。面对这一现实,如何在提升效率的同时保护自身利益,成为职场人亟需思考的问题。

来源:36氪

17:20

2025 AI 年度复盘:读完200篇论文,看DeepMind、Meta、DeepSeek ,中美巨头都在描述哪种AGI叙事

2025 AI 年度复盘:读完200篇论文,看DeepMind、Meta、DeepSeek ,中美巨头都在描述哪种AGI叙事

2025年,AI技术从’暴力美学’转向基础研究,重点突破流体推理、长期记忆、空间智能及元学习四大领域。Test-Time Compute引领AI学会慢思考;Titans架构与Nested Learning打破Transformer无状态假设,增强模型记忆能力;视频生成迈向物理规律理解。强化学习在工程优化中取得显著进展,但其性能提升存在天花板。这些革新正逐步解决AGI瓶颈,推动AI向更聪明而非更大规模发展。

来源:36氪

17:19

2026大模型伦理深度观察:理解AI、信任AI、与AI共处

2025年,AI大模型技术突飞猛进,但其内部运作机制仍如同‘黑箱’。可解释性和透明度成为确保AI安全、可靠的关键。最新研究如电路追踪和模型内省揭示了AI决策路径,但也发现思维链监控存在不忠实问题。模型规范作为新探索,增强了AI行为的公开透明性。尽管面临多重挑战,可解释性领域正吸引大量资本与政策支持。

来源:36氪

16:17

复盘CES2026,要抓住几个核心趋势

复盘CES2026,要抓住几个核心趋势

CES2026揭示了AI硬件创新的四大趋势:实用性与垂直细分、物理AI崛起、第二大脑设备竞争加剧、以及AI驱动的连接技术。英伟达推出Rubin架构和Alpamayo系列开源模型,推动自动驾驶等应用落地。智能眼镜、AI宠物、录音设备等产品纷纷亮相,展现出AI融入日常生活的潜力。同时,Matter协议成为实现设备间无缝连接的关键。

🔗 [英伟达开源武器库]:https://github.com/nvidia/Alpamayo
🔗 [Matter战略白皮书]:https://csa-iot.org/matter/

来源:36氪

13:11

谷歌联合沃尔玛等零售商扩展AI模型购物功能

美国谷歌公司1月11日表示,将与沃尔玛公司等大型零售商合作,扩展其“双子座”人工智能(AI)模型的购物功能,推动双子座应用从“智能助手”升级为可直接完成交易的“虚拟商家”。据介绍,双子座应用将引入“即时结账”功能,消费者在聊天界面内即可从部分商家完成商品购买,无需打开该应用以外的界面。(新华社)

来源:钛媒体

13:11

AI重构自动驾驶:Motional重启Robotaxi,赌上2026拉斯维加斯终局

AI重构自动驾驶:Motional重启Robotaxi,赌上2026拉斯维加斯终局

自动驾驶行业正经历从‘规则驱动’到‘AI驱动’的转型,Motional通过重构技术底座,采用端到端AI架构应对挑战。这不仅是一次企业战略转向,更是全球L4级自动驾驶路线的集体升级尝试。2026年拉斯维加斯将成为其全无人商业服务的试金石,成败在此一举。掌握AI核心能力、实现技术与商业平衡者,方能笑到最后。

来源:36氪