标签筛选

日期筛选

日

一

二

三

四

五

六

28

29

30

31

01

02

03

04

05

06 27

07 27

08 21

09 41

10 7

11 5

12 13

13 9

14 3

15 21

16

17 2

18

19 2

20

21 2

22 1

23 2

24 1

25

26 2

27 1

28 1

29 2

30 3

31

01

02

03

04

05

06

07

1月

193 条

2月

0 条

3月

0 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

1月 14日

3 条新闻

15:35

新型人工智能模型可通过睡眠数据预测疾病

许多疾病在身体出现明显症状之前会在睡眠状况中有所体现。美国科研人员日前开发出一个人工智能模型，可仅根据一晚上的睡眠情况预测约130种疾病的发病风险，包括心脏病、痴呆症和部分癌症等。该模型名为SleepFM，由美国斯坦福大学研究人员开发，用来自6.5万名参与者、总时长近60万小时的多导睡眠图数据进行了训练，整合不同的生理信号并梳理其中的关系。这是首个使用人工智能分析如此大规模睡眠数据的研究，相关论文发表在英国《自然-医学》杂志上。（新华社）

来源：钛媒体

14:49

刚刚，智谱和华为搞波大的：中国首个国产芯片训练出的SOTA多模态模型！

刚刚，智谱和华为搞波大的：中国首个国产芯片训练出的SOTA多模态模型！

国产芯+国产模型迎来重大突破！智谱与华为联手发布GLM-Image，中国首个全程在国产芯片上完成训练的SOTA多模态模型。该模型在文字渲染和长文本生成方面表现卓越，尤其擅长处理汉字，一举拿下CVTG-2K和LongText-Bench双榜单第一。此外，API调用成本极低，每张图仅需0.1元，为中小企业和开发者提供了高性价比的AI生图方案。

🔗 [开源武器库]：https://github.com/THUDM/GLM-Image
🔗 [战略白皮书]：https://arxiv.org/abs/2601.07845

来源：量子位

14:09

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

英伟达联合多所顶尖大学推出TTT-E2E记忆压缩方案，无需额外缓存即可处理128K上下文，速度提升至全注意力模型的2.7倍。该技术通过实时学习将关键信息压缩进模型权重中，避免了冗余数据存储，且在长文本场景下性能更优。为开发者提供了一种高效处理超长文本的新途径，是构建高性能AI应用的必备利器。

🔗 [开源武器库]：https://github.com/test-time-training/e2e
🔗 [战略白皮书]：https://arxiv.org/abs/2512.23675

来源：量子位

1月 13日

9 条新闻

15:54

DeepSeek开源大模型记忆模块，梁文锋署名新论文，下一代稀疏模型提前剧透

DeepSeek开源大模型记忆模块，梁文锋署名新论文，下一代稀疏模型提前剧透

DeepSeek提出全新范式“条件记忆”，通过Engram模块显著提升大模型推理能力，让27B参数模型在多项基准测试中超越同规模MoE模型。此方法回归查表机制，高效处理静态知识检索，释放更多计算资源用于复杂推理任务。研究发现，当约20%-25%的稀疏参数预算分配给Engram时，模型性能最佳。

🔗 [战略白皮书]：https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源：36氪

15:54

从洗碗工到“AI教母”，她又预言了下一个十年

李飞飞，被誉为‘AI教母’，在2025年底发表万字长文，预言AI的下一个十年将是‘空间智能’时代。她认为，若AI不能理解物体的深度、距离等，就无法真正‘具身’。李飞飞创立的World Labs于2025年末发布了首款商用‘世界模型’Marble。她的自传《我看见的世界》揭示了从计算机图像到具身智能的成长历程，以及为何对空间智能如此笃定。掌握空间智能，将为职场人士提供效率跃迁和防替代的关键优势。

来源：36氪

11:50

“几乎所有大模型，视觉能力都不如3岁小孩”

“几乎所有大模型，视觉能力都不如3岁小孩”

最新研究揭示，多数顶尖多模态大模型的视觉处理能力远逊于3岁儿童。UniPatAI团队发布的BabyVision评测集显示，即使是最强大的Gemini3-Pro-Preview模型，在视觉任务上也仅勉强超过3岁基线。这一发现凸显了现有大模型在精细辨别、视觉追踪等关键领域的系统性缺失，表明未来模型需从根本上重建视觉能力，而非依赖语言推理。

来源：36氪

11:50

英伟达，筑起新高墙

英伟达通过一系列策略性收购，如Groq、Bright Computing及Run:ai等，不仅在硬件层面巩固其地位，更是在系统与集群控制上构筑了难以逾越的壁垒。特别是对Groq的吸纳，标志着英伟达正从单纯追求算力向重视推理效率与系统级优化转变，这直接回应了AI行业日益增长的对延迟敏感应用的需求。此举揭示了英伟达对未来AI生态布局的深远考量——构建一个集训练、推理、网络、软件与生态于一体的全方位防御体系。

来源：36氪

09:29

DeepSeek发布梁文锋署名新论文，开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》（基于可扩展查找的条件记忆：大型语言模型稀疏性的新维度）。该论文为北京大学与DeepSeek共同完成，合著作者署名中出现梁文锋。论文提出条件记忆（conditional memory），通过引入可扩展的查找记忆结构，在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时，DeepSeek开源相关记忆模块Engram。（广角观察）

来源：钛媒体

09:27

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文，提出条件记忆（conditional memory）以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块，实现了 O(1) 时间复杂度的知识检索，显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系，为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]：https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]：https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源：36氪

09:27

Anthropic深夜放出王炸，白领饭碗要被AI砸了？网友：不支持Linux，差评

Anthropic深夜放出王炸，白领饭碗要被AI砸了？网友：不支持Linux，差评

Anthropic 的 Claude Code 超越了编程助手的角色，成为多任务数字同事。基于这一发现，Anthropic 推出了 Cowork，一款面向日常工作的智能协作工具，支持文档整理、报告生成等非编码工作。Cowork 引入了虚拟机隔离和浏览器自动化等功能，旨在提供更安全且高效的用户体验。它不仅标志着从‘对话助手’到‘数字同事’的转变，还强调了用户在实际工作环境中的协同需求。

🔗 [Cowork 研究预览版介绍]：https://claude.com/blog/cowork-research-preview
🔗 [Boris Cherny X 发帖]：https://x.com/bcherny/status/2010809450844831752
🔗 [Reddit 讨论串]：https://www.reddit.com/r/singularity/comments/1qb6qv1/introducing_cowork_claude

来源：36氪

09:26

梁文锋署名新论文，DeepSeek V4架构首曝？直击Transformer致命缺陷

梁文锋署名新论文，DeepSeek V4架构首曝？直击Transformer致命缺陷

DeepSeek联合北大发布新论文，直击Transformer缺乏原生知识查找机制的痛点。通过引入Engram模块，实现了O(1)时间复杂度的知识检索，显著提升了模型在推理、代码及数学任务上的表现。这一创新不仅解决了计算效率问题，还为稀疏化LLM提供了新的方向。研究发现MoE与Engram之间存在U形scaling law，表明两者间需找到最优资源配比以实现性能最大化。

🔗 [认知原点]：https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源：36氪

04:48

Anthropic宣布推出医疗版Claude，继OpenAI发布ChatGPT健康版之后

Anthropic宣布推出医疗版Claude，继OpenAI发布ChatGPT健康版之后

Anthropic紧随OpenAI的步伐，推出Claude for Healthcare，专为医疗提供者、支付方及患者设计。相较于ChatGPT Health侧重于患者端聊天体验，Claude通过连接至CMS数据库等关键资源，显著加速了研究过程与报告生成，尤其在预授权审查方面展现优势。这不仅解放了医生的时间，让他们能更专注于诊疗，同时也为医疗机构提供了前所未有的效率提升。

🔗 [TechCrunch报道原文]：https://techcrunch.com/2026/01/12/anthropic-announces-claude-for-healthcare-following-openais-chatgpt-health-reveal/

来源：TechCrunch AI

1月 12日

8 条新闻

17:20

中国高校屠榜2026 CSRankings，上交清华并列第一，北大AI封神

中国高校屠榜2026 CSRankings，上交清华并列第一，北大AI封神

中国高校在2026 CSRankings全球计算机科学排名中大放异彩，清华与上交并列第一，北大AI领域独占鳌头。中国高校不仅在总榜上占据七席，在AI领域更是包揽前八名，展现出强大的科研实力和国际竞争力。这标志着中国计算机科学教育和研究进入新时代，对于追求学术卓越的职场人来说，是不可错过的趋势信号。

🔗 [CSRankings开源武器库]：https://github.com/emeryberger/CSrankings
🔗 [全球CSRankings战略白皮书]：https://csrankings.org/#/fromyear/2025/toyear/2026/index?all&world

来源：36氪

17:20

时薪千元挖大厂前员工教会AI后一脚踹开，“多少数据公司正在把高级牛马当饲料榨干”

时薪千元挖大厂前员工教会AI后一脚踹开，“多少数据公司正在把高级牛马当饲料榨干”

高薪AI数据标注工作背后隐藏着对个人经验和知识的‘一次性买断’。看似光鲜的时薪，实则是在榨取打工人的职业生涯精华。一旦经验耗尽，便被无情抛弃。这种现象揭示了AI发展中的伦理困境：打工人正成为AI成长的‘饲料’。面对这一现实，如何在提升效率的同时保护自身利益，成为职场人亟需思考的问题。

来源：36氪

17:20

2025 AI 年度复盘：读完200篇论文，看DeepMind、Meta、DeepSeek ，中美巨头都在描述哪种AGI叙事

2025 AI 年度复盘：读完200篇论文，看DeepMind、Meta、DeepSeek ，中美巨头都在描述哪种AGI叙事

2025年，AI技术从’暴力美学’转向基础研究，重点突破流体推理、长期记忆、空间智能及元学习四大领域。Test-Time Compute引领AI学会慢思考；Titans架构与Nested Learning打破Transformer无状态假设，增强模型记忆能力；视频生成迈向物理规律理解。强化学习在工程优化中取得显著进展，但其性能提升存在天花板。这些革新正逐步解决AGI瓶颈，推动AI向更聪明而非更大规模发展。

来源：36氪

17:19

2026大模型伦理深度观察：理解AI、信任AI、与AI共处

2025年，AI大模型技术突飞猛进，但其内部运作机制仍如同‘黑箱’。可解释性和透明度成为确保AI安全、可靠的关键。最新研究如电路追踪和模型内省揭示了AI决策路径，但也发现思维链监控存在不忠实问题。模型规范作为新探索，增强了AI行为的公开透明性。尽管面临多重挑战，可解释性领域正吸引大量资本与政策支持。

来源：36氪

16:17

复盘CES2026，要抓住几个核心趋势

复盘CES2026，要抓住几个核心趋势

CES2026揭示了AI硬件创新的四大趋势：实用性与垂直细分、物理AI崛起、第二大脑设备竞争加剧、以及AI驱动的连接技术。英伟达推出Rubin架构和Alpamayo系列开源模型，推动自动驾驶等应用落地。智能眼镜、AI宠物、录音设备等产品纷纷亮相，展现出AI融入日常生活的潜力。同时，Matter协议成为实现设备间无缝连接的关键。

🔗 [英伟达开源武器库]：https://github.com/nvidia/Alpamayo
🔗 [Matter战略白皮书]：https://csa-iot.org/matter/

来源：36氪

14:13

大模型能干的事很多，智能体赚钱的其实不多

大模型能干的事很多，智能体赚钱的其实不多

大模型普遍亏损，智能体赚钱者寥寥。关键在于精度与成本两堵墙：无状态模型难以在高精度需求场景落地；而高昂的模型及流量成本使得多数尝试难以为继。真正盈利的如Midjourney，依靠自然流量和低成本运营成为例外。未来，构建以智能体为主导的无人公司将是突破之道。

来源：36氪

13:11

谷歌联合沃尔玛等零售商扩展AI模型购物功能

美国谷歌公司1月11日表示，将与沃尔玛公司等大型零售商合作，扩展其“双子座”人工智能（AI）模型的购物功能，推动双子座应用从“智能助手”升级为可直接完成交易的“虚拟商家”。据介绍，双子座应用将引入“即时结账”功能，消费者在聊天界面内即可从部分商家完成商品购买，无需打开该应用以外的界面。（新华社）

来源：钛媒体

13:11

AI重构自动驾驶：Motional重启Robotaxi，赌上2026拉斯维加斯终局

AI重构自动驾驶：Motional重启Robotaxi，赌上2026拉斯维加斯终局

自动驾驶行业正经历从‘规则驱动’到‘AI驱动’的转型，Motional通过重构技术底座，采用端到端AI架构应对挑战。这不仅是一次企业战略转向，更是全球L4级自动驾驶路线的集体升级尝试。2026年拉斯维加斯将成为其全无人商业服务的试金石，成败在此一举。掌握AI核心能力、实现技术与商业平衡者，方能笑到最后。

来源：36氪

« 上一页
1
2
3
4
5
…
10
下一页 »