AI新闻 | goodux 好体验

1月 30日

3 条新闻

15:44

英伟达支持的Perplexity据悉与微软签署价值7.5亿美元协议

相关报道援引知情人士称，人工智能初创公司Perplexity已与微软签署了一项价值7.5亿美元的协议，将使用其Azure云服务。据悉，这项为期三年的协议将允许英伟达支持的Perplexity通过微软的Foundry计划运行一系列AI模型，包括来自OpenAI、Anthropic和xAI的系统。Perplexity的一位发言人证实，该公司正与微软合作，“以获取来自X、OpenAI和Anthropic的前沿模型”。该发言人表示，作为与微软合作的一部分，Perplexity并未将支出从其主要云服务提供商亚马逊网络服务（AWS）转移到微软。（广角观察）

来源：钛媒体

15:44

商汤开源多模态自主推理模型SenseNova-MARS

商汤正式开源多模态自主推理模型SenseNova-MARS（8B/32B双版本）。据商汤介绍，该模型是首个支持动态视觉推理和图文搜索深度融合的Agentic VLM模型。（广角观察）

来源：钛媒体

15:44

蚂蚁灵波开源具身世界模型LingBot-VA

蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。据介绍，该模型首次提出自回归视频-动作世界建模框架，将大规模视频生成模型的能力与机器人控制融合，模型在生成“下一步世界状态”的同时，直接推演并输出对应的动作序列，使机器人能够像人一样“边推演、边行动”。（广角观察）

来源：钛媒体

1月 29日

3 条新闻

09:31

世界模型怎么才算“能用”？李飞飞把它做成了 API

李飞飞创立的World Labs推出World API，标志着AI从生成视频内容迈向构建可交互三维空间。该API利用多模态输入技术，将文字或图像转化为具备物理规则与几何结构的数字世界，为机器人训练、游戏开发及虚拟现实提供支持。World API不仅是一个生成工具，更是重新定义了‘世界’的概念，旨在赋予机器真正的空间智能。其核心能力在于多模态输入和语义可编辑性，使任何需要3D环境的应用都能直接调用它来构建场景。

🔗 [效率传送门]：https://www.worldlabs.ai/blog/announcing-the-world-api

来源：36氪

08:21

OpenAI推出面向科学家的免费AI原生工作台Prism

当地时间1月27日，OpenAI宣布推出基于GPT-5.2驱动的免费AI原生工作台Prism，供科学家开展研究写作与协作。Prism支持无限项目与协作者名额，即日起所有拥有ChatGPT个人账户的用户均可使用。Prism即将面向采用ChatGPT商业版、企业版及教育版计划的组织机构开放。（广角观察）

来源：钛媒体

08:21

软银据悉正在洽谈向OpenAI追加至多300亿美元投资

软银据悉正在洽谈向OpenAI追加至多300亿美元投资。OpenAI正在向投资者寻求至多1000亿美元的新资金，如果成功全额筹集，这轮融资对公司的估值可能高达8300亿美元。（广角观察）

来源：钛媒体

1月 28日

3 条新闻

07:18

OpenAI 的最强对手，离「AI Windows」又近了一步

Anthropic 为 Claude 引入 Model Context Protocol (MCP)，实现与 Figma、GitHub 等生产力工具的深度集成。这一更新不仅简化了多工具间的数据搬运，还通过统一标准接口提升了工作效率，标志着 Claude 从被动聊天机器人向主动智能体平台的转变。MCP 的开源特性有望推动更开放的 AI 工具生态，降低开发门槛并提升互操作性。

来源：36氪

07:14

AI马拉松，中美大厂纷纷遇上“撞墙期”？

AI竞赛从技术理想转向商业现实，OpenAI推出广告业务以应对高昂的推理成本，而国内大厂如腾讯、字节跳动和阿里巴巴则在场景应用上展开激烈竞争。腾讯通过春节红包活动吸引用户，字节跳动凭借豆包争夺AI入口，阿里巴巴则通过千问将AI插件化。面对内卷，中国AI企业需在工程优化基础上追求范式创新，实现真正普惠。

来源：36氪

02:57

让 Mac Mini 都涨价的 AI 助手，真有那么强吗？

Clawdbot，一款通过对话操控电脑执行任务的AI助手，在GitHub上已获三万星。它能处理文件整理、编写代码等任务，甚至远程操作你的电脑。然而，其实际体验却存在局限：配置门槛高、对国内常用App支持不佳且存在安全隐患。尽管如此，对于需要批量处理重复性工作的用户来说，Clawdbot仍是一个值得尝试的效率工具。

🔗 [开源武器库]：https://github.com/Clawbot/Clawbot

来源：36氪

1月 27日

2 条新闻

15:27

千问PC和网页端接入Qwen3-Max-Thinking

阿里正式发布旗舰推理模型Qwen3-Max-Thinking，AI助手千问同步在PC端和网页端接入，千问App也即将接入。用户只需在模型选择栏中一键切换，即可体验更为强大的推理能力。据悉，Qwen3-Max-Thinking是目前阿里规模最大、能力最强的推理模型，总参数量超万亿（1T），预训练数据量高达36T Tokens。经过大规模强化学习训练，该模型在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐等19个公认的大模型基准测试中，刷新多项最佳表现纪录，整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5 和 Gemini 3 Pro。（广角观察）

来源：钛媒体

15:27

蚂蚁灵波开源具身智能技术基座方向重要成果LingBot-Depth模型

蚂蚁集团旗下灵波科技1月27日开源高精度空间感知模型LingBot-Depth，这是该公司在2025外滩大会后首次公布具身智能技术基座方向重要成果。该模型基于奥比中光Gemini330系列双目3D相机芯片级原始数据，专注于提升环境深度感知与三维空间理解能力。模型创新采用”掩码深度建模”技术，有效解决透明和反光物体的视觉感知难题。本周蚂蚁灵波将陆续开源多款具身智能方向模型。

在权威基准评测中，LingBot-Depth展现出代际级优势：相比主流模型，室内场景相对误差降低超70%，稀疏SfM任务RMSE误差降低约47%。灵波科技计划开源包含200万组真实世界深度数据的数据资产，并与奥比中光合作推出新一代深度相机。（广角观察）

来源：钛媒体

1月 26日

2 条新闻

14:50

腾讯元宝内测”元宝派”，尝试探索社交AI形态

腾讯旗下AI助手”元宝”正式开启”元宝派”社交AI功能内测。该功能允许用户创建或加入兴趣社群”派”，元宝AI可参与群聊、总结讨论内容，并支持健身、阅读等打卡活动的监督提醒。用户还能通过图片二创功能制作梗图，增强互动趣味性。后续公测将接入腾讯会议音视频能力，支持”一起看””一起听”等多人协作场景。目前”元宝派”已与微信、QQ打通，用户可通过社交平台分享邀请链接。腾讯近期宣布在元宝APP发放10亿现金红包，推进AI新功能布局。（广角观察）

来源：钛媒体

14:50

腾讯混元图像3.0图生图版本正式发布

腾讯混元图像3.0图生图版本（HunyuanImage 3.0-Instruct）正式发布，支持多样化图片编辑与多图融合功能。该模型基于80B参数的混合专家架构，通过指令微调和后训练实现了对用户图像和编辑指令的深度理解。模型采用”先思考后编辑”的工作机制，在收到输入后会分析图像内容并推理编辑步骤，确保输出效果的一致性。目前该功能已同步上线元宝应用和混元官网，用户可体验图片增删改、风格变换、老照片修复等编辑能力。性能上，模型在盲测中表现与国内外SOTA闭源模型基本持平，生成图片具有高真实感和良好情绪表现力。

来源：钛媒体

1月 24日

1 条新闻

11:18

纳德拉懂张一鸣

AI正从魔法变为工业品，纳德拉在达沃斯明确指出，未来的AI竞争在于Token工厂的效率。谁能在单位能耗下产出更多、更优质的Token，谁就能掌握市场定价权。这一观点与张一鸣通过火山引擎降低Token成本的战略不谋而合。随着AI工业化进程加快，任务成功率、推理延迟以及多模态融合效率将成为新的核心指标。

来源：36氪

1月 23日

1 条新闻

11:16

Mobileye势头强劲，2025财年全年营收同比增长15%

Mobileye以强劲势头迈入2026财年，全年营收同比增长15%，达18.94亿美元。公司赢得了美国一家主流主机厂的环绕式ADAS大规模订单，并与大众汽车集团合作推进无人驾驶出租车服务。2025财年经营活动现金流净额增长51%，彰显运营韧性。Mobileye计划通过收购Mentee Robotics拓展至人形机器人领域，成为物理AI领域的全面领导者。

来源：量子位

1月 22日

2 条新闻

11:37

黄仁勋达沃斯对话：五层蛋糕、三大突破、万亿基建重塑AI未来

黄仁勋在世界经济论坛上提出了AI的“五层蛋糕”理论，强调从底层能源到顶层应用的全栈革命将催生大规模基础设施建设。他指出，AI不是取代人类工作，而是通过自动化具体任务增强人类实现工作核心目的的能力。同时，开放模型的崛起和发展中国家利用AI缩小技术鸿沟的机会也得到了深入探讨。

来源：36氪

11:32

报道称苹果计划将Siri打造为AI聊天机器人

Apple计划将Siri转型为类似ChatGPT的聊天机器人，代号‘Campos’，支持语音和文本输入，预计成为iOS 27及WWDC六月展示的核心。面对其他AI助手的成功压力以及OpenAI进军硬件市场的潜在威胁，苹果选择了谷歌Gemini作为其AI合作伙伴，标志着公司在AI竞赛中的策略转变。

来源：TechCrunch AI

1月 21日

1 条新闻

15:19

OpenAI据悉将于2月推出聊天机器人广告服务，按广告展示次数收费

OpenAI据悉将于2月推出聊天机器人广告服务，按广告展示次数收费。（广角观察）

来源：钛媒体

1月 20日

2 条新闻

13:53

OpenAI去年收入超200亿美元，首款硬件设备将于今年下半年推出

OpenAI收入激增，2025年突破200亿美元，算力规模三年内增长9.5倍。公司正从单一算力供应商转向多元化合作，并启动总投资5000亿美元的全球AI算力网络“星门”计划。此外，OpenAI宣布首款硬件设备将于2026年下半年推出，标志着其向软硬一体化转型。这款由前苹果首席设计师主导设计的无屏便携AI终端，旨在重新定义人机交互方式。

来源：36氪

13:01

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

谷歌最新研究揭示，顶尖AI模型如DeepSeek-R1在解题时会自发‘分裂’出多个人格，进行类似人类的‘左右脑互搏’式对话，从而提升推理准确率。这种内部对话机制不仅让AI更聪明，还暗示了社交互动对智能进化的关键作用。对于开发者而言，这不仅是理解AI思维的新视角，也是优化模型性能的突破口。

🔗 [战略白皮书]：https://arxiv.org/abs/2601.10825

来源：量子位