AI新闻

已选标签:
1月 30日
3 条新闻
15:44

英伟达支持的Perplexity据悉与微软签署价值7.5亿美元协议

相关报道援引知情人士称,人工智能初创公司Perplexity已与微软签署了一项价值7.5亿美元的协议,将使用其Azure云服务。据悉,这项为期三年的协议将允许英伟达支持的Perplexity通过微软的Foundry计划运行一系列AI模型,包括来自OpenAI、Anthropic和xAI的系统。Perplexity的一位发言人证实,该公司正与微软合作,“以获取来自X、OpenAI和Anthropic的前沿模型”。该发言人表示,作为与微软合作的一部分,Perplexity并未将支出从其主要云服务提供商亚马逊网络服务 (AWS) 转移到微软。(广角观察)

来源:钛媒体

15:44

蚂蚁灵波开源具身世界模型LingBot-VA

蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。据介绍,该模型首次提出自回归视频-动作世界建模框架,将大规模视频生成模型的能力与机器人控制融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列,使机器人能够像人一样“边推演、边行动”。(广角观察)

来源:钛媒体

1月 29日
2 条新闻
09:31

世界模型怎么才算“能用”?李飞飞把它做成了 API

李飞飞创立的World Labs推出World API,标志着AI从生成视频内容迈向构建可交互三维空间。该API利用多模态输入技术,将文字或图像转化为具备物理规则与几何结构的数字世界,为机器人训练、游戏开发及虚拟现实提供支持。World API不仅是一个生成工具,更是重新定义了‘世界’的概念,旨在赋予机器真正的空间智能。其核心能力在于多模态输入和语义可编辑性,使任何需要3D环境的应用都能直接调用它来构建场景。

🔗 [效率传送门]:https://www.worldlabs.ai/blog/announcing-the-world-api

来源:36氪

1月 28日
1 条新闻
07:18

OpenAI 的最强对手,离「AI Windows」又近了一步

OpenAI 的最强对手,离「AI Windows」又近了一步

Anthropic 为 Claude 引入 Model Context Protocol (MCP),实现与 Figma、GitHub 等生产力工具的深度集成。这一更新不仅简化了多工具间的数据搬运,还通过统一标准接口提升了工作效率,标志着 Claude 从被动聊天机器人向主动智能体平台的转变。MCP 的开源特性有望推动更开放的 AI 工具生态,降低开发门槛并提升互操作性。

来源:36氪

1月 27日
1 条新闻
15:27

蚂蚁灵波开源具身智能技术基座方向重要成果LingBot-Depth模型

蚂蚁集团旗下灵波科技1月27日开源高精度空间感知模型LingBot-Depth,这是该公司在2025外滩大会后首次公布具身智能技术基座方向重要成果。该模型基于奥比中光Gemini330系列双目3D相机芯片级原始数据,专注于提升环境深度感知与三维空间理解能力。模型创新采用”掩码深度建模”技术,有效解决透明和反光物体的视觉感知难题。本周蚂蚁灵波将陆续开源多款具身智能方向模型。

在权威基准评测中,LingBot-Depth展现出代际级优势:相比主流模型,室内场景相对误差降低超70%,稀疏SfM任务RMSE误差降低约47%。灵波科技计划开源包含200万组真实世界深度数据的数据资产,并与奥比中光合作推出新一代深度相机。(广角观察)

来源:钛媒体

1月 26日
2 条新闻
14:50

腾讯元宝内测”元宝派”,尝试探索社交AI形态

腾讯旗下AI助手”元宝”正式开启”元宝派”社交AI功能内测。该功能允许用户创建或加入兴趣社群”派”,元宝AI可参与群聊、总结讨论内容,并支持健身、阅读等打卡活动的监督提醒。用户还能通过图片二创功能制作梗图,增强互动趣味性。后续公测将接入腾讯会议音视频能力,支持”一起看””一起听”等多人协作场景。目前”元宝派”已与微信、QQ打通,用户可通过社交平台分享邀请链接。腾讯近期宣布在元宝APP发放10亿现金红包,推进AI新功能布局。(广角观察)

来源:钛媒体

14:50

腾讯混元图像3.0图生图版本正式发布

腾讯混元图像3.0图生图版本(HunyuanImage 3.0-Instruct)正式发布,支持多样化图片编辑与多图融合功能。该模型基于80B参数的混合专家架构,通过指令微调和后训练实现了对用户图像和编辑指令的深度理解。模型采用”先思考后编辑”的工作机制,在收到输入后会分析图像内容并推理编辑步骤,确保输出效果的一致性。目前该功能已同步上线元宝应用和混元官网,用户可体验图片增删改、风格变换、老照片修复等编辑能力。性能上,模型在盲测中表现与国内外SOTA闭源模型基本持平,生成图片具有高真实感和良好情绪表现力。

来源:钛媒体

1月 24日
1 条新闻
11:18

纳德拉懂张一鸣

纳德拉懂张一鸣

AI正从魔法变为工业品,纳德拉在达沃斯明确指出,未来的AI竞争在于Token工厂的效率。谁能在单位能耗下产出更多、更优质的Token,谁就能掌握市场定价权。这一观点与张一鸣通过火山引擎降低Token成本的战略不谋而合。随着AI工业化进程加快,任务成功率、推理延迟以及多模态融合效率将成为新的核心指标。

来源:36氪

1月 23日
2 条新闻
13:06

物理AI基础设施供应商飞捷科思获近亿元Pre-A1轮融资

物理AI基础设施供应商飞捷科思完成近亿元Pre-A1轮融资,由经纬创投、东方富海领投,沐曦股份等跟投。资金将用于完善自研物理仿真引擎,推动具身智能数据生成、模型训练等核心应用落地,进一步强化技术壁垒与商业化进程。作为中国唯一攻克多物理场统一求解技术的厂商,飞捷科思引擎支持国产GPU并行计算,通过合成数据高效解决行业训练数据短缺问题,降低机器人研发成本。其联合复旦推出的FysicsWorld评测基准,已为物理AI提供标准化测试体系。(创投家CLUB)

来源:钛媒体

11:16

Mobileye势头强劲,2025财年全年营收同比增长15%

Mobileye以强劲势头迈入2026财年,全年营收同比增长15%,达18.94亿美元。公司赢得了美国一家主流主机厂的环绕式ADAS大规模订单,并与大众汽车集团合作推进无人驾驶出租车服务。2025财年经营活动现金流净额增长51%,彰显运营韧性。Mobileye计划通过收购Mentee Robotics拓展至人形机器人领域,成为物理AI领域的全面领导者。

来源:量子位

1月 22日
1 条新闻
11:37

黄仁勋达沃斯对话:五层蛋糕、三大突破、万亿基建重塑AI未来

黄仁勋达沃斯对话:五层蛋糕、三大突破、万亿基建重塑AI未来

黄仁勋在世界经济论坛上提出了AI的“五层蛋糕”理论,强调从底层能源到顶层应用的全栈革命将催生大规模基础设施建设。他指出,AI不是取代人类工作,而是通过自动化具体任务增强人类实现工作核心目的的能力。同时,开放模型的崛起和发展中国家利用AI缩小技术鸿沟的机会也得到了深入探讨。

来源:36氪

1月 21日
2 条新闻
15:19

OpenAI:将自行承担“星际之门”项目能源费用

OpenAI公告称,在宣布“星际之门”项目一年后,计划到2029年将美国的人工智能基础设施扩展到10吉瓦。OpenAI称,已经在规划容量方面远超目标的一半,得克萨斯州第一批站点已经开始训练和提供服务,同时得克萨斯州、新墨西哥州、威斯康星州和密歇根州还有多个“星际之门”站点正在开发中。OpenAI表示,在所有“星际之门”社区计划中,承诺自行承担能源费用,确保项目运营不会推高电价。每个社区和地区都有独特的能源需求及电网状况,OpenAI承诺将根据具体区域量身定制。根据项目地点的不同,具体措施包括:由项目全额出资建设新的专用供电及储能设施,或增设并支付新型能源发电与输电资源的费用。(广角观察)

来源:钛媒体

15:19

杭州:到2030年培育国际顶尖水平的开源基础大模型3个以上

杭州市第十四届人民代表大会第六次会议在省人民大会堂隆重开幕。大会听取和审议了杭州市人民政府工作报告。报告介绍了杭州“十五五”发展规划,目标到2030年培育国际顶尖水平的开源基础大模型3个以上,规上人工智能核心产业营收超6000亿元。全社会研发投入强度达4.5%,科技型中小企业突破5万家。壮大”296x”先进制造业集群,建设中国视谷,中国数谷,中国云谷,中国医药港等产业地标。安排超1000个重大工程,完成投资1.8万亿元。服务业增加值突破2万亿元,生产性服务业增加值占服务业比重达60%以上。(广角观察)

来源:钛媒体

1月 19日
2 条新闻
13:58

智谱与MiniMax上市后,“六小虎”路径分化

AI大模型企业分化发展,MiniMax、月之暗面等聚焦AGI理想,百川智能则转向医疗领域。MiniMax开源面向Coding Agent的评测集OctoCodingBench,百川智能发布全球领先的医疗大模型Baichuan—M3。行业格局不断重塑,技术迭代成为关键。

🔗 [效率传送门]:https://github.com/MiniMax/OctoCodingBench
🔗 [核心配方]:https://github.com/baichuan-ai/Baichuan-M3

来源:36氪

1月 17日
2 条新闻
15:50

仅用一周时间,谷歌就让OpenAI认清现实

仅用一周时间,谷歌就让OpenAI认清现实

谷歌Gemini最新推出的Personal Intelligence功能,通过整合Gmail、Google Photos等应用数据,实现跨数据源推理,提供个性化回答。同时,谷歌与苹果达成合作,Gemini 3将作为新版Siri的技术底座。此外,谷歌推出通用商务协议UCP,使AI代理无缝对接商业系统。这些举措不仅强化了谷歌的全栈优势,还重新定义了流量分发权。

来源:36氪

15:42

Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间!

Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间!

Transformer之父Llion Jones警告,当前的AI研究可能陷入局部优化陷阱,真正的AGI突破或需生物启发的新架构。他指出,尽管Transformer在多项任务上表现出色,但其万金油式的特性掩盖了更根本的问题。Jones认为,继续扩大现有模型规模并非通往AGI的唯一路径,而应探索如连续思维机(CTM)等新方向。

🔗 [效率传送门]:https://sakana.ai/ctm/
🔗 [战略白皮书]:https://hardwarelottery.github.io/

来源:36氪

1月 15日
1 条新闻
15:17

清华新研究,Nature+Science双杀!

清华新研究,Nature+Science双杀!

清华团队最新研究揭示了AI在科研领域中的双刃剑效应:尽管个体科学家通过AI加速了论文发表和职业晋升,但整体科学探索的广度却因此收窄。研究指出,这种现象源于当前AI模型缺乏通用性。为解决这一问题,团队推出了跨学科科研智能体OmniScientist,旨在推动更广泛、更深入的科研创新。

🔗 [认知原点]:https://arxiv.org/abs/2412.07727

来源:量子位