AI新闻

已选标签:
1月 13日
18 条新闻
11:50

“几乎所有大模型,视觉能力都不如3岁小孩”

“几乎所有大模型,视觉能力都不如3岁小孩”

最新研究揭示,多数顶尖多模态大模型的视觉处理能力远逊于3岁儿童。UniPatAI团队发布的BabyVision评测集显示,即使是最强大的Gemini3-Pro-Preview模型,在视觉任务上也仅勉强超过3岁基线。这一发现凸显了现有大模型在精细辨别、视觉追踪等关键领域的系统性缺失,表明未来模型需从根本上重建视觉能力,而非依赖语言推理。

来源:36氪

11:50

AI for Science:中国AI大爆发的底层密码

AI for Science:中国AI大爆发的底层密码

AI for Science正悄然重塑中国科技发展逻辑,推动科研从试错驱动转向数据+模型驱动。中国企业已在新材料、生物医药、芯片三大硬核产业扎根AI4S,破解基础研究效率瓶颈。如方大炭素与晶泰科技合作,将新材料研发周期缩短至3-6个月;美迪西重构AI药物发现全链条,降低新药研发成本;道氏技术布局原子级科学计算芯片,填补国内空白。AI4S为中国科技突破‘卡脖子’困境提供了前所未有的机遇。

来源:36氪

09:29

OpenAI以1亿美元收购人工智能医疗健康应用程序Torch

OpenAI已同意以约1亿美元的股权对价,收购成立仅一年的人工智能医疗健康应用程序公司Torch。Torch这款应用能够帮助用户查看并分析来自不同渠道的健康数据,包括凯撒医疗集团等医疗体系、普雷努沃等医学影像公司,以及苹果健康等运动监测类应用。收购这家初创公司,或将助力OpenAI自身的研发计划,即在智能聊天机器人ChatGPT中推出个性化健康助手功能。Torch方面表示,其产品部分依托OpenAI的人工智能模型,基于用户数据生成个性化医疗建议。目前尚不清楚这款聊天机器人形态的应用拥有多少用户,该应用现阶段仅对特定私密用户群体开放。(第一财经)

来源:钛媒体

09:29

DeepSeek发布梁文锋署名新论文,开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时,DeepSeek开源相关记忆模块Engram。(广角观察)

来源:钛媒体

09:27

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文,提出条件记忆(conditional memory)以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块,实现了 O(1) 时间复杂度的知识检索,显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系,为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]:https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

09:27

企业 Agent 为何多半是玩具?差的不是模型,是品味

Replit CEO Amjad Masad 指出,当前AI Agent看似全能却低效,真正的突破在于建立以‘品味’为核心的工程标准。这不仅包括预设业务框架、限定可信数据范围,还涉及闭环验证流程。Replit通过制定规则、限定答案范围和增加资源投入,确保生成内容的可靠性。最终,AI的竞争将从模型能力转向严谨的工程交付力。

来源:36氪

09:27

云厂商的AI决战

云厂商的AI决战

AI云的竞争已从单一的算力供给,升级为涵盖训练、推理、部署等全生命周期的AI Infra较量。忽视多维度竞争要素,仅关注Token使用量将导致战略短视。头部云厂商正通过自研芯片与模型、优化Infra来构建核心竞争力,形成难以逾越的技术壁垒。这不仅关乎成本控制,更是决定未来市场格局的关键。

来源:36氪

09:26

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

DeepSeek联合北大发布新论文,直击Transformer缺乏原生知识查找机制的痛点。通过引入Engram模块,实现了O(1)时间复杂度的知识检索,显著提升了模型在推理、代码及数学任务上的表现。这一创新不仅解决了计算效率问题,还为稀疏化LLM提供了新的方向。研究发现MoE与Engram之间存在U形scaling law,表明两者间需找到最优资源配比以实现性能最大化。

🔗 [认知原点]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

08:21

字节AI出海进入新阶段

字节AI出海进入新阶段

字节跳动正加速布局海外AI市场,2025年末其C端与B端产品如Dola、AnyGen等在东南亚、南美等地取得显著进展。特别是AnyGen,作为对标Manus的工作场景Agent,强调专业任务执行能力及生成内容的复用性,采用强付费模式。此举不仅提升了字节在全球AI市场的竞争力,还标志着从输出快乐到出售效率的战略转型。

来源:36氪

08:00

亲身体验Bee:亚马逊最新的人工智能可穿戴设备

亲身体验Bee:亚马逊最新的人工智能可穿戴设备

Amazon新推AI可穿戴设备Bee,一键录音转录,智能分段摘要,助你轻松回顾日常对话。不同于专业转录工具,Bee旨在成为生活助手,通过与Google服务集成,将对话关联至具体任务。尽管存在隐私顾虑,但其便捷性及未来潜力不容小觑。对于追求高效生活的职场人士来说,这可能是一个值得尝试的防替代利器。

来源:TechCrunch AI

05:55

亚马逊为何收购AI可穿戴设备公司Bee

亚马逊为何收购AI可穿戴设备公司Bee

亚马逊在CES上展示了其最新收购的AI可穿戴设备Bee,标志着其在智能设备领域的进一步扩张。Bee不仅能够记录会议、讲座等对话内容,还能作为个人AI助手,学习用户习惯并提供个性化建议。与Alexa不同,Bee专注于户外使用场景,两者未来将共同为用户提供更全面的服务体验。这不仅是效率工具的升级,也是职场人士防替代的关键一步。

来源:TechCrunch AI

05:44

马克·扎克伯格表示Meta将推出自己的人工智能基础设施计划

马克·扎克伯格表示Meta将推出自己的人工智能基础设施计划

Meta 正在全力构建其 AI 基础设施,计划在未来十年内建设数十吉瓦的能源容量。这不仅将提升 Meta 的技术优势,还将重塑美国的电力消耗格局。Zuckerberg 指定三位高管负责这一项目,旨在打造领先的 AI 环境。此举标志着 Meta 在 AI 领域的战略布局正在加速推进,为开发者提供了前所未有的机遇。

来源:TechCrunch AI

04:48

Anthropic宣布推出医疗版Claude,继OpenAI发布ChatGPT健康版之后

Anthropic宣布推出医疗版Claude,继OpenAI发布ChatGPT健康版之后

Anthropic紧随OpenAI的步伐,推出Claude for Healthcare,专为医疗提供者、支付方及患者设计。相较于ChatGPT Health侧重于患者端聊天体验,Claude通过连接至CMS数据库等关键资源,显著加速了研究过程与报告生成,尤其在预授权审查方面展现优势。这不仅解放了医生的时间,让他们能更专注于诊疗,同时也为医疗机构提供了前所未有的效率提升。

🔗 [TechCrunch报道原文]:https://techcrunch.com/2026/01/12/anthropic-announces-claude-for-healthcare-following-openais-chatgpt-health-reveal/

来源:TechCrunch AI

03:30

Anthropic的新协作工具Cowork提供无需编写代码的Claude Code功能

Anthropic的新协作工具Cowork提供无需编写代码的Claude Code功能

Anthropic 推出 Claude Code 的简化版 Cowork,让非技术用户也能轻松上手。通过指定文件夹,Cowork 可以读取和修改文件,无需复杂的命令行工具或虚拟环境。这一创新降低了使用门槛,拓宽了应用场景,如自动生成费用报告、管理媒体文件等。尽管简化了操作,但用户仍需谨慎给出明确指令以避免风险。Cowork 目前仅对 Max 订阅者开放,其他计划的用户可加入等待名单。

来源:TechCrunch AI

03:20

亚马逊表示其97%的设备可支持Alexa+

亚马逊表示其97%的设备可支持Alexa+

亚马逊在CES上透露,其超过6亿设备中绝大多数将支持升级版AI助手Alexa+,凭借广泛的家庭覆盖率和用户对Alexxa品牌的熟悉度,亚马逊认为这将是其在生成式AI市场中的竞争优势。Alexa+提供更丰富的语音、世界知识接入及任务执行能力,目标是成为基础且全能的AI助手之一。随着数千万用户已可选择升级至Alexa+,亚马逊正聚焦于将其带给所有Prime会员,进一步证明其实用性与吸引力。

来源:TechCrunch AI

01:12

谷歌的Gemini将为苹果的AI功能如Siri提供支持

谷歌的Gemini将为苹果的AI功能如Siri提供支持

苹果与谷歌达成合作,将使用Gemini模型等技术为Siri等AI功能提供支持。此合作标志着苹果在AI领域的重大战略调整,旨在提升用户体验并保持隐私标准。尽管面临反垄断诉讼,苹果仍选择谷歌作为其AI合作伙伴,以期实现更强大的AI功能。此举或将成为苹果追赶竞争对手的关键一步。

来源:TechCrunch AI

00:34

新泽西州的一起诉讼揭示了打击深度伪造色情内容的难度

新泽西州的一起诉讼揭示了打击深度伪造色情内容的难度

面对日益猖獗的AI生成非法内容问题,一起针对ClothOff应用的诉讼揭示了打击此类平台的艰难。尽管该应用已被主要应用商店下架,但仍通过网站和Telegram机器人活跃。这起案件不仅反映了受害者寻求正义之难,也凸显了现有法律体系在处理这类技术滥用时的局限性。对于科技从业者而言,了解这些挑战有助于提前布局,防止自身产品成为下一个被追责的目标。

🔗 [完整诉状]:https://techcrunch.com/2026/01/12/a-new-jersey-lawsuit-shows-how-hard-it-is-to-fight-deepfake-porn/

来源:TechCrunch AI

1月 12日
2 条新闻
20:25

MiniMax和智谱,千亿IPO的两条路

MiniMax和智谱,千亿IPO的两条路

在AI烧钱浪潮中,MiniMax和智谱AI以独特路径突围。MiniMax通过C端驱动、多模型并进的激进策略,在情感化产品上取得成功,并逐步扩展到多模态技术;而智谱AI则依托B端服务、统一基底大模型的学院派路线,实现了高毛利率。两家公司展现了国产AI企业的不同成长路径,但都面临激烈的市场竞争与高额投入的压力。

来源:36氪

19:24

全球爆火AI框架陷绝境,创始人深夜崩溃痛呼:已裁员75%,只剩6个月续命

全球爆火AI框架陷绝境,创始人深夜崩溃痛呼:已裁员75%,只剩6个月续命

AI时代下的残酷现实:Tailwind因开发的AI编程工具太好用,导致收入骤降80%,团队裁员75%。尽管每月下载量高达7500万次,但用户直接依赖AI生成UI,不再购买付费组件,使公司陷入绝境。最终,谷歌和Vercel站出来赞助,暂时缓解了危机。这警示我们,AI虽强大,但底层基础设施仍需重视与支持。

来源:36氪