AI新闻

已选标签:
1月 19日
4 条新闻
13:58

智谱与MiniMax上市后,“六小虎”路径分化

AI大模型企业分化发展,MiniMax、月之暗面等聚焦AGI理想,百川智能则转向医疗领域。MiniMax开源面向Coding Agent的评测集OctoCodingBench,百川智能发布全球领先的医疗大模型Baichuan—M3。行业格局不断重塑,技术迭代成为关键。

🔗 [效率传送门]:https://github.com/MiniMax/OctoCodingBench
🔗 [核心配方]:https://github.com/baichuan-ai/Baichuan-M3

来源:36氪

13:49

编程从此不再有门槛,Claude Code火爆出圈,一周干完一年的活,一人顶一个团队

Claude Code 正在颠覆软件开发领域,让非技术人员也能轻松构建个性化应用。其最新版本 Claude Opus 4.5 显著提升生产力,使用户在短时间内完成复杂项目。这一变革不仅降低了编程门槛,还催生了‘微应用’和‘超级程序员’的新趋势。前者强调个人定制化工具的兴起,后者则对专业工程师提出了更高要求,只有掌握AI工具的‘超级个体’才能在竞争中脱颖而出。

来源:36氪

1月 17日
4 条新闻
15:50

仅用一周时间,谷歌就让OpenAI认清现实

仅用一周时间,谷歌就让OpenAI认清现实

谷歌Gemini最新推出的Personal Intelligence功能,通过整合Gmail、Google Photos等应用数据,实现跨数据源推理,提供个性化回答。同时,谷歌与苹果达成合作,Gemini 3将作为新版Siri的技术底座。此外,谷歌推出通用商务协议UCP,使AI代理无缝对接商业系统。这些举措不仅强化了谷歌的全栈优势,还重新定义了流量分发权。

来源:36氪

15:46

Cursor一夜翻车,AI 300万代码写浏览器被打假!全网群嘲「AI泔水」

Cursor一夜翻车,AI 300万代码写浏览器被打假!全网群嘲「AI泔水」

警惕AI泡沫!Cursor声称GPT-5.2在7天内构建出一个功能完整的浏览器,但技术社区的深入分析揭示了真相:代码根本无法编译。这不仅是一次失败的技术尝试,更是对开发者社区信任的严重挑战。此事件提醒我们,在追求效率跃迁的同时,必须保持对工程质量和可复现性的严格要求。

🔗 [开源武器库]:https://github.com/wilsonzlin/fastrender

来源:36氪

15:42

Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间!

Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间!

Transformer之父Llion Jones警告,当前的AI研究可能陷入局部优化陷阱,真正的AGI突破或需生物启发的新架构。他指出,尽管Transformer在多项任务上表现出色,但其万金油式的特性掩盖了更根本的问题。Jones认为,继续扩大现有模型规模并非通往AGI的唯一路径,而应探索如连续思维机(CTM)等新方向。

🔗 [效率传送门]:https://sakana.ai/ctm/
🔗 [战略白皮书]:https://hardwarelottery.github.io/

来源:36氪

14:37

OpenAI拟在ChatGPT中测试定向广告,加码营收增长计划

据报道,OpenAI将于未来几周内,面向美国部分用户在ChatGPT应用内启动广告测试。这一举措标志着该公司在推动这款热门聊天机器人创收的道路上,迎来了重大转变。该公司周五透露,广告投放对象涵盖免费版ChatGPT用户,以及此前率先在印度推出、现正拓展至美国市场的新款低价套餐——月费8美元的Go套餐用户。而价格更高的ChatGPT付费高级版则依旧不会出现广告。OpenAI此次决定试水广告业务,源于其在潜在首次公开募股前,推进营收多元化的整体战略布局,同时也是为了抵消人工智能系统开发与运维的巨额成本。(广角观察)

来源:钛媒体

1月 15日
12 条新闻
17:22

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

【导读】一个大模型持续写代码,能写多久?一小时?一天?还是像大部分AI编程工具那样,完成一个任务就结束对话?Cursor的CEO MichaelTruell决定搞一次极限压力测试!
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。
不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。
结果?
300万行代码。数千个文件。
AI完全从零构建出一个全新浏览器。
而且,还是Chrome那种浏览器。
HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。
Michael Truell轻描淡写地发了条推文:它基本能跑!简单的网页能快速且正确地渲染出来。
一个模型究竟能跑多久
传统的AI编程工具,比如Github Copilot和早期的其他IDE,都是一问一答模式。
对话长度有限,上下文有限,任务复杂度有限。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。
这已经是很大的进步,但大多数情

来源:36氪

15:54

阿福“满月”交上优异答卷,但“独美”为时尚早

阿福“满月”交上优异答卷,但“独美”为时尚早

医疗AI应用’阿福’在改名后的一个月内用户数翻倍至3000万,单日提问量突破1000万。这标志着AI技术正在解决医疗资源分布不均的问题,并逐渐从工具属性转向专业服务。蚂蚁集团通过整合内外部资源,特别是收购’好大夫在线’,为’阿福’提供了强大的数据支持和专业度保障。然而,面对来自其他大厂的竞争以及用户对隐私的关注,’阿福’仍需不断优化用户体验以保持增长势头。

来源:36氪

15:17

清华新研究,Nature+Science双杀!

清华新研究,Nature+Science双杀!

清华团队最新研究揭示了AI在科研领域中的双刃剑效应:尽管个体科学家通过AI加速了论文发表和职业晋升,但整体科学探索的广度却因此收窄。研究指出,这种现象源于当前AI模型缺乏通用性。为解决这一问题,团队推出了跨学科科研智能体OmniScientist,旨在推动更广泛、更深入的科研创新。

🔗 [认知原点]:https://arxiv.org/abs/2412.07727

来源:量子位

13:11

AI开始“动手”了,全世界第一个带头的是阿里千问

AI开始“动手”了,全世界第一个带头的是阿里千问

阿里千问App率先实现AI在真实世界中的任务执行能力,成为全球首个大规模开放“搜索-决策-支付-履约”全链路AI功能的科技公司。通过Qwen最强模型与阿里生态的深度融合,千问App现在能一键搞定点外卖、做攻略、购物比价等日常琐事,极大提升了生活和工作效率,让AI真正成为你的私人助理。这不仅标志着人机交互的新拐点,也为职场人士提供了防替代的实操价值。

来源:量子位

12:49

李彦宏的AI野心,淹没在字节和阿里的战火里

李彦宏的AI野心,淹没在字节和阿里的战火里

百度在AI领域的先发优势正逐渐被字节和阿里超越。尽管百度拥有从芯片到应用的全栈自研能力,但在C端与开发者群体中已明显落后。面对豆包、千问等竞争对手的价格战和技术突破,百度被迫调整策略,宣布文心大模型开源。然而,这一举措并未能扭转局势,反而暴露出其在市场战略上的失误。百度必须重新审视自身定位,以适应快速变化的AI竞争格局。

来源:36氪

11:47

今年最快千亿独角兽诞生

今年最快千亿独角兽诞生

机器人赛道迎来新星!Skild AI完成14亿美元C轮融资,估值飙升至140亿美元。其通用机器人大脑Skild Brain已适配多类机器人形态,并在复杂环境中执行任务。该技术有望填补美国超百万岗位缺口,成为职场效率跃迁的关键。科技巨头如软银、英伟达等纷纷加注,预示着通用大脑之争才刚刚开始。

来源:36氪

11:47

魅族22 Next将至,小方屏集体爆发:AI算力正在「解放」手机形态

魅族22 Next将至,小方屏集体爆发:AI算力正在「解放」手机形态

AI 算力与交互方式的脱钩正推动智能手机形态变革。魅族 22 Next 作为一款 4 英寸正方形屏幕、支持 5G 的 AI 终端,不仅重构了 Flyme 交互,还原生支持 Agent to Agent 跨智能体协作,成为智能家居和 IoT 设备控制的新入口。小方屏设备的复兴标志着 AI 时代下硬件形态的多样化趋势,未来 AI 硬件将更加分化,专注于不同场景入口。

来源:36氪

11:04

一年拿下三轮融资!影目INMO正在鼻梁上“复刻”一个AI手机

一年拿下三轮融资!影目INMO正在鼻梁上“复刻”一个AI手机

影目INMO在智能眼镜赛道上狂飙突进,一年内完成三轮融资近5亿,产品首发即售罄。其轻量化一体式AI+AR眼镜不仅成为资本宠儿,更在市场上大放异彩,吸引贾樟柯等大咖背书,并荣登京东金榜榜首。通过自研IMOS系统结合GLM大模型,实现双向对话实时翻译等功能,正逐步定义下一代移动终端形态。

来源:量子位

10:45

英首相:X平台伪造色情图像“可耻”,英国不会妥协

英国首相斯塔默1月14日说,社交媒体平台X的人工智能聊天机器人“格罗克”(Grok)伪造色情图像,这“令人作呕”且“可耻”,英国不会对此妥协。

“格罗克”由马斯克旗下人工智能企业xAI公司开发,内置于马斯克旗下社交媒体平台X。这一工具已被滥用于生成基于真实人物的虚假性暴露内容,并在X平台上散播,受害者包括众多女性和未成年人。

斯塔默说,如果X平台不对此采取行动,那么英国政府会“全力支持”英国通信管理局对其采取行动。(新华社)

来源:钛媒体

10:45

云海医数发布云键AI精灵,中医红外算法不限时使用

红外数字中医软件服务商云海医数正式推出”云键AI精灵”,该产品通过标准化接口技术,兼容市面所有红外硬件厂商。此前,硬件厂商接入中医红外算法需支付单次超5万元的对接费及后续年费,云键AI精灵采用不限时套餐收费模式,减少用户长期成本。目前红外设备主要应用于工业、消防及医学治未病科,云海医数依托该产品推动其向大健康市场拓展。其检测系统涵盖九大体质辨识、十二经络分析及健康风险评估等。公司透露,未来计划向美容行业延伸服务,进一步挖掘红外技术的健康管理应用潜力。(广角观察)

来源:钛媒体

10:45

OpenAI签下近700亿AI芯片巨单

OpenAI与Cerebras达成百亿美元合作,部署全球最大的高速AI推理平台。Cerebras芯片以超大规模晶体管集成,实现比GPU快15倍的响应速度,直接推动AI实时处理能力跃升。此次合作不仅标志着对英伟达传统算力解决方案的重大挑战,也预示着多元算力路线正成为头部玩家的新战场。

来源:36氪