AI新闻

已选标签:
1月 17日
1 条新闻
14:37

OpenAI拟在ChatGPT中测试定向广告,加码营收增长计划

据报道,OpenAI将于未来几周内,面向美国部分用户在ChatGPT应用内启动广告测试。这一举措标志着该公司在推动这款热门聊天机器人创收的道路上,迎来了重大转变。该公司周五透露,广告投放对象涵盖免费版ChatGPT用户,以及此前率先在印度推出、现正拓展至美国市场的新款低价套餐——月费8美元的Go套餐用户。而价格更高的ChatGPT付费高级版则依旧不会出现广告。OpenAI此次决定试水广告业务,源于其在潜在首次公开募股前,推进营收多元化的整体战略布局,同时也是为了抵消人工智能系统开发与运维的巨额成本。(广角观察)

来源:钛媒体

1月 16日
3 条新闻
15:45

吴恩达开新课教OCR,用Agent搞定文档提取

吴恩达开新课教OCR,用Agent搞定文档提取

你懂OCR吗?2025年之前,可能人人都懂。
但2025年之后,你还认为你真的懂OCR吗?
是的,随着AI大模型研发在架构、记忆、存储等等领域的深水区创新,OCR重新成为了技术专项。DeepSeek在研究、智谱在研究、阿里千问和腾讯混元也都在研究……
那么,怎样才能速成AI时代的OCR呢?
还得是吴恩达老师,火速来了新课程,帮你速通OCR。
在新课程里,直接提出了一个新方案——智能体文档提取(Agent Doc Extraction)。
不仅是OCR技术在Agent时代的进阶,更是一个统一的智能体工作流。
并且这个方法在DocVQA基准测试中的准确率达到了99.15%。
新课上线,不仅手把手教你跑通本地代码,还给出了在AWS上部署的完整线路~
OCR重新成为技术专项
在介绍ADE之前,先来了解一下各大厂近期在OCR技术上的密集更新。
如果把目光放回到2025,就不难发现,吴恩达老师的这门课也是对这一技术深水区回归的及时呼应。
从10月份开始,DeepSeek让这项技术的讨论爆发。
DeepSeek-OCR玩起“视觉压缩一切”,靠专属视觉编码器把万字长文压成百个视觉token,在10倍压

来源:36氪

1月 15日
16 条新闻
17:22

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

【导读】一个大模型持续写代码,能写多久?一小时?一天?还是像大部分AI编程工具那样,完成一个任务就结束对话?Cursor的CEO MichaelTruell决定搞一次极限压力测试!
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。
不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。
结果?
300万行代码。数千个文件。
AI完全从零构建出一个全新浏览器。
而且,还是Chrome那种浏览器。
HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。
Michael Truell轻描淡写地发了条推文:它基本能跑!简单的网页能快速且正确地渲染出来。
一个模型究竟能跑多久
传统的AI编程工具,比如Github Copilot和早期的其他IDE,都是一问一答模式。
对话长度有限,上下文有限,任务复杂度有限。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。
这已经是很大的进步,但大多数情

来源:36氪

17:18

中国Coding Agent最大融资浮现,蚂蚁、凯辉、锦秋等投了

中国Coding Agent最大融资浮现,蚂蚁、凯辉、锦秋等投了

文|周鑫雨
编辑|苏建勋
2025年2月,OpenAI联合创始人Andrej Karpathy金口一开,他提出的“Vibe Coding(氛围编程)”就成了AI创业最性感的赛道。
在这个主打“忘却代码存在,靠与AI对话创作式编程”的赛道中,跑出了全球增速最快的AI独角兽,ARR(年化收入)已达1亿美金的Lovable。
在国内,入局Vibe Coding的明星创业者众多。不过,隐形冠军却出自一家深圳公司,DeepWisdom。
提起DeepWisdom,你可能会觉得稍显陌生,但从中却诞生了近几年国内最知名的几个爆款开源项目:
GitHub上拥有近60k stars的多智能体框架项目MetaGPT,以及5名成员半夜仅用3小时就复刻出Manus的OpenManus。
旗下2025年2月发布的多智能体Vibe Coding产品MetaGPT-X(简称“MGX”),0投放,却在发布一个月实现了全球50万注册用户、100万美金ARR的成绩。
上线7个月以来,MGX依然保持稳定的增速。官方数据显示,截至2025年9月,MGX的月访问量已达到120万,每天生成应用数量超过1万。
DeepWisdom

来源:36氪

17:14

姚班陈立杰入职OpenAI,破解50年世界难题的30岁天才,要颠覆ChatGPT

姚班陈立杰入职OpenAI,破解50年世界难题的30岁天才,要颠覆ChatGPT

【导读】清华姚班天才陈立杰,也要加入OpenAI了?从此,他将挥别UC伯克利助理教授的岗位,在硅谷开展一段新的人生。16岁拿下NOI金牌,直接保送清华姚班;18岁以世界第一的成绩,斩获IOI金牌。
就在刚刚,有消息传出:30岁姚班大神陈立杰,也要入职OpenAI了!
来源:叉叉叉叉叉😈
「Top华人社消息」称,也得到了OpenAI内部确认。
这条传闻一出,立刻引爆了不少AI和理论计算圈的讨论。
不过,目前个人主页上暂未更新——UC伯克利电气工程与计算机科学系助理教授。
16岁拿下NOI金牌,直接保送清华姚班;
18岁以世界第一的成绩,斩获IOI金牌。
2017年,他进入MIT攻读博士,师从计算复杂性泰斗Ryan Williams。此后几年,他直接开启了「刷奖模式」。
去年一篇论文,陈立杰带队破解了50年来计算复杂性「天坑」,用逆向数学的思路,彻底颠覆了人们世界观。
如果加入传闻成真,陈立杰可能是目前最能给OpenAI带来「理论天花板」突破的人选之一。
一路拿奖,理论计算机硬核选手
陈立杰是谁?
清华姚班学霸、特奖获得者、MIT博士、UC伯克利博士后。
简单梳理一下他的履历,就能理解为何

来源:36氪

15:54

RISC-V架构AI芯片公司进迭时空再获数亿元融资,新一代RISC-V AI芯片即将发布|硬氪首发

RISC-V芯片先锋「进迭时空」获数亿元B轮融资,以全栈自研技术加速AI算力普及。公司已成功量产高性能RISC-V CPU核与终端AI CPU芯片,瞄准万亿级市场。其核心优势在于自主掌控根技术,实现产品迭代与市场需求紧密绑定,推动AI应用大规模普及。未来将深耕“AI+”与“机器人”两大领域。

来源:36氪

15:54

阿福“满月”交上优异答卷,但“独美”为时尚早

阿福“满月”交上优异答卷,但“独美”为时尚早

医疗AI应用’阿福’在改名后的一个月内用户数翻倍至3000万,单日提问量突破1000万。这标志着AI技术正在解决医疗资源分布不均的问题,并逐渐从工具属性转向专业服务。蚂蚁集团通过整合内外部资源,特别是收购’好大夫在线’,为’阿福’提供了强大的数据支持和专业度保障。然而,面对来自其他大厂的竞争以及用户对隐私的关注,’阿福’仍需不断优化用户体验以保持增长势头。

来源:36氪

15:53

清华新研究,Nature+Science双杀

清华新研究,Nature+Science双杀

AI在加速个体科研的同时,却导致科学探索广度的收缩。清华大学李勇团队通过分析2.5亿篇文献揭示了这一矛盾现象,并指出这是由于当前AI模型缺乏通用性所致。研究结果表明,使用AI的科学家发表论文和引用量显著增加,但整体科学版图却异常收缩,跨界互动减少。为解决这一问题,团队推出了OmniScientist系统,旨在实现跨学科、全流程的科研支持。

🔗 [战略白皮书]:https://rdcu.be/eY5f7

来源:36氪

15:17

清华新研究,Nature+Science双杀!

清华新研究,Nature+Science双杀!

清华团队最新研究揭示了AI在科研领域中的双刃剑效应:尽管个体科学家通过AI加速了论文发表和职业晋升,但整体科学探索的广度却因此收窄。研究指出,这种现象源于当前AI模型缺乏通用性。为解决这一问题,团队推出了跨学科科研智能体OmniScientist,旨在推动更广泛、更深入的科研创新。

🔗 [认知原点]:https://arxiv.org/abs/2412.07727

来源:量子位

14:21

不得了,这个新技术把视频压缩到了0.02%!

不得了,这个新技术把视频压缩到了0.02%!

彻底颠覆视频传输规则!中国电信AI研究院推出GVC技术,将视频压缩至0.02%,在极低带宽下仍能保持高清流畅。这项技术不仅重新定义了视频压缩的底层逻辑,还为远洋通信、应急救援等极端环境下的高效数据传输提供了可能。GVC通过’用计算换宽带’的方式,实现了从像素搬运到语义生成的范式转移,预示着未来视频通信将以任务有效性为核心。

🔗 [核心技术战略白皮书]:https://www.qbitai.com/2026/01/369609.html

来源:量子位

13:11

AI开始“动手”了,全世界第一个带头的是阿里千问

AI开始“动手”了,全世界第一个带头的是阿里千问

阿里千问App率先实现AI在真实世界中的任务执行能力,成为全球首个大规模开放“搜索-决策-支付-履约”全链路AI功能的科技公司。通过Qwen最强模型与阿里生态的深度融合,千问App现在能一键搞定点外卖、做攻略、购物比价等日常琐事,极大提升了生活和工作效率,让AI真正成为你的私人助理。这不仅标志着人机交互的新拐点,也为职场人士提供了防替代的实操价值。

来源:量子位

11:47

XSKY发布AI数据方案AIMesh,大幅降低AI推理硬件投入成本

XSKY星辰天合发布全栈AI数据方案AIMesh,包含三个核心组件:训练数据网MeshFS、全局对象网MeshSpace、推理内存网MeshFusion,定位为面向“AI工厂”的数据与内存网。性能上,MeshFS在顺序读带宽上比行业通用方案提升30%,顺序写带宽超出50%,解决训练数据供给滞后问题;MeshSpace单个对象存储桶每秒支持高达一百万对象写入,大块写性能提升近50%,延迟降低30%;MeshFusion将服务器本地NVMeSSD转化为L3级外部内存,以1%的硬件成本实现近乎无限的上下文窗口,大幅降低AI推理的硬件投入成本。(广角观察)

来源:钛媒体

11:47

农业农村部智能采收机器人重点实验室正式获批落地南京

近日,农业农村部正式批准江苏集萃智能制造技术研究所有限公司(简称“集萃智造”)牵头江苏省农业科学院、农业农村部南京农业机械化研究所参与建设“农业农村部智能采收机器人重点实验室”(以下简称“实验室”)。未来,实验室将打造成为国内领先的具身智能农业机器人研发、转化与人才培养基地。(南京发布)

来源:钛媒体

11:47

今年最快千亿独角兽诞生

今年最快千亿独角兽诞生

机器人赛道迎来新星!Skild AI完成14亿美元C轮融资,估值飙升至140亿美元。其通用机器人大脑Skild Brain已适配多类机器人形态,并在复杂环境中执行任务。该技术有望填补美国超百万岗位缺口,成为职场效率跃迁的关键。科技巨头如软银、英伟达等纷纷加注,预示着通用大脑之争才刚刚开始。

来源:36氪

11:47

魅族22 Next将至,小方屏集体爆发:AI算力正在「解放」手机形态

魅族22 Next将至,小方屏集体爆发:AI算力正在「解放」手机形态

AI 算力与交互方式的脱钩正推动智能手机形态变革。魅族 22 Next 作为一款 4 英寸正方形屏幕、支持 5G 的 AI 终端,不仅重构了 Flyme 交互,还原生支持 Agent to Agent 跨智能体协作,成为智能家居和 IoT 设备控制的新入口。小方屏设备的复兴标志着 AI 时代下硬件形态的多样化趋势,未来 AI 硬件将更加分化,专注于不同场景入口。

来源:36氪

11:47

出货量登顶后的真相,人形机器人仍在过渡期

出货量登顶后的真相,人形机器人仍在过渡期

人形机器人产业正经历从技术演示到可交付工业产品的关键转变。智元以超过5100台的出货量,占据全球近39%市场份额,标志着该领域首次跨入量产阶段。行业关注点已从‘能不能做出来’转向‘谁能率先跑进量产节奏’。这一轮竞争中,决定胜负的是产品成熟度、制造能力与商业结构的综合体现。真正决定下一阶段格局的,是积累最多的真实数据、工程经验与客户反馈的企业。

来源:36氪

11:04

一年拿下三轮融资!影目INMO正在鼻梁上“复刻”一个AI手机

一年拿下三轮融资!影目INMO正在鼻梁上“复刻”一个AI手机

影目INMO在智能眼镜赛道上狂飙突进,一年内完成三轮融资近5亿,产品首发即售罄。其轻量化一体式AI+AR眼镜不仅成为资本宠儿,更在市场上大放异彩,吸引贾樟柯等大咖背书,并荣登京东金榜榜首。通过自研IMOS系统结合GLM大模型,实现双向对话实时翻译等功能,正逐步定义下一代移动终端形态。

来源:量子位