
UC伯克利发布全新AI智能体基准测试ALE,挑战当今最强AI Agent。结果显示,在真实工作场景下,GPT 5.5表现优于Claude Fable 5,揭示了答题学霸≠干活能手的现实。此外,测试还暴露了效率与成本的巨大差异,GPT 5.5在时间和金钱上均优于Claude系列模型。
主题测试文章,只做测试使用。发布者:,转转请注明出处:https://uxwork.cn/archives/ai-news/%e6%99%ba%e8%83%bd%e4%bd%93%e6%9c%80%e5%90%8e%e7%9a%84%e8%80%83%e8%af%95%ef%bc%8cfable-5%e7%ab%9f%e7%84%b6%e4%b8%8d%e6%95%8cgpt-5-5