
最强模型Claude Fable 5的安全分类器被黑客团队攻破,原本封锁的敏感信息被公开。黑客利用字符级迷魂阵、对话稀释意图等手段绕过安全机制,甚至将内部系统提示词上传至GitHub。Anthropic因「暗箱降智」风波致信任危机,紧急撤回相关政策但仍面临质疑。
🔗 [GitHub项目]:https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md
主题测试文章,只做测试使用。发布者:,转转请注明出处:https://uxwork.cn/archives/ai-news/%e5%88%9a%e5%88%9a%ef%bc%8c%e5%9c%b0%e8%a1%a8%e6%9c%80%e5%bc%baclaude-5%e8%a2%ab%e6%94%bb%e7%a0%b4