Anthropic的新AI模型Fable限制重重，引发用户强烈不满

bravefilm · 2026 年6 月 12 日 09:41

安全护栏使得这款强大的模型对AI研究人员的效用降低，这让一场日益升温的争论愈演愈烈：究竟应该由谁来把守危险的AI能力？

Anthropic最新的AI模型Claude Fable 5基于备受争议的Mythos级模型。

Anthropic终于让公众体验到了其下一代模型，但该模型生硬的安全屏障激怒了部分人工智能(AI)开发者和用户，也让一场日益升温的争论愈演愈烈：究竟应该由谁来把守危险的AI能力？

Anthropic周二发布的这款新模型名为Claude Fable 5，是Mythos模型的更新版本。该公司曾表示Mythos模型过于危险，不宜广泛发布。因为Mythos模型有可能发现全球正在使用的软件中的未知漏洞，这令政府官员和网络安全专家感到恐慌。但Anthropic表示，Fable带有广泛的限制措施，旨在削弱该模型协助用户进行潜在危险活动的能力。

当用户触及生物武器和网络安全等敏感话题时，Fable会弹出通知，随后将对话重定向到能力较弱的早期版本的Claude。

Fable还降低了对于高端AI开发问题的回复质量，让那些试图开发缺乏同等安全保障的AI工具的开发者难以从中获益。然而，在给出这类回复时，该模型并没有弹出通知。Anthropic将国家安全及其自身的服务条款列为设置这些隐性限制的理由。

许多AI专家对此表示不满，指责Anthropic通过设置门槛来打压潜在竞争对手，并干扰了外部研究人员评估及充分利用Fable潜力的能力。Anthropic的回应是，将让这些安全通知也显示出来。

“隐藏的安全屏障更难被探测和规避，”该公司在一份声明中表示，“我们做出了错误的取舍，对于未能把握好平衡，我们深表歉意。”

许多人抱怨称，该模型阻止他们讨论数学、生物和化学等表面上无害的话题，甚至不让他们分析Fable自身公开发布的系统信息。

一位用户发布了一张截图，显示Fable拒绝回答有关基础细胞解剖学的问题：“给我讲讲线粒体。”

非营利性生物医学研究机构杰克逊实验室(Jackson Laboratory)的免疫学家兼癌症研究员德莉亚·乌努特马兹(Derya Unutmaz)说，他第一时间打开Fable试用，结果却发现该模型拒绝回答任何问题。他怀疑这是因为他的聊天记录中包含了生物学话题。

“我甚至不能提‘癌症’这个词，连说句‘你好’都不行，”乌努特马兹说道，“在我看来，这简直是噩梦般的场景：一家公司竟然可以决定我们能问什么问题，以及什么才算安全问题。”

谈及科学研究，Anthropic表示，最初“有必要采取过度保守的态度”，并“拦截大多数与生物学工作相关的查询”，以防恶意行为者开展“高风险”研究。该公司表示，目前正致力于减少不必要的阻碍。

Anthropic的一名发言人在周三表示，该公司还计划向更广泛的生物学和生命科学界“提供不带这些安全保障的”Fable等Mythos级模型，“以便利用这些能力加速生物医学研究和药物发现”。

AI研究领域的其他人士表示，Anthropic承认其在暗中干预模型以降低其效用，此举开创了一个危险的先例。一些人表示，该模型在AI开发任务上性能下降，将使未来评估或信任模型能力变得更加困难。

“这可以说是AI公司推出安全护栏后首次遭到一致唾弃，”普林斯顿大学(Princeton University)AI研究员Sayash Kapoor说，“这引发了许多合乎情理的愤怒。”

Anthropic首席执行官达里奥·阿莫迪

这款新模型似乎确实比前几代更强大。一位用户发布了一段视频，展示了由Fable自主编写代码生成的克隆版《侠盗猎车手》(Grand Theft Auto)游戏，虽然粗糙但能运行。

Anthropic在Fable上采取的举措表明，该公司正试图在商业利益与既定安全目标之间艰难寻找平衡。Anthropic目前正与ChatGPT开发商OpenAI展开激烈竞争，争夺企业客户和投资者的青睐，如今两家公司都在朝着最快于今年秋季公开上市的目标迈进。

然而，Anthropic自成立以来一直标榜安全，其首席执行官达里奥·阿莫迪(Dario Amodei)长期以来也一直对其工具可能引发的风险表示担忧，这些风险涵盖从AI辅助的网络攻击和生物武器，到机器摆脱人类控制等各个方面。

上周，Anthropic发表了一篇博文，称应该建立一个国际机制来减缓或暂停高级AI的开发，这样做“将对世界有益”。OpenAI首席执行官山姆·阿尔特曼(Sam Altman)响应了这一呼吁，他在自己的博文中表示，应该设立一个全球性的AI监管机构。

批评人士早就指出，AI行业关于潜在危险的声明其实是在为自家产品做营销，同时也是为了排挤更廉价的开源替代品。现在一些人表示，大型AI公司为其模型设置的安全护栏正在催生一种“保姆式”的管控状态。

随着模型能力的提升，保护措施也变得愈发激进，这引发了关于由谁来决定拦截哪些内容的争议。美国政府能否将Anthropic的AI用于所有合法目的，正是该公司目前与美国国防部产生法律纠纷的核心所在。