据ADL称,Grok是反犹太主义倾向最严重的聊天机器人 - AI News
据ADL称,Grok是反犹太主义倾向最严重的聊天机器人

据ADL称,Grok是反犹太主义倾向最严重的聊天机器人

2026-01-28

新闻要点

周三,反诽谤联盟(ADL)发布研究称,在六款主流大语言模型中,xAI 的 Grok 识别和对抗反犹太内容表现最差,Anthropic 的 Claude 表现最佳,但所有模型均存在需改进的漏洞。研究测试了反犹太、反犹太复国主义及极端主义三类内容,ADL 未在新闻稿提及 Grok 最差,因希望突出正面案例以展示安全防护可能性。

- Grok 是六款模型中对抗反犹太内容表现最差的

- Claude 表现最佳,与 Grok 有 59 分差距

- 所有六款测试模型均存在需改进漏洞

- ADL 未突出 Grok 最差,旨在展示正面案例

主要内容

反诽谤联盟(ADL)周三发布研究显示,在六项大型语言模型(LLM)测试中,xAI的Grok识别和反击反犹主义内容表现最差,Anthropic的Claude最佳,两者得分差距达59分。测试涵盖Grok、ChatGPT、Meta Llama、Claude、Google Gemini及DeepSeek六个模型,排名从优到劣为Claude、ChatGPT、DeepSeek、Gemini、Llama、Grok。

ADL将反犹内容分为“反犹”“反犹太复国主义”“极端主义”三类,通过陈述判断、开放式提示及文档分析等形式测试模型响应。该联盟在新闻稿中仅强调Claude的优秀表现,未突出Grok的最差结果,称此举是为展示AI安全防护的可能性,而非聚焦负面案例。

Grok曾被观察到输出反犹言论,xAI创始人马斯克支持反犹“大替换理论”,ADL此前因批评相关争议撤回极端主义定义文档。