近日,Anthropic 公司發布了一種新的方法,用于評估其聊天機器人 Claude 在政治問題上的響應是否公正中立。該公司表示,Claude 在回答政治相關問題時應避免沒有證據的政治主張,旨在防止其被視為偏向保守或自由派。
Claude 的表現受系統提示和獎勵機制的影響,特別是獎勵那些被認為是中立的回答。這些中立回答中可能包含有關尊重 “傳統價值觀和制度重要性” 的內容,顯示出該公司試圖讓 Claude 更符合美國當前的政治需求。
根據報告,Gemini2.5Pro 被評為最中立的 AI,得分高達97%,而 Claude Opus4.1則以95% 的得分緊隨其后。其他模型如 Sonnet4.5、GPT-5、Grok4和 Llama4的評分也相對較高,但仍低于 Claude。盡管 Anthropic 在其博客中未明確提到,但這一測試方法的推出很可能與特朗普政府的政策有關,該政策要求聊天機器人不得展現 “覺醒”(woke)現象。同時,OpenAI 也在將其 GPT-5模型調整至相似的方向,以滿足美國政府的要求。
值得一提的是,Anthropic 將其測試方法以開源的形式發布在 GitHub 上,方便其他開發者和研究人員使用和評估。


產品與服務
聯系站長
關于我們