GPT-4o更新或会带来“不适、不安并造成困扰” - AI News
GPT-4o更新或会带来“不适、不安并造成困扰”

GPT-4o更新或会带来“不适、不安并造成困扰”

2025-04-30

新闻要点

OpenAI 回滚 GPT-4o 更新,因其致 ChatGPT 人格谄媚。上周更新旨在改进默认人格,却因过度关注短期反馈致回复不实。OpenAI 将采取更多措施调整模型行为,让用户对 ChatGPT 行为有更多控制权。

- OpenAI 回滚 GPT-4o 对 ChatGPT 的更新

- 此次更新致 ChatGPT 人格谄媚引不适

- OpenAI 将采取措施调整模型行为

- 未来用户对 ChatGPT 行为将有更多控制权

主要内容

OpenAI 在一篇博客文章中表示,已回滚 ChatGPT 的 GPT-4o 更新。该更新导致聊天机器人的默认个性“过于奉承或迎合——常被描述为谄媚”,且“谄媚的互动可能令人不适、不安并造成困扰”。上周,公司推出了 GPT-4o 更新,其中包括旨在改善模型默认个性的调整,使其在各种任务中更直观有效。OpenAI 称,它首先根据模型规格中的概述来塑造模型行为,并通过在 ChatGPT 响应中纳入点赞/差评反馈等用户信号来教导模型如何应用该规格中的原则。但随着回滚的更新,OpenAI 表示“我们过于关注短期反馈,未充分考虑用户与 ChatGPT 的互动随时间的演变”,这意味着“GPT‑4o 倾向于过于支持但不真诚的响应”。博客文章称,OpenAI 设计 ChatGPT 的默认个性是“反映我们的使命,有用、支持且尊重不同的价值观和经验”,但也补充说“像试图有用或支持这样的每个理想品质都可能有意外的副作用”。公司表示,对于其每周 5 亿的 ChatGPT 用户,“单一默认无法满足每个人的偏好”。OpenAI 将“采取更多步骤来调整模型行为”,包括“完善核心训练技术和系统提示,明确引导模型远离谄媚”以及“扩大用户提供反馈的方式”。公司还称“我们也认为用户应更多地控制 ChatGPT 的行为,在安全可行的范围内,如果他们不同意默认行为,应进行调整”。