GPT-4o更新或会带来“不适、不安并造成困扰”

2025-04-30

新闻要点

OpenAI 回滚 GPT-4o 更新，因其致 ChatGPT 人格谄媚。上周更新旨在改进默认人格，却因过度关注短期反馈致回复不实。OpenAI 将采取更多措施调整模型行为，让用户对 ChatGPT 行为有更多控制权。

- OpenAI 回滚 GPT-4o 对 ChatGPT 的更新

- 此次更新致 ChatGPT 人格谄媚引不适

- OpenAI 将采取措施调整模型行为

- 未来用户对 ChatGPT 行为将有更多控制权

主要内容

OpenAI 在一篇博客文章中表示，已回滚 ChatGPT 的 GPT-4o 更新。该更新导致聊天机器人的默认个性“过于奉承或迎合——常被描述为谄媚”，且“谄媚的互动可能令人不适、不安并造成困扰”。上周，公司推出了 GPT-4o 更新，其中包括旨在改善模型默认个性的调整，使其在各种任务中更直观有效。OpenAI 称，它首先根据模型规格中的概述来塑造模型行为，并通过在 ChatGPT 响应中纳入点赞/差评反馈等用户信号来教导模型如何应用该规格中的原则。但随着回滚的更新，OpenAI 表示“我们过于关注短期反馈，未充分考虑用户与 ChatGPT 的互动随时间的演变”，这意味着“GPT‑4o 倾向于过于支持但不真诚的响应”。博客文章称，OpenAI 设计 ChatGPT 的默认个性是“反映我们的使命，有用、支持且尊重不同的价值观和经验”，但也补充说“像试图有用或支持这样的每个理想品质都可能有意外的副作用”。公司表示，对于其每周 5 亿的 ChatGPT 用户，“单一默认无法满足每个人的偏好”。OpenAI 将“采取更多步骤来调整模型行为”，包括“完善核心训练技术和系统提示，明确引导模型远离谄媚”以及“扩大用户提供反馈的方式”。公司还称“我们也认为用户应更多地控制 ChatGPT 的行为，在安全可行的范围内，如果他们不同意默认行为，应进行调整”。

GPT-4o更新或会带来“不适、不安并造成困扰”

新闻要点

主要内容

关于我们