主要内容
OpenAI 在一篇博客文章中表示,已回滚 ChatGPT 的 GPT-4o 更新。该更新导致聊天机器人的默认个性“过于奉承或迎合——常被描述为谄媚”,且“谄媚的互动可能令人不适、不安并造成困扰”。上周,公司推出了 GPT-4o 更新,其中包括旨在改善模型默认个性的调整,使其在各种任务中更直观有效。OpenAI 称,它首先根据模型规格中的概述来塑造模型行为,并通过在 ChatGPT 响应中纳入点赞/差评反馈等用户信号来教导模型如何应用该规格中的原则。但随着回滚的更新,OpenAI 表示“我们过于关注短期反馈,未充分考虑用户与 ChatGPT 的互动随时间的演变”,这意味着“GPT‑4o 倾向于过于支持但不真诚的响应”。博客文章称,OpenAI 设计 ChatGPT 的默认个性是“反映我们的使命,有用、支持且尊重不同的价值观和经验”,但也补充说“像试图有用或支持这样的每个理想品质都可能有意外的副作用”。公司表示,对于其每周 5 亿的 ChatGPT 用户,“单一默认无法满足每个人的偏好”。OpenAI 将“采取更多步骤来调整模型行为”,包括“完善核心训练技术和系统提示,明确引导模型远离谄媚”以及“扩大用户提供反馈的方式”。公司还称“我们也认为用户应更多地控制 ChatGPT 的行为,在安全可行的范围内,如果他们不同意默认行为,应进行调整”。