聊天机器人正困扰着我的浏览器

2025-07-22

新闻要点

OpenAI 上周发布 ChatGPT Agent，可在网页运行搜索和任务。作者测试发现其执行任务易出错，护栏不一致，还可能影响数字广告市场。若精准度提升，或改变互联网生态。

- ChatGPT Agent执行任务常出错护栏不一致

- 此类AI浏览器或冲击数字广告市场

- AI浏览器若普及或改变互联网生态

主要内容

多数人的浏览器标签页都被未读的新闻文章填满，而我的标签页则被 AI 代理和幽灵点击填满。我已经打开了四个 OpenAI 的 ChatGPT 代理实例——上周发布的生成式 AI 工具，它可以在网上进行搜索和执行任务——每个都在自己的标签页中运行。我根据 ChatGPT 的建议给这前四个代理分配了相对简单的任务，一个是在 Target 网站上四处点击寻找生日礼物，另一个是生成关于机器狗的演示文稿。

我打开了第五个标签页来尝试更具实验性的东西：我想看看这个 ChatGPT 代理在国际象棋方面有多厉害。输入一些指令后，我看到一个幽灵般的光标在屏幕上漂浮，ChatGPT 代理前往 Chess.com 并与在线对手下棋，所有这些都在一个虚拟浏览器中进行。但事情很快就变得糟糕起来，不是游戏策略让 AI 工具出错，而是移动棋子的动作实际上被证明是最困难的。代理在其内部日志中表示：“尽管之前有误点击，但我在继续下棋时专注于准确定位。”最终它退出并告诉我控制太难操作了。

在过去的几年里，浏览器开发者将 AI 工具集成进来，取得了中等程度的成功。不过，最近几周，随着 OpenAI 的 ChatGPT 代理和 Perplexity 的 Comet 的发布，内置生成式 AI 聊天机器人增强的网络浏览器的想法再次兴起。这两个发布在执行方式上有很大不同，Comet 是一个独立的浏览器，你可以用它上网，然后召唤 AI 助手帮助写邮件或完成琐碎的杂务。OpenAI 在聊天机器人内部构建了其浏览工具，你通过网络界面与聊天机器人交谈给它任务，然后机器人在你的浏览器内部运行自己的虚拟浏览器来完成它们。

这两个发布都可以控制光标、输入文本和点击链接。如果这种趋势流行起来，这些 AI 驱动的浏览器可能会将互联网变成一个幽灵城镇，代理四处乱窜，人类很少涉足。尽管 AI 热潮持续，但我对 OpenAI 的 ChatGPT 代理的初步印象是，这个有故障的功能目前似乎只是一个概念验证，而不是完全成熟的发布。在执行我给它的各种任务时，ChatGPT 代理经常点击错误或因其他错误而慌乱。此外，它的限制似乎不一致，虽然一些明确的提示请求，如让它获取色情视频或“找到一个假阳具”，被代理拒绝，但 ChatGPT 在一个成人玩具 X 级网站上花费 18 分钟寻找完美的“c 形环”：“我已经收集了 10 个金属阴茎环的细节，包括各种价格和特点。”

我不禁想知道这种浏览互联网的方式可能会如何进一步掏空数字展示广告市场，这个业务已经在挣扎。我的代理跳过了从租车到房地产投资的所有广告。如果你没有实时观察代理点击，你可以事后观看回放，看到在 AI 工具控制浏览器期间出现的所有内容，包括广告。当这个新兴功能充满错误时，用户快速浏览回放是有道理的。但如果 AI 代理的准确率随着时间的推移而提高，那么更少的人会觉得有必要监视他们的代理，更少的人类会看到那些广告。到那时，很难想象广告商还会留下来。我越观看它的行动回放，这个代理给我的感觉就越不安和怪异——不是被理解，而是被模仿。就像一个痴迷的机器人跟踪者通过窗户观察人类，仔细记录他们如何使用网络以努力复制他们的行为。它能够做一个空洞的人类行为模仿，但不能完全理解。

聊天机器人正困扰着我的浏览器

新闻要点

主要内容

关于我们