AI 模式现可通过图像查看和搜索 - AI News
AI 模式现可通过图像查看和搜索

AI 模式现可通过图像查看和搜索

2025-04-07

新闻要点

Google 为 AI Mode 增添多模态能力,能“看”图作答,即日起在安卓和 iOS 版 Google 应用可用,还向美国数百万 Labs 用户开放 。

- Google 为 AI Mode 增多模态能力,结合 Gemini AI 与图像识别技术

- 新增功能通过“扇出技术”提供精准且有上下文的回答

- AI Mode 从面向付费用户扩展至美国数百万 Labs 用户

主要内容

谷歌正在为其以搜索为中心的 AI 模式聊天机器人添加多模态能力,使其能够“看到”并回答关于图像的问题,同时将 AI 模式的访问范围扩大到“数百万更多”的用户。
此更新将 Gemini AI 的定制版本与公司的 Lens 图像识别技术相结合,允许 AI 模式搜索用户拍摄或上传图片,并获得关于其内容的“丰富、全面的回复及链接”。
AI 模式的多模态更新今日开始可用,可在安卓和 iOS 的谷歌应用中访问。谷歌搜索产品副总裁 Robby Stein 表示:“AI 模式基于我们多年在视觉搜索方面的工作,并将其推进了一步。凭借 Gemini 的多模态能力,AI 模式可以理解图像中的整个场景,包括物体之间的关系及其独特的材料、颜色、形状和排列的上下文。”
谷歌称,该更新使用“扇出技术”,对其看到的图像及其内的任何物体发出多个查询,以提供“极其细微且与上下文相关”的回复。这使其能够识别图像中展示的书籍,为具有好评的类似书籍提供建议,并回答问题以进一步整理推荐。
搜索的 AI 模式是谷歌对 Perplexity 和 ChatGPT Search 的回应,这是一种类似聊天机器人的体验,通过从谷歌搜索索引中的所有内容中提取 AI 生成的摘要来回答查询。上个月,AI 模式仅为 Google One AI Premium 订阅者推出,仅在实验室中可用。现在,谷歌表示已开始在美国向“数百万更多”的实验室用户提供 AI 模式,而不仅仅是付费的 AI Premium 订阅者。