AI 模式现可通过图像查看和搜索

2025-04-07

新闻要点

Google 为 AI Mode 增添多模态能力，能“看”图作答，即日起在安卓和 iOS 版 Google 应用可用，还向美国数百万 Labs 用户开放。

- Google 为 AI Mode 增多模态能力，结合 Gemini AI 与图像识别技术

- 新增功能通过“扇出技术”提供精准且有上下文的回答

- AI Mode 从面向付费用户扩展至美国数百万 Labs 用户

主要内容

谷歌正在为其以搜索为中心的 AI 模式聊天机器人添加多模态能力，使其能够“看到”并回答关于图像的问题，同时将 AI 模式的访问范围扩大到“数百万更多”的用户。
此更新将 Gemini AI 的定制版本与公司的 Lens 图像识别技术相结合，允许 AI 模式搜索用户拍摄或上传图片，并获得关于其内容的“丰富、全面的回复及链接”。
AI 模式的多模态更新今日开始可用，可在安卓和 iOS 的谷歌应用中访问。谷歌搜索产品副总裁 Robby Stein 表示：“AI 模式基于我们多年在视觉搜索方面的工作，并将其推进了一步。凭借 Gemini 的多模态能力，AI 模式可以理解图像中的整个场景，包括物体之间的关系及其独特的材料、颜色、形状和排列的上下文。”
谷歌称，该更新使用“扇出技术”，对其看到的图像及其内的任何物体发出多个查询，以提供“极其细微且与上下文相关”的回复。这使其能够识别图像中展示的书籍，为具有好评的类似书籍提供建议，并回答问题以进一步整理推荐。
搜索的 AI 模式是谷歌对 Perplexity 和 ChatGPT Search 的回应，这是一种类似聊天机器人的体验，通过从谷歌搜索索引中的所有内容中提取 AI 生成的摘要来回答查询。上个月，AI 模式仅为 Google One AI Premium 订阅者推出，仅在实验室中可用。现在，谷歌表示已开始在美国向“数百万更多”的实验室用户提供 AI 模式，而不仅仅是付费的 AI Premium 订阅者。

AI 模式现可通过图像查看和搜索

新闻要点

主要内容

关于我们