主要内容
谷歌将为其 AI 助手 Gemini Live 带来一系列新功能,你可以与它进行实时对话。下周,在共享摄像头时,Gemini Live 能直接在屏幕上突出显示事物,这使 AI 助手更易指出特定物品。例如,若你在为项目寻找合适工具,可将智能手机摄像头对准一堆工具,Gemini Live 会在屏幕上突出正确的那个。此功能将在 8 月 28 日发布的新款 Pixel 10 设备上可用。谷歌将同时开始向其他安卓设备推出视觉引导,之后数周将扩展至 iOS。
谷歌还推出新集成,不久后 Gemini Live 能与更多应用交互,包括 Messages、Phone 和 Clock。比如你正在与 Gemini 讨论前往目的地的路线,却意识到要迟到了,谷歌称你可打断聊天机器人,如“这条路线看起来不错。现在给 Alex 发消息说我要迟到约 10 分钟”,然后谷歌可为你起草短信。
最后,谷歌为 Gemini Live 推出更新的音频模型,称将“大幅提升”聊天机器人“使用人类语音关键元素,如语调、节奏和音高”的能力。不久后,Gemini 将根据你谈论的内容改变语调,如询问有压力的话题时使用更平静的声音。你还能改变 Gemini 的语速快慢,这有点类似用户现在可调整 ChatGPT 语音模式的风格。而且,如果你让 Gemini 从特定角色或历史人物的角度戏剧性地重述一个故事,聊天机器人可能会采用一种口音以呈现“丰富、吸引人的叙述”。