Google 正在加速将其 Gemini 模型的能力融入核心产品线。
Google 周五宣布,正式向 Google 翻译引入其 Gemini 模型的各项能力。此次更新不仅带来了能够通过耳机进行的实时语音翻译 Beta 版体验,还大幅提升了文本翻译的语境理解能力,并扩展了应用内的语言学习工具。
Google 还通过 Google Labs 推出了一款名为「Disco」的实验性浏览器,试图用 AI 重构网页浏览体验。
谷歌宣布,Google Translate 正在推出一项基于 Gemini 模型的全新 Beta 功能,允许用户通过耳机收听实时翻译。

与以往仅限于 Pixel Buds 的独占功能不同,此次更新支持任何品牌的耳机。该功能旨在将佩戴耳机的用户设备变成一个实时的单向翻译工具。根据谷歌产品管理副总裁 Rose Yao 的介绍,这项功能不仅能翻译语言,还能保留说话者的语调、重音和节奏,从而让对话更加自然,也更容易区分不同的发言者。
无论是跨语言对话、在国外听讲座,还是观看外语影视作品,用户只需打开 App 点击「Live Translate」即可使用。
目前该 Beta 版本已在 Android 端的 Translate 应用中上线,支持超过 70 种语言。谷歌计划在 2026 年将该功能扩展至 iOS 平台及更多国家。
除了语音功能,Google 还利用 Gemini 模型的高级能力重构了文本翻译体验。新的翻译引擎在处理俚语、成语或具有本地特色的表达时,能够更智能地解析上下文,而非进行生硬的逐字翻译。
Google 举例称,在翻译英语成语「stealing my thunder」(抢风头/抢功劳)时,Gemini 不会给出字面意思的翻译,而是根据语境捕捉其真实含义,生成更符合目标语言习惯的译文。
这一改进即日起在美国和印度推出,支持英语与近 20 种语言(包括中文、日语、德语、阿拉伯语和西班牙语)之间的互译。用户可通过 Android、iOS 应用及网页版体验。
另外,Google 还在进一步完善其翻译应用中的语言学习功能,使其更接近专业的语言学习软件(如 Duolingo)。

语言学习工具现已扩展至近 20 个新国家/地区。英语使用者现在可以练习德语和葡萄牙语。孟加拉语、简体中文、荷兰语、德语、印地语、意大利语、罗马尼亚语和瑞典语使用者可以练习英语。
新增了基于口语练习的改进型反馈机制,以及「连胜打卡(Streak)」功能,记录用户连续学习的天数,以激励用户保持学习习惯。
在翻译工具之外,谷歌 Chrome 团队在 Google Labs 推出了一个更具前瞻性的实验项目:Disco(意为 Discovery)。这是一款全新的浏览器,其核心概念是「GenTabs」(生成式标签页)。

什么是 GenTabs?不同于传统浏览器单纯展示网页,或目前主流 AI 浏览器仅提供文本摘要,Disco 试图通过 Gemini 3 模型将信息转化为「微型应用」。
当用户输入需求(例如「计划一次日本旅行」)时,Disco 不仅会打开相关的网页标签,还会根据这些网页的内容和用户的对话,自动生成一个包含地图、行程表和链接的交互式界面。

这是一个「浏览器中的浏览器」。GenTabs 是动态的,如果用户打开了新的相关网页,GenTabs 会自动抓取新信息并更新到交互界面中。
Chrome 团队负责人 Parisa Tabriz 强调,Disco 并非旨在取代 Chrome,也不是要「吃掉」网页流量。相反,它鼓励用户打开真实网页作为 AI 的「锚点」,形成用户浏览网页与 AI 整理信息之间的良性循环。
目前,Disco 作为一个实验性项目,已开放 macOS 版本的等待名单。
文章来自于微信公众号 “机器之心”,作者 “机器之心”
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales