智东西 08-12
谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

编译 | 黄心如

编辑 | 李水青

智东西 8 月 9 日消息,谷歌于 8 月 6 日宣布,将推出基于 Gemini AI 的 Google Home 功能。随着 Google Home 获得强大的 AI 支持,Nest 智能音箱和显示器上的 Google Assistant 将于 2024 年晚些时候进行重大升级 Nest 摄像头也将在不久后具备识别和显示功能。

尽管聊天机器人往往更能引起关注,但生成式 AI 的确有潜力使智能家居变得更加直观和用户友好。亚马逊今年六月已公布了增强版 Alexa 的计划,而谷歌也在加紧步伐,承诺推出更智能、更强大的 Google Assistant。

一、 Google Home 引入 Gemini,智能摄像头等新功能即将上线

在下周(8 月 13 日)秋季硬件产品发布会之前,谷歌宣布了三项新的 Gemini 智能体验,这些功能将于今年晚些时候登陆 Google Home 平台。其中包括:

一项新的摄像头智能功能,它可以为 Nest 摄像头的视频片段自动生成描述性字幕;

一项自然语言输入功能,用于在 Google Home 里创建程序;

一个更智能的 Google Assistant,它将适用于 Nest 智能音箱和显示器,并且配备新的语音选项。

除了新语音选项之外,大多数这些功能都将通过 Google 的 Nest Aware 订阅付费提供—— Nest 摄像头的视频录制订阅起价为每月 8 美元(每年 80 美元)。这些功能将首先在 Google 的公共预览测试版计划中限量向 Nest Aware 订阅者推出,并将于明年扩展至更多用户。

在发布会前,Google Home 产品负责人 Anish Kattukaran 接受 The Verge 采访时提到,这只是谷歌智能家居平台迈向智能化新时代的开始," 这为 Google Home 的下一个时代铺平了道路 "。

▲以上是一个 Matter 控制器和 Thread 边界路由器组成的新智能家居中心(图源:Google Home)

二、Gemin 提升用户体验,但不取代 Google Assistant

这一更新对于长期受挫的 Google Home 用户来说是个好消息,许多用户已经厌倦了性能不足、设备老化的智能显示器,以及常用的功能被取消的困扰。此外,他们还经历了从 Nest 应用到 Google Home 应用的艰难过渡。本周推出的 Google TV Streamer 4K(Google Home 中心)和新的 Nest Learning Thermostat,加上更智能的 Google Assistant,预示着 Google 的智能家居生态系统正在改善。

Google Assistant 显然将继续存在。Google 并未将 Gemini 直接移植到 Nest 智能音箱和显示器上来控制智能家居,而是在幕后部署了 Gemini 智能。Kattukaran 解释道:"Gemini 是一个模型系列,我们正在针对 Google Home 的各项功能对其进行优化 "。

三、三大新功能实操展示,智能家居多方面发展

智能家居的发展不仅仅是技术功能的提升,同时也要注重在增强功能的同时保护用户的隐私和安全。下文将展示智能摄像头的新功能、家庭自动化的简化操作以及 Google Assistant 的升级和新声音技术。

1、自动生成字幕的摄像头安全警报

▲多模式 Gemini AI 可以理解摄像机捕捉到的画面和声音并生成描述动作的字幕(图源:Google Nest)

Google 正在为 Nest 摄像头引入 Gemini 智能,使其能够理解摄像头捕捉到的画面和声音,并向用户传递关键信息。这意味着,Google Home 之后将不仅仅发送有关某个人或包裹的警报,用户必须观看视频才能了解发生了什么,而直接添加摄像头所见内容的详细描述。这些模型将在云端专为用户的家庭数据进行学习和训练,随着时间推移,它们将变得越来越智能,更准确地了解用户家庭周围的动态。

Kattukaran 分享的一个例子是一段人从车上卸下杂货的视频,标题为:

停放在车库里的一辆黑色 SUV 旁边站着一个穿着休闲服装的年轻人,他提着购物袋,周围环境显得十分平静。

除了提供解释性细节外,视频标题还包含丰富的背景信息。这样不仅有助于用户查找录像,还可以帮助系统链接到其他自动化功能。例如,如果摄像头识别到动物并判断是 " 狗在花园里挖洞 ",系统可能会自动执行 " 打开洒水器 " 的操作。

▲用户将能够使用文本提示在 Nest 摄像机视频片段中搜索特定事件(图源:Google Home)

Google Home 的活动标签中将新增文本搜索视频的功能。例如,当用户的猫在天黑后偷偷溜出家时,这一功能将非常方便。用户可以直接搜索上次发现猫的时间,而无需逐个浏览所有标有动物的视频来寻找。

2、可解析自然语言的自动化程序

▲ Gemini 智能可以解析自然语言来创建复杂的智能家居自动化(图源:Google Home)

Google Home 应用程序新增的 " 帮我创建 " 功能允许用户描述希望发生的事情,例如 " 睡觉时锁门并关灯 ",系统会自动创建一个对应的执行程序。

用户需要通过手机上的 Home 应用程序进行文本或语音输入(目前此功能尚不支持通过 Nest 智能音箱操作),但 Kattukaran 指出,它将具备 Google Home 应用程序的所有现有功能。这包括所有当前的启动器、条件和操作,以及对连接到 Google Home 的所有设备的访问,包括支持 Matter 标准的设备。尽管这项功能不像谷歌的脚本编辑器那样精密,但它足够简单,能够让任何用户轻松创建自动化功能。

3、新增声线及自然交互的 Google Assistant

Google 正在为其 Google Assistant 推出新的声音选项。除了摄像头智能和更简便的自然语言输入之外,谷歌还提到将改进其 Google Assistant 的 " 核心体验 " ——例如在所有当前的 Nest 智能音箱和显示器上播放音乐和设置计时器。

此外,Google Assistant 将新增不同风格、语调和口音的声音选项。该公司发布了首个新声音选项的演示视频,这其中保留了女性的语调,但听起来更轻盈、更自然。

Google Assistant 不仅听起来更自然,也能进行更自然的互动。Kattukaran 说,它不需要特定的命令模式即可完成用户的需求,也能够处理停顿、" 嗯 " 和 " 啊 ",并回答后续问题。这与去年秋季亚马逊宣布的 Alexa 功能(尚未推出)类似。

Kattukaran 提到,新的 Google Assistant 将能够保留用户的对话背景,并逐渐学习和了解用户的家庭情况。他透露,由 Gemini 驱动的功能将依据谷歌的隐私原则,在云端为用户的家庭提供服务。

" 这个功能是根据用户家庭和数据模型量身定制的。我们在家用领域特意放慢了节奏,因为智能家居领域的容错率非常小,我们不希望出差池。" 他提到。而 Google Assistant 的目标是逐步了解用户的家庭情况,比如用户拥有的房间和设备,并在此基础上变得更加智能化。

结语:Gemini 助力 Google Home 升级,谷歌看好智能助手未来

这些变化旨在推动数字语音助手更接近谷歌及其竞争对手多年来一直努力实现的愿景:一个真正有用的数字助手。

" 当我们开始推出第一代助手时,我们承诺它会是像《杰森一家》里那样的家具智能助手,我们的愿景是打造一个超级有用的助手,可以主动帮助你解决问题," Kattukaran 说," 我们取得了很多进展,但之后就停滞不前了——不仅是我们,所有‘助手’都如此。我们遇到了技术瓶颈,不过随着大型语言模型和多模态语言模型的出现,这一瓶颈已经得到解决。"

正如 Kattukaran 指出的那样:" 家庭是一个庞然大物 ",它复杂而混乱,有多个角色和场景。对于人类来说,管理它已经不易,对计算机而言更是巨大的挑战。但亚马逊、谷歌和苹果似乎都在竞相打造一个未来,让我们的家庭拥有一个智能的、可感知情感的助手,从而回应我们的需求。

未来的进展如何,值得期待。

来源:The Verge

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

google 谷歌 智能音箱 智能家居 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论