Alexa是如何工作的? 亚马逊虚拟助手背后的技术,解释说

带灯环的亚马逊 Echo Dot Alexa 扬声器 股票照片 1

埃德加·塞万提斯 / Android 权威

我们有很多关于在 Android Authority 上使用 Amazon Alexa 的指南,但您可能会对语音助手的底层技术感到好奇。 以下是 Alexa 工作原理的简要说明,从其整体结构到它如何听到和响应语音命令。

Alexa 的工作原理:概述

墙上的 Amazon Echo Show 15。

从用户的角度来看,Alexa 的基本组件是一个亚马逊账户和一个连接到互联网的支持 Alexa 的设备,通常是智能扬声器或显示器。 该帐户可让您构建配置文件、保存软件和硬件设置以及链接兼容的设备、服务和附件。 Alexa 设备监听语音命令,将它们上传到亚马逊服务器进行翻译,然后以音频或视频的形式提供结果。 某些型号还可用作兼容智能家居产品的 Thread 或 Zigbee 集线器。

所有语音命令都以唤醒词开头,告诉设备要听。 默认当然是“Alexa”,但使用 Android 或 iPhone/iPad 的助手应用程序,您可以将其更改为“亚马逊”、“计算机”、“Echo”或(在某些地区)“Ziggy”。 事实上,该应用程序实际上是第三个基础组件,因为它是设备设置和将事物链接到您的亚马逊帐户所必需的。

有很多很多可能的 Alexa 命令,所以我们不会在这里深入探讨,但这些是自然语言语音请求,涵盖从常识问题到媒体播放和智能家居控制的所有内容。 例如:

有些功能需要启用“技能”,无论是通过亚马逊网站还是 Alexa 应用程序。 以上面的命令为例,如果没有链接您的 Spotify 帐户的技能,中间的命令将无法工作,而恒温器控制将需要适当的品牌技能,例如 Ecobee 或 Nest。

Alexa 应用程序还启用了例程,这只是自动化的另一个词。 您可以在我们的例程指南中了解有关它们的更多信息。 简短的版本是它们是用户创建的,并根据语音命令或各种条件(例如位置、配件状态或一天中的时间)触发操作。 例如,当你说“Alexa,开始我的一天”时,一个早安例行程序可能会打开你的灯、播放 NPR 新闻并通过智能插头加热你的咖啡机。

要由 Alexa 控制,智能家居配件必须专门支持该平台,至少在通用的 Matter 标准于 2022 年秋季生效之前。不过,几乎可以使用任何类型的配件。 除了插头、恒温器和智能灯泡之外,您还可以获得从空气净化器到机器人吸尘器的所有物品。 无论它们是通过技能、线程还是 Zigbee 连接,它们都使用 Alexa 应用程序配对。

更多:如何使用亚马逊 Alexa

Alexa 是如何听到声音的?

带有智能家居控件的 Amazon Echo Show 8 侧面轮廓

Dhruv Bhutani / Android 管理局

虽然所有配备 Alexa 的设备都至少有一个麦克风,但在智能扬声器和显示器上通常是两个或更多。 这使得将语音与环境噪声分离变得更容易,因为它创建了可以通过信号处理算法进行比较和过滤的方向数据。 当然有有限的限制——你不能站在嘈杂的电视或洗碗机旁边,期望 Echo 扬声器能听懂。

与您可能被告知的相反,Alexa 不会不断记录您所说的一切。 它不断地听它的唤醒词,随后的音频(在你停止说话后结束)通常被发送到亚马逊进行解释。 我们这么说是因为亚马逊越来越多地推动离线处理。 但是,您需要配备公司 AZ Neural Edge 处理器的最新设备,例如第 4 代 Echo 或 Echo Show 10。 该功能还必须手动启用,设备仍会上传成绩单。

亚马逊表示,它会对上传的录音进行加密,但默认情况下会保存它们并分析匿名剪辑的“极小样本”以提高 Alexa 的性能。 录音已用于刑事案件,某些声音或短语可能会被误解为唤醒词 – 因此,如果您担心隐私,您将希望选择不保存或定期删除您的语音历史记录。 阅读我们的智能家居隐私指南以获取更多详细信息和比较。

另请参阅:如何设置 Alexa 以应对紧急情况

Alexa如何回应?

2020 年第四代 Amazon Echo Dot

直到最近,Alexa 完全依赖云的原因是自然语言处理的需求。 每个命令都被分解成单独的语音单元,称为音素,然后将这些单元与数据库进行比较,以找到最接近的单词匹配。 最重要的是,软件必须识别句子结构,以及与不同子系统相关的术语。 如果您说“将恒温器设置为冷却”,Alexa 知道将其转发到智能家居 API(应用程序编程接口)。

这是 Alexa 可以区分口音和方言的主要原因。 亚马逊支持的每种语言都有独特的数据库,包括地区变化,如果他们的设备没有预装它们,用户需要在 Alexa 应用程序中选择它们。 一位美国 Echo 演讲者不会开箱即用地理解德语,任何被要求听 Nachtmahr 歌曲的人都可以证明这一点。

机器学习扮演着同样重要的角色,因为上下文和历史让 Alexa 更好地猜测你的意图。 这就是为什么亚马逊如此投入分析来自现实世界客户的录音的原因。 人类倾向于使用上下文和历史来衡量对话中的含义,并且仅通过计算机逻辑,Alexa 可能会将诸如“播放 Chvrches (苏格兰合成流行乐队)的音乐”之类的内容解释为请求听教堂合唱团的音乐。 Alexa 可以而且确实会犯错误,但亚马逊拥有的海量数据意味着该助手会随着时间的推移而发展。

经常问的问题

Alexa 需要互联网连接吗?

有效。 虽然某些设备可能允许离线语音控制成交量和连接集线器的智能家居配件,或者检查和取消计时器和提醒等内容,但几乎所有其他事情都需要与亚马逊服务器和/或链接的第三方服务进行通信。 甚至可以在本地处理音频的设备仍在上传脚本。

Alexa 总是在听吗?

是的,假设您没有将设备的麦克风静音。 它需要对它的唤醒词做出反应。

但至关重要的是,它并没有记录所有内容。 仅在检测到唤醒词后才会触发录音,并在您停止说话(或者 Alexa 认为您有,无论如何)时结束。 如果您担心隐私,则需要选择不保存这些录音或定期删除语音历史记录。

Alexa算不算人工智能?

根据一些定义。 它能够学习和解决问题,例如解释尚未预先编程的语音命令。

也就是说,它没有显示出与人类或动物思维相同的灵活性或适应性。 你不能进行真正的对话,它的学习是渐进式的,而不是即时进行的。 它肯定离有知觉还差得很远,不管它有多么难以定义。

注释

资讯来源:由0x资讯编译自ANDROIDAUTHORITY。版权归作者Roger Fingas所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢