日记大全

日记大全 > 句子大全

一不小心就变人工智障的语音助手(究竟是未来还是鸡肋)

句子大全 2023-01-28 03:01:01
相关推荐

相信iPhone用户都知道“嘿,siri。”这句话。这句话你有多久没用过了?

人工智能给我们带来了更多的好处,手机的语音助手就是其中最为典型、最为人所知的应用。

随着时间的推移,围绕着它的讨论,也一直没有休止。语音助手究竟是未来,还是鸡肋?

语音助手正式进入大众的视野,正式大规模商用还得追溯到2011年iPhone4s搭载的siri。随后各厂家都涌入了这一领域,包括微软、谷歌、亚马逊、三星等等巨头都研发出了自己的语音助手。

国内厂家当然也不示弱。我们熟悉的小爱同学、jovi、Breeno、YOYO、小艺都是语音助手的典型代表。用语音指挥设备可以说代表了几十年前人们对于现代的想象,相关的素材在很多科幻电影中比比皆是。

现在这个想法已经基本被实现,我们可以很轻松的借助智能音箱实现一系列诸如开关空调、开启电视、打开窗帘等操作,当然,这一切的前提是要有一套智能家居。

那么语音助手是如何听懂我们讲话的?

语音助手的工作大体可以拆分为两部分。语音识别和语义分析。虽然目前的语音助手多种多样,但是他们都遵循着相似的工作逻辑。

首先是语音识别,简单来说就是语音转文字。当用户发出(说出)指令后,手机会通过麦克风收集声音的模拟信号,经过降噪等一系列处理后,转化为数字信号并发送到云端,然后通过云端的服务器,结合大量声学模型,对模拟信号进行分析,最终输出为文本。这里的难点在于精确度和对复杂句式的识别。

由声音转文字只是第一步,还要让设备理解人说的话,这一步就称之为自然语言理解,这也是语音产品的难点。云端服务器会对句子进行分析,分析方式多种多样,既有关键词匹配,也有更复杂的语法分析。得出句子的意思后,在搜索相关的解决方案。这里需要结合大量机器学习才能帮助设备更好地推断出句子的真实含义。对句义进行初步解析后,设备会判断用户是否提供了足够的信息,如果已经足够,就会给出相关的文字反馈,然后将文字转为语音反馈给用户。如果不够,语音助手就会进行多轮对话,以补充不足的信息,直到信息足够为止。

语音助手听起来确实非常美好,他把原本需要多个步骤的动作简化到一句话即可完成,尤其是在一些无法亲自操作的场景下,语音助手无疑为我们提供了很大的便利。当然,如果他真的有那么完美也不会有鸡肋这种说法,我们再来看一看它的不足之处。

首先语音助手毕竟属于人工智能范畴,十分依赖深度学习,这也就决定了他不能像人类那样理解句子的含义,再碰到一些没见过的用法或者一些复合句式,机器在语义的理解上就会遇到一些困难。比如你可以尝试一下,让语音助手同时完成两项任务,很大几率只能完成一项任务或者理解错误。这里也可以大致推断,语音助手并非如同人一样能弄清句子的前后逻辑。因此,目前的语音助手多数时间还是只能操作一些相对比较简单直观的操作。

其次,语音助手的可实现场景有限。虽然语音助手可以帮助我们完成一部分工作,但顾及到隐私等原因,你在地铁上就不可能旁若无人地使用语音助手。锤子的TNT就是一个明显的例子,这就在一定程度上局限了应用的场景,有碍他的进一步推广。虽然语音助理目前仍有其局限性,但是随着语音识别和语言处理的技术进一步发展,语音助手在识别的准确度和反馈能力后续还有巨大的提升空间。结合物联网、智能家居等产业的发展,语音助手未来必然有更多的应用场景。或许还能带动一波智能生态的发展。

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新