日记大全

日记大全 > 句子大全

「专利解密」如何解决对话理解系统中语言歧义问题

句子大全 2023-12-25 05:41:01
相关推荐

集微网消息,微软的CORTANA软件和服务、谷歌的GOOGLE NOW软件和服务以及苹果的SIRI软件和服务中的个人助理软件都加入了对话理解系统。对话理解系统在这些软件中用来执行各种任务,例如:搜索执行、消息发送、行程安排等。

对话理解系统最重要的事情就是需要确定用户想要什么,也就是理解用户意图。

然而现实生活中总是存在着导致对话理解系统理解不正确的潜在输入源,例如:用户语音输入时,单词的读错,语音的发音问题,还有一词多义的情况。

目前,典型的解决方案就是在采取任何动作之前请求来自用户的反馈或确认。

上述这种方案常常让用户感觉对这些请求做出响应而乏味,所以如何能更好的解决语言输入歧义问题是一个难题。

微软公司于2019年4月26公布了一项名叫“解决歧义的对话理解系统”的专利(申请号:CN109690480A),这项专利给解决这类语言输入歧义的问题带来了福音。

微软设计的解决歧义的对话理解系统与用户交互示意图,如图1所示。

图1用户与解决歧义对话理解系统交互示意图

整个系统将根据用户输入的语言,判断用户意图,根据内部对输入语言的歧义值判断,不同的判定值系统将作出不同的响应以加深对用户的意图确信值。那么系统中的核心解决歧义的技术是什么呢?

解决歧义技术包括如图2所示的步骤:

具体步骤介绍如下:

1. 整个系统接收输入,输入可以是口头输入、文本输入或另一类型的输入。输入可以直接从用户接收或者由另外一个计算机设备发送。待解决歧义的对话理解系统接收到输入后需要对输入进行预处理,如果是语音的话需要执行语音自动识别,来识别出语音输入中的单词。

2. 对输入进行初步的预处理工作后,紧接着需要基于已预处理好的输入来标识动作,主要包括执行:文本的语言理解,知识检索,以及任务状态管理。

3. 操作(506)确定是否存在于输入或所标识的代理动作相关的歧义。

此部分的关键模块是歧义分数的计算。歧义分数的计算与多个因素相关:自动语音识别生成语言文本的置信度分数、语言理解引擎中语言建模的似然分数、语言理解语义分数、后知识检索上下文更新情况、相同过程中先前表达的关系和指示关于结果的潜在语义。在计算好歧义分数后,将歧义分数与特定阈值进行比较来进行判断是否有歧义。

4. 如果确定有歧义,则进行操作[508],对标识的动作的后果进行评估以获得危害性,危害性可以被评估为定量或定性分数。危害性涉及不正确地执行所标识的代理动作的后果的严重性。

5.如果没有歧义,则进行代理动作的执行。

纵观整个解决歧义的对话理解系统的流程,发现歧义分数计算是整个系统的核心部分,而影响歧义分数的计算因素又是比较多的,这就需要定义好影响因素,但是随着人工智能的发展,寻求多个因素之间的关系的算法模型日趋成熟,足以应对此种情况。

通过微软的这些专利技术,着实可以避免每次采取动作前都需要反复寻求客户确定所带来的问题,这样既方便了用户也成功的解决了对话理解系统的歧义问题。(校对/诗诗)

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新