CN101292282A - 支持自然语言人机交互的移动系统和方法 - Google Patents

支持自然语言人机交互的移动系统和方法 Download PDF

Info

Publication number
CN101292282A
CN101292282A CNA200680038560XA CN200680038560A CN101292282A CN 101292282 A CN101292282 A CN 101292282A CN A200680038560X A CNA200680038560X A CN A200680038560XA CN 200680038560 A CN200680038560 A CN 200680038560A CN 101292282 A CN101292282 A CN 101292282A
Authority
CN
China
Prior art keywords
voice
mobile device
user
module
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200680038560XA
Other languages
English (en)
Other versions
CN101292282B (zh
Inventor
C·威德尔
R·肯尼威克
M·肯尼威克
P·迪克里斯图
R·A·肯尼威克
S·米纳克
L·E·阿姆斯特隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
VoiceBox Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=37805456&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101292282(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceBox Technologies Corp filed Critical VoiceBox Technologies Corp
Publication of CN101292282A publication Critical patent/CN101292282A/zh
Application granted granted Critical
Publication of CN101292282B publication Critical patent/CN101292282B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

提供一种包括用于远程信息处理应用的基于语音的接口(136)和基于非语音的接口(114,155)的移动系统。该移动系统识别和使用上下文、先验信息、领域知识和用户特定的简档数据为提交多个领域中的请求和/或命令的用户实现自然环境(106,108,110,112)。本发明创建、存储并使用关于每个用户的详尽的个人简档信息(110),从而改进确定上下文和呈现特定问题或命令的预期结果的可靠性。本发明可将领域特定行为和信息组织到可通过广域网分布和更新的代理(110)中。

Description

支持自然语言人机交互的移动系统和方法
技术领域
本发明提供具有语音接口和/或语音接口和非语音接口的组合以使得能够实现自然语言人机交互的移动装置。更具体地讲,本发明使得移动用户能够提交宽范围领域内的自然语言语音和/或非语音问题或命令。所述移动装置被构造为以自然的方式呈现答复。
背景技术
远程信息处理系统为将人-计算机接口引进移动环境的系统。传统的计算机接口使用键盘、键区、点击技术和触摸屏显示器的一些组合。至少部分由于交互速度和固有的危险和干扰而导致这些传统的接口技术通常不适合于移动环境。因此,在许多远程信息处理应用中采用语音接口。
然而,已证明创建适合于在移动环境中使用的自然语言语音接口是很困难的。通用远程信息处理系统应该适应来自宽范围领域的和来自许多用户的具有各种偏好和需要的命令和请求。此外,多个移动用户可能经常同时想使用这样的系统。最后,大多数移动环境相对有噪声,这使得语音识别从本质上讲就很难。
以自然的方式对本地信息和网络在线信息进行检索和对命令进行处理在任何环境中仍然是一个困难的问题,尤其是在移动环境中。对人类交互的认知研究表明,口头交流,例如问问题或给出命令的人,典型地极其依赖于上下文和目标人的领域知识。相反,基于机器的请求(请求可以是问题、命令和/或其它类型的交流)可能被高度结构化,并且从本质上讲可能对人类用户不自然。因而,口头交流和从口头交流提取的请求的机器处理可能根本上是不相容的。然而,允许人类发出基于自然语言语音的请求的能力仍然是期望的目标。
已对自然语言处理和语音识别的多个领域进行了研究。语音识别已在准确度方面得到了稳定的改进,目前,语音识别已成功地用在宽广范围的应用中。以前自然语言处理应用于语音查询的解析。然而,已研发了非常有限数量的这样的系统,这些系统为用户提供完整的环境,以在移动环境中发出自然语言语音请求和/或命令,并接收自然发声的答复。对于创建完整的自然语言口头的和/或基于文本的查询和答复环境,仍存在许多重要的障碍。
大多数自然语言请求和命令的定义不完整的事实对自然语言查询-答复交互是重要的障碍。此外,仅可关于以前的问题的上下文、领域知识或用户的兴趣和偏好的历史对一些问题进行解释。因而,可能不容易将一些自然语言问题和命令变换为机器可处理的形式。使这个问题更复杂的是,许多自然语言问题可能是有歧义的或者主观的。在这些情况下,机器可处理的查询的形成和自然语言答复的返回最难。
甚至,一旦问题被问出、解析和解释,机器可处理的请求和命令就必须被明确表达。根据问题的性质,可能不存在返回让人满意的答复的简单的请求集合。可能需要发起几个请求,甚至这些请求可能需要被链接或级联以实现完整的结果。此外,没有单个可用的源可包括所需要的整个结果集合。因而,可能需要将可能具有几个部分的多个请求放入位于本地或远程的多个数据源。不是所有的这些源和请求可返回有用的结果,或者根本就不返回任何结果。
在移动环境中,无线通信的使用可进一步减少请求将是完整的或者将返回成功的结果的机会。返回的有用结果通常被嵌入在其它信息中,并且可能需要从这些信息提取这些有用的结果。例如,通常需要从文本串、表格、列表、页面或者其它信息中的大量其它信息“积攒”几个关键词或数字。同时,可能需要去除其它非必要的信息诸如图形或图片以处理语音答复。在任何情况下,应该对多个结果进行评估并组合这些结果以形成最佳的可能的答案,即使在一些请求没有返回有用的结果或完全失败的情况下也要如此。在问题有歧义或者结果在本质上主观的情况下,确定要呈现的最佳结果是个复杂的过程。最后,为了维持自然交互,应该将答复快速地返回给用户。在保持实时性能的同时对复杂的不确定的请求进行管理和评估是个重要的挑战。
这些缺点和其它缺点存在于现有系统中。
发明内容
本发明克服现有的远程信息处理系统的这些缺点和其它缺点。
根据本发明的一方面,提供基于语音和基于非语音的系统,这些系统应命令行动并检索信息。本发明使用上下文、先验信息、领域知识和用户特定的简档数据来为提交多个领域中的请求和/或命令的用户实现自然环境。在所述过程中的每一步,可包容完全失败或部分失败和适度的恢复。在所述过程的几个阶段,可通过使用概率和模糊推理来实现对部分失败的鲁棒性。该对部分失败的鲁棒性增进了对问题和命令的自然答复的感觉。
根据本发明的另一方面,可将交互式自然语言系统(这里,“系统”)并入移动装置,或者可经由有线或无线连接使该系统连接至移动装置。移动装置可通过有线或无线链接与计算机或其它电子控制系统建立接口。移动装置还可独立于移动结构操作,并可通过无线局域连接、广域无线连接或者通过其它通信链接将所述移动装置用于远程控制装置。
根据本发明的一方面,可将这样的软件安装到移动装置上,所述软件包括:输入模块,捕捉用户输入;解析程序,对输入进行解析;文本至语音引擎模块,将文本转换为语音;网络接口,使得所述装置能够与一个或多个网络建立接口;非语音接口模块;事件管理程序,管理事件;和/或其它模块。在一些实施例中,事件管理程序可与上下文描述语法、用户简档模块、个性模块、代理模块、更新管理程序和一个或多个数据库通信,用户简档模块使得用户简档能够被创建、修改和/或访问,个性模块使得各种个性能够被创建和/或使用。将理解,可在移动装置、附到移动结构的计算机、桌面计算机或服务器之间以任何方式分布这个软件,而不改变本发明的功能、特征、范围或意图。
根据本发明的一方面,所述系统可包括语音单元接口装置和计算机装置或系统,语音单元接口装置从用户接收口述的自然语言请求、命令和/或其它话语,计算机装置或系统从语音单元接收输入,对该输入进行处理,并用自然语言语音答复来答复用户。
根据本发明的另一方面,可通过有线或无线连接使所述系统与一个或多个其它系统建立接口。所述其它系统可自己将其分布在附到移动结构或者位于移动结构外部的电子控制器或计算机之间。所述其它系统可包括电子控制系统、娱乐装置、导航仪器、测量仪器或传感器或者其它系统。还可为外部系统提供这样的特征,包括支付系统、急救辅助网络、远程定货系统、自动或参与型顾客服务功能或其它特征。
根据本发明的另一方面,可在装置网络中部署所述系统,所述装置共享代理、数据、信息、用户简档、历史或其它组件的共用库。每个用户可在所述网络上配备有移动装置的任何位置与相同的服务和应用交互,并接收这些服务和应用。例如,可在遍及家里、营业地点、车辆或其它位置的不同位置放置多个移动装置。在这样的情况下,所述系统可将用户对其说话的特定装置的位置用作所问的问题的上下文的一部分。
根据本发明的一个实施例,可在移动装置执行处理。可现场处理命令以使得移动装置能够控制它们自己和/或控制其它移动装置、固定计算机、移动电话和其它装置。另外,移动装置可跟踪上下文。
根据本发明的一个实施例,可提供在多模式交互期间维护上下文信息的基础架构,所述多模式交互诸如语音和/或非语音交互。根据本发明的一个示例性实施例,可通过在移动装置或多模式装置和所述系统之间提供通信信道来在多模式环境中维护上下文信息。所述通信信道允许所述系统接收多模式输入,诸如基于文本的命令和问题和/或基于声音的命令和问题。根据本发明的另一实施例,所述多模式输入可包括作为命令或问题而接收的文本串,诸如关键词。根据本发明的又一实施例,所述系统可使移动装置和基于语音的单元之间的上下文同步。为了将答复发送到对应的移动装置,所述系统可跟踪源,并将答复发送到对应的语音接口或非语音接口。
根据本发明的可替换实施例,可使用上下文管理程序来维护上下文信息,可对上下文管理程序进行集中定位以从多个移动装置接收输入并将输出提供给多个移动装置。根据一个实施例,与上下文管理程序通信的移动装置可通过注册模块注册,并可预订一个或多个事件。根据本发明的另一实施例,上下文管理程序可接收例如上下文XML表单的输入。可通过上下文跟踪模块向其它注册的移动装置通知上下文改变,以使得在注册的模块之间的上下文能够同步。根据本发明的一个实施例,可添加注册的模块或者从所述系统去除注册的模块。注册的模块可包括多模式装置所特有的动态链接库(DLL)或其它信息源。
根据本发明的又一可替换实施例,可从以文本格式呈现的命令或请求和/或作为话语呈现的命令或请求确定上下文信息,并使用多通道自动语音识别模块对上下文信息进行处理,多通自动语音识别模块将话语转录为文本。可将所述命令或请求与上下文描述语法进行比较以识别匹配。可对照所述命令或请求对上下文描述语法中的任何活动语法进行评分,并可将最佳的匹配发送给答复产生器模块。可将代理与对应的答复产生器模块相关联,代理可检索用于产生答复的请求的信息。代理可更新上下文堆栈以使得能够实现后续请求。
根据本发明的另一实施例,移动装置可被构造为允许将对象的口语注解存储在其上。移动装置可将口语注解转录给文本,并将文本注解与对象一起存储。可替换地,移动装置可被构造为使得用户能够手动输入与对象一起存储的文本描述。根据本发明的一个实施例,可对文本注解和/或文本描述进行分类和搜索。在可替换的实施例中,移动装置可对口语注解而不是文本注解进行分类和搜索。然而,对口语注解进行分类和搜索可能比对文本注解和/或文本描述进行分类和搜索困难得多。
根据本发明的一个实施例,可使用移动电话或其它装置上的短消息服务传送文本注解和文本描述。短消息服务为能够实现短文本消息的发送和接收的文本消息服务。可在数据中心存储文本消息以转发给想要的接收者。可使用其它构造。
根据本发明的另一方面,可将领域特定的行为和信息组织到数据管理程序中。数据管理程序是接收、处理和答复用户问题、查询和命令的自主可执行程序。数据管理程序提供完整的、方便的、可重新分布的包或者典型地针对特定应用领域的功能性模块。数据管理程序可以是完整的可执行代码、脚本、与信息的链接的包以及其它形式的通信数据,所述其它形式的通信数据提供特定功能性包,通常是特定领域中的特定功能性包。换句话说,数据管理程序可包括用于将功能性扩展到新的领域的组件。此外,当新的行为被添加或者新的信息变得可利用时,可通过网络远程对数据管理程序及其相关联的数据进行更新。数据管理程序可使用系统资源和其它的服务,典型地更具体地讲,数据管理程序的服务。可以以许多方式分布和重新分布数据管理程序,包括在可拆除存储介质上、通过网络转移或附到邮件和其它消息上。更新管理程序可用于将新的数据管理程序添加到所述系统或者更新现有的数据管理程序。
为了提高自然查询和答复环境,所述系统可对结果进行格式化以提高对用户的理解力。结果的格式化和呈现可基于问题的上下文、呈现的答复的内容、与用户的交互历史、用户的偏好和兴趣以及领域的性质。相反,许多用户可能认为严格的高度格式化或结构化的结果呈现是不自然的。
根据本发明的另一实施例,所述系统可仿真人类“个性”的一些方面。在一些情况下,可使答复的呈现和用于提供答复的术语随意一些以避免严格格式化或机械化的答复的出现。其它仿真的个性特点的使用也是期望的。例如,可以以表示同情的方式呈现可能令用户苦恼的答复。此外,请求的结果可以是长文本串、列表、表格或其它非常长的数据集合。由于简单地读取长答复通常不是优选的,所以这种类型的信息的自然呈现提出了特别的挑战。相反,所述系统可对答复的重要部分进行解析,并且最初可仅提供报告。确定呈现长答复的哪些部分可基于问题的上下文、呈现的答复的内容、与用户的交互历史、用户的偏好和兴趣以及领域的性质。同时,所述系统可给予关于要呈现什么信息和要呈现多少信息的用户交互控制,以同时一起停止所有答复,或者采取其它行动。
可将本发明作为用户接口应用于广泛的各种环境中的远程信息处理系统。这些环境可包括但是不限于以下方面:1)个人汽车、租用汽车或车队汽车;2)摩托车、踏板车和其它两轮或野外车辆;3)商用长途和短途卡车;4)递送服务车辆;5)车队服务车辆;6)工业车辆;7)农业和建筑机械;8)水运车辆;9)飞机;和10)专用军事、执法和急救车辆。
根据本发明的另一方面,所述系统可对问题、请求和/或命令进行处理和答复。可使用关键词或上下文来确定接收的话语和/或文本消息是否包括请求或命令。例如,话语可包括问题、请求和/或命令的方面。例如,用户可说“调到我喜欢的无线电台”。对请求进行处理以确定用户喜欢的无线电台的名称、频道和时间。如果该台的节目编制是用户通常不收听的类型,则所述系统可建议使用替代的选择,诸如更可能让用户高兴地听CD。必须执行用于设置无线电台的调频的命令。
本发明可用于移动环境中的一般化的本地或网络信息查询、检索和呈现。对于包括问题或查询或者问题或查询集合的每段用户话语,所述系统可执行多个步骤,这些步骤可包括:1)通过在各种真实世界的环境中操作的语音识别来捕捉用户的问题或查询;2)对问题或查询进行解析和解释;3)确定所需要的专门知识的领域和上下文以调用适当的资源,包括代理;4)对对一个或多个本地和/或网络数据源的一个或多个查询进行公式化表达,或者将合适的命令发送到本地或远程装置或系统本身;5)执行所需要的格式化、变量替换和变换以将查询修改为最可能从可利用的源产生期望的结果的形式;6)以异步方式执行多个查询或命令,并恰当地处理失败;7)从一个或多个结果提取或积攒期望的信息,可以以许多不同格式中的任何一种格式返回这些结果;8)对结果进行评估和解释,包括错误的处理,收集这些结果并将这些结果组合成被判断为“最佳”的单个最佳结果,即使这些结果有歧义、不完整或有冲突;9)执行所需要的格式化、变量替换和变换以将这些结果修改为用户最容易理解的形式;10)以有用的和/或预期的方式通过文本至语音引擎或多模式接口将混合的结果呈现给用户;11)可选地,将指示命令的成功或失败的答复提供给用户,所述答复可包括状态信息;或者其它步骤。
可利用专业领域的知识、问题或命令的上下文、领域特定信息、用户的交互历史、用户偏好、可利用的信息源或命令以及从源获得的答复来执行以上步骤。
概率或模糊集决策和匹配方法可应用于处理不一致的、有歧义的、有冲突的、不完整的信息或答复。另外,异步查询可用于提供请求或命令的快速、恰当的失败,这允许所述系统鲁棒地快速地并以对用户看似自然的方式返回结果。
就像事实情况那样,许多日常问题在本质上都是主观的,并导致说法不一或一致的答案。此外,这样的问题通常特别地具有它们的性质。根据本发明的另一方面的系统可使用自适应的概率和模糊集决策和匹配方法来识别问题的主观性质,并对可能的答案的范围进行评估,其中,可选择最准确地表示用户所期望的结果的类型的一个或多个答案。
来自特定问题的上下文和预期结果可能高度依赖于问问题的个体。因此,所述系统可创建、存储和使用关于每个用户的个人简档信息。当用户使用所述系统时,可自动对简档中的信息进行添加和更新,或者可由用户或其他人对简档中的信息进行手动添加或更新。领域特定代理可收集、存储和使用如最佳操作可能需要的特定的简档信息。用户可创建这样的命令,即,用于常规使用的报告、自动产生的警报和其它请求的命令、以及用于结果的格式化和呈现的命令。所述系统可在对问题进行解释、对请求进行公式化表达、对请求结果进行解释和将答案呈现给用户时使用简档数据。用户简档中的信息的示例包括所问的问题的历史、会话历史、格式化和呈现偏好、特殊字拼写、感兴趣的术语、感兴趣的特别数据源、年龄、性别、教育、位置或地址、营业地点、营业的类型、投资、嗜好、体育兴趣、新闻兴趣以及其它简档数据。
根据本发明的一方面,为了提供自然问题和答复环境,所述系统可试图提供快速的答复。可在没有获得附加信息的情况下提供快速的答复。所述系统可通过使用实时评分系统或其它技术来确定用于用户的问题或命令的代理组件、上下文和/或领域。基于这个确定,所述系统可触发一个或多个代理对用户的问题或命令进行答复。所述代理可发出一个或多个请求,并快速地返回格式化的答复。因而,用户可接收对问题集合的直接答复,所述问题集合中的每个问题具有不同的答复或上下文。在一些情况下,可利用的信息,包括请求的结果,可能不足以地回答所呈现的问题。在这样的情形下,可问用户一个或多个后续问题以解决歧义性。然后可在提供让人满意的答复之前发出另外的请求。在这些情况下,所述系统可使用上下文信息、用户简档信息和/或领域特定信息以最小化递送答复所需的与用户的交互。
如果领域的置信水平或上下文得分不是高得足以确保可靠的答复,则所述系统可请求用户验证问题或命令被正确地理解。通常,可用短语描述问题以指示该问题的上下文,包括所有标准或参数。如果用户确认问题是正确的,则所述系统可继续生成答复。否则,要么用户可重新用短语描述原始问题,可能添加附加信息以去除歧义性,要么所述系统可问一个或多个问题以试图解决歧义性,要么可采取其它行动。
根据本发明的一方面,所述系统可接受任何自然语言问题或命令,结果,所述系统可经受有歧义的问题。为了辅助用户对简明的问题和命令进行公式化表达,所述系统可支持声音查询语言。该语言可帮助用户清楚地指定问题或命令的连同参数或标准一起的关键词或上下文。所述系统可提供帮助用户学习将他们的问题和命令公式化表达的最佳方法的内置训练能力。
为了使对用户的问题和命令的答复看似更自然,所述系统可采用一个或多个动态的能够调用的个性和/或情感模型。个性和情感模型具有仿真实际的人的行为特点的特定特点。这些特点的示例包括同情、愤怒、有用性和相关联的情感。个性还使答复的方面随意一些,就像实际的人会做的那样。这个行为包括所使用的术语和信息呈现的次序的随意化。使用概率或模糊集决策和匹配方法并使用标准来调用个性和/或情感的特点,所述标准包括问题的上下文、用户的交互历史、用户偏好、可利用的信息源、从源获得的答复。
根据本发明的另一方面,可采用呈现长文本串、表格、列表或其它长答复集合的形式的信息的专门过程。以有序的方式简单地呈现长信息集合可能不被认为是自然的或者大多数用户记得住的。所述系统可使用概率或模糊集匹配方法来提取相关信息,并首先呈现这些子集。此外,所述系统可提供允许用户跳过列表、找到列表中的关键词或关键信息、或者同时一起停止处理列表的命令。
根据本发明的一个实施例,所述系统可支持在不同时间访问该系统的多个用户。根据本发明的另一实施例,所述系统可支持以交错或重叠方式在相同会话期间访问该系统的多个用户。所述系统可通过姓名、声音或其它特点识别多个用户,并可为每个用户调用正确的简档。如果多个用户在重叠或交错的会话中对所述系统说话,则所述系统可识别所述多个用户,并可调用一个或多个对应的简档。对于要求安全防护措施的应用,可使用声纹匹配、口令或口令短语匹配或其它安全防护措施对多个用户进行验证。
当多个用户参与交织会话时,所述系统可通过将概率或模糊集决策方法用于每个用户来恰当地解决冲突。这个过程可仿真人将说出来自各种源的多个问题的方式。例如,所述系统可在及时回答较长的问题的同时首先及时地回答短问题。可替换地,在其它构造中,所述系统可按接收问题的顺序回答这些问题。
由于本发明可运行于许多环境中,所以语音输入的滤波可能是有利的,所述环境包括具有背景噪声、点噪声源和保持会话的人的移动环境。本发明可使用,例如,一维或二维阵列麦克风(或其它装置)来接收人的语音。所述阵列麦克风可以是固定的,或者采用动态波束形成技术。可对阵列模式进行调整以最大化用户方向上的增益并使点噪声源不存在。可替换地,可在移动环境内的特定位置放置麦克风,在所述特定位置附近,所有者可能使用所述系统。这些麦克风可以是单个麦克风、定向麦克风或麦克风阵列。然后,可用模拟或数字滤波器对在麦克风接收的语音进行处理以优化带宽、取消回波、切除窄带噪声源或者执行其它功能。在滤波之后,所述系统可使用可变速率采样来最大化编码的语音的逼真度,同时最小化所需要的带宽。在通过无线网或链接传输编码的语音的情况下,这个过程可以是特别有用的。
本发明可应用于宽范围的远程信息处理应用。一般的应用范围可包括,但是不限于,远程或本地车辆控制、信息查询、从本地或网络源的检索和呈现、保险应用和安全性应用。
所述系统可为包括位于移动结构上或者不在移动结构上的装置的系统提供本地或远程控制功能。用户可在本地或者远程发起命令。典型地,可通过IP连接、电话连接或其它连接来进行远程操作。用户可对移动装置或桌面单元说出口述命令,该移动装置或桌面单元可通过无线链接将这些命令发送到车辆上的控制器。可使用其它远程命令技术。所述系统可以以与请求近似相同的方式对命令进行处理。一个不同在于命令的结果通常是动作而不是答复。在许多情况下,所述系统可给用户指示已成功地执行命令或者命令失败的提示或答复。在失败的情况下,可启动交互式会话来允许用户解决难题或者对更可能成功地对命令进行公式化表达。
本发明为包括移动结构操作者的用户提供这样的能力,即,使用交互式语音和非语音命令和/或请求来控制大多数任意的移动系统。通常,危急性质的控制或者具有安全暗示的控制可采用自动防故障检查,即,在执行之前,验证命令将不造成危险的条件。还可提供手动超控器作为额外的预防措施。本发明可提供关于受控装置的内置帮助和用户向导。这个向导可包括对于正学习使用移动结构的特征的操作者的逐步训练。当不能执行命令或者当命令失败时,所述系统可提供扩展的交互式向导。这个装置可包括重新对随后的命令进行公式化表达的建议、失败时的工作建议、关于可实现类似的功能的可替换命令的建议或者其它建议。可通过本发明从本地或远程位置执行的控制功能的示例包括:
1、移动结构多媒体娱乐电器的控制,所述娱乐电器例如是收音机、CD播放器或视频播放器。这个控制可基于用户指定的播放列表,并可能对用户简档信息敏感,所述用户简档信息包括偏好历史或其它信息。本发明可包括控制多个或独个多媒体娱乐站的能力。
2、通信装置的控制,所述通信装置诸如蜂窝电话、语音邮件系统、传真系统、文本或即时通讯系统、呼叫和消息转发系统、电子邮件系统和其它通信装置。这个控制包括控制以下特征,诸如,其它特征中的通讯簿、电话簿、呼叫转发、会议呼叫和语音邮件。
3、移动结构系统的本地或远程控制。移动结构上的大多数任意的装置可被控制,所述装置包括门锁、窗户控制器、内部温度控制器、变速箱的换档、转向信号灯、安全仪器、发动机点火器、巡航控制器、燃料箱开关、座位调节器、诸如绞盘机的专用仪器、提升系统或加载系统以及其它移动结构系统。
4、典型地,可通过无线链接对位于移动结构外部的系统进行控制,所述系统包括车库门开门器、门控制器、移动接口入口安全通道、自动玩具收集系统和移动结构称重系统以及其它外部系统。
5、移动结构电源管理和系统控制。本发明可为移动结构操作者提供关于极限和关于用于更好的电源管理或燃料利用或其它系统控制的终端接口处理器的信息。
6、诊断信息管理。本发明可为移动结构操作者提供诊断信息声明和警告。这些声明和警告可以交互式地允许操作者请求附加信息或者建议各种行动进程。本发明可对问题的解决方案进行调解,直到可实现永久的解决方案为止,所述调解包括提供对调度服务的访问、呼唤帮助或者提供用于补救措施的指令。所述系统可要求操作者对所需要的部分的定货进行授权,并可提供成本估计。所述系统可从宽范围的源接收用于这些声明和警告的数据,所述源包括传感器和车辆控制计算机。传感器可包括燃料水平传感器、冷却剂温度传感器、油温传感器、轴温传感器、轮胎气压传感器和其它传感器。
7、系统状态询问。移动结构操作者可使用本发明的交互式自然语言接口来查询位于移动结构上的系统的状态,并接收关于该状态的报告,所述状态包括燃料水平、内部温度、外部温度、引擎或其它移动结构系统状态。如果检测到问题,则操作者可进一步查询系统以接收更多的信息或者确定行动进程。
8、车辆服务历史。本发明可为车辆驾驶者或其它人员提供对车辆服务历史的交互式访问。当服务时间临近时,本发明可提供声明或警告。用户可与所述系统交互以调度所需要的服务、订购所需要的部分、接收成本估计、或者更新服务历史。用户可定制这个交互的性质以满足他们的期望或策略。
9、诊断和服务历史。本发明可提供诊断和服务历史信息以为人服务。这个信息可包括车辆故障代码和关于受系统控制或者被系统测量的装置的其它信息。可替换地,本发明可从其它控制计算机接收关于车辆操作的状态和历史的信息。本发明可提供交互式服务信息和历史。可通过语音接口或非语音接口来查询服务历史和呈现服务历史。如果认为记录不完整,则所述系统可提示服务人员给予更多的信息。在其它情况下,如果在系统状态中检测到改变,诸如一部分的替代,则本发明可提示服务人员给予他们的动作的信息。
本发明可通过交互式语音接口和/或非语音接口为移动结构的用户或操作者提供专用的安全功能。本发明可使用可动态引出的个性,该个性能够创建适合于情形的严重性的声明。声明和个性可受制于用户控制和构造。这些安全应用的一些例子可包括:
1、本发明可通过无线通信链接提供事故情形的自动检测和报告。可从气囊控制系统或其它传感器收集关于事故情形的信息。一旦已检测到事故情形,本发明就可使用交互式语音接口和/或非语音接口来确定事故的性质和/或受害者的状况。这个信息,与位置信息和其它相关信息一起,可通过无线链接来报告。可替换地,本发明可在车辆的所有者和急救人员之间建立声音信道通信或其它通信。
2、本发明可用于存储和检索关于车辆所有者的医药信息。在事故之后,急救人员可在所述系统中查询这个信息。可替换地,如果某人具有专门的医药状况,则所述系统可对急救人员发出警告。所述系统通过许多技术来维护医药信息的保密性,所述技术包括,除非检测到事故,否则不通告医药信息,或者除非这个人或另一授权的人给出许可,否则不通告医药信息。
3、如果犯罪发生,则车辆的所有者使用语音接口和/或非语音接口来呼唤帮助。典型的犯罪可包括盗窃和劫持。本发明允许车辆所有者设置对系统指示犯罪正在发生的恐慌或急救单词或短语。
4、如果检测到不安全或可能不安全的情形,则本发明可为车辆驾驶者提供安全声明。驾驶者可使用交互式语音接口和/或非语音接口来获得关于情形的更多的信息或者不理会警报。驾驶者可通告命令或者以其它方式提供命令来补救或缓和这个对话期间的情形。可被通告的状况包括,尾随另一车辆太近、对于道路或状况而言速度太快、路面上的障碍、车辆的一些部分着火、高的货物压力或温度、泄漏和其它信息。
5、本发明的交互式语音接口和/或非语音接口可为操作者提供实时帮助。这个帮助可包括,停车或倒车的帮助、对于复杂机动的帮助、对于车辆的最佳驾驶和其它操作的帮助。驾驶者可要求所述系统给予对于有计划的机动或驾驶的忠告或帮助。可替换地,如果检测到某些情形,则本发明可积极地提供帮助。
6、可使用交互式语音接口和非语音接口来改进车辆安全性。可使用声纹或声音认证来获取对车辆的使用或者开动车辆。可替换地或者另外,可使用口令或口令短语。在另一可替换方案中,语音安全性可用作对其它车辆安全性技术的补充。
7、本发明可提供驾驶者疲劳的测量,并且如果检测到不可接受的疲劳级别,则警告驾驶者或远处的人。可使用交互式语音接口和/或非语音接口来查询驾驶者以检测疲劳。可替换地,或者另外,可使用驾驶者疲劳的其它测量。如果检测到疲劳情形,则本发明可发起与驾驶者的对话来确定问题的程度,并且如果需要的话,则要求驾驶者停止驾驶。
本发明可为车辆驾驶者和所有者提供当在车辆中时和/或当在到达目的地时有用的各种服务。此外,用户可采用交互式自然语言接口来定制这些服务以满足每个个体。本发明的自然语言交互式语音接口可支持的服务的一些例子包括:
1、为车辆驾驶者提供到目的地或路点的交互式方向,其中,用户可指定期望的目的地和任何优选的路点。可以以任何方式指定目的地,包括提供地名、地址、人的姓名、企业的名称或其它类型的信息。随着行程前进,如果犯了错误,则所述系统可为驾驶者提供继续的方向和警告。驾驶者可向所述系统查询附加信息或者请求更少的信息。通常,所述系统与一个或多个导航传感器和本地或远程地图数据库建立接口。本发明可为驾驶者或乘客提供即将到来的点或兴趣、退出或停止、危险或其它状况的警报。用户可向所述系统查询更多的特定信息。可替换地,本发明可为车辆的驾驶者或所有者提供交互式向导旅游。用户可采用所述系统的信息查询、检索和呈现能力来在旅游期间接收附加信息或者感兴趣的点或项目,所述系统的信息查询、检索和呈现能力可考虑存储的关于用户的个人简档信息。
2、本发明可为车辆的驾驶者提供交互式动态路线安排信息。可基于交通条件、天气条件、设施可利用性和由驾驶者提供的信息来更新路线安排。通常,所述系统与一个或多个导航传感器、本地或远程地图数据库以及交通、天气和设施使用数据的源建立接口。
3、在帮助一个或多个驾驶者在预定目的地或任何其它方便的中点集合的交互式系统中,可将本发明的方向、路线安排和通信能力组合起来。驾驶者可使用交互式自然语言接口与所述系统交流来布置集合点,并且当他们旅行到集合点和/或与其他驾驶者交流时接收方向。
4、本发明的导航能力可用于设置允许车辆前进行驶到哪和/或需要多长时间的极限。所述系统可采用交互式自然语言语音接口和/或非语音接口,以当车辆正逼近极限或者已超过极限时,通知驾驶者。驾驶者可查询所述系统以确定最佳的行动进程,以返回到极限或者防止超过极限。可替换地,所述系统可查询驾驶者以确定他们为什么超过极限,或者如果境况要求扩大极限,则调解协商以扩大极限。在几种情形下,这种能力是有用的,所述情形包括,使递送或载客车辆保持在常规路线上、设置十几岁的青少年的使用极限并强制执行该使用极限、防止驾驶者以未经授权的方式使用车辆或者其它情形。
5、本发明的交互式自然语言接口可用于对车辆驾驶者和乘客提供顾客关系管理(CRM)服务。用户可与经由数据网、视频信号或音频提供的服务交互。可通过自动服务或者与现场顾客服务代表执行交互。与顾客服务代表的交互可经由可能的技术的任何组合,所述技术诸如现场音频、现场视频、电子通讯或电子邮件、即时通讯和其它技术。可通过许多实体提供这些服务,所述实体包括车辆制造商、车辆经销商、车辆服务机构、汽车或旅行俱乐部、无线载波、旅行服务机构或其它机构。可使用各种信息来对所提供的服务赋予车辆的所有者的个性,所述信息包括用户简档信息、历史、位置、旅行路径、一天中的时间、一星期中的某天或其它信息。另外,所述系统可基于关于车辆的信息来提供定制服务,所述信息包括旅行路径、距离、服务历史、车辆上的仪器的类型。在其它情形中,在某人是车辆的所有者时,在某人不是所有者但是正使用配备无线网或有线网的移动装置时,或者在使用有线网或无线网桌面系统时,可接入这些服务。这些服务的例子包括:
a、基于位置的推销规划,其中,车辆的所有者沿着旅行路线从商家接收促销报价。所有者可沿着旅行路线向所述系统查询商品、服务的报价和促销或其它信息。所述系统可应用其它可利用的信息来形成答复,所述信息包括用户简档、历史、位置或其它信息。所述系统可对车辆驾驶者提供优化的交互式路线安排帮助。可替换地,所述系统可沿着路线或者在特定行程之前提供关于商品和服务的交互式报价和促销。可对商品的促销进行报价,服务可包括但不限于旅行服务、食品杂货、预加工食品、车辆服务、燃料、娱乐或其它商品和服务。
b、商品和服务的远程定货和支付。所述系统可使用本发明的列表和表格呈现能力来交互式地呈现菜单或产品目录。所述系统可通过使用位置信息、顾客偏好、顾客定单历史等来使远程定货变得便利。所述系统可为用户管理安全的支付钱包。可将声纹、口述口令和非语音安全性方法(即,PIN pad等)组合起来以创建适当等级的安全性。
c、对于车辆的所有者的旅行服务。这些服务可包括旅行和娱乐服务的名录或者娱乐餐厅、旅馆和其它住所的预定。所述系统可使用它的交互式列表和表格呈现能力来呈现名录、列表和菜单。可结合远程定货和支付能力以及动态交互式路线安排能力来使用旅行服务能力。
d、回答以下领域中的专门的旅行相关问题,所述领域诸如车辆注册、税款、安全法、所需要的检验、重量限制、保险责任范围要求、保险单条款或其它领域。
6、本发明可使用自然语言接口为车辆的驾驶者或其他所有者提供交互式位置敏感的购物列表或者位置和时间敏感的任务提醒列表。用户可在车辆中、在步行使用移动装置时或者在固定位置使用手持或桌面装置时创建列表。用户可给予其它用户将任务或购物项目添加到他们的列表的许可。一旦在车辆中,所述系统就可为所有者提供路线安排帮助以对旅行时间进行优化,并且随着车辆靠近特定位置、特定类型的商家或其它服务提供商的附近,或者在其它标准中,当已到达设置时间时,所述系统可提供将购买的项目和将完成的任务的提醒。
7、对于车队车辆的自动交互式调遣和报告,所述车队车辆具有使用语音接口和/或非语音接口与这些服务交互的车辆驾驶者或其它车辆所有者。这些服务可包括动态优化路线安排、部件和其它材料的清单、所需要的部件和材料的定货、派工单、开收据、支付或其它服务。
8、销售人员自动化、销售报告、联系数据库管理、日历管理和呼叫路由。所述系统可采用其交互式列表和表格呈现能力来供应目录和定价信息或其它信息。这些服务可使用本地或网络数据。另外的服务可包括备忘录、提醒器、活动列表或其它信息。
车辆驾驶者和其他所有者可使用本发明的交互式自然语言交互式接口来执行许多类型的信息查询、检索和呈现操作。通过使用自然语言交互式接口,用户可修改查询的参数或者指定结果的呈现格式。用于创建答复的数据可来自本地和远程数据源的任何组合。可使用户特定数据在固定到一个或多个车辆上的系统、移动结构和桌面系统之间同步。用于本发明的信息查询、检索和呈现应用的一些例子包括但不限于以下例子:
1、用于找到关于企业和个体的电子邮件地址、电话号码、街道地址和其它信息的白页和黄页查找表。可结合其它服务使用这些服务,所述其它服务包括远程定货和支付、报价和促销、绘图和驾驶方向;
2、对用户的个人地址簿、日历和提醒的管理和访问;
3、自动电话拨号、通过声音、文本或视频读取和发送电子邮件、页面、即时通讯以及其它通信控制功能;
4、关于电视机、卫星广播、无线电或其它娱乐时间表的选择、时间表、播放列表管理。可利用的信息可包括关于节目编制的回顾和其它信息。所述系统可为用户提供装置控制;
5、关于当地区域或其它位置的天气信息;
6、股票和其它投资信息,包括价格、公司报告、简档、公司信息、企业新闻事迹、公司报告、分析、价格警报、新闻警报、证券报告、证券计划或其它信息;
7、当地、国家和国际新闻信息,包括依据主题或位置的感兴趣的大字标题、事迹摘要、整个事迹、音频和视频检索和事迹的播放;
8、运动得分、新闻事迹、时间表、警报、统计、背景和历史信息或其它信息;
9、通过将用户特定偏好应用于提取和呈现信息来交互式预订多媒体信息频道的能力,所述多媒体信息频道包括体育、新闻、企业、不同类型的音乐和娱乐;
10、对所使用的或公布的信息或内容的权限管理;
11、占星术、每日笑话和喜剧、纵横拼字谜检索和显示以及相关娱乐或消遣;
12、使用当地和网络材料的交互式教育规划,具有基于用户的简档、车辆的位置、车辆的计划路线、行程期间的计划活动而设置的课程材料水平,其包括交互式多媒体课程、宗教指导、计算器、字典和拼写、地理信息、关于行程期间计划的专门任务的指导、语言训练、外语翻译、技术手册说明和百科全书以及其它参考材料。
将意识到,并不是要将前述的本发明的特征的陈述作为穷举或限制,而是通过参考这个完整的公开内容及其相当明显的变形和扩展来领会本发明的正确范围。
附图说明
将通过参考本发明的优选的可替换实施例并结合附图来描述本发明,在附图中:
图1是根据本发明的第一实施例的系统的总框图;
图2是根据本发明的第二实施例的系统的总框图;
图3是根据本发明的实施例的移动装置的总框图;
图4是根据本发明的实施例的固定计算机的总框图;
图5是根据本发明的实施例的交互式自然语言处理系统的总图解视图;
图6是显示根据本发明的实施例的代理架构的示意性框图;
图7示出根据本发明的一个实施例的用于集中维护上下文的示图;和
图8示出根据本发明的一个实施例的增强型会话声音用户接口的系统图。
具体实施方式
下面的详细描述参考附图描述本发明的示例性实施例。在不脱离本发明的精神、功能性和范围的情况下,考虑其它实施例,并且可对示例性实施例进行修改。因此,下面的详细描述不意味着限制本发明。
根据本发明的一个实施例,提供远程信息处理自然语言语音接口和非语音接口用在移动环境和远程信息处理应用中。所述系统或者其部分可被用在车辆中、步行时或者诸如办公室或家里的固定位置处或者其它位置。图1中示出本发明的一个实施例的总框图。
可将语音单元128和/或键区14整体与移动结构10耦合,或者语音单元128和/或键区14可以是移动装置36、固定的家庭或办公室计算机系统44或其它装置的一部分。移动装置36可包括移动电话、个人数字助理、数字收音机、光盘播放器、导航系统或其它移动装置。移动装置36可被构造为与机顶盒、闹钟、收音机或其它电子组件集成。语音单元128和/或键区14可通过一个或多个数据接口26与远程信息处理控制单元(TCU)28建立接口。根据一些实施例,主语音处理单元98可被嵌入在一个或多个TCU 28中。在一些实施例中,还可在一个或多个TCU之间分布语音单元128的组件。
语音处理单元可被构建到移动装置36中,并可通过无线或有线的手持接口20与数据接口26耦合。其它用户接口外设可通过数据接口连接至TCU,并可包括显示器18,诸如用于显示文本、图形和视频的触摸屏显示器;用于接收文本数据输入的键区14;用于接收多媒体通信或会议的视频相机16;指取装置或触针,或者其它用户接口外设。其它装置可通过以下数据接口连接至TCU,所述数据接口包括广域RF收发器24、导航系统组件22或其它装置。导航系统可包括几种组件,诸如,全球定位系统(GPS)接收器或其它无线电定位系统接收器、陀螺仪或其它惯性测量仪器、诸如里程表的距离测量传感器或者其它组件。无线电定位仪器可从一个或多个卫星或地面源40接收编码的信号。一个或多个位置服务服务器48可辅助导航系统。可通过数据接口连接至TCU的其它系统可包括汽车控制计算机、用于诸如媒体播放器或其它电子系统的装置的数字控制接口、测量传感器或其它专用电子仪器。
控制器和装置接口30可使TCU 28连接至移动结构10内的各种装置32。控制器和装置接口30可用于执行来自自然语言接口的用户的本地或远程命令。在一些情况下,控制器和装置接口30可包括用于与不同类型的装置交互的专用硬件。连同可控制接口32的用于测量的模拟或数字接口仪器一起,硬件接口可包括用于装置控制的模拟或数组信号接口。这些接口还可包括封装或抽取装置32的特定行为的专用软件。接口软件可包括硬件接口和一个或多个代理所特有的一个或多个驱动程序。领域代理可包括控制特定装置或一类装置所需的专用软件行为和数据。可通过对与特定装置或一类装置相关联的数据管理程序进行更新来将新行为或更新的行为添加到所述系统。装置32可包括手动控制器或手动超控器34。由于安全原因,控制器和装置接口30可合并这样的自动防故障系统,该自动防故障系统例如,可在改变设置之前验证操作极限,以确保命令与来自手动控制器的设置不冲突,并且在与其它命令或装置设置的一些组合中将不会引起不安全的情形。可将确保安全操作的软件行为和数据包括在所述装置或一类装置所特有的领域代理内。可通过控制器和装置接口30控制的装置和系统的示例包括电源管理系统、测量传感器、门锁、窗口控制器、内部温度控制器、变速箱的换档、转向信号灯、光、安全仪器、发动机点火器、巡航控制器、油箱开关、座位调节器、诸如绞盘机的专用仪器、提升系统或加载系统和其它系统。
广域RF收发器24可与连接至数据网42的一个或多个广域无线网38通信,数据网42包括因特网、公用交换电话网(PSTN)42或其它数据网。广域无线网可以是任何合适的基于地面或卫星的类型。移动装置36可与一个或多个局域或广域无线网通信。配备有有线网或无线网接口的家庭或办公室系统44可通过数据网或PSTN通信。
根据本发明的一个实施例,可将数据和代理存储在具有一个或多个主语音处理单元98的移动结构10、移动装置36和/或固定系统44中,并使数据和代理在移动结构10、移动装置36和/或固定系统44中同步。通过手持接口20或其它本地数据连接,这些不同的系统之间的同步可发生在广域无线网38、数据网42上。当任何两个或更多个计算机连接至这些网络时,可自动执行同步。可替换地,可在用户控制下应要求执行同步。同步过程试图确定哪个版本的数据元素或代理是最新的或者最近的,并传播该元素。因而,同步是增量式改变过程。在一些情况下,可执行数据库、数据库的一部分或者一个或多个代理的完全代替,而不是执行一系列增量式更新。
广域无线网38、数据网42或PSTN可使移动结构10、移动装置36和固定计算机44连接至提供多种服务中的一种服务的一个或多个服务器。根据本发明的一个实施例,可提供交互式自然语言用户接口,该接口支持数据的转移或者语音、文本、视频和其它格式的传输。对于以数据为中心的应用,可使用标准化的数据传输格式,包括,例如,基于超文本传输协议(HTTP)之上的超文本置标语言、可扩展置标语言(XML)和基于HTTP或其它传输协议之上的其它数据格式或方案、基于各种传输协议之上的电子数据交换格式等。将理解,可分情况逐个地考虑提供的服务的精确组合、提供服务的服务提供商、服务提供商之间的契约关系和其它因素来确定服务器的精确构造。本发明支持任何合适的构造。在每种情况下,这些服务器可自己将其分布在一个或多个公共网或私人网上。以下给出可用于传递这些服务的服务器的一些示例:
1、为用户供应支付能力的一个或多个支付服务提供商56。这些支付服务可包括一个或多个支付帐户的电子钱包能力,并可包括支付安全信息、支付帐户信息、交易历史、帐户余额信息和其它信息。示例性支付类型包括储值帐户、促销帐户、赊欠帐户、电信计费帐户、借方帐户或者使用在线或离线方法存取的其它支付类型。可以以任何方式计算支付款,包括特定商品或服务的支付款、预订支付款、计量支付款或其它支付款。可以以许多方式分布支付服务。用于存储和处理支付交易信息的计算机和服务器的示例包括智能卡、主语音处理单元128、移动装置36、TCU 28、固定个人计算机44、支付网关、支付服务器56或其它系统。
2、如上所讨论的,一个或多个顾客关系管理(CRM)系统52可供应任意数量的消费者和企业顾客服务。CRM系统可供应自动服务或者部分或完全人工的服务。对于人工服务,一个或多个顾客服务代表可使用一个或多个服务代表工作站54。CRM系统和服务代表工作站可连接至一个或多个数据网42或PSTN。任何其它服务器也可具有与一个或多个服务代表工作站的连接,这些工作站可以是共有的或者彼此独立。
3、一个或多个专用服务服务器50可支持专用消费者和企业服务。
4、一个或多个位置服务服务器48可供应位置信息和基于位置的服务。位置数据被用作输入到位置服务器的数据,然后可以以任何合适的方式分布该数据,所述方式包括在主语音处理单元128、移动装置36、TCU 28、固定个人计算机44、其它服务器(即,46、50、52、56)或者一个或多个位置服务服务器48上。
5、一个或多个急救服务服务器46可为用户供应公共和私有急救服务两种。
可以以许多方式在移动装置36中分布主语音处理单元98、语音单元128和键盘14。例如,这些单元可作为独立组件或者作为单个集成组件附到移动装置36上。在本发明的另一实施例中,可将主语音处理单元98和语音单元128中的一些或所有嵌入在TCU 28、移动装置36、固定计算机系统44或其它装置中的一个或多个中。
图2示出本发明的第二实施例的可替换框图。在这个实施例中,主语音处理单元98和语音单元128位于TCU 28外部。可将这些组件储藏在一个或多个包中,或者可将这些组件包括在单个集成包中。
在所有其它方面中,第二实施例与图1中示出的第一实施例类似。将理解,可根据部署情形的细节来确定主语音处理单元98和语音单元128的精确的分布和包装,并且主语音处理单元98和语音单元128的精确的分布和包装不应该以任何方式改变本发明的功能性、能力或精神。
图3示出包括主语音处理单元98和语音单元128的移动装置36的一个实施例的框图,主语音处理单元98和语音单元128被嵌入在移动装置36、移动电话或其它移动装置中。主语音处理单元可与位于移动装置36中的一个或多个处理单元70建立接口。处理单元70可包括一个或多个中央处理单元、一个或多个数据和地址总线、数据接口、易失性存储器或其它组件。处理单元70可将多种类型的非易失性存储器80中的一种类型用于软件和数据存储。合适类型的非易失性存储器80可包括闪存和硬盘驱动器。在一些实施例中,主语音处理单元98可与一个或多个处理单元70集成。
根据一个实施例,用户可通过语音单元128、键区74或键盘、显示器72或其它外设与移动装置36交互,显示器72显示文本、图形、视频。在一些实施例中,显示器可以是触摸屏类型。可替换地,在其它装置中,可使用定点装置(未显示)。
移动装置36可通过一个或多个接口连接至一个或多个有线或无线广域网或局域网。广域网收发器78可使用无线或有线连接连接至广域无线网38或数据网42,所述无线或有线连接包括IP连接、拨号PSTN网连接或其它连接。局域网收发器76可连接至有线或无线局域网。这些网络可包括手持接口20或与固定计算机系统44的连接。在移动装置环境和固定计算机环境中,由于自然语言命令的定义可能不完整,所以人和机器之间的交流可能至少没有提供精确的结果。可通过对以前的话语的上下文、领域的知识和/或用户的兴趣和偏好的历史或者其它因素进行杠杆调节来减少不精确的结果的发生。
根据本发明的一个实施例,可在移动装置36执行处理。可替换地,可在服务器端执行处理。在又一实施例中,处理可在移动装置36和服务器端都发生。移动装置36可现场对命令进行处理以使得移动装置36能够控制它们自己和/或控制其它移动装置36、固定计算机44、移动电话或其它装置。另外,移动装置36可跟踪上下文。根据图7中示出的本发明的另一实施例,可对上下文管理程序702进行集中维护以允许输入到多个移动装置36和从多个移动装置36输出。每个移动装置可与上下文管理程序702通信以经由注册模块712注册,其中,注册可指示移动装置36可预订的事件。上下文管理程序702可接收例如上下文XML表单的输入。可通过上下文跟踪模块714向其它注册的移动装置36通知上下文改变,从而使注册的移动装置36之间的上下文同步。根据本发明的一个实施例,可添加或去除注册的移动装置36。注册的移动装置36可以是动态链接库(DLL)、对象代码或者可能是移动装置36所特有的其它数据。
根据本发明的又一可替换实施例,可从作为文本消息而呈现的命令或请求和/或作为口头话语而呈现的命令或请求来确定上下文信息,并使用多通路自动语音识别模块对上下文信息进行处理,多通路自动语音识别模块将口头话语转录为文本消息。多通路自动语音识别模块可使用其它资源中的口述语法或大的词汇表语法来将口头话语转录为文本消息。在口述语法不可利用的平台上,多通路自动语音识别可使用虚拟口述语法,虚拟口述语法将假字用于词汇表之外的字。假字可包括实用字、无意义的字、分离音节、分离独特的发声和其它假字。
根据本发明的一个实施例,可在文本消息中搜索特定字符、字符组、单词、词组和其它文本组合。可将文本组合与上下文描述语法中与每个代理106相关联的条码进行比较。如果在上下文描述语法中的活动语法和命令和/或请求之间识别到匹配,则可对该匹配进行评分。可基于确定的得分对代理106进行分级。在从从代理106接收的一个或多个答复产生总答复中,可基于代理106的等级确定来自各个代理的答复的排序。可通过答复产生器模块产生总答复。代理106可更新上下文堆栈以使得能够实现后续请求,上下文堆栈包括命令上下文的排序列表。
根据本发明的另一实施例,如果在文本消息和活动语法之间没有找到匹配,或者仅找到部分匹配,则知识增强型语音识别系统可用于从语义上使搜索变宽。知识增强型语音识别系统可用于确定请求的意图和/或校正错误的识别。知识增强型语音识别可访问存储在上下文堆栈中的预期的上下文的集合,以确定最可能的上下文。知识增强型语音识别可使用能够识别上下文的上下文特定匹配程序,所述上下文诸如时间、位置、数量、日期、类别(比如,音乐、电影、电视、演讲等)和其它上下文。可通过将字符、字符组、单词、词组和其它文本组合进行比较来执行匹配。可替换地,或者除了基于文本的匹配之外,可使用其它技术中的音标匹配来执行匹配。任何匹配的结果可用于产生被传送到代理106以用于另外的处理的命令和/或请求。根据本发明的一个实施例,非语音接口114可以以比通过语音接口可能的方式更简明的方式显示系统、状态和历史信息。非语音接口114可被访问以创建或扩展代理106的能力。这些操作可包括其它操作中的代理的脚本撰写、将数据添加到代理或代理所使用的数据库102、将链接添加到信息源。
根据本发明的另一实施例,移动装置36可被构造置为允许将对象的语音注解存储在其上。所述对象可包括照片、日历条目、电子邮件消息、即时消息、电话簿条目、语音邮件条目、数字电影或其它对象。移动装置36可将语音注解转录为文本注解,并将文本注解与对象一起存储。可替换地,移动装置36可被构造为使得用户能够输入与对象一起存储的非语音注解,诸如文本描述。
根据本发明的一个实施例,可在服务器端、客户机端、服务器端和客户机端的组合上或者根据其它构造存储注解的对象。本发明还考虑在分布的工作组之间协作交换和共享注解的对象,所述工作组可包括具有用于提供共同的对象存储和检索设施的共享工作区的集中式服务器。可在集中式服务器上实现共享工作区,并可使用移动装置36从不同的平台访问共享工作区。所述系统可包括用于访问注解的对象的对等系统。
根据本发明的一个实施例,可对非语音注解进行分类和搜索。在可替换的实施例中,可对语音注解进行分类和搜索。然而,对语音注解进行分类和搜索可能比对非语音注解进行分类和搜索困难得多。
根据本发明的另一实施例,可将与对象相关联的文本注解和/或文本描述存储为元数据,从而使得能够使用元数据来搜索对象。元数据可包括GPS信息、环境信息、地理信息或其它信息。例如,可使用GPS信息、环境信息、地理信息或其它信息来确定对著名的路标的接近,并可将这个信息集成到与对象相关联的元数据中。根据本发明的一个实施例,可将GPS坐标存储在与对象相关联的元数据中,用户可基于GPS坐标搜索所选择的对象。用户可提供语音命令,诸如“为我显示Greece的所有照片”。在这种情况下,所述系统将对象的类型限制为照片,并将确定Greece的GPS坐标。然后,所述系统将在元数据中搜索与照片对应并且还满足Greece的GPS坐标的对象。根据本发明的另一实施例,将GPS坐标包括在对象的元数据中使得能够基于GPS坐标对对象进行后处理。例如,可基于存储在元数据中的通用GPS坐标对对象进行初始整理,并可基于关于GPS坐标的更多的特定标准对对象进行另外的整理。因而,用户最初可搜索与著名的路标附近的位置对应的对象元数据,并可将图像匹配用于用可搜索的元数据(即,文本描述)对对象进行标注。例如,通过使用存储在元数据中的GPS坐标,用户可首先确定在Jefferson Memorial拍摄的照片,并可将这个信息用于用包括“Jefferson Memorial的照片”的可搜索的元数据(即,文本描述)对照片进行标注。本领域的普通技术人员中的一个将容易意识到,元数据可包括各种类型的信息,并可通过使用各种类型的信息来搜索元数据。
根据本发明的一个实施例,在移动电话或其它装置上可使用短消息服务来传送文本注解。短消息服务为能够实现短文本消息的发送和接收的文本消息服务。可在数据中心存储文本消息以转发给想要的接收者。可使用其它构造。
根据本发明的另一实施例,在其它构造中,移动装置36可支持多模式通信,多模式通信能够实现在图形接口上显示非语音搜索结果和接收语音命令以提供后续搜索。例如,可为用户呈现与著名人物的姓名对应的文本搜索结果,并且用户可提供语音命令来找到该著名人物的传记。所述系统可维持文本搜索结果的上下文以找到与所述著名人物相关联的传记。相反,已知的系统可对术语“传记”执行后续搜索,并可呈现术语“传记”的词典定义。
图4示出使用固定计算机44的实施例。在一些实施例中,可将主语音处理单元98和语音单元128嵌入在固定计算机44中。主语音处理单元可与和固定计算机相关联的一个或多个处理单元84建立接口。处理单元可包括一个或多个中央处理单元、一个或多个数据和地址总线、数据接口、易失性存储器或其它组件。处理单元可将多种类型的非易失性存储器94中的一种用于软件和数据存储。合适类型的非易失性存储器包括,例如,闪存和硬盘驱动器。在一些实施例中,可将主语音处理单元98与一个或多个处理单元84集成。根据本发明的一个实施例,可在固定计算机44执行处理。可现场对命令进行处理以使得固定计算机44能够控制它们自己和/或控制其它固定计算机44、移动装置36、移动电话或其它装置。另外,如上所述,固定计算机44可跟踪上下文。
根据本发明的另一实施例,固定计算机44可被构造为允许将对象的口语注解存储在其上。固定计算机44可将口语注解转录为文本,并将文本注解与对象一起存储。可替换地,固定计算机44可被构造为使得用户能够手动输入与对象一起存储的文本描述。根据本发明的一个实施例,可对文本注解和/或文本描述进行分类和搜索。在可替换的实施例中,固定计算机44可对口语注解而不是文本注解进行分类和搜索。然而,对口语注解进行分类和搜索可能比对文本注解和/或文本描述进行分类和搜索困难得多。
在本发明的另一实施例中,用户可使用语音单元128、键盘88或键区、显示器86或其它外设与固定计算机44交互,显示器86用于显示文本、图形、视频。根据本发明的一些实施例,显示器可以是触摸屏类型。可替换地,可与其它装置一起使用定点装置(未显示)。可通过一个或多个接口将固定计算机44与一个或多个有线或无线广域网或局域网耦合。广域网收发器92可使用无线或有线连接连接至广域无线网38或数据网42,所述无线或有线连接包括IP网、拨号PSTN网连接或其它连接。局域网收发器90可连接至有线或无线局域网。这些网络可包括与移动装置36的连接。
为了使装置适当地答复以自然语言形式提交的请求和/或命令,可在对自然形式的问题或命令进行解析和解释之后对机器可执行的请求和/或算法进行公式化表达。算法描述机器应该如何收集数据来答复问题或命令。根据请求或命令的性质,可能不存在将返回让人满意的答复的简单的请求和/或算法集合。可能需要发起几个请求和算法,甚至可能需要对这些请求和算法进行束缚或结合以实现完整的答复。此外,没有单个可利用的源可包含产生完整的答复所需要的整个结果集合。因而,可产生可能具有几个部分的多个请求和/或算法来访问位于本地或远程的多个数据源。不是所有的数据源、请求和/或算法都可返回有用的结果,或者根本不返回任何结果。通常将返回的有用的结果嵌入在其它信息中,并且可能需要从这些信息提取这些有用的结果。例如,可能需要从大量的文本串、表格、列表、页面、视频流中的其它信息或其它信息“积攒”几个关键词或数字。同时,可去除包括图形或图片的不必要的信息以对答复进行处理。在任何情况下,必须对多个结果进行评估并组合这些结果以形成最佳的可能的答复,甚至在一些请求不返回有用的结果或者未能完整地生成结果的情况下,也必须对多个结果进行评估并组合这些结果以形成最佳的可能的答复。在确定命令具有歧义或者结果在本质上主观的情况下,确定要在答复中呈现的结果是个复杂的过程。最后,为了维持自然交互,应该将答复快速地返回给用户。在维持实时性能的同时对复杂的不确定的请求进行管理和评估是个重要的挑战。
本发明为远程信息处理应用提供完整的基于语音的命令产生、信息查询、检索、处理和呈现环境或者基于语音和基于非语音的命令产生、信息查询、检索、处理和呈现环境的组合。另外,本发明对于控制系统自身和/或外部装置可能有用。这个集成环境可最大化地利用上下文、先验信息和领域以及用户特定的简档数据来为提交多个领域中的请求或命令的一个或多个用户实现自然环境。通过这个集成方法,可创建完整的基于语音的自然语言命令、算法和答复环境或者基于语音和基于非语音的命令、算法和答复环境的组合。
远程信息处理自然语言接口可被部署为TCU或其它移动装置36的一部分或外设,被部署为通过有线、无线、光学或其它类型的连接与车辆计算机和其它移动系统建立接口的移动装置或者通过有线、无线、光学和/或其它类型的连接与车辆计算机或其它系统建立接口的固定计算机的一部分。可替换地,可以以任何合适的方式在这些多个计算平台之间分布交互式自然语言远程信息处理接口的组件。
图5示出根据本发明的实施例的系统90的一个示例性示意图。系统90可包括主单元98、语音单元128和多模式装置155。在可替换的实施例中,系统98可包括关于主单元98、语音单元128和多模式装置155的完全分离的系统。事件管理程序100可对主单元98的组件之间的交互进行调解。事件管理程序100提供多线程环境,该多线程环境允许系统98没有冲突地以有效率的方式对来自多个用户会话的多个命令或问题进行操作,以维持实时答复能力。
图8示出增强型会话用户接口800的一个示例性实施例,增强型会话用户接口800从用户802接收多模式输入,并与会话语音分析器804通信。会话语音分析器804可与几个组件耦合,所述组件包括一般认知模型806、环境模型808、个性化认知模型810和自适应错误识别分析引擎812或其它组件。根据本发明的一个实施例,会话语音分析器804可包括将话语转录为文本消息的一个或多个语音识别引擎。可使用一个或多个会话语法、上下文描述语法112或其它转录方法来执行转录。根据本发明的一个实施例,可将以文本形式键入的数据与被从话语转录为文本格式的数据合并。会话语音分析器804还可包括基于语义知识的模块,该模块分析文本消息并检测命令组成。
根据本发明的一个实施例,个性化认知模型810为从用户与所述系统的交互模式得到的模块,该模块可用于预测用户在下一时间可能采取什么动作,从而辅助语音识别和/或问题或命令识别。个性化认知模型810可跟踪用户执行的动作。当所述系统试图预测用户行为时,可首先请教个性化认知模型。所述系统可具有多个个性化认知模型,其中,一个模块可与每个用户对应。
根据本发明的另一实施例,一般认知模型806为对应于多个用户与所述系统的交互模式的统计抽象。存储在一般认知模型806内的数据可用于预测用户的下一动作,从而辅助语音识别和/或问题或命令识别。一般认知模型806还可跟踪特定用户已执行什么动作,当用户以不在个性化认知模型中处理的方式与所述系统交互时,可使用一般认知模型806。
根据本发明的一个实施例,环境模型808可包括与用户的环境和周遭相关联的信息。该信息可包括用户所处的环境的类型(比如,安静或吵闹);麦克风和/或扬声器系统的细节;如可由GPS确定的用户的当前全球位置和移动;当前的系统状态,诸如正播放什么歌曲/电影、为正在检索一些东西之中的系统或者其它系统状态;紧邻的所有能够发声的装置的细节,诸如在同一房屋内能够发声的TV、立体声系统和DVD播放器的存在;用户的信用卡信息,诸如号码和当前余额,其中,用户可让移动电话下载和支付视频,并且所述系统可响应资金不足;或者其它信息。可访问所述信息以调用上下文、领域知识、偏好和/或提高问题和/或命令的解释的其它认知品质。
会话语音分析器804还可访问一般认知模型806和/或个性化认知模型810以进一步提炼上下文、领域知识、偏好和/或提高问题和/或命令的解释的其它认知品质。基于从一般认知模型806、环境模型808和/或个性化认知模型810接收的信息,所述系统可通过包括用户行为的预测来提高对命令和问题的答复。
自适应错误识别分析引擎812可对被会话语音分析器804识别为不被识别的或者被不正确识别的文本消息进行分析,并存储该文本消息,该文本消息包括转录的话语。当一确定文本不被识别时,所述系统就可产生不被识别的事件。例如,不被识别的事件可由没有找到与文本和/或转录的话语的匹配引起。
根据本发明的一个实施例,所述系统可实现确定文本消息被不正确地识别的一种或多种技术。例如,在其它变形中,用户可命令所述系统播放特定的歌曲标题,所述系统可能错误识别请求的歌曲标题并提供具有不同标题的歌曲,所述系统可能错误识别不正确的歌曲标题并提供具有与请求的标题不同的标题的歌曲,所述系统可能错误识别正确的歌曲标题并提供具有无效的歌曲标题的歌曲。当所述系统错误识别请求时,用户典型地提供直接反馈,诸如,在比命令的预期执行时间短的时间内推翻命令、重复原始请求、发出停止命令或者采取其它动作,其中,在其它构造中,可口头呈现所述动作、通过在蜂窝电话或远程控制器上按下所选择的按钮来非口头呈现所述动作,或者口头呈现所述动作并通过在蜂窝电话或远程控制器上按下所选择的按钮来非口头呈现所述动作。根据本发明的一个实施例,所述系统可检测用户动作,并可提示用户重新用短语描述请求以使得所述系统能够修改查询中的单词。可在统计模型中对用户的动作进行分析以确定对特定命令的错误识别的频率发生,结果用于更新对应的个性化认知模型810。
根据本发明的另一实施例,会话语音分析器804可访问个性化认知模型810以为接收的文本积极地选择下一最佳(或第n最佳)匹配。可通过用户动作确认匹配,所述用户动作包括用户不直接取消命令或采取其它动作。还可对错误识别进行分析,以可能确定用于所述系统的语音识别组件的个性化的调整参数。例如,所述系统可随着时间通过分析语音识别引擎如何错误识别话语来调整语音识别引擎以来提高识别。
事件管理程序100可调解本发明的其它组件之间的交互。事件管理程序可提供多线程环境,该多线程环境允许所述系统没有冲突地以有效率的方式对来自多个用户会话的多个命令或问题操作,同时维持实时答复能力。
代理106可包括可被访问以对请求和/或命令集合作出答复的语法、标准处理程序和算法的集合。代理106还可包含用于系统98的一般行为和领域特定行为两种行为的包。代理106可将非易失性存储器用于数据、参数、历史信息和在系统数据库102或其它本地源中提供的本地存储的内容。可提供一个或多个用户简档110,用户简档110包括用于确定代理106的行为的用户特定数据、参数和会话和历史信息。可在数据确定系统中提供一个或多个个性模块108,个性模块108包括用于代理的个性特点。更新管理程序104管理代理106及其来自因特网146或者通过网络接口116的其它网络的相关联的数据的自动和手动加载和更新。
根据本发明的一个实施例,用于系统90的基于语音的接口可包括一个或多个语音单元128。语音单元128可包括一个或多个麦克风,例如阵列麦克风134,以从用户接收话语。滤波器132可对在麦克风134接收的语音进行处理,并将该语音传递到用于编码和压缩的语音编码器138。在一个实施例中,收发器模块130可将编码的语音发送到主单元98。收发器130检测从主单元98接收的编码的语音,然后语音编码器138对该语音进行解码和解压缩,扬声器136宣读该语音。
根据本发明的一个实施例,用于系统90的基于非语音的接口可包括一个或多个多模式装置155,其可包括移动装置、独立计算机和联网计算机、个人数字助理(PDA)、便携式计算机装置或其它多模式装置。
语音单元128、多模式装置155和主单元98可通过通信链接通信。通信链接可包括有线或无线链接。根据一个实施例,通信链接可包括RF链接。语音单元上的收发器130可通过与主单元98上的收发器126的通信链接双向传送编码的语音数据。根据另一实施例,RF链接可使用任何标准的局域无线数据协议,包括IEEE 802.11、蓝牙或其它标准。可替换地,可使用符合任何合适的标准的红外数据链接,所述标准诸如IrDA或其它红外标准。在可替换的实施例中,接线可连接语音单元128和主单元98,去除了对于一个语音编码器138的需要。可使用其它有线或无线模拟或数字传输技术。
根据本发明的一个实施例,将在主单元98上的收发器126接收的编码的语音传递到用于解码和解压缩的语音编码器122。在其它信息中,语音识别引擎120可使用上下文描述语法模块112对解码的语音进行处理。解析程序118可对任何识别的信息进行处理,解析程序118使用由知识代理供应的数据将信息变换为完整的算法和问题。可使用语法堆栈来从多个代理106选择知识代理,其中,知识代理提供用于产生对问题或命令的答复的信息。然后知识代理可通过创建提交到本地数据库102的请求或者通过网络接口116提交到因特网146或外部其它网络上的外部数据源的请求来对命令或问题进行处理。算法典型地导致由系统90自己采取的动作(即,暂停或停止),或者通过与因特网的网络接口或其它数据接口对远程装置或数据源采取的动作(即,下载数据或程序或者控制远程装置)。
根据本发明的一个实施例,知识代理可将问题的结果作为答复返回给用户。可使用信息请求的结果、系统个性108、用户偏好、用户简档110中的其它数据和/或其它信息来创建答复。代理106可使用语音单元128来呈现这些结果。代理106可创建发送到文本至语音引擎124的答复串。文本至语音引擎124可产生语音编码器122可对其进行编码和压缩的话语。一旦被编码,收发器126就将话语从主单元98发送到语音单元128上的收发器130。然后,语音编码器138对话语进行解码和解压缩,扬声器136输出该话语。可替换地,代理106可使用多模式装置155来呈现结果。
非语音接口114可以是多模式装置155的一部分,或者与多模式装置155分离,可将非语音接口114用作语音接口的替代或者补充。例如,非语音接口114可用于以用户更容易理解的方式呈现非语音(比如,图形或表格)信息和与非语音信息交互。根据本发明的一个实施例,可提供多模式支持以维持声音交互期间和通过非语音接口114的交互期间的上下文。在一个示例性实施例中,可在多模式装置155和主用户接口系统90之间开放通信信道,以允许多模式装置155输入文本命令和问题。根据本发明的一个实施例,多模式装置155可发送命令或问题的文本串或关键词。主接口系统90可使多模式装置155和语音单元128之间的上下文同步。为了将答复发送到对应的装置,主用户接口系统90可跟踪输入从其而来的地方,从而可将答复发送到TTS或多模式装置155。
根据本发明的一个实施例,非语音接口114可以以比可通过语音接口的方式更简明的方式显示系统、状态和历史信息。可访问非语音接口114以创建或扩展代理106的能力。这些操作可包括其它操作中的代理的脚本撰写、将数据添加到代理或者代理所使用的数据库102、将链接添加到信息源。
根据本发明的另一实施例,系统90可包括不同类型的代理106。在本发明的一些实施例中,可将一般行为和信息以及领域特定行为和信息组织到领域代理156中。另一方面,系统代理可提供默认功能和基本服务。领域特定代理可为每个应用领域提供完整的、方便的和可重新分布的包或模块。换句话说,领域代理可包括在当前领域或者新的领域中扩展或修改系统90的功能性所需的数据。此外,当添加新的行为或者新的信息变得可利用时,可通过网络远程更新领域代理及其相关联的数据。领域代理可访问可提供各种服务的多个源。领域代理可使用其它的服务,典型地更具体地讲,数据管理程序和系统代理的服务。以许多方式分布和重新分布代理,所述方式包括在可拆除的存储介质上、通过网络转移或者附到电子邮件或其它消息上。本发明可提供许可证管理能力,许可证管理能力允许第三方一次或者基于预订将数据管理程序卖给一个或多个用户。另外,具有特定的专门知识的用户可通过添加新的行为和信息并使得其他用户可利用这些数据管理程序来创建数据管理程序和更新现有的数据管理程序。图6中显示根据本发明的实施例的代理架构的框图。
代理106可接收事件,并将事件返回给事件管理程序100。系统代理150和领域代理156都可从解析程序118接收问题和命令。基于问题和命令中的关键词以及问题和命令的结构,解析程序可调用所选择的代理。代理将非易失性存储用于数据、参数、历史信息和在系统数据库102中提供的本地内容。
根据本发明的一个实施例,当所述系统开机或者启动时,代理管理程序154可加载系统代理150和一个或多个领域代理156,并对系统代理150和一个或多个领域代理156进行初始化。代理管理程序154包括代理106的知识,并将代理106映射到代理库158。在关机时,代理管理程序可卸载代理106。代理管理程序154还对领域代理156和数据库102中的内容执行许可证管理功能。
系统代理150管理标准处理程序152,标准处理程序152处理用于确定关于问题和命令的上下文的特定参数或值(标准)。根据本发明的一个实施例,标准处理程序152包括解析例行程序,其专用于识别语音的特定部分,诸如时间、位置、电影标题和语音的其他部分。标准处理程序152可识别匹配短语,并从这些短语提取语义属性。系统代理150和领域代理156都可使用标准处理程序152。各领域代理156可使用系统代理150和其它的服务,典型地更具体地讲,领域代理156的服务。系统代理150和领域代理156可使用代理库158的服务,代理库158包含关于公共使用的功能的实用程序。根据本发明的一个实施例,代理库可以是实现一个或多个代理的动态链接库。代理库可包括关于文本和串处理、网络通信、数据库查找和管理、模糊和概率评估、文本至语音格式的实用程序以及其他实用程序。
可用编译的代码对领域代理156进行数据驱动、撰写脚本或创建。一般代理的库可被用作用于数据驱动或撰写脚本的代理的起点。典型地,将用编译的代码创建的代理构建到动态可链接或可加载的库中。代理的开发者可根据需要将新的功能性添加到代理库158中。以下将在各部分中对代理分布和更新以及代理创建或修改的细节进行讨论。
根据本发明的另一实施例,提供这样的能力,即,使用更新管理程序104通过无线网或有线网136分布和更新系统代理150、领域代理156、代理库158组件、数据库102和上下文描述语法112,所述无线网或有线网136包括IP网和拨号网。网络接口116可提供与一个或多个网络的连接。更新管理程序104还可管理核心系统更新的下载和安装。代理管理程序154可对领域代理和数据库执行许可证管理功能。更新管理程序104和代理管理程序154可对所有的代理和数据库内容执行这些功能,所述代理和数据库内容包括所有用户或代理可利用的代理和内容和/或所选择的用户可利用的内容。基于周期性添加或更新的代理和数据库组件的示例包括:
●用于新的领域的代理;
●用于代理的附加领域知识;
●用于领域的新的关键词,其可包括政客、运动员、演艺人员的姓名、新的电影或歌曲的名称等,所述政客、运动员、演艺人员、新的电影或歌曲最近受到突出关注;
●与用于覆盖领域的优选信息源集合的链接,所述领域包括对于娱乐、新闻、体育、天气等的链接;
●基于例如税法的改变、公司合并、变化的政治分界线对领域信息的更新;
●对内容的更新,所述内容包括词典、百科全书、年鉴;和
●其它内容和数据库组件。
当用户需要或者选择新的领域代理156或数据库元素102时,更新管理程序104可通过网络接口116连接至它们在网络146上的源,下载和安装代理或数据。为了节省系统资源并符合任何许可证条件,更新管理程序104可卸载不再使用的代理。在本发明的一个实施例中,更新管理程序104可周期性地查询许可的代理和数据库组件的一个或多个源,以当代理可执行程序、脚本或数据变得可利用时,对对代理可执行程序、脚本或数据的更新进行定位和下载。可替换地,当注册的或者许可的代理的代理更新变得可利用时,代理源可启动将所述代理更新下载到更新管理程序的步骤。
代理管理程序154可提供能够执行大多数任何许可证期限和条件的许可证管理客户机程序。当基于提交的命令选择特定代理106和/或数据库元素102时,代理管理程序154验证代理或数据元素的使用在所允许的期限和条件内,并且如果是这样,则调用代理或者允许对数据元素的访问。可通过代理管理程序154实现的许可证管理方案包括直接买断、预订更新、一次或有限次使用。还可由代理管理程序154对共享的代理和数据元素(诸如,从由领域专家组维护的网站下载的这些代理和数据元素)的使用进行管理。
如果问题或命令与当前在所述系统上加载的代理不匹配,则代理管理程序154可通过网络接口116搜索网络146以找到用于合适的代理的源。例如,当在代理不可利用的领域中进行查询时,当将新的装置添加到移动结构时,或者当移动装置的行为被更新时,可触发这个过程。如代理管理程序强制实施地那样,一旦被定位,就可在更新管理程序104的控制下、在许可证协议的期限和条件内加载代理。
可通过改变代理数据或撰写脚本来将新的命令、关键词、信息或信息源添加到任何领域代理156。这些构造能力可允许用户和内容开发商对现有的领域代理156的行为进行扩展和修改,或者从一般代理创建新的领域代理156,而无需创建新的编译的代码。因而,领域代理156的修改范围可从甚至由最偶然的用户进行的次要的数据驱动的更新到如典型地由领域专家将进行的使用脚本语言的复杂行为的开发,所述次要的数据驱动的更新诸如指定单词的拼写。用户可通过语音接口命令或者使用非语音接口114创建领域代理156并管理对领域代理156的修改。结合用户的简档110存储领域代理156的用户特定修改,并且在运行时领域代理156访问该修改。
可以以有助于有效率的评估和帮助开发者进行组织的方式对用于构造数据驱动的代理156的数据进行结构化。不仅代理使用这个数据,而且还在语音识别引擎120、文本至语音引擎124和解析程序118中使用这个数据。一些主要类别的数据的示例包括:
1、内容包可包括问题或命令。每个命令或问题或者命令或问题组可包括用于创建一个或多个请求的上下文。领域代理156可将上下文描述语法表达传递到解析程序118以用于对上下文或问题进行评估。典型地,为每个命令或问题供应初始的或默认的上下文。命令或问题包括用于上下文堆栈的管理和评估的语法。
2、受自然语言语音接口控制的装置上的参数和其它操作数据。领域代理156可使用这个数据和参数来确定如何执行命令、如何对用于解析程序118的命令串进行公式化表达、确定命令是否可行、并确定是否可在安全和操作极限内执行命令。
3、页面列表或者指向其它本地或网络内容源的指针。对于每个页面或内容源,可能存在指向页面或源的指针(比如,URL、URI或其它指针)。每个页面可具有用于提取感兴趣的数据的特定的积攒信息。积攒信息可包括,例如,匹配模式、HTML或其它格式解析信息。
4、答复列表,其在给定上下文、用户简档和检索的信息的情况下确定领域代理156对特定命令或问题的答复。答复可包括诊断错误消息,或者如果仍不能从已知的信息解决问题或命令,则答复可包括对更多信息的请求。答复可基于或者取决于用于变量的阈值或者概率或模糊权重。
5、包括变量替换和变换的替换列表,通常由代理150、156在对请求和结果进行格式化时应用替换列表。例如,证券领域特定代理156将使用公司交易代号、公司名称和普遍使用的缩写的替换列表。可对命令和问题执行替换和变换以创建精确的查询,可对一个或多个信息源应用这些查询,或者可将这些查询应用于用于创建对用户更有意义的输出的结果。替换列表还包括用于对结构化信息进行优化处理的信息,所述优化处理诸如HTML格式化页面解析和评估。
6、用于答复的个性。可通过以加权的方式组合多个特征来构造个性。可对每个代理的领域范围指定权重以创建一个或多个特定的个性。个性特征的示例包括讽刺、幽默、愤怒和同情以及其它特征。
7、用于源、替换、变换、变量或标准的公共参数和用户特定参数。公共参数列表为代理包156的一部分。用户特定参数包括在用户简档110中。
对命令和问题进行解释,公式化表达的请求、创建的答复和呈现的结果可基于用户的个人值或用户简档110值。个人简档可包括个体所特有的信息、他们的兴趣、他们的专用术语、他们与所述系统交互的历史、感兴趣的领域或者其它因素。代理106、语音识别引擎120、文本至语音引擎124和解析程序118可使用个人简档数据。偏好可包括特殊(修改)命令、过去行为或历史、问题、信息源、格式、报告、警报或其它偏好。可由用户手动键入用户简档数据,和/或可由系统基于用户行为学习用户简档数据。用户简档值可包括:1)拼写偏好;2)用户、家人和朋友的生日;3)收入水平;4)性别;5)职业;6)位置信息,诸如,家庭地址、街道和营业地址、旅行路径、参观的位置;7)一种车辆类型或多种车辆类型;8)车辆驾驶者证书、许可证或特殊证件;9)命令和查询的历史;10)电信和其它服务提供商和服务;11)金融和投资信息;12)异名(即,某人的绰号、同一项目的不同术语);13)特殊拼写;14)关键词;15)变换或替换变量;16)感兴趣的领域;或者,17)其它值。
终端用户可使用存储在用户简档110中的数据驱动的代理156扩展和修改设施和值来创建特别专题报告、查询包、警报和输出格式。单个警报或报告可被构造为使用多个数据源和其它变量(即,时间、位置、测量的值)值来确定什么时候应该发送警报。例如,可通过以下方式产生警报,即,每15分钟对股票价格进行采样,并且如果价格下降到一些值以下,则发送警报。在另一示例中,当特定条件或条件的组合对于车辆发生时,可产生警报。警报和报告可被发往本地或远程输出。
为了创建报告,用户可首先指定命令或问题集合。接下来,用户可创建或选择报告格式。最后,用户可为报告命名。报告可具有可变参数。例如,用户可通过陈述报告的名称和公司名称来创建公司股票报告并执行该报告,该报告以用于该公司的指定格式给出用户所选择的信息。在另一示例中,用户可创建“早晨”报告,该报告以期望的顺序和格式呈现所选择的来自不同源(新闻、体育、交通、天气)的多媒体信息。在又一示例中,用户可创建关于一个或多个车辆系统的状态的报告。可仅使用声音命令和答复、通过图形用户接口114的命令和答复或者使用声音命令和答复与通过图形用户接口114的命令和答复的组合来创建警报和报告。可对于车辆本地或远程运行报告。为了创建报告、警报或其它专门行为,用户执行许多步骤,包括:1)指定运行报告或警告的命令;2)指定用于查询的一个问题或多个问题,包括关键词;3)设置用于运行报告的标准,诸如应命令或者当特定条件满足时;4)定义优选的信息源;5)按源、值和其它参数的结果评估顺序定义偏好;6)指定用于报告或警报的呈现介质,诸如电子邮件、文本至语音引擎、发到寻呼机的消息或者文本和图形显示器;以及7)指定报告的优选格式,诸如将呈现的信息、将呈现的信息的顺序、优选缩写或其它可变替换。
在使系统90的各种功能性便利的步骤中,滤波和噪声消除可能是重要的,滤波和噪声消除可改进有噪声的移动环境中的操作。在到语音识别引擎120的输入以良好的信噪比实现用户的语音的识别和解析。为了提供可接受的结果,可采用声学模型、阵列麦克风134、滤波器132或其它组件的集合。如果不能实现良好的信噪比,则可使用噪声识别算法,并且可选择合适的声学模型,例如,在与所识别的噪声类似的条件下经过训练的声学模型。根据本发明的一个实施例,麦克风阵列、滤波器和语音编码器138在物理上主单元98分离而是被设置到语音单元128中,并使用无线链接连接。由于无线连接上的带宽非常珍贵,所以语音编码器动态地适应捕捉的语音的数字化速率和压缩。
本发明的一些实施例可使用麦克风134的一个或多个阵列来提供比可用单个麦克风实现的定向信号捕捉和噪声消除好的定向信号捕捉和噪声消除。麦克风阵列可以是一维(线性阵列)或两维(圆、正方形、三角形或其它合适的形状)。阵列的波束模式可以是固定的,或者可通过使用模拟或数字相移电路使阵列的波束模式自适应。引导有源阵列的图案指向一个或多个讲话的用户的方向。同时,可将零讯号添加到模式中以切除点噪声源或有限区噪声源。阵列麦克风的使用还帮助减少从文本至语音引擎124通过扬声器136的输出或者从另一说话的用户的输出和用户的语音的方向之间的串音。
本发明可在阵列麦克风或传统麦克风134和语音编码器138之间使用模拟或数字滤波器132。可将滤波器的带通设置为优化到语音识别引擎120的输入处的信噪比。在一些实施例中,通过使用与陷波滤波器组合的频带形成来除去窄频带噪声,滤波器是自适应的。一个实施例在滤波器中采用自适应回波消除。回波消除帮助防止从文本至语音引擎的输出和用户的语音的检测之间的串音以及抑制环境引起的回波。将背景噪声与从用户语音接收的信号进行比较的算法可用于优化自适应滤波器的频带形成参数。
可将由阵列麦克风134接收并通过滤波器132的语音发送到语音数字转换器或编码器138。语音编码器可使用自适应有损音频压缩来优化通过无线链接将编码的语音发送到语音识别引擎120的带宽要求。对有损编码进行优化以仅保留优化识别所需的语音信号的分量。此外,可使用的有损压缩算法被设计为防止信号流中的平坦瞬时间隙,平坦瞬时间隙可引起语音识别引擎中的错误。可在编码器中对数字化的语音进行缓冲,编码器可改编输出数据速率以优化可利用的带宽的使用。当在编码器和语音识别引擎之间使用限带无线链接时,自适应语音编码器的使用特别有利。
可用模拟或数字(即,Voice over IP)语音接口实现麦克风。这个接口允许远程用户连接至系统,并且如果它们在物理上存在,则以可能的相同的方式与系统交互。
在可替换的实施例中,可用物理分布的麦克风或用户佩戴的耳机的集合代替阵列麦克风。可在车辆的不同部分、房间的不同部分或者建筑的不同房间中放置分布的麦克风。分布的麦克风可创建三维阵列以改进信噪比。耳机可使用无线或有线连接。
尽管本发明的意图在于能够接受大多数任何自然语言问题或命令,但是歧义性可能是个问题。为了辅助用户对简明的问题和命令进行公式化表达,系统可支持声音查询语言。可对语言进行结构化以使得各种查询和命令具有最小歧义性。因而,声音查询语言帮助用户清楚地指定连同参数或标准一起的问题或命令的关键词或上下文。该语言可提供这样的语法,该语法清楚地指定用于确定上下文的关键词和呈现标准或参数集合。可几乎总是保证以声音查询语言问问题或者陈述命令的用户接收到答复。
声音查询语言可能对上下文堆栈的内容敏感,其中,上下文定义在对话期间可被激活或禁止的问题的集合。根据一个实施例,每个代理可指定一个上下文为定义代理实现的基本算法的根本上下文。因而,由于可从上下文堆栈继承关键词和标准,所以可使用缩写语法来问后续问题。例如,如果问题的标准保持不变,则用户可简单地询问另一关键词。
系统90可提供帮助用户学习对他们的问题和命令进行公式化表达的最佳方法的内置训练能力。交互式训练允许用户可听地或者可视地看见他们的查询的机器解释,并提供关于如何更好地对查询进行结构化的建议。通过使用交互式训练,用户可快速地变得对声音查询语言感觉舒适,同时,可学习如何优化对话的每个步骤所需的信息量。
可将语音编码器122的输出供给到语音识别引擎120。语音识别引擎120使用上下文描述语法112中的信息来识别单词和短语,并将这些单词和短语传递到解析程序118以用于解释。语音识别引擎120可通过每段话语的声音和姓名来确定用户的身份。在所有进一步的处理中,可用这个身份对识别的单词和短语进行标记。因而,由于多个用户参与重叠会话,所以由语音识别引擎120添加到每段话语的标记允许系统90的其它组件将这段话语与正确的用户和对话联系起来。用户识别能力还可被用作需要安全措施的应用的安全措施,所述应用诸如拍卖或在线购物。可将每个用户的声音特点包含在用户简档110中。
根据本发明的一个实施例,当用户首先对系统90说话时,用户可与系统90一起开始对话。这可通过讲出一般单词(“计算机”)或者说出特定名称(“Fred”)来执行,所述一般单词和特定名称通常可能与系统个性108联系。一旦用户开始对话,语音识别引擎120就可使用用户语音的独特特点来识别该对话。在对话结束时或者为了中断对话,用户可说出遣散单词(“再见”)。
根据本发明的另一实施例,系统90可采用语音识别引擎124,语音识别引擎124使用来自其它组件中的上下文描述语法112、用户简档110和代理106的数据来获取改进的单词识别准确度。同时,可对单词在上下文描述语法中的模糊集概率或先验概率进行动态更新以最大化对话的每一阶段的正确识别的概率。可基于许多标准对概率或可能性进行动态更新,所述标准包括其它标准中的应用领域、问题或命令、上下文、用户简档和偏好、用户对话历史、识别器词典和短语表以及单词拼写。
对于不常见的单词或新的词汇单词,可给予用户拼写单词的选择。可通过说出名称或字母或者使用音标字母来进行拼写。音标字母可以是默认的字母或者用户的选择中的一个。
可替换地,当用户提交语音识别引擎120根本不识别或者没有被正确识别的单词时,可要求用户拼写该单词。语音识别引擎120基于评分过程的置信水平来确定这个条件。可在词典中查找单词,并将该单词的发音添加到词典、代理106或用户的简档110。然后将单词发音与领域、问题、上下文和用户相关联。通过这个过程,语音识别引擎随着时间学习,并改进准确度。为了辅助用户拼写单词,可使用个性化的音标字母。每个用户可用他们可更容易记住的单词来修改标准的音标字母。
一旦语音识别引擎120已识别单词和短语,就可将表征和用户识别传递到解析程序118。解析程序检查用于问题或命令、上下文和标准的表征。解析程序可通过将先验概率或模糊概率应用于关键词匹配、用户简档110、对话历史和上下文堆栈内容来确定话语的上下文。问题或命令的上下文可确定领域,从而,如果有的话,确定将被调用的领域代理156。例如,具有关键词“温度”的问题暗示问题的天气上下文值。在不同对话内,关键词“温度”可暗示测量上下文。解析程序从系统代理150或已激活的领域代理156动态地接收关键词和相关联的先验概率或模糊概率更新。基于这些概率或可能性,对可能的上下文进行评分,并将顶部的一个或几个用于进一步处理。
解析程序118使用评分系统来确定用户的问题和/或命令的最可能的上下文或领域。通过权衡许多因素来确定评分,所述因素包括用户简档110、领域代理的数据内容和以前的上下文。基于这个评分,系统90调用正确的代理。如果得分的置信水平不是高得足以确保可靠的答复,则系统90可叫用户验证是否正确地理解问题和/或命令。
通常,可将系统90所问的问题分成短语以指示问题的上下文,包括所有的标准或参数。例如,问题可以是这样的形式:“我理解你想如此这般吗”。如果用户确认问题是正确的,则所述系统继续生成答复。否则,用户可重新将原始问题分成短语,可通过添加附加信息来重新将原始问题分成短语以去除歧义性,或者系统可问一个或多个问题以尝试解决歧义性。
一旦已确定问题或命令的上下文,解析程序118就可调用正确的代理156、150。为了对代理所使用的常规语法中的问题和命令进行公式化表达,解析程序将优选地确定用于标准或参数的所需要的可选值。可由用户明确地供应这些标准,或者可能需要对这些标准进行推测。解析程序可使用由系统代理供应的标准处理程序152。标准处理程序可提供对上下文敏感的进程,该进程用于从用户的问题或命令提取标准或参数。可通过执行代理中的算法来确定一些标准,而可通过将概率或模糊推理应用于可能的值的表格来确定其它标准。可从许多源接收先验概率或模糊概率以及相关联的值,所述源包括,例如,对话的历史、用户简档110和代理。基于用户答复,当系统学习期望的行为时,可对先验概率或模糊概率进行更新。对于天气上下文,标准的示例包括位置、日期和时间。其它标准可包括命令标准(即,是/不是、开/关、暂停、停止)和拼写。可从用于处理列表、表格、插入命令、长的文本串和系统命令的系统代理获得专用标准处理程序。
标准处理程序152可迭代地或者递归地对被提取以消除歧义性的标准进行操作。这个处理可帮助减少用户的问题或命令中的歧义性。例如,如果在用户的话语具有地名(或者其它合适的名词),则解析程序118可使用领域代理156的服务来在数据库102的表格中查找该地名,或者可尝试从话语的句法确定哪个单词是合适的名词。在另一示例中,用户问“what about fight one hundred and twenty too?”。解析程序和领域代理使用数据库中的航班信息和连同上下文的网络信息来确定以下解释中的最似乎可信的解释:航班100和航班20,还有,航班100和航班22、航班122等。
一旦确定上下文和标准,解析程序118就可形成用于代理150、156进行处理的标准格式或分级数据结构的问题或命令。解析程序118可为上下文的语法填充所有需要的表征和一些可选的表征。经常,必须将表征变换为代理可接受的值和形式。解析程序从代理、对话历史或用户简档110获得所需要的变换。由解析程序对表征执行的变换或替换的示例包括:1)用股票代号替换公司名称或缩写;2)用数值替换一个单词或多个单词;3)将邮政编码添加到地址中;和4)将地点或其它名称变为普遍使用的标准缩写。
一旦解析程序118已以所需要的标准格式设置命令或问题,代理150、156就可接收该命令或问题。基于上下文,解析程序可调用正确的代理来对问题或命令进行处理。
可将命令发往系统或外部实体。通常将系统命令发往系统代理150。通常由包括命令上下文和外部实体的行为的领域代理156对关于外部实体的命令进行处理。
通常可将特定问题发往领域代理156中的一个。正确的代理的实时选择允许本发明动态地切换上下文。基于问题、命令或上下文和参数或标准,领域代理可创建对一个或多个本地或外部信息源的一个或多个查询。本质上,问题可以是客观的或者主观的。通常可通过对一个或多个本地或网络信息源的结构化的查询来获得客观问题的结果。即使对于客观问题,系统也可能需要应用概率或模糊集分析来处理冲突信息或不完整信息的情况。通常通过对本地或网络数据源的一个或多个自组查询来获得用于回答主观问题的信息,之后对一个结果进行概率或模糊集评估以确定最佳答案。
一旦领域代理156已对一个或多个查询进行公式化表达,就可将这些查询发送到本地和/或网络信息源。可以以异步方式执行查询以说明源以不同的速度答复或者源可能根本未能答复的事实。可将完全相同的查询发送到不同的信息源以确保至少一个源以及时的方式用有用的结果作出答复。此外,如果以及时的方式接收到多个结果,则系统可对它们进行评分以确定哪个数据最可靠或者最合适。适应的数据源的示例包括HTTP数据源、具有包括XML的各种格式的元数据的源、来自使用各种格式的传感器的测量数据、装置32设置参数、娱乐音频、包括MP3的视频和游戏文件、使用查询语言的数据库和诸如SQL的结构化答复以及其它数据源。
可将本地信息源存储在一个或多个系统数据库102中,或者本地信息源可在任何本地数据存储器上,所述本地数据存储器诸如播放机中的CD或DVD的集合或者其它本地数据存储器。在其它情况下,可从车辆系统设置或测量装置获得本地信息。网络信息源可连接至控制器和装置接口30、数据接口26、因特网42或其它网络,可通过网络接口116中的已知为可插式源的一系列插件程序或适配器对网络信息源进行访问。可插式源能够执行协议,并解释用于感兴趣的数据源的数据格式。可插式源提供从每个源到领域代理156的信息积攒形式和过程。如果将使用新类型的数据源,则可将新的插件程序或适配器添加到合适的接口。
当一个或多个查询的结果到达时,领域代理156可对这些结果进行评估。领域代理可使用概率或模糊评分技术基于已接收的结果、上下文、标准、对话的历史、用户简档110和领域特定信息对结果的相关性进行评分。在上下文堆栈中对对话历史的部分进行维护。用于评分的每个上下文的权重可基于一个上下文与另一上下文的相关性和上下文的年龄。可通过上下文堆栈将其它评分变量关联。上下文也可以是独有的,从而以前的上下文在评分中不具有权重。
基于正在进行的评分过程,领域代理156可确定是否可提取单个最佳的答案。对于大多数问题,期望的结果可包括可被找到以对答案进行公式化表达的表征的集合。一旦已对这些表征中的每个表征找到值,就准备将结果呈现给用户。例如,对于天气问题,表征可包括日期、一周中的某天、预测的高温、预测的低温、降雨量的变化、预期的云覆盖范围、预期类型的降雨量和其它表征。以这种方式处理的结果可包括错误消息。对于主观问题,通过确定最可能的一个答案或多个答案来作出这个确定,通过接收的结果的匹配提取这些答案。如果不能从查询的结果推测出满意的答案,则代理可进行以下步骤中的一个步骤:
1、要求用户给予更多的信息,典型地通过语音接口,并基于获得的结果对新的查询进行公式化表达。当不可解决的歧义性在答复的公式化表达中出现时,应用这个方法。
2、基于从第一查询集合接收的结果对新的查询进行公式化表达。典型地,在所接收的答复不包括所有需要的信息的情况下应用这个方法。可从已经获得的结果(即,HTML文档中的链接或者来自其它装置32的测量或设置)或者从其它源推测出查询的信息源。通过使用这个方法,可对查询和答复的一个或多个集合进行束缚,而无需用户采取动作。
3、等待另外的查询以返回结果。
在任何情况下,领域代理156可继续进行查询并对结果进行评估,直到构成满意的答复为止。在这样做的步骤中,代理可开始几个重叠的查询路径或询问线程,典型地由事件管理程序100对这些查询路径或询问线程进行调解。这个技术,与来自多个数据源的异步查询的使用组合,提供与用户的自然交互所需的实时答复性能。
当接收到每个查询答复时,领域代理156可将条件积攒操作应用于每个查询答复。条件积攒动作可取决于上下文、标准、用户简档110和领域代理编码和数据。对于将被提取的每个表征,可使用系统代理150的服务来创建积攒标准152。积攒标准可使用格式特定的积攒方法,包括表格、列表、文本和其它方法。可将一个或多个积攒标准应用于一个页面或者结果集合。一旦接收到另外的结果,领域代理就可创建新的积攒标准以应用于已获取的结果。条件积攒处理去除不必对其进行进一步处理或存储的不必要的信息,诸如图形,从而改进系统性能。
通常将特定命令发往领域代理156中的一个。正确的代理的实时选择允许本发明动态地切换上下文。面向命令的领域代理156对命令和车辆系统的状态、系统能力和测量进行评估以确定是否根本可执行命令,或者如果根本可执行命令,则确定命令是否将超出操作或安全极限。如果命令有歧义或者由于一些其它原因而导致不能执行命令,则系统可要求用户给予更多的信息,或者可建议问题是什么以及可能的解决方法。领域代理可对用于特定装置32以及控制器和装置接口30的命令进行格式化。这个格式化可涉及变量替换、丢失值的推测和其它格式化。变量替换和推测取决于命令上下文、用户简档110、命令历史、车辆系统的状态和测量的值以及其它因素。复杂的命令可导致发送到多个装置的更微小的命令,可能在序列中发送这些更微小的命令。序列和随后命令的性质可取决于以前的命令、以前的命令的结果、装置设置和其它测量。当执行命令时,进行测量,并收集结果以确定执行是否正确以及是否达到期望的一种状态或多种状态。
一旦领域代理156已创建对问题或者对命令的满意答复,代理就可对该答复进行格式化以用于呈现。典型地,领域代理可将答复格式化为文本至语音引擎124所使用的标记格式。领域代理可使用可利用的格式模板并基于上下文、标准和用户简档110对结果呈现进行格式化。领域代理可执行变量替换和变换以生成用户最好理解、最自然的答复。领域代理可改变表征的呈现顺序和用于创建对用户更自然的答复的准确术语。领域代理还可选择将被使用的呈现个性108。
对于命令和查询答复,领域代理156可选择呈现模板,确定关于表征的呈现的顺序,并通过使用概率或模糊集决策方法确定变量替换和变换。用于形成呈现的模板可来自领域代理本身或者来自用户简档110。用户简档可完全指定呈现格式,或者可用于选择然后修改现有的呈现格式。呈现模板的选择和格式化还可取决于呈现个性108。同时,通过使用从上下文、标准、领域代理本身和用户简档110得到的概率或模糊概率来动态地确定用于答复的个性化的特点。
领域代理156可在呈现给用户之前将许多变换应用于表征。可从许多源得到这些变量替换和变换,所述源包括代理所携带的领域信息、上下文、表征值、标准、将被使用的个性108以及用户简档110。变量替换和变换的示例包括:1)用单词替换数字;2)用名称替换首字母缩略词或符号(即,交易代号);3)从信息源(即,HTML标记)得到的格式化信息的使用;4)答复的性质,包括文本、长文本、列表、表格;5)可能的丢失信息或差错;6)测量单位(即,英语或尺度);以及7)来自用户简档或呈现个性108的优选术语。
本发明可为长文本串、表格、列表和其它大的结果集合提供专用呈现能力。领域代理156可将专用的格式模板用于这样的结果。系统代理150可提供用于呈现的专用标准处理程序152和用于大的结果集合的用户命令。领域代理将其用于大的结果集合的呈现模板典型地包括用于对结果进行总结然后允许用户更详细地查询结果的方法。例如,一开始仅呈现短的摘要,诸如标题或关键数字。然后用户可进一步查询结果集合。标准处理程序为用户提供浏览大的结果集合的能力。由标准处理程序提供的用于大的结果集合的命令包括停止、暂停、跳过、倒退、开始和前进。
可以以显示格式最好地呈现诸如视频、图片和图形的格式的一些信息。领域代理156应用在这些情况下合适的呈现模板,并通过非语音接口114呈现信息。系统代理150提供用于呈现的专用标准处理程序152和用于显示呈现和控制的用户命令。
虽然已显示和描述了本发明的特定实施例,但是将理解,其意图并不在于将本发明限于所公开的实施例,对本领域的技术人员显而易见的是,可在不脱离本发明的精神和范围的情况下进行各种改变和修改。因而,本发明的意图在于覆盖可替换物、修改和等同物,可将这些可替换物、修改和等同物包括在如由权利要求所限定的本发明的精神和范围内。

Claims (49)

1、一种用于处理语音和非语音交流的移动装置,包括:
识别模块,识别与所述移动装置交流的用户;
匹配模块,将识别的用户与一个或多个简档匹配;
转录模块,对语音和非语音交流进行转录以创建基于语音的文本消息和基于非语音的文本消息,其中,该转录模块访问所述一个或多个简档;
合并模块,合并所述基于语音的文本消息和所述基于非语音的文本消息以产生查询;
搜索模块,在所述查询中搜索文本组合;
比较模块,将所述文本组合与上下文描述语法中的条目进行比较;
与所述上下文描述语法相关联的多个领域代理;
评分模块,基于来自比较模块的结果提供相关性得分;
领域代理选择器,基于来自评分模块的结果选择领域代理;和
答复产生模块,与所选择的领域代理通信以获得由所选择的领域代理收集的内容,并从该内容产生答复,其中,基于来自评分模块的结果按选定的顺序布置所述内容。
2、根据权利要求1所述的移动装置,其中,所述答复产生模块产生包括由所选择的领域代理收集的内容的总答复。
3、根据权利要求1所述的移动装置,其中,所述识别模块支持在同一会话期间访问所述移动装置的多个用户。
4、根据权利要求3所述的移动装置,其中,所述会话可包括重叠会话或交错会话。
5、根据权利要求3所述的移动装置,其中,所述识别模块基于声纹匹配或口令匹配来验证所述多个用户的身份。
6、根据权利要求4所述的移动装置,其中,在交错会话期间,所述移动装置按接收的顺序处理一个或多个查询。
7、根据权利要求1所述的移动装置,其中,在交错会话期间,所述移动装置基于根据所述查询的长度而确定的顺序处理一个或多个查询。
8、根据权利要求1所述的移动装置,其中,所述移动装置包括(i)个人数字助理、(ii)蜂窝电话、(iii)便携式计算机、(iv)桌面计算机或者(i)至(iv)的任何组合。
9、根据权利要求1所述的移动装置,其中,所述移动装置接收后续的语音和非语音交流,其中,所述转录模块对后续的语音和非语音交流进行转录以创建后续的基于语音的文本消息和后续的基于非语音的文本消息。
10、根据权利要求9所述的移动装置,其中,所述合并模块合并所述后续的基于语音的文本消息和后续的基于非语音的文本消息以产生后续查询。
11、根据权利要求1所述的移动装置,还包括有助于对答复进行格式化的个性模块。
12、根据权利要求1所述的移动装置,其中,所述移动装置被构造为与上下文堆栈通信,所述上下文堆栈包括基于所述查询而选择的一个或多个上下文。
13、根据权利要求12所述的移动装置,其中,所述评分模块基于至少将先验概率或模糊概率应用于(i)关键词匹配、(ii)用户简档、(iii)对话历史或者(i)至(iii)的任何组合来确定所述一个或多个上下文。
14、根据权利要求1所述的移动装置,其中,至少一个所述领域代理创建请求并将该请求发往本地信息源或网络信息源。
15、根据权利要求1所述的移动装置,其中,至少一个所述领域代理创建命令并将该命令发往远程装置或本地装置。
16、根据权利要求10所述的移动装置,其中,所述后续查询与和所述查询相同的上下文相关联。
17、根据权利要求1所述的移动装置,其中,所述移动装置支持因特网浏览,并且其中,产生的查询被用于进行因特网浏览。
18、根据权利要求1所述的移动装置,其中,所述移动装置支持多模式通信。
19、一种移动装置,包括:
可由该移动装置访问的对象;
输入装置,接收与所述对象相对应的语音和非语音注解;
转录模块,对所述语音和非语音注解进行转录以创建基于语音的文本消息和基于非语音的文本消息;和
关联模块,将所述对象与所述基于语音的文本消息和基于非语音的文本消息相互关联。
20、根据权利要求19所述的移动装置,还包括:
分类模块,对所述基于语音的文本消息和基于非语音的文本消息进行分类;和
搜索模块,基于搜索请求搜索所述基于语音的文本消息和基于非语音的文本消息。
21、根据权利要求19所述移动装置,其中,所述关联模块将所述对象与所述语音和非语音注解相关联。
22、根据权利要求21所述的移动装置,还包括:
分类模块,对所述语音和非语音注解进行分类;和
搜索模块,基于搜索请求搜索所述语音和非语音注解。
23、根据权利要求19所述的移动装置,其中,所述对象包括数字介质。
24、根据权利要求23所述的移动装置,其中,所述对象包括数字照片、日历条目、电子邮件消息、即时消息、电话簿条目、语音邮件条目或数字电影。
25、根据权利要求19所述的移动装置,其中,所述关联模块将所述对象与所述语音和非语音注解、基于语音的文本消息和基于非语音的文本消息相关联。
26、根据权利要求25所述的移动装置,其中,可使用(i)声音命令、(ii)文本命令或者(i)和(ii)的组合来检索所述对象。
27、根据权利要求19所述的移动装置,其中,所述对象被存储在(i)所述移动装置中,被存储在(ii)服务器处或者被存储在(i)和(ii)的组合中。
28、根据权利要求19所述的移动装置,其中,所述对象包括元数据。
29、根据权利要求28所述的移动装置,其中,所述元数据包括全球定位系统信息、环境信息或地理信息。
30、根据权利要求28所述的移动装置,还包括能够实现元数据的搜索的元数据搜索模块。
31、一种系统,包括:
多个支持多模式通信的移动装置,其中,两个或更多个移动装置与用户相关联;和
被耦合到所述多个移动装置的上下文模块,其中,在与所述用户相关联的所述两个或更多个移动装置处维持相同的上下文。
32、根据权利要求31所述的系统,其中,所述多个移动装置包括:
识别模块,识别与该移动装置交流的用户;
匹配模块,将识别的用户与一个或多个简档匹配;
转录模块,对语音和非语音交流进行转录以创建基于语音的文本消息和基于非语音的文本消息,其中,该转录模块访问所述一个或多个简档;
合并模块,合并所述基于语音的文本消息和所述基于非语音的文本消息以产生查询;
搜索模块,在所述查询中搜索文本组合;
比较模块,将所述文本组合与上下文描述语法中的条目进行比较;
与上下文描述语法相关联的多个领域代理;
评分模块,基于来自比较模块的结果提供相关性得分;
领域代理选择器,基于来自评分模块的结果选择领域代理;和
答复产生模块,与所选择的领域代理通信以获得由所选择的领域代理收集的内容,并从该内容产生答复,其中,基于来自评分模块的结果按选定的顺序布置所述内容。
33、根据权利要求31所述的系统,其中,所述上下文模块被构造为将相同的信息广播到两个或更多个移动装置,并从这些移动装置之一接收答复。
34、根据权利要求31所述的系统,其中,所述上下文模块广播第一类型的信息,接收第二类型的信息。
35、根据权利要求34所述的系统,其中,第一类型的信息和第二类型的信息包括语音信息或非语音信息。
36、根据权利要求35所述的系统,其中,第一类型的信息包括在图形用户接口上呈现的非语音信息,第二类型的信息包括应用于搜索网络的语音信息。
37、根据权利要求36所述的系统,其中,第一类型的信息和第二类型的信息对应于相同的上下文。
38、一种在多模式环境中处理语音和非语音交流的方法,包括:
接收语音和非语音交流;
识别提供所述语音和非语音交流的用户;
将识别的用户与一个或多个简档匹配;
对所述语音和非语音交流进行转录以创建基于语音的文本消息和基于非语音的文本消息,其中,该转录操作包括访问所述一个或多个简档;
合并所述基于语音的文本消息和基于非语音的文本消息以产生查询;
在所述查询中搜索文本组合;
将所述文本组合与上下文描述语法中的条目进行比较;
访问与所述上下文描述语法相关联的多个领域代理;
基于来自将所述文本组合和上下文描述语法中的条目进行比较的结果产生相关性得分;
基于来自相关性得分的结果选择一个或多个领域代理;
获得由所选择的领域代理收集的内容;和
从所述内容产生答复,其中,基于来自相关性得分的结果按选定的顺序布置所述内容。
39、根据权利要求38所述的方法,还包括产生包括由所选择的领域代理收集的内容的总答复。
40、根据权利要求38所述的方法,还包括:
接收后续的语音和非语音交流;
对所述后续的语音和非语音交流进行转录以创建后续的基于语音的文本消息和后续的基于非语音的文本消息;和
合并所述后续的基于语音的文本消息和后续的基于非语音的文本消息以产生后续查询。
41、根据权利要求38所述的方法,还包括将答复传达给用户的个性模块。
42、根据权利要求38所述的方法,其中,所述系统在同一会话期间支持多个用户。
43、根据权利要求42所述的方法,其中,所述会话可包括重叠会话或交错会话。
44、根据权利要求42所述的方法,其中,基于声纹匹配或口令匹配来识别所述多个用户。
45、根据权利要求43所述的方法,还包括按接收的顺序处理一个或多个查询。
46、根据权利要求43所述的方法,还包括基于根据所述查询的长度而确定的顺序处理一个或多个查询。
47、根据权利要求38所述的方法,还包括产生上下文堆栈,所述上下文堆栈包括基于所述查询而选择的一个或多个上下文。
48、根据权利要求47所述的方法,其中,基于将先验概率或模糊概率应用于(i)关键词匹配、(ii)用户简档、(iii)对话历史或者(i)至(iii)的任何组合来产生所述一个或多个上下文。
49、根据权利要求38所述的方法,还包括用产生的查询进行因特网浏览。
CN200680038560.XA 2005-08-29 2006-08-29 支持自然语言人机交互的移动系统和方法 Expired - Fee Related CN101292282B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/212,693 US7949529B2 (en) 2005-08-29 2005-08-29 Mobile systems and methods of supporting natural language human-machine interactions
US11/212,693 2005-08-29
PCT/US2006/033378 WO2007027546A2 (en) 2005-08-29 2006-08-29 Mobile systems and methods of supporting natural language human-machine interactions

Publications (2)

Publication Number Publication Date
CN101292282A true CN101292282A (zh) 2008-10-22
CN101292282B CN101292282B (zh) 2016-01-06

Family

ID=37805456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680038560.XA Expired - Fee Related CN101292282B (zh) 2005-08-29 2006-08-29 支持自然语言人机交互的移动系统和方法

Country Status (4)

Country Link
US (5) US7949529B2 (zh)
EP (2) EP1929466A4 (zh)
CN (1) CN101292282B (zh)
WO (1) WO2007027546A2 (zh)

Cited By (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853253A (zh) * 2009-03-30 2010-10-06 三星电子株式会社 在移动终端中管理多媒体内容的设备和方法
WO2011030355A2 (en) * 2009-09-14 2011-03-17 Arun Jain Zolog intelligent human language interface for business software applications
CN102385619A (zh) * 2011-10-19 2012-03-21 百度在线网络技术(北京)有限公司 一种根据语音输入信息提供访问建议的方法与设备
CN102945120A (zh) * 2012-11-27 2013-02-27 南京恒知讯科技有限公司 一种基于儿童应用中的人机交互辅助系统及交互方法
CN103188409A (zh) * 2011-12-29 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音自动应答云端服务器、系统及方法
WO2013097376A1 (zh) * 2011-12-31 2013-07-04 中兴通讯股份有限公司 一种为备份数据添加备注的方法及具有备份功能的终端
CN103514875A (zh) * 2012-06-29 2014-01-15 联想(北京)有限公司 语音数据的匹配方法和电子设备
CN103703481A (zh) * 2013-02-28 2014-04-02 观致汽车有限公司 一种日历事项制定、提醒及导航方法及其系统
CN104216990A (zh) * 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
CN104503581A (zh) * 2014-12-26 2015-04-08 安徽寰智信息科技股份有限公司 一种基于视频交互系统的科普方法
CN104637492A (zh) * 2013-11-07 2015-05-20 大陆汽车系统公司 用于自动语音识别系统的共同讲话者调零
CN104700352A (zh) * 2013-12-09 2015-06-10 Cjcgv株式会社 生成用于多投影剧院的图像的方法和图像管理设备
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
CN104732974A (zh) * 2013-12-19 2015-06-24 国家电网公司 智能录音识别系统
WO2015113752A1 (de) * 2014-01-31 2015-08-06 AgBRAIN - AGRITECHNICAL BASIC RESEARCH FOR ADVANCED INNOVATION GMBH Bedienterminal einer landmaschine mit hypervisor-software
CN105122353A (zh) * 2013-05-20 2015-12-02 英特尔公司 用于虚拟个人助理系统的自然人-计算机交互
CN105144136A (zh) * 2012-12-13 2015-12-09 微软技术许可有限责任公司 动作代理
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
CN105551490A (zh) * 2015-12-23 2016-05-04 中国电子科技集团公司第四十一研究所 一种电子测量仪器的智能语音交互系统及方法
CN105679318A (zh) * 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
CN105808200A (zh) * 2010-01-18 2016-07-27 苹果公司 智能自动化助理
CN106250508A (zh) * 2012-09-10 2016-12-21 谷歌公司 使用环境上下文回答问题
CN106847258A (zh) * 2013-02-20 2017-06-13 谷歌公司 用于共享调适语音简档的方法和设备
CN107004410A (zh) * 2014-10-01 2017-08-01 西布雷恩公司 语音和连接平台
CN107077504A (zh) * 2015-01-05 2017-08-18 国际商业机器公司 增补信息请求
CN107092646A (zh) * 2009-04-14 2017-08-25 高通股份有限公司 用于使用移动装置进行图像辨识的系统和方法
CN107195298A (zh) * 2016-03-15 2017-09-22 通用汽车环球科技运作有限责任公司 根本原因分析以及校正系统和方法
CN107633844A (zh) * 2017-10-10 2018-01-26 杭州嘉楠耘智信息科技股份有限公司 设备控制方法及装置
CN107798055A (zh) * 2016-09-06 2018-03-13 国立大学法人京都大学 语音交互设备和使用语音交互设备的自动交互方法
CN107810387A (zh) * 2015-06-23 2018-03-16 谷歌有限责任公司 在汽车环境中的移动地理应用
CN109074397A (zh) * 2016-05-06 2018-12-21 索尼公司 信息处理系统和信息处理方法
CN109463004A (zh) * 2017-05-16 2019-03-12 苹果公司 数字助理服务的远场延伸
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
CN109840320A (zh) * 2017-11-28 2019-06-04 微软技术许可有限责任公司 文本的定制化处理
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
CN110019688A (zh) * 2019-01-23 2019-07-16 艾肯特公司 对机器人进行训练的方法
CN110110952A (zh) * 2011-06-03 2019-08-09 苹果公司 生成和处理代表待执行任务的任务项目
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
CN110277086A (zh) * 2019-06-25 2019-09-24 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN110277090A (zh) * 2019-07-04 2019-09-24 苏州思必驰信息科技有限公司 用户个人的发音词典模型的自适应修正方法及系统
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
CN110400564A (zh) * 2019-08-21 2019-11-01 科大国创软件股份有限公司 一种基于栈的聊天机器人对话管理方法
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
CN110476169A (zh) * 2018-01-04 2019-11-19 微软技术许可有限责任公司 在会话中提供情感关怀
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
CN110800044A (zh) * 2017-09-08 2020-02-14 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
CN110889161A (zh) * 2019-12-11 2020-03-17 清华大学 一种声控建筑信息模型三维显示系统和方法
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
WO2020073656A1 (zh) * 2018-10-11 2020-04-16 平安科技(深圳)有限公司 人机交互方法、系统、计算机设备及存储介质
CN111028836A (zh) * 2019-12-16 2020-04-17 华南理工大学广州学院 一种智能声控电子仪表台的控制系统及其控制方法
CN111095400A (zh) * 2017-07-28 2020-05-01 赛伦斯运营公司 选择系统和方法
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
CN111552517A (zh) * 2019-01-23 2020-08-18 阿里巴巴集团控股有限公司 应用程序启动方法、装置、电子设备及计算机存储介质
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
CN111939559A (zh) * 2019-05-16 2020-11-17 北京车和家信息技术有限公司 车载语音游戏的控制方法和装置
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
CN112270925A (zh) * 2014-09-14 2021-01-26 谷歌有限责任公司 用于创建可定制对话系统引擎的平台
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
CN112313740A (zh) * 2018-04-20 2021-02-02 脸谱公司 聚合语义信息以提高对用户的理解
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
CN112585642A (zh) * 2019-02-25 2021-03-30 株式会社酷比特机器人 信息处理系统和信息处理方法
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN112970061A (zh) * 2018-11-14 2021-06-15 惠普发展公司,有限责任合伙企业 基于策略许可的内容
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
CN113168833A (zh) * 2018-12-13 2021-07-23 大众汽车股份公司 用于运行车辆的交互信息系统的方法以及车辆
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
CN115064168A (zh) * 2022-08-17 2022-09-16 广州小鹏汽车科技有限公司 语音交互方法、服务器和存储介质
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
CN117409781A (zh) * 2023-12-14 2024-01-16 深圳市恒利数码科技有限公司 一种基于智能机顶盒的人机交互管理系统
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11948563B1 (en) 2019-10-18 2024-04-02 Meta Platforms, Inc. Conversation summarization during user-control task execution for assistant systems

Families Citing this family (698)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590224B1 (en) * 1995-09-15 2009-09-15 At&T Intellectual Property, Ii, L.P. Automated task classification system
WO2001013255A2 (en) 1999-08-13 2001-02-22 Pixo, Inc. Displaying and traversing links in character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
CA2348353A1 (en) 2001-05-22 2002-11-22 Marc Arseneau Local broadcast system
US10115128B2 (en) * 2010-10-21 2018-10-30 Concur Technologies, Inc. Method and system for targeting messages to travelers
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) * 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US7162237B1 (en) 2002-07-26 2007-01-09 Bellsouth Intellectual Property Corporation System for automatic selection of profile based on location
GB2399983A (en) * 2003-03-24 2004-09-29 Canon Kk Picture storage and retrieval system for telecommunication system
US7669134B1 (en) 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
US7684550B2 (en) * 2003-05-20 2010-03-23 Oc Concepts, Inc. Customer information system
US9984377B2 (en) * 2003-10-06 2018-05-29 Yellowpages.Com Llc System and method for providing advertisement
US7386443B1 (en) 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
KR100843901B1 (ko) * 2004-12-04 2008-07-03 주식회사 현대오토넷 텔레매틱스 시스템을 이용한 원격지 차량 제어 시스템 및그 제어방법
US9821344B2 (en) * 2004-12-10 2017-11-21 Ikan Holdings Llc Systems and methods for scanning information from storage area contents
JP4517866B2 (ja) * 2005-01-28 2010-08-04 株式会社日立製作所 センサデータ処理方式
US20060271520A1 (en) * 2005-05-27 2006-11-30 Ragan Gene Z Content-based implicit search query
US8042140B2 (en) 2005-07-22 2011-10-18 Kangaroo Media, Inc. Buffering content on a handheld electronic device
EP2463820A3 (en) 2005-07-22 2012-09-12 Kangaroo Media, Inc. System and methods for enhancing the experience of spectators attending a live sporting event
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
EP1934971A4 (en) 2005-08-31 2010-10-27 Voicebox Technologies Inc DYNAMIC LANGUAGE SCRIPTURE
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US8620667B2 (en) * 2005-10-17 2013-12-31 Microsoft Corporation Flexible speech-activated command and control
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US7996228B2 (en) * 2005-12-22 2011-08-09 Microsoft Corporation Voice initiated network operations
US20130054317A1 (en) 2011-08-24 2013-02-28 Raj Vasant Abhyanker Geospatially constrained gastronomic bidding
US7786979B2 (en) * 2006-01-13 2010-08-31 Research In Motion Limited Handheld electronic device and method for disambiguation of text input and providing spelling substitution
WO2007088877A1 (ja) * 2006-01-31 2007-08-09 Honda Motor Co., Ltd. 会話システムおよび会話ソフトウェア
DE102006006551B4 (de) * 2006-02-13 2008-09-11 Siemens Ag Verfahren und System zum Bereitstellen von Sprachdialoganwendungen sowie mobiles Endgerät
US20070208861A1 (en) * 2006-03-02 2007-09-06 Zellner Samuel N User preference interpretation
US7747246B2 (en) 2006-03-02 2010-06-29 At&T Intellectual Property I, L.P. Environment independent user preference communication
US20070208860A1 (en) * 2006-03-02 2007-09-06 Zellner Samuel N User specific data collection
US8510109B2 (en) 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
US20150255067A1 (en) * 2006-04-05 2015-09-10 Canyon IP Holding LLC Filtering transcriptions of utterances using received information to correct transcription errors
CA2644666A1 (en) 2006-04-17 2007-10-25 Vovision Llc Methods and systems for correcting transcribed audio files
US7809360B2 (en) * 2006-05-24 2010-10-05 International Business Machines Corporation Optimization of calendar, itinerary, route plan, and PIM efficiencies according to assimilated wireless service availability conditions
US7899251B2 (en) * 2006-06-05 2011-03-01 Microsoft Corporation Balancing out-of-dictionary and in-dictionary recognition scores
US8015014B2 (en) * 2006-06-16 2011-09-06 Storz Endoskop Produktions Gmbh Speech recognition system with user profiles management component
US7775442B2 (en) * 2006-07-12 2010-08-17 Nokia Corporation Method for accessing after-operation information of secure element applications
GB2440766B (en) * 2006-08-10 2011-02-16 Denso Corp Control system
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
PT2066662E (pt) * 2006-09-21 2013-02-13 Kyorin Seiyaku Kk Inibidores de serina-hidrolase
EP1902906B1 (en) * 2006-09-22 2017-07-26 Harman Becker Automotive Systems GmbH Add-on module for externally controlling a speech dialog system
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
EP1914639A1 (en) * 2006-10-16 2008-04-23 Tietoenator Oyj System and method allowing a user of a messaging client to interact with an information system
US20080153537A1 (en) * 2006-12-21 2008-06-26 Charbel Khawand Dynamically learning a user's response via user-preferred audio settings in response to different noise environments
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US9530117B2 (en) * 2007-02-13 2016-12-27 International Business Machines Corporation Method and apparatus for transforming user requests and responses based on a persona
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9973450B2 (en) 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
AU2008251299B2 (en) * 2007-05-10 2012-08-09 Cardinalcommerce Corporation Application server and/or method for supporting mobile electronic commerce
US9794348B2 (en) 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
US8892171B2 (en) 2007-06-20 2014-11-18 Qualcomm Incorporated System and method for user profiling from gathering user data through interaction with a wireless communication device
US8886259B2 (en) 2007-06-20 2014-11-11 Qualcomm Incorporated System and method for user profiling from gathering user data through interaction with a wireless communication device
US8280025B2 (en) * 2007-06-29 2012-10-02 Microsoft Corporation Automated unique call announcement
US8639276B2 (en) * 2007-06-29 2014-01-28 Microsoft Corporation Mobile telephone interactive call disposition system
JP5025353B2 (ja) * 2007-07-03 2012-09-12 ニュアンス コミュニケーションズ,インコーポレイテッド 対話処理装置、対話処理方法及びコンピュータ・プログラム
US20090018818A1 (en) * 2007-07-10 2009-01-15 Aibelive Co., Ltd. Operating device for natural language input
JP2009020291A (ja) * 2007-07-11 2009-01-29 Yamaha Corp 音声処理装置および通信端末装置
ITFI20070177A1 (it) 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US20090048866A1 (en) * 2007-08-17 2009-02-19 Prakash Mahesh Rules-Based System For Routing Evidence and Recommendation Information to Patients and Physicians By a Specialist Based on Mining Report Text
US7741978B2 (en) * 2007-08-31 2010-06-22 Disney Enterprises, Inc. System and method for providing location-based entertainment
US8392192B2 (en) * 2007-09-18 2013-03-05 Samuel Seungmin Cho Method and apparatus for improving transaction success rates for voice reminder applications in E-commerce
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8364694B2 (en) 2007-10-26 2013-01-29 Apple Inc. Search assistant for digital media assets
US8521766B1 (en) * 2007-11-12 2013-08-27 W Leo Hoarty Systems and methods for providing information discovery and retrieval
US8620662B2 (en) * 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US20110022387A1 (en) * 2007-12-04 2011-01-27 Hager Paul M Correcting transcribed audio files with an email-client interface
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US20090177568A1 (en) * 2008-01-09 2009-07-09 Hodges Michael D System And Method For Conducting Account Requests Over A Network Using Natural Language
US8117225B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC Drill-down system, method, and computer program product for focusing a search
US8117242B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC System, method, and computer program product for performing a search in conjunction with use of an online application
US20090190735A1 (en) * 2008-01-24 2009-07-30 General Motors Corporation Method and system for enhancing telematics services
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US9037583B2 (en) * 2008-02-29 2015-05-19 Ratnakar Nitesh Geo tagging and automatic generation of metadata for photos and videos
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8255224B2 (en) * 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US8223932B2 (en) * 2008-03-15 2012-07-17 Microsoft Corporation Appending content to a telephone communication
US8676577B2 (en) * 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) * 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20090287680A1 (en) * 2008-05-14 2009-11-19 Microsoft Corporation Multi-modal query refinement
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8589161B2 (en) * 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8924543B2 (en) 2009-01-28 2014-12-30 Headwater Partners I Llc Service design center for device assisted services
US8589541B2 (en) 2009-01-28 2013-11-19 Headwater Partners I Llc Device-assisted services for protecting network capacity
US8346225B2 (en) 2009-01-28 2013-01-01 Headwater Partners I, Llc Quality of service for device assisted services
US8391834B2 (en) 2009-01-28 2013-03-05 Headwater Partners I Llc Security techniques for device assisted services
US8898293B2 (en) 2009-01-28 2014-11-25 Headwater Partners I Llc Service offer set publishing to device agent with on-device service selection
US8725123B2 (en) 2008-06-05 2014-05-13 Headwater Partners I Llc Communications device with secure data path processing agents
US8326958B1 (en) 2009-01-28 2012-12-04 Headwater Partners I, Llc Service activation tracking system
US8275830B2 (en) 2009-01-28 2012-09-25 Headwater Partners I Llc Device assisted CDR creation, aggregation, mediation and billing
US8635335B2 (en) 2009-01-28 2014-01-21 Headwater Partners I Llc System and method for wireless network offloading
US8626115B2 (en) 2009-01-28 2014-01-07 Headwater Partners I Llc Wireless network service interfaces
US8340634B2 (en) 2009-01-28 2012-12-25 Headwater Partners I, Llc Enhanced roaming services and converged carrier networks with device assisted services and a proxy
US8402111B2 (en) 2009-01-28 2013-03-19 Headwater Partners I, Llc Device assisted services install
US8924469B2 (en) 2008-06-05 2014-12-30 Headwater Partners I Llc Enterprise access control and accounting allocation for access networks
US8548428B2 (en) 2009-01-28 2013-10-01 Headwater Partners I Llc Device group partitions and settlement platform
US8406748B2 (en) 2009-01-28 2013-03-26 Headwater Partners I Llc Adaptive ambient services
US8832777B2 (en) 2009-03-02 2014-09-09 Headwater Partners I Llc Adapting network policies based on device service processor configuration
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US8010487B2 (en) * 2008-06-27 2011-08-30 Microsoft Corporation Synchronization and collaboration within peer-to-peer and client/server environments
US7619319B1 (en) * 2008-07-15 2009-11-17 F3 & I2, Llc Network of energy generating modules for transfer of energy outputs
US8294286B2 (en) * 2008-07-15 2012-10-23 F3 & I2, Llc Network of energy generating modules for transfer of energy outputs
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US7608934B1 (en) * 2008-08-14 2009-10-27 F3 & I2, Llc Power packaging with railcars
US8294285B2 (en) 2008-08-14 2012-10-23 F3 & I2, Llc Power packaging with railcars
US20100049692A1 (en) * 2008-08-21 2010-02-25 Business Objects, S.A. Apparatus and Method For Retrieving Information From An Application Functionality Table
US8190692B1 (en) 2008-08-22 2012-05-29 Boadin Technology, LLC Location-based messaging system, method, and computer program product
US8131458B1 (en) 2008-08-22 2012-03-06 Boadin Technology, LLC System, method, and computer program product for instant messaging utilizing a vehicular assembly
US8265862B1 (en) 2008-08-22 2012-09-11 Boadin Technology, LLC System, method, and computer program product for communicating location-related information
US8078397B1 (en) 2008-08-22 2011-12-13 Boadin Technology, LLC System, method, and computer program product for social networking utilizing a vehicular assembly
US8073590B1 (en) 2008-08-22 2011-12-06 Boadin Technology, LLC System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly
US8793135B2 (en) * 2008-08-25 2014-07-29 At&T Intellectual Property I, L.P. System and method for auditory captchas
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8560394B2 (en) * 2010-07-12 2013-10-15 Incentient, Llc System and method to enable a customer to select a wine based upon available inventory
US8355919B2 (en) 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8352272B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8396714B2 (en) 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8583418B2 (en) * 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
US8374872B2 (en) * 2008-11-04 2013-02-12 Verizon Patent And Licensing Inc. Dynamic update of grammar for interactive voice response
US20100131280A1 (en) * 2008-11-25 2010-05-27 General Electric Company Voice recognition system for medical devices
US9129601B2 (en) 2008-11-26 2015-09-08 At&T Intellectual Property I, L.P. System and method for dialog modeling
US9959870B2 (en) * 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
WO2010080598A1 (en) * 2008-12-19 2010-07-15 Nurago Gmbh Mobile device and method for providing logging and reporting of user-device interaction
JP2010154397A (ja) * 2008-12-26 2010-07-08 Sony Corp データ処理装置、データ処理方法、及び、プログラム
US9954975B2 (en) 2009-01-28 2018-04-24 Headwater Research Llc Enhanced curfew and protection associated with a device group
US10798252B2 (en) 2009-01-28 2020-10-06 Headwater Research Llc System and method for providing user notifications
US10779177B2 (en) 2009-01-28 2020-09-15 Headwater Research Llc Device group partitions and settlement platform
US8793758B2 (en) 2009-01-28 2014-07-29 Headwater Partners I Llc Security, fraud detection, and fraud mitigation in device-assisted services systems
US9572019B2 (en) 2009-01-28 2017-02-14 Headwater Partners LLC Service selection set published to device agent with on-device service selection
US9351193B2 (en) 2009-01-28 2016-05-24 Headwater Partners I Llc Intermediate networking devices
US9578182B2 (en) 2009-01-28 2017-02-21 Headwater Partners I Llc Mobile device and service management
US9706061B2 (en) 2009-01-28 2017-07-11 Headwater Partners I Llc Service design center for device assisted services
US10326800B2 (en) 2009-01-28 2019-06-18 Headwater Research Llc Wireless network service interfaces
US9557889B2 (en) 2009-01-28 2017-01-31 Headwater Partners I Llc Service plan design, user interfaces, application programming interfaces, and device management
US9858559B2 (en) 2009-01-28 2018-01-02 Headwater Research Llc Network service plan design
US8606911B2 (en) 2009-03-02 2013-12-10 Headwater Partners I Llc Flow tagging for service policy implementation
US10264138B2 (en) 2009-01-28 2019-04-16 Headwater Research Llc Mobile device and service management
US9955332B2 (en) 2009-01-28 2018-04-24 Headwater Research Llc Method for child wireless device activation to subscriber account of a master wireless device
US9270559B2 (en) 2009-01-28 2016-02-23 Headwater Partners I Llc Service policy implementation for an end-user device having a control application or a proxy agent for routing an application traffic flow
US10492102B2 (en) 2009-01-28 2019-11-26 Headwater Research Llc Intermediate networking devices
US10715342B2 (en) 2009-01-28 2020-07-14 Headwater Research Llc Managing service user discovery and service launch object placement on a device
US9571559B2 (en) 2009-01-28 2017-02-14 Headwater Partners I Llc Enhanced curfew and protection associated with a device group
US8893009B2 (en) 2009-01-28 2014-11-18 Headwater Partners I Llc End user device that secures an association of application to service policy with an application certificate check
US9392462B2 (en) 2009-01-28 2016-07-12 Headwater Partners I Llc Mobile end-user device with agent limiting wireless data communication for specified background applications based on a stored policy
US10248996B2 (en) 2009-01-28 2019-04-02 Headwater Research Llc Method for operating a wireless end-user device mobile payment agent
US9565707B2 (en) 2009-01-28 2017-02-07 Headwater Partners I Llc Wireless end-user device with wireless data attribution to multiple personas
US9647918B2 (en) 2009-01-28 2017-05-09 Headwater Research Llc Mobile device and method attributing media services network usage to requesting application
US8745191B2 (en) 2009-01-28 2014-06-03 Headwater Partners I Llc System and method for providing user notifications
US10200541B2 (en) 2009-01-28 2019-02-05 Headwater Research Llc Wireless end-user device with divided user space/kernel space traffic policy system
US9253663B2 (en) 2009-01-28 2016-02-02 Headwater Partners I Llc Controlling mobile device communications on a roaming network based on device state
US10841839B2 (en) 2009-01-28 2020-11-17 Headwater Research Llc Security, fraud detection, and fraud mitigation in device-assisted services systems
US10484858B2 (en) 2009-01-28 2019-11-19 Headwater Research Llc Enhanced roaming services and converged carrier networks with device assisted services and a proxy
US10064055B2 (en) 2009-01-28 2018-08-28 Headwater Research Llc Security, fraud detection, and fraud mitigation in device-assisted services systems
US10237757B2 (en) 2009-01-28 2019-03-19 Headwater Research Llc System and method for wireless network offloading
US10783581B2 (en) 2009-01-28 2020-09-22 Headwater Research Llc Wireless end-user device providing ambient or sponsored services
US9980146B2 (en) 2009-01-28 2018-05-22 Headwater Research Llc Communications device with secure data path processing agents
US11218854B2 (en) 2009-01-28 2022-01-04 Headwater Research Llc Service plan design, user interfaces, application programming interfaces, and device management
US9755842B2 (en) 2009-01-28 2017-09-05 Headwater Research Llc Managing service user discovery and service launch object placement on a device
US8351898B2 (en) 2009-01-28 2013-01-08 Headwater Partners I Llc Verifiable device assisted service usage billing with integrated accounting, mediation accounting, and multi-account
US10057775B2 (en) 2009-01-28 2018-08-21 Headwater Research Llc Virtualized policy and charging system
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
JP4973722B2 (ja) * 2009-02-03 2012-07-11 株式会社デンソー 音声認識装置、音声認識方法、及びナビゲーション装置
US8417523B2 (en) * 2009-02-03 2013-04-09 SoftHUS Sp z.o.o Systems and methods for interactively accessing hosted services using voice communications
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US20100268534A1 (en) * 2009-04-17 2010-10-21 Microsoft Corporation Transcription, archiving and threading of voice communications
US8660970B1 (en) * 2009-04-23 2014-02-25 The Boeing Company Passive learning and autonomously interactive system for leveraging user knowledge in networked environments
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9002713B2 (en) * 2009-06-09 2015-04-07 At&T Intellectual Property I, L.P. System and method for speech personalization by need
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110015998A1 (en) * 2009-07-15 2011-01-20 Hirschfeld Robert A Use of vehicle data to interact with Internet online presence and status
JP5471106B2 (ja) * 2009-07-16 2014-04-16 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
US8301320B2 (en) * 2009-07-29 2012-10-30 The Invention Science Fund I, Llc Vehicle system for varied compliance benefits
US8412454B2 (en) * 2009-07-29 2013-04-02 The Invention Science Fund I, Llc Selective control of an optional vehicle mode
US8332099B2 (en) * 2009-07-29 2012-12-11 The Invention Science Fund I, Llc Selective implementation of an optional vehicle mode
US20110029189A1 (en) * 2009-07-29 2011-02-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Promotional correlation with selective vehicle modes
US8352107B2 (en) * 2009-07-29 2013-01-08 The Invention Science Fund I, Llc Vehicle system for varied compliance benefits
US9073554B2 (en) * 2009-07-29 2015-07-07 The Invention Science Fund I, Llc Systems and methods for providing selective control of a vehicle operational mode
US8457873B2 (en) * 2009-07-29 2013-06-04 The Invention Science Fund I, Llc Promotional incentives based on hybrid vehicle qualification
US8392101B2 (en) * 2009-07-29 2013-03-05 The Invention Science Fund I Llc Promotional correlation with selective vehicle modes
US8571791B2 (en) * 2009-07-29 2013-10-29 Searete Llc Remote processing of selected vehicle operating parameters
US8452532B2 (en) * 2009-07-29 2013-05-28 The Invention Science Fund I, Llc Selective control of an optional vehicle mode
US9008956B2 (en) 2009-07-29 2015-04-14 The Invention Science Fund I, Llc Promotional correlation with selective vehicle modes
US9123049B2 (en) * 2009-07-29 2015-09-01 The Invention Science Fund I, Llc Promotional correlation with selective vehicle modes
US8396624B2 (en) 2009-07-29 2013-03-12 The Invention Science Fund I, Llc Remote processing of selected vehicle operating parameters
US8326485B2 (en) 2009-07-29 2012-12-04 The Invention Science Fund I, Llc Selective control system for vehicle operating parameters
US8253580B2 (en) * 2009-07-29 2012-08-28 Schneider Electric USA, Inc. Natural language navigation for power monitoring systems
US20110054977A1 (en) * 2009-08-27 2011-03-03 Oracle International Corporation Customer relationship management using text messages
US8386482B2 (en) * 2009-09-02 2013-02-26 Xurmo Technologies Private Limited Method for personalizing information retrieval in a communication network
US8751059B2 (en) * 2009-09-29 2014-06-10 The Invention Science Fund I, Llc Selective implementation of an optional vehicle mode
US8751058B2 (en) * 2009-09-29 2014-06-10 The Invention Science Fund I, Llc Selective implementation of an optional vehicle mode
EP2317730B1 (en) * 2009-10-29 2015-08-12 Unify GmbH & Co. KG Method and system to automatically change or update the configuration or setting of a communication system
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US20110110534A1 (en) * 2009-11-12 2011-05-12 Apple Inc. Adjustable voice output based on device status
KR101622111B1 (ko) * 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
AU2012101473B4 (en) * 2010-01-18 2013-05-23 Apple Inc. Service orchestration for intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
AU2012101191B4 (en) * 2010-01-18 2013-05-09 Apple Inc. Personalized vocabulary for digital assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8676581B2 (en) * 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
US8626511B2 (en) * 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US9047283B1 (en) * 2010-01-29 2015-06-02 Guangsheng Zhang Automated topic discovery in documents and content categorization
US20110202269A1 (en) * 2010-02-15 2011-08-18 Avaya Inc. Mobile gaming, hospitality and communications appliance
CN102934107B (zh) 2010-02-18 2016-09-14 株式会社尼康 信息处理装置、便携式装置以及信息处理系统
US8341185B2 (en) 2010-04-02 2012-12-25 Nokia Corporation Method and apparatus for context-indexed network resources
US20110257957A1 (en) * 2010-04-15 2011-10-20 Htc Corporation Personalized information service method and information platform
US8756571B2 (en) * 2010-05-07 2014-06-17 Hewlett-Packard Development Company, L.P. Natural language text instructions
CN102238472B (zh) * 2010-05-07 2014-11-26 神达电脑股份有限公司 以移动装置的目前位置更新服务器储存的位置资讯的方法
US10115392B2 (en) * 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9104670B2 (en) 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8359020B2 (en) * 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US9137238B1 (en) * 2010-08-06 2015-09-15 RightQuestions, LLC Pass-sequences
US8731939B1 (en) * 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8606923B2 (en) * 2010-09-15 2013-12-10 Core Mobile Networks, Inc. System and method for real time delivery of context based content from the cloud to mobile devices
US9594845B2 (en) 2010-09-24 2017-03-14 International Business Machines Corporation Automating web tasks based on web browsing histories and user actions
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US9083561B2 (en) 2010-10-06 2015-07-14 At&T Intellectual Property I, L.P. Automated assistance for customer care chats
JPWO2012046562A1 (ja) * 2010-10-06 2014-02-24 日本電気株式会社 システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム
US8689181B2 (en) 2010-11-23 2014-04-01 Axeda Corporation Scripting web services
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) * 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8527483B2 (en) 2011-02-04 2013-09-03 Mikko VÄÄNÄNEN Method and means for browsing by walking
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US11763212B2 (en) 2011-03-14 2023-09-19 Amgine Technologies (Us), Inc. Artificially intelligent computing engine for travel itinerary resolutions
WO2012125753A2 (en) 2011-03-14 2012-09-20 Amgine Technologies, Inc. Processing and fulfilling natural language travel requests
US9659099B2 (en) 2011-03-14 2017-05-23 Amgine Technologies (Us), Inc. Translation of user requests into itinerary solutions
US20130066634A1 (en) * 2011-03-16 2013-03-14 Qualcomm Incorporated Automated Conversation Assistance
US9202465B2 (en) * 2011-03-25 2015-12-01 General Motors Llc Speech recognition dependent on text message content
US9154826B2 (en) 2011-04-06 2015-10-06 Headwater Partners Ii Llc Distributing content and service launch objects to mobile devices
US20120256769A1 (en) * 2011-04-07 2012-10-11 GM Global Technology Operations LLC System and method for real-time detection of an emergency situation occuring in a vehicle
US10010633B2 (en) 2011-04-15 2018-07-03 Steriliz, Llc Room sterilization method and system
BR112013026529A2 (pt) * 2011-04-15 2016-09-20 Samuel Richard Trapani método e sistema de esterilização de ambiente
US9368107B2 (en) * 2011-04-20 2016-06-14 Nuance Communications, Inc. Permitting automated speech command discovery via manual event to command mapping
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US20120316884A1 (en) * 2011-06-10 2012-12-13 Curtis Instruments, Inc. Wheelchair System Having Voice Activated Menu Navigation And Auditory Feedback
WO2012174510A1 (en) * 2011-06-16 2012-12-20 Agero Connected Services, Inc. Systems and methods for delivering contents to a vehicle
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8954317B1 (en) * 2011-07-01 2015-02-10 West Corporation Method and apparatus of processing user text input information
US20130018659A1 (en) * 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9020523B2 (en) 2011-07-12 2015-04-28 Qualcomm Incorporated Position estimating for a mobile device
JP2013025299A (ja) * 2011-07-26 2013-02-04 Toshiba Corp 書き起こし支援システムおよび書き起こし支援方法
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8660847B2 (en) * 2011-09-02 2014-02-25 Microsoft Corporation Integrated local and cloud based speech recognition
CN102622221A (zh) * 2011-09-20 2012-08-01 中兴通讯股份有限公司 一种mml终端及提高mml终端使用效率的方法
US8762156B2 (en) * 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
DE102012019178A1 (de) * 2011-09-30 2013-04-04 Apple Inc. Verwendung von Kontextinformationen zum Erleichtern der Verarbeitung von Befehlen bei einem virtuellen Assistenten
US9640175B2 (en) * 2011-10-07 2017-05-02 Microsoft Technology Licensing, Llc Pronunciation learning from user correction
CN102405905B (zh) * 2011-10-28 2014-04-16 海南正业中农高科股份有限公司 一种用于抗西瓜病毒病的壳寡糖组合物及其用途和方法
CN103092887B (zh) * 2011-11-07 2016-10-05 联想(北京)有限公司 电子设备及其语音信息提供方法
US9460095B2 (en) 2011-11-28 2016-10-04 Microsoft Technology Licensing, Llc Quick capture of to-do items
KR101193668B1 (ko) * 2011-12-06 2012-12-14 위준성 스마트 기기를 이용한 상황 인식 기반 외국어 습득 및 학습 서비스 제공 방법
DE102011087843B4 (de) * 2011-12-06 2013-07-11 Continental Automotive Gmbh Verfahren und System zur Auswahl mindestens eines Datensatzes aus einer relationalen Datenbank
US9583108B2 (en) * 2011-12-08 2017-02-28 Forrest S. Baker III Trust Voice detection for automated communication system
CN102520427B (zh) * 2011-12-14 2013-11-06 鸿富锦精密工业(深圳)有限公司 具有路况标识功能的导航装置及方法
EP2795538A4 (en) * 2011-12-21 2016-01-27 Nokia Technologies Oy PROCESS, DEVICE AND COMPUTER SOFTWARE FOR CONTEX IDENTIFICATION
WO2013101066A1 (en) * 2011-12-29 2013-07-04 Intel Corporation Direct grammar access
WO2013101051A1 (en) * 2011-12-29 2013-07-04 Intel Corporation Speech recognition utilizing a dynamic set of grammar elements
US20130226892A1 (en) * 2012-02-29 2013-08-29 Fluential, Llc Multimodal natural language interface for faceted search
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9317605B1 (en) 2012-03-21 2016-04-19 Google Inc. Presenting forked auto-completions
US20130262224A1 (en) * 2012-03-30 2013-10-03 Ebay Inc. Providing More Relevant Ads to Motorists
CA2869530A1 (en) * 2012-04-27 2013-10-31 Aravind GANAPATHIRAJU Negative example (anti-word) based performance improvement for speech recognition
US10019991B2 (en) * 2012-05-02 2018-07-10 Electronics And Telecommunications Research Institute Apparatus and method for speech recognition
US20130297318A1 (en) * 2012-05-02 2013-11-07 Qualcomm Incorporated Speech recognition systems and methods
US20130297287A1 (en) * 2012-05-07 2013-11-07 Google Inc. Display two keyboards on one tablet computer to allow two users to chat in different languages
KR101907406B1 (ko) * 2012-05-08 2018-10-12 삼성전자 주식회사 통신 서비스 운용 방법 및 시스템
US9002768B2 (en) 2012-05-12 2015-04-07 Mikhail Fedorov Human-computer interface system
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US20130325451A1 (en) * 2012-05-31 2013-12-05 Elwha LLC, a limited liability company of the State of Delaware Methods and systems for speech adaptation data
US9620128B2 (en) * 2012-05-31 2017-04-11 Elwha Llc Speech recognition adaptation systems based on adaptation data
US9305565B2 (en) * 2012-05-31 2016-04-05 Elwha Llc Methods and systems for speech adaptation data
US20130325449A1 (en) * 2012-05-31 2013-12-05 Elwha Llc Speech recognition adaptation systems based on adaptation data
US9639676B2 (en) 2012-05-31 2017-05-02 Microsoft Technology Licensing, Llc Login interface selection for computing environment user login
US10431235B2 (en) * 2012-05-31 2019-10-01 Elwha Llc Methods and systems for speech adaptation data
US10949230B2 (en) 2012-05-31 2021-03-16 Microsoft Technology Licensing, Llc Language lists for resource selection based on language text direction
US9899040B2 (en) * 2012-05-31 2018-02-20 Elwha, Llc Methods and systems for managing adaptation data
US9495966B2 (en) 2012-05-31 2016-11-15 Elwha Llc Speech recognition adaptation systems based on adaptation data
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) * 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
CN104412323B (zh) 2012-06-25 2017-12-12 三菱电机株式会社 车载信息装置
US20130346068A1 (en) * 2012-06-25 2013-12-26 Apple Inc. Voice-Based Image Tagging and Searching
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9064492B2 (en) * 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
US20140019126A1 (en) * 2012-07-13 2014-01-16 International Business Machines Corporation Speech-to-text recognition of non-dictionary words using location data
US8880398B1 (en) * 2012-07-13 2014-11-04 Google Inc. Localized speech recognition with offload
US9396179B2 (en) * 2012-08-30 2016-07-19 Xerox Corporation Methods and systems for acquiring user related information using natural language processing techniques
US9424840B1 (en) 2012-08-31 2016-08-23 Amazon Technologies, Inc. Speech recognition platforms
US9809185B2 (en) 2012-09-04 2017-11-07 Ford Global Technologies, Llc Method and apparatus for subjective command control of vehicle systems
KR20140031717A (ko) * 2012-09-05 2014-03-13 삼성전자주식회사 콘텐츠 관리 방법 및 장치
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
JP6019968B2 (ja) * 2012-09-10 2016-11-02 株式会社リコー レポート作成システム、レポート作成装置及びプログラム
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
US10276157B2 (en) * 2012-10-01 2019-04-30 Nuance Communications, Inc. Systems and methods for providing a voice agent user interface
US9014974B2 (en) * 2012-10-16 2015-04-21 Qualcomm, Incorporated Predictive scheduling of navigation tasks
US9161172B2 (en) 2012-11-06 2015-10-13 Qualcomm Incorporated Map-based adaptive sampling of orientation sensors for positioning
US9171066B2 (en) 2012-11-12 2015-10-27 Nuance Communications, Inc. Distributed natural language understanding and processing using local data sources
US9798799B2 (en) * 2012-11-15 2017-10-24 Sri International Vehicle personal assistant that interprets spoken natural language input based upon vehicle context
CN103871401B (zh) * 2012-12-10 2016-12-28 联想(北京)有限公司 一种语音识别的方法及电子设备
US9087520B1 (en) * 2012-12-13 2015-07-21 Rawles Llc Altering audio based on non-speech commands
US9070366B1 (en) * 2012-12-19 2015-06-30 Amazon Technologies, Inc. Architecture for multi-domain utterance processing
US8977555B2 (en) 2012-12-20 2015-03-10 Amazon Technologies, Inc. Identification of utterance subjects
US9620107B2 (en) * 2012-12-31 2017-04-11 General Electric Company Voice inspection guidance
US9159315B1 (en) * 2013-01-07 2015-10-13 Google Inc. Environmentally aware speech recognition
CN103943110A (zh) * 2013-01-21 2014-07-23 联想(北京)有限公司 控制方法、装置和电子设备
CN103971686B (zh) * 2013-01-30 2015-06-10 腾讯科技(深圳)有限公司 自动语音识别方法和系统
KR20230137475A (ko) 2013-02-07 2023-10-04 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9830039B2 (en) 2013-03-04 2017-11-28 Microsoft Technology Licensing, Llc Using human wizards in a conversational understanding system
US9148398B2 (en) * 2013-03-13 2015-09-29 Google Inc. Prioritized and contextual display of aggregated account notifications
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US20140279506A1 (en) * 2013-03-14 2014-09-18 Bank Of America Corporation User interface for mobile payment via transfer network
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
WO2014159862A1 (en) 2013-03-14 2014-10-02 Headwater Partners I Llc Automated credential porting for mobile devices
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US8694305B1 (en) * 2013-03-15 2014-04-08 Ask Ziggy, Inc. Natural language processing (NLP) portal for third party applications
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
KR101857648B1 (ko) 2013-03-15 2018-05-15 애플 인크. 지능형 디지털 어시스턴트에 의한 사용자 트레이닝
AU2014251347B2 (en) 2013-03-15 2017-05-18 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9285587B2 (en) * 2013-03-15 2016-03-15 Inrix, Inc. Window-oriented displays for travel user interfaces
US10453103B2 (en) 2013-03-15 2019-10-22 Home Depot Product Authority, Llc Price estimation system
US9607617B2 (en) * 2013-04-02 2017-03-28 Nuance Communications, Inc. Concept cloud in smart phone applications
DE102013006173A1 (de) * 2013-04-10 2014-10-16 Audi Ag Verfahren und Vorrichtung zur proaktiven Dialogführung
CN104078043B (zh) * 2013-04-26 2016-06-15 腾讯科技(深圳)有限公司 网络交易系统的语音操作指令识别处理方法和系统
US9431008B2 (en) 2013-05-29 2016-08-30 Nuance Communications, Inc. Multiple parallel dialogs in smart phone applications
CN103347044A (zh) * 2013-06-03 2013-10-09 苏州阔地网络科技有限公司 一种智能客服的实现方法及系统
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014196984A1 (en) * 2013-06-07 2014-12-11 Nuance Communications, Inc. Speech-based search using descriptive features of surrounding objects
WO2014197336A1 (en) * 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
US9710829B1 (en) * 2013-06-19 2017-07-18 Intuit Inc. Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
US9594542B2 (en) * 2013-06-20 2017-03-14 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on training by third-party developers
US9633317B2 (en) * 2013-06-20 2017-04-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on a natural language intent interpreter
US10474961B2 (en) * 2013-06-20 2019-11-12 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on prompting for additional user input
US10083009B2 (en) 2013-06-20 2018-09-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system planning
WO2014205049A1 (en) * 2013-06-20 2014-12-24 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on third-party developers
US9589565B2 (en) * 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
US20140379346A1 (en) * 2013-06-21 2014-12-25 Google Inc. Video analysis based language model adaptation
US9646606B2 (en) 2013-07-03 2017-05-09 Google Inc. Speech recognition using domain knowledge
US9786296B2 (en) * 2013-07-08 2017-10-10 Qualcomm Incorporated Method and apparatus for assigning keyword model to voice operated function
KR102141116B1 (ko) * 2013-08-05 2020-08-04 삼성전자주식회사 음성 대화 서비스를 지원하는 인터페이스 장치 및 방법
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US20150056951A1 (en) * 2013-08-21 2015-02-26 GM Global Technology Operations LLC Vehicle telematics unit and method of operating the same
US10990924B2 (en) * 2013-08-30 2021-04-27 Messagepoint Inc. System and method for variant content management
US9530416B2 (en) 2013-10-28 2016-12-27 At&T Intellectual Property I, L.P. System and method for managing models for embedded speech and language processing
US9666188B2 (en) 2013-10-29 2017-05-30 Nuance Communications, Inc. System and method of performing automatic speech recognition using local private data
US20150120505A1 (en) * 2013-10-31 2015-04-30 International Business Machines Corporation In-store omnichannel inventory exposure
JP2015089697A (ja) * 2013-11-05 2015-05-11 トヨタ自動車株式会社 車両用音声認識装置
CN103577198B (zh) * 2013-11-22 2017-05-31 中国联合网络通信集团有限公司 一种面向用户的物联网服务平台及远程控制方法
US9626966B2 (en) 2013-12-18 2017-04-18 Harman International Industries, Incorporated Voice recognition query response systems and methods for generating query responses using information from a vehicle
US9607015B2 (en) 2013-12-20 2017-03-28 Qualcomm Incorporated Systems, methods, and apparatus for encoding object formations
US10181322B2 (en) * 2013-12-20 2019-01-15 Microsoft Technology Licensing, Llc Multi-user, multi-domain dialog system
US9514748B2 (en) 2014-01-15 2016-12-06 Microsoft Technology Licensing, Llc Digital personal assistant interaction with impersonations and rich multimedia in responses
US20150286486A1 (en) * 2014-01-16 2015-10-08 Symmpl, Inc. System and method of guiding a user in utilizing functions and features of a computer-based device
US10846112B2 (en) 2014-01-16 2020-11-24 Symmpl, Inc. System and method of guiding a user in utilizing functions and features of a computer based device
CN103760984A (zh) * 2014-01-24 2014-04-30 成都万先自动化科技有限责任公司 人机对话系统
WO2015132829A1 (ja) * 2014-03-07 2015-09-11 パナソニックIpマネジメント株式会社 音声対話装置、音声対話システムおよび音声対話方法
CA2944652A1 (en) 2014-04-01 2015-10-08 Amgine Technologies (Us), Inc. Inference model for traveler classification
US9430461B2 (en) 2014-04-11 2016-08-30 International Business Machines Corporation Mobile based lexicon and forecasting
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
KR102069700B1 (ko) * 2014-05-20 2020-01-23 한국전자통신연구원 특화영역 교체형 음성인식 시스템, 모바일 장치 및 그 방법
US9990433B2 (en) 2014-05-23 2018-06-05 Samsung Electronics Co., Ltd. Method for searching and device thereof
US11314826B2 (en) 2014-05-23 2022-04-26 Samsung Electronics Co., Ltd. Method for searching and device thereof
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
WO2015194684A1 (ko) * 2014-06-16 2015-12-23 주식회사 다이퀘스트 사용자 다이알로그에 따른 서비스 제공 방법 및 다이알로그 에이전트 시스템
US9462112B2 (en) 2014-06-19 2016-10-04 Microsoft Technology Licensing, Llc Use of a digital assistant in communications
WO2015195308A1 (en) * 2014-06-19 2015-12-23 Thomson Licensing System for natural language processing
US10403393B2 (en) 2014-06-25 2019-09-03 Cerner Innovation, Inc. Voice-assisted clinical note creation on a mobile device
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9786276B2 (en) * 2014-08-25 2017-10-10 Honeywell International Inc. Speech enabled management system
US20160063095A1 (en) * 2014-08-27 2016-03-03 International Business Machines Corporation Unstructured data guided query modification
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US10310808B2 (en) * 2014-09-08 2019-06-04 Google Llc Systems and methods for simultaneously receiving voice instructions on onboard and offboard devices
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
EP3195145A4 (en) 2014-09-16 2018-01-24 VoiceBox Technologies Corporation Voice commerce
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US9256890B1 (en) * 2014-09-29 2016-02-09 Sap Se Framework for geolocation-based customer-to-product matching hosted in a cloud-computing environment
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9892192B2 (en) 2014-09-30 2018-02-13 International Business Machines Corporation Information handling system and computer program product for dynamically assigning question priority based on question extraction and domain dictionary
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9747896B2 (en) * 2014-10-15 2017-08-29 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
JP6365229B2 (ja) 2014-10-23 2018-08-01 株式会社デンソー 多感覚インタフェースの制御方法および多感覚インタフェース制御装置、多感覚インタフェースシステム
US20160140216A1 (en) * 2014-11-19 2016-05-19 International Business Machines Corporation Adjusting Fact-Based Answers to Consider Outcomes
US10431214B2 (en) * 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10180988B2 (en) 2014-12-02 2019-01-15 International Business Machines Corporation Persona-based conversation
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9626352B2 (en) 2014-12-02 2017-04-18 International Business Machines Corporation Inter thread anaphora resolution
US10102289B2 (en) 2014-12-02 2018-10-16 International Business Machines Corporation Ingesting forum content
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10282409B2 (en) 2014-12-11 2019-05-07 International Business Machines Corporation Performance modification based on aggregation of audience traits and natural language feedback
US10090002B2 (en) * 2014-12-11 2018-10-02 International Business Machines Corporation Performing cognitive operations based on an aggregate user model of personality traits of users
US9811515B2 (en) 2014-12-11 2017-11-07 International Business Machines Corporation Annotating posts in a forum thread with improved data
US9626622B2 (en) 2014-12-15 2017-04-18 International Business Machines Corporation Training a question/answer system using answer keys based on forum content
US10417345B1 (en) * 2014-12-22 2019-09-17 Amazon Technologies, Inc. Providing customer service agents with customer-personalized result of spoken language intent
RU2608882C2 (ru) 2014-12-25 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки поискового запроса пользователя и сервер
US9747901B1 (en) * 2015-02-27 2017-08-29 Amazon Technologies, Inc. Speech interaction for unmanned aerial vehicles
US9392417B1 (en) 2015-03-03 2016-07-12 Qualcomm Incorporated Managing activities performed by a plurality of collocated mobile devices
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US11231826B2 (en) * 2015-03-08 2022-01-25 Google Llc Annotations in software applications for invoking dialog system functions
CN104714449B (zh) * 2015-03-09 2018-02-27 湖南工学院 获取用于人机交互任务的操作数据的方法和装置
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
WO2016172038A1 (en) * 2015-04-19 2016-10-27 Schlumberger Technology Corporation Wellsite report system
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
US9953648B2 (en) * 2015-05-11 2018-04-24 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same
US10803241B2 (en) * 2015-05-14 2020-10-13 Nice Ltd. System and method for text normalization in noisy channels
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083697B2 (en) * 2015-05-27 2018-09-25 Google Llc Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device
US9870196B2 (en) * 2015-05-27 2018-01-16 Google Llc Selective aborting of online processing of voice inputs in a voice-enabled electronic device
US9966073B2 (en) * 2015-05-27 2018-05-08 Google Llc Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device
US9922138B2 (en) 2015-05-27 2018-03-20 Google Llc Dynamically updatable offline grammar model for resource-constrained offline device
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11049047B2 (en) 2015-06-25 2021-06-29 Amgine Technologies (Us), Inc. Multiattribute travel booking platform
US10041803B2 (en) 2015-06-18 2018-08-07 Amgine Technologies (Us), Inc. Scoring system for travel planning
US11941552B2 (en) 2015-06-25 2024-03-26 Amgine Technologies (Us), Inc. Travel booking platform with multiattribute portfolio evaluation
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US20170017734A1 (en) * 2015-07-15 2017-01-19 Ford Global Technologies, Llc Crowdsourced Event Reporting and Reconstruction
GB2540957B (en) * 2015-07-31 2019-12-25 Arm Ip Ltd Managing interaction constraints
US10255921B2 (en) * 2015-07-31 2019-04-09 Google Llc Managing dialog data providers
US9691070B2 (en) * 2015-09-01 2017-06-27 Echostar Technologies L.L.C. Automated voice-based customer service
WO2017044415A1 (en) 2015-09-07 2017-03-16 Voicebox Technologies Corporation System and method for eliciting open-ended natural language responses to questions to train natural language processors
WO2017044409A1 (en) 2015-09-07 2017-03-16 Voicebox Technologies Corporation System and method of annotating utterances based on tags assigned by unmanaged crowds
US9448993B1 (en) 2015-09-07 2016-09-20 Voicebox Technologies Corporation System and method of recording utterances using unmanaged crowds for natural language processing
US9401142B1 (en) 2015-09-07 2016-07-26 Voicebox Technologies Corporation System and method for validating natural language content using crowdsourced validation jobs
US9519766B1 (en) 2015-09-07 2016-12-13 Voicebox Technologies Corporation System and method of providing and validating enhanced CAPTCHAs
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10075482B2 (en) * 2015-09-25 2018-09-11 International Business Machines Corporation Multiplexed, multimodal conferencing
US10241754B1 (en) * 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US9697198B2 (en) 2015-10-05 2017-07-04 International Business Machines Corporation Guiding a conversation based on cognitive analytics
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
WO2017090954A1 (en) * 2015-11-24 2017-06-01 Samsung Electronics Co., Ltd. Electronic device and operating method thereof
JP6392734B2 (ja) * 2015-11-27 2018-09-19 株式会社Subaru 情報処理装置、車両の情報処理装置、情報処理方法及び車両の情報処理方法
US20170161386A1 (en) * 2015-12-02 2017-06-08 International Business Machines Corporation Adaptive product questionnaire
GB2545005B (en) * 2015-12-03 2021-09-08 Bentley Motors Ltd Responsive human machine interface
US10685331B2 (en) * 2015-12-08 2020-06-16 TCL Research America Inc. Personalized FUNC sequence scheduling method and system
US9959872B2 (en) 2015-12-14 2018-05-01 International Business Machines Corporation Multimodal speech recognition for real-time video audio-based display indicia application
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
EP3410309A4 (en) * 2016-01-25 2018-12-05 Sony Corporation Communication system and communication control method
CN105786377B (zh) * 2016-02-17 2019-08-06 京东方科技集团股份有限公司 触控监测方法及装置、终端
US9740751B1 (en) * 2016-02-18 2017-08-22 Google Inc. Application keywords
US9836527B2 (en) 2016-02-24 2017-12-05 Google Llc Customized query-action mappings for an offline grammar model
US9922648B2 (en) 2016-03-01 2018-03-20 Google Llc Developer voice actions system
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10706716B2 (en) * 2016-03-30 2020-07-07 K-9 Ice, Llc Vehicle interface system
US10291565B2 (en) * 2016-05-17 2019-05-14 Google Llc Incorporating selectable application links into conversations with personal assistant modules
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11734302B2 (en) * 2016-06-09 2023-08-22 Apple Inc. Multi-device context store
US10148546B2 (en) 2016-06-09 2018-12-04 Apple Inc. Scheduling processing tasks based on predicted context
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10073842B2 (en) * 2016-06-15 2018-09-11 International Business Machines Corporation Culturally-aware cognitive system for human interactions
US11200891B2 (en) * 2016-06-21 2021-12-14 Hewlett-Packard Development Company, L.P. Communications utilizing multiple virtual assistant services
US10606952B2 (en) 2016-06-24 2020-03-31 Elemental Cognition Llc Architecture and processes for computer learning and understanding
US10339934B2 (en) * 2016-06-27 2019-07-02 Google Llc Asynchronous processing of user requests
US10802671B2 (en) * 2016-07-11 2020-10-13 Google Llc Contextual information for a displayed resource that includes an image
US10331784B2 (en) 2016-07-29 2019-06-25 Voicebox Technologies Corporation System and method of disambiguating natural language processing requests
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10237137B2 (en) 2016-09-12 2019-03-19 Edward Linn Helvey Remotely assigned, bandwidth-limiting internet access apparatus and method
US10540513B2 (en) 2016-09-13 2020-01-21 Microsoft Technology Licensing, Llc Natural language processor extension transmission data protection
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
US10503767B2 (en) 2016-09-13 2019-12-10 Microsoft Technology Licensing, Llc Computerized natural language query intent dispatching
WO2018063155A1 (en) * 2016-09-27 2018-04-05 Hewlett-Packard Development Company, L.P. Communication apparatuses
US9940390B1 (en) * 2016-09-27 2018-04-10 Microsoft Technology Licensing, Llc Control system using scoped search and conversational interface
ES2765415T3 (es) 2016-10-21 2020-06-09 Fujitsu Ltd Aparato, método y programa de procesamiento de datos basado en microservicios
US10776170B2 (en) 2016-10-21 2020-09-15 Fujitsu Limited Software service execution apparatus, system, and method
JP7100422B2 (ja) 2016-10-21 2022-07-13 富士通株式会社 データプロパティ認識のための装置、プログラム、及び方法
JP6805765B2 (ja) 2016-10-21 2020-12-23 富士通株式会社 ソフトウェアサービスの実行のためのシステム、方法、及びプログラム
EP3312722A1 (en) 2016-10-21 2018-04-25 Fujitsu Limited Data processing apparatus, method, and program
US10032360B1 (en) 2016-11-15 2018-07-24 Allstate Insurance Company In-vehicle apparatus for early determination of occupant injury
US10380263B2 (en) * 2016-11-15 2019-08-13 International Business Machines Corporation Translation synthesizer for analysis, amplification and remediation of linguistic data across a translation supply chain
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
CN106782551B (zh) * 2016-12-06 2020-07-24 北京华夏电通科技有限公司 一种语音识别系统及方法
US11003417B2 (en) * 2016-12-15 2021-05-11 Samsung Electronics Co., Ltd. Speech recognition method and apparatus with activation word based on operating environment of the apparatus
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10276155B2 (en) * 2016-12-22 2019-04-30 Fujitsu Limited Media capture and process system
USD817313S1 (en) 2016-12-22 2018-05-08 Michael Horito Network access point
CN107053191B (zh) * 2016-12-31 2020-05-08 华为技术有限公司 一种机器人,服务器及人机互动方法
US10373515B2 (en) 2017-01-04 2019-08-06 International Business Machines Corporation System and method for cognitive intervention on human interactions
US10235990B2 (en) 2017-01-04 2019-03-19 International Business Machines Corporation System and method for cognitive intervention on human interactions
WO2018129330A1 (en) * 2017-01-05 2018-07-12 Nuance Communications, Inc. Selection system and method
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10424297B1 (en) * 2017-02-02 2019-09-24 Mitel Networks, Inc. Voice command processing for conferencing
US10318639B2 (en) 2017-02-03 2019-06-11 International Business Machines Corporation Intelligent action recommendation
US20180232449A1 (en) * 2017-02-15 2018-08-16 International Business Machines Corporation Dynamic faceted search
US10360916B2 (en) * 2017-02-22 2019-07-23 Plantronics, Inc. Enhanced voiceprint authentication
US10755317B2 (en) 2017-03-11 2020-08-25 International Business Machines Corporation Managing a set of offers using a dialogue
US11093841B2 (en) 2017-03-28 2021-08-17 International Business Machines Corporation Morphed conversational answering via agent hierarchy of varied granularity
KR102388539B1 (ko) * 2017-04-30 2022-04-20 삼성전자주식회사 사용자 발화를 처리하는 전자 장치
US11663205B2 (en) * 2017-05-04 2023-05-30 Salesforce, Inc. Technologies for asynchronous querying
US10419489B2 (en) 2017-05-04 2019-09-17 International Business Machines Corporation Unidirectional trust based decision making for information technology conversation agents
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
CN108877813A (zh) * 2017-05-12 2018-11-23 阿里巴巴集团控股有限公司 人机识别的方法、装置和系统
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US11074280B2 (en) * 2017-05-18 2021-07-27 Aiqudo, Inc Cluster based search and recommendation method to rapidly on-board commands in personal assistants
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
WO2019010309A1 (en) * 2017-07-05 2019-01-10 Johnson Controls Technology Company SYSTEMS AND METHODS FOR CONVERSATIONAL INTERACTION WITH A BUILDING AUTOMATION SYSTEM
US11120803B2 (en) 2017-07-05 2021-09-14 Johnson Controls Tyco IP Holdings LLP Building automation system with NLP service abstraction
US10847148B2 (en) * 2017-07-14 2020-11-24 International Business Machines Corporation Dynamic personalized multi-turn interaction of cognitive models
US11315560B2 (en) 2017-07-14 2022-04-26 Cognigy Gmbh Method for conducting dialog between human and computer
US20190019516A1 (en) * 2017-07-14 2019-01-17 Ford Global Technologies, Llc Speech recognition user macros for improving vehicle grammars
KR102419374B1 (ko) * 2017-07-21 2022-07-11 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법
US9946514B1 (en) * 2017-07-27 2018-04-17 Huma.Ai Systems and methods for generating functional application designs
KR102559166B1 (ko) * 2017-08-14 2023-07-24 스미토모 겐키 가부시키가이샤 쇼벨, 및 쇼벨과 협동하는 지원장치
US10853424B1 (en) * 2017-08-14 2020-12-01 Amazon Technologies, Inc. Content delivery using persona segments for multiple users
US10497370B2 (en) * 2017-08-18 2019-12-03 2236008 Ontario Inc. Recognition module affinity
US10831839B1 (en) 2017-08-21 2020-11-10 Facet Labs, Llc Computing architecture for multiple search bots and behavior bots and related devices and methods
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10452695B2 (en) * 2017-09-22 2019-10-22 Oracle International Corporation Context-based virtual assistant implementation
EP3712563A4 (en) * 2017-09-29 2021-08-25 Pioneer Corporation INFORMATION PROVISION SYSTEM, INFORMATION PROVISION PROCESS AND PROGRAM
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US11410648B2 (en) * 2017-10-03 2022-08-09 Google Llc Multiple digital assistant coordination in vehicular environments
KR102441067B1 (ko) * 2017-10-12 2022-09-06 현대자동차주식회사 차량의 사용자 입력 처리 장치 및 사용자 입력 처리 방법
US11010656B2 (en) 2017-10-30 2021-05-18 Clinc, Inc. System and method for implementing an artificially intelligent virtual assistant using machine learning
WO2019088969A1 (en) * 2017-10-30 2019-05-09 Clinc, Inc. System and method for implementing an artificially intelligent virtual assistant using machine learning
DE102017219616B4 (de) * 2017-11-06 2022-06-30 Audi Ag Sprachsteuerung für ein Fahrzeug
CN107967308B (zh) * 2017-11-16 2021-04-23 百度在线网络技术(北京)有限公司 一种智能交互的处理方法、装置、设备和计算机存储介质
US10621978B2 (en) * 2017-11-22 2020-04-14 International Business Machines Corporation Dynamically generated dialog
US10572801B2 (en) 2017-11-22 2020-02-25 Clinc, Inc. System and method for implementing an artificially intelligent virtual assistant using machine learning
CN107886949B (zh) * 2017-11-24 2021-04-30 科大讯飞股份有限公司 一种内容推荐方法及装置
US10572585B2 (en) 2017-11-30 2020-02-25 International Business Machines Coporation Context-based linguistic analytics in dialogues
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN110085219A (zh) * 2018-01-26 2019-08-02 博西华电器(江苏)有限公司 家用电器及通过语音控制该家用电器的方法和系统
JP6928842B2 (ja) * 2018-02-14 2021-09-01 パナソニックIpマネジメント株式会社 制御情報取得システム、及び、制御情報取得方法
WO2019172868A1 (en) 2018-03-05 2019-09-12 Clinc, Inc. Systems and method for automatically configuring machine learning models
US10706086B1 (en) * 2018-03-12 2020-07-07 Amazon Technologies, Inc. Collaborative-filtering based user simulation for dialog systems
US10303978B1 (en) 2018-03-26 2019-05-28 Clinc, Inc. Systems and methods for intelligently curating machine learning training data and improving machine learning model performance
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US11676220B2 (en) * 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11094316B2 (en) * 2018-05-04 2021-08-17 Qualcomm Incorporated Audio analytics for natural language processing
CN110692040A (zh) * 2018-05-07 2020-01-14 谷歌有限责任公司 在网络系统中激活远程设备
CN108806700A (zh) * 2018-06-08 2018-11-13 英业达科技有限公司 通过声纹及语音密码判断身分的系统及方法
WO2020018525A1 (en) * 2018-07-17 2020-01-23 iT SpeeX LLC Method, system, and computer program product for an intelligent industrial assistant
US10810994B2 (en) 2018-07-19 2020-10-20 International Business Machines Corporation Conversational optimization of cognitive models
US11436215B2 (en) 2018-08-20 2022-09-06 Samsung Electronics Co., Ltd. Server and control method thereof
EP4343534A2 (en) * 2018-08-23 2024-03-27 Google Llc Regulating assistant responsiveness according to characteristics of a multi-assistant environment
KR102637339B1 (ko) * 2018-08-31 2024-02-16 삼성전자주식회사 음성 인식 모델을 개인화하는 방법 및 장치
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10762893B2 (en) * 2018-09-28 2020-09-01 Comcast Cable Communications, Llc Monitoring of one or more audio/video collection devices
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11404058B2 (en) * 2018-10-31 2022-08-02 Walmart Apollo, Llc System and method for handling multi-turn conversations and context management for voice enabled ecommerce transactions
US10885280B2 (en) * 2018-11-14 2021-01-05 International Business Machines Corporation Event detection with conversation
US10878805B2 (en) * 2018-12-06 2020-12-29 Microsoft Technology Licensing, Llc Expediting interaction with a digital assistant by predicting user responses
US10948310B2 (en) * 2018-12-10 2021-03-16 Dish Network L.L.C. Location-based in-vehicle restaurant menu
KR20200072026A (ko) * 2018-12-12 2020-06-22 현대자동차주식회사 음성 인식 처리 장치 및 방법
US10679150B1 (en) 2018-12-13 2020-06-09 Clinc, Inc. Systems and methods for automatically configuring training data for training machine learning models of a machine learning-based dialogue system including seeding training samples or curating a corpus of training data based on instances of training data identified as anomalous
DE102018133149A1 (de) 2018-12-20 2020-06-25 Bayerische Motoren Werke Aktiengesellschaft Multimodale Mehrstufeninteraktion
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11783443B2 (en) 2019-01-22 2023-10-10 Fyusion, Inc. Extraction of standardized images from a single view or multi-view capture
US10887582B2 (en) 2019-01-22 2021-01-05 Fyusion, Inc. Object damage aggregation
US11176704B2 (en) 2019-01-22 2021-11-16 Fyusion, Inc. Object pose estimation in visual data
US11211064B2 (en) 2019-01-23 2021-12-28 Soundhound, Inc. Using a virtual assistant to store a personal voice memo and to obtain a response based on a stored personal voice memo that is retrieved according to a received query
JP2020119412A (ja) * 2019-01-28 2020-08-06 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP7135896B2 (ja) * 2019-01-28 2022-09-13 トヨタ自動車株式会社 対話装置、対話方法及びプログラム
US10565365B1 (en) 2019-02-21 2020-02-18 Capital One Services, Llc Systems and methods for data access control using narrative authentication questions
JP2020144274A (ja) * 2019-03-07 2020-09-10 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11195518B2 (en) * 2019-03-27 2021-12-07 Sonova Ag Hearing device user communicating with a wireless communication device
KR102330978B1 (ko) * 2019-03-29 2021-11-26 엘지전자 주식회사 음성 인터렉션 방법 및 이를 이용한 차량
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US10671941B1 (en) 2019-05-23 2020-06-02 Capital One Services, Llc Managing multifaceted, implicit goals through dialogue
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110287339A (zh) * 2019-06-28 2019-09-27 百度在线网络技术(北京)有限公司 一种播放升级方法及装置
US11322234B2 (en) 2019-07-25 2022-05-03 International Business Machines Corporation Automated content avoidance based on medical conditions
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
US11551676B2 (en) * 2019-09-12 2023-01-10 Oracle International Corporation Techniques for dialog processing using contextual data
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11567788B1 (en) 2019-10-18 2023-01-31 Meta Platforms, Inc. Generating proactive reminders for assistant systems
US11664044B2 (en) 2019-11-25 2023-05-30 Qualcomm Incorporated Sound event detection learning
US11625422B2 (en) 2019-12-02 2023-04-11 Merative Us L.P. Context based surface form generation for cognitive system dictionaries
US11423223B2 (en) 2019-12-02 2022-08-23 International Business Machines Corporation Dynamic creation/expansion of cognitive model dictionaries based on analysis of natural language content
CA3164009A1 (en) * 2020-01-06 2021-07-15 Strengths, Inc. Precision recall in voice computing
KR102197329B1 (ko) * 2020-01-09 2020-12-31 주식회사 카카오뱅크 스크래핑 기반 서비스 제공 방법 및 이를 수행하는 어플리케이션
US11562474B2 (en) 2020-01-16 2023-01-24 Fyusion, Inc. Mobile multi-camera multi-view capture
US11776142B2 (en) 2020-01-16 2023-10-03 Fyusion, Inc. Structuring visual data
WO2021162489A1 (en) * 2020-02-12 2021-08-19 Samsung Electronics Co., Ltd. Method and voice assistance apparatus for providing an intelligence response
US11610582B2 (en) * 2020-03-26 2023-03-21 Paypal, Inc. Systems and methods for formatting informal utterances
US11431658B2 (en) * 2020-04-02 2022-08-30 Paymentus Corporation Systems and methods for aggregating user sessions for interactive transactions using virtual assistants
US11038966B1 (en) 2020-04-28 2021-06-15 Arm Ip Limited Remote device operation
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11900300B2 (en) * 2020-06-11 2024-02-13 T-Mobile Usa, Inc. Coach-assist controller for customer service representative (CSR) interactions
US11610065B2 (en) 2020-06-12 2023-03-21 Apple Inc. Providing personalized responses based on semantic context
US11875362B1 (en) * 2020-07-14 2024-01-16 Cisco Technology, Inc. Humanoid system for automated customer support
US11907670B1 (en) 2020-07-14 2024-02-20 Cisco Technology, Inc. Modeling communication data streams for multi-party conversations involving a humanoid
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20220036891A1 (en) * 2020-07-30 2022-02-03 Intuition Robotics, Ltd. Customizing a policy of an input/output device in response to user constraints
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models
US11769018B2 (en) * 2020-11-24 2023-09-26 Openstream Inc. System and method for temporal attention behavioral analysis of multi-modal conversations in a question and answer system
US11410677B2 (en) 2020-11-24 2022-08-09 Qualcomm Incorporated Adaptive sound event classification
US20230281249A1 (en) * 2020-12-15 2023-09-07 ClearVector, Inc. Computer-implemented methods, systems comprising computer-readable media, and electronic devices for enabled intervention into a network computing environment
US11605151B2 (en) 2021-03-02 2023-03-14 Fyusion, Inc. Vehicle undercarriage imaging
US20220375553A1 (en) * 2021-05-14 2022-11-24 Apple Inc. Digital assistant for health requests
US11856038B2 (en) 2021-05-27 2023-12-26 International Business Machines Corporation Cognitively learning to generate scripts that simulate live-agent actions and responses in synchronous conferencing
WO2023076187A2 (en) * 2021-10-25 2023-05-04 Exxo, Inc. Systems and methods for query source identification and response
US20230252984A1 (en) * 2022-02-09 2023-08-10 Google Llc Providing contextual automated assistant action suggestion(s) via a vehicle computing device
WO2023215517A1 (en) * 2022-05-04 2023-11-09 ClearVector, Inc. Computer-implemented methods, systems comprising computer-readable media, and electronic devices for narrative representation of a network computing environment
US11868344B1 (en) 2022-09-09 2024-01-09 Tencent America LLC System, method, and computer program for cross-lingual text-to-SQL semantic parsing with representation mixup

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342290A (zh) * 1998-10-02 2002-03-27 国际商业机器公司 会话浏览器和会话系统
US20020188602A1 (en) * 2001-05-07 2002-12-12 Eastman Kodak Company Method for associating semantic information with multiple images in an image database environment
US6567797B1 (en) * 1999-01-26 2003-05-20 Xerox Corporation System and method for providing recommendations based on multi-modal user clusters
US6570555B1 (en) * 1998-12-30 2003-05-27 Fuji Xerox Co., Ltd. Method and apparatus for embodied conversational characters with multimodal input/output in an interface device
US20030112267A1 (en) * 2001-12-13 2003-06-19 Hewlett-Packard Company Multi-modal picture
US20040044516A1 (en) * 2002-06-03 2004-03-04 Kennewick Robert A. Systems and methods for responding to natural language speech utterance
US6735592B1 (en) * 2000-11-16 2004-05-11 Discern Communications System, method, and computer program product for a network-based content exchange system
US6757718B1 (en) * 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input

Family Cites Families (515)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4430669A (en) * 1981-05-29 1984-02-07 Payview Limited Transmitting and receiving apparatus for permitting the transmission and reception of multi-tier subscription programs
US4829423A (en) * 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US5208748A (en) 1985-11-18 1993-05-04 Action Technologies, Inc. Method and apparatus for structuring and managing human communications by explicitly defining the types of communications permitted between participants
US4910784A (en) 1987-07-30 1990-03-20 Texas Instruments Incorporated Low cost speech recognition system and method
CA1268228A (en) 1987-09-14 1990-04-24 Gary Lennartz Voice interactive security system
US5027406A (en) 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
SE466029B (sv) 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
JPH03129469A (ja) 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
JP3266246B2 (ja) 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5164904A (en) 1990-07-26 1992-11-17 Farradyne Systems, Inc. In-vehicle traffic congestion information system
US5722084A (en) 1990-09-28 1998-02-24 At&T Corp. Cellular/PCS handset NAM download capability using a wide-area paging system
DE69116167D1 (de) 1990-11-27 1996-02-15 Gordon M Jacobs Digitaler datenumsetzer
US5274560A (en) 1990-12-03 1993-12-28 Audio Navigation Systems, Inc. Sensor free vehicle navigation system utilizing a voice input/output interface for routing a driver from his source point to his destination point
DE69232407T2 (de) * 1991-11-18 2002-09-12 Toshiba Kawasaki Kk Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung
US5608635A (en) * 1992-04-14 1997-03-04 Zexel Corporation Navigation system for a vehicle with route recalculation between multiple locations
US5233681A (en) * 1992-04-24 1993-08-03 International Business Machines Corporation Context-dependent speech recognizer using estimated next word context
CA2102077C (en) 1992-12-21 1997-09-16 Steven Lloyd Greenspan Call billing and measurement methods for redirected calls
US5465289A (en) 1993-03-05 1995-11-07 E-Systems, Inc. Cellular based traffic sensor system
US5471318A (en) 1993-04-22 1995-11-28 At&T Corp. Multimedia communications network
US5377350A (en) 1993-04-30 1994-12-27 International Business Machines Corporation System for cooperative communication between local object managers to provide verification for the performance of remote calls by object messages
US5537436A (en) 1993-06-14 1996-07-16 At&T Corp. Simultaneous analog and digital communication applications
US5983161A (en) * 1993-08-11 1999-11-09 Lemelson; Jerome H. GPS vehicle collision avoidance warning and control system and method
EP0645757B1 (en) * 1993-09-23 2000-04-05 Xerox Corporation Semantic co-occurrence filtering for speech recognition and signal transcription applications
US5475733A (en) 1993-11-04 1995-12-12 At&T Corp. Language accommodated message relaying for hearing impaired callers
CA2118278C (en) 1993-12-21 1999-09-07 J. David Garland Multimedia system
US5748841A (en) * 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US5533108A (en) 1994-03-18 1996-07-02 At&T Corp. Method and system for routing phone calls based on voice and data transport capability
US5488652A (en) * 1994-04-14 1996-01-30 Northern Telecom Limited Method and apparatus for training speech recognition algorithms for directory assistance applications
US5652570A (en) 1994-05-19 1997-07-29 Lepkofker; Robert Individual location system
US5752052A (en) 1994-06-24 1998-05-12 Microsoft Corporation Method and system for bootstrapping statistical processing into a rule-based natural language parser
JP2674521B2 (ja) 1994-09-21 1997-11-12 日本電気株式会社 移動体誘導装置
US5539744A (en) 1994-10-17 1996-07-23 At&T Corp. Hand-off management for cellular telephony
US5696965A (en) 1994-11-03 1997-12-09 Intel Corporation Electronic information appraisal agent
JP2855409B2 (ja) 1994-11-17 1999-02-10 日本アイ・ビー・エム株式会社 自然言語処理方法及びシステム
US6571279B1 (en) 1997-12-05 2003-05-27 Pinpoint Incorporated Location enhanced information delivery system
US5499289A (en) 1994-12-06 1996-03-12 At&T Corp. Systems, methods and articles of manufacture for performing distributed telecommunications
US5748974A (en) * 1994-12-13 1998-05-05 International Business Machines Corporation Multimodal natural language interface for cross-application tasks
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US5892900A (en) 1996-08-30 1999-04-06 Intertrust Technologies Corp. Systems and methods for secure transaction management and electronic rights protection
US5918222A (en) * 1995-03-17 1999-06-29 Kabushiki Kaisha Toshiba Information disclosing apparatus and multi-modal information input/output system
US6965864B1 (en) * 1995-04-10 2005-11-15 Texas Instruments Incorporated Voice activated hypermedia systems using grammatical metadata
WO1996037881A2 (en) 1995-05-26 1996-11-28 Applied Language Technologies Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system
JP3716870B2 (ja) 1995-05-31 2005-11-16 ソニー株式会社 音声認識装置および音声認識方法
US5708422A (en) 1995-05-31 1998-01-13 At&T Transaction authorization and alert system
US20070061735A1 (en) 1995-06-06 2007-03-15 Hoffberg Steven M Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5721938A (en) 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US5617407A (en) * 1995-06-21 1997-04-01 Bareis; Monica M. Optical disk having speech recognition templates for information access
US5794196A (en) 1995-06-30 1998-08-11 Kurzweil Applied Intelligence, Inc. Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules
US6292767B1 (en) 1995-07-18 2001-09-18 Nuance Communications Method and system for building and running natural language understanding systems
US5963940A (en) 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US5911120A (en) 1995-09-08 1999-06-08 At&T Wireless Services Wireless communication system having mobile stations establish a communication link through the base station without using a landline or regional cellular network and without a call in progress
US5855000A (en) 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US5675629A (en) 1995-09-08 1997-10-07 At&T Cordless cellular system base station
US6192110B1 (en) 1995-09-15 2001-02-20 At&T Corp. Method and apparatus for generating sematically consistent inputs to a dialog manager
US5774841A (en) 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5799276A (en) 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US5960447A (en) 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
CN1135753C (zh) * 1995-12-15 2004-01-21 皇家菲利浦电子有限公司 自适应噪声抵消装置、减噪系统及收发机
US6567778B1 (en) 1995-12-21 2003-05-20 Nuance Communications Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores
US5802510A (en) 1995-12-29 1998-09-01 At&T Corp Universal directory service
US5832221A (en) 1995-12-29 1998-11-03 At&T Corp Universal message storage system
US5742763A (en) 1995-12-29 1998-04-21 At&T Corp. Universal message delivery system for handles identifying network presences
US6067520A (en) * 1995-12-29 2000-05-23 Lee And Li System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US5633922A (en) 1995-12-29 1997-05-27 At&T Process and apparatus for restarting call routing in a telephone network
US5987404A (en) 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US5848396A (en) 1996-04-26 1998-12-08 Freedom Of Information, Inc. Method and apparatus for determining behavioral profile of a computer user
US5878386A (en) 1996-06-28 1999-03-02 Microsoft Corporation Natural language parser with dictionary-based part-of-speech probabilities
US5953393A (en) 1996-07-15 1999-09-14 At&T Corp. Personal telephone agent
US6009382A (en) 1996-08-19 1999-12-28 International Business Machines Corporation Word storage table for natural language determination
US5867817A (en) * 1996-08-19 1999-02-02 Virtual Vision, Inc. Speech recognition manager
US6385646B1 (en) 1996-08-23 2002-05-07 At&T Corp. Method and system for establishing voice communications in an internet environment
US6470315B1 (en) 1996-09-11 2002-10-22 Texas Instruments Incorporated Enrollment and modeling method and apparatus for robust speaker dependent speech models
US5878385A (en) * 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US6085186A (en) 1996-09-20 2000-07-04 Netbot, Inc. Method and system using information written in a wrapper description language to execute query on a network
US6961700B2 (en) 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
EP0863466A4 (en) * 1996-09-26 2005-07-20 Mitsubishi Electric Corp INTERACTIVE PROCESSOR
US5892813A (en) 1996-09-30 1999-04-06 Matsushita Electric Industrial Co., Ltd. Multimodal voice dialing digital key telephone with dialog manager
US5995928A (en) 1996-10-02 1999-11-30 Speechworks International, Inc. Method and apparatus for continuous spelling speech recognition with early identification
US5902347A (en) * 1996-11-19 1999-05-11 American Navigation Systems, Inc. Hand-held GPS-mapping device
US5839107A (en) 1996-11-29 1998-11-17 Northern Telecom Limited Method and apparatus for automatically generating a speech recognition vocabulary from a white pages listing
US6154526A (en) 1996-12-04 2000-11-28 Intellivoice Communications, Inc. Data acquisition and error correcting speech recognition system
US5960399A (en) 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer
US6456974B1 (en) 1997-01-06 2002-09-24 Texas Instruments Incorporated System and method for adding speech recognition capabilities to java
US6009355A (en) 1997-01-28 1999-12-28 American Calcar Inc. Multimedia information and control system for automobiles
US6122613A (en) 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
JPH10254486A (ja) * 1997-03-13 1998-09-25 Canon Inc 音声認識装置および方法
GB2323693B (en) 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
US6167377A (en) 1997-03-28 2000-12-26 Dragon Systems, Inc. Speech recognition language models
FR2761837B1 (fr) * 1997-04-08 1999-06-11 Sophie Sommelet Dispositif d'aide a la navigation ayant une architecture distribuee basee sur internet
US6014559A (en) 1997-04-10 2000-01-11 At&T Wireless Services, Inc. Method and system for delivering a voice mail notification to a private base station using cellular phone network
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6058187A (en) 1997-04-17 2000-05-02 At&T Corp. Secure telecommunications data transmission
US5895464A (en) * 1997-04-30 1999-04-20 Eastman Kodak Company Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6128369A (en) 1997-05-14 2000-10-03 A.T.&T. Corp. Employing customer premises equipment in communications network maintenance
US5960397A (en) * 1997-05-27 1999-09-28 At&T Corp System and method of recognizing an acoustic environment to adapt a set of based recognition models to the current acoustic environment for subsequent speech recognition
US5995119A (en) 1997-06-06 1999-11-30 At&T Corp. Method for generating photo-realistic animated characters
FI972723A0 (fi) 1997-06-24 1997-06-24 Nokia Mobile Phones Ltd Mobila kommunikationsanordningar
US6199043B1 (en) 1997-06-24 2001-03-06 International Business Machines Corporation Conversation management in speech recognition interfaces
US6101241A (en) 1997-07-16 2000-08-08 At&T Corp. Telephone-based speech recognition for data collection
US5926784A (en) 1997-07-17 1999-07-20 Microsoft Corporation Method and system for natural language parsing using podding
US5933822A (en) 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6275231B1 (en) 1997-08-01 2001-08-14 American Calcar Inc. Centralized control and management system for automobiles
US6044347A (en) 1997-08-05 2000-03-28 Lucent Technologies Inc. Methods and apparatus object-oriented rule-based dialogue management
US6144667A (en) 1997-08-07 2000-11-07 At&T Corp. Network-based method and apparatus for initiating and completing a telephone call via the internet
US6192338B1 (en) 1997-08-12 2001-02-20 At&T Corp. Natural language knowledge servers as network resources
US6360234B2 (en) * 1997-08-14 2002-03-19 Virage, Inc. Video cataloger system with synchronized encoders
US6707421B1 (en) 1997-08-19 2004-03-16 Siemens Vdo Automotive Corporation Driver information system
US5895466A (en) 1997-08-19 1999-04-20 At&T Corp Automated natural language understanding customer service system
US6081774A (en) 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
US6018708A (en) * 1997-08-26 2000-01-25 Nortel Networks Corporation Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies
US6076059A (en) 1997-08-29 2000-06-13 Digital Equipment Corporation Method for aligning text with audio signals
US6650747B1 (en) 1997-09-18 2003-11-18 At&T Corp. Control of merchant application by system monitor in virtual contact center
US6049602A (en) 1997-09-18 2000-04-11 At&T Corp Virtual call center
DE19742054A1 (de) 1997-09-24 1999-04-01 Philips Patentverwaltung Eingabesystem wenigstens für Orts- und/oder Straßennamen
US6134235A (en) 1997-10-08 2000-10-17 At&T Corp. Pots/packet bridge
US5897613A (en) 1997-10-08 1999-04-27 Lucent Technologies Inc. Efficient transmission of voice silence intervals
US6272455B1 (en) 1997-10-22 2001-08-07 Lucent Technologies, Inc. Method and apparatus for understanding natural language
JPH11126090A (ja) * 1997-10-23 1999-05-11 Pioneer Electron Corp 音声認識方法及び音声認識装置並びに音声認識装置を動作させるためのプログラムが記録された記録媒体
US6021384A (en) 1997-10-29 2000-02-01 At&T Corp. Automatic generation of superwords
US6498797B1 (en) 1997-11-14 2002-12-24 At&T Corp. Method and apparatus for communication services on a network
US6188982B1 (en) * 1997-12-01 2001-02-13 Industrial Technology Research Institute On-line background noise adaptation of parallel model combination HMM with discriminative learning using weighted HMM for noisy speech recognition
US6219346B1 (en) 1997-12-02 2001-04-17 At&T Corp. Packet switching architecture in cellular radio
US6614773B1 (en) 1997-12-02 2003-09-02 At&T Corp. Packet transmissions over cellular radio
US5970412A (en) 1997-12-02 1999-10-19 Maxemchuk; Nicholas Frank Overload control in a packet-switching cellular environment
US6195634B1 (en) * 1997-12-24 2001-02-27 Nortel Networks Corporation Selection of decoys for non-vocabulary utterances rejection
US6301560B1 (en) 1998-01-05 2001-10-09 Microsoft Corporation Discrete speech recognition system with ballooning active grammar
US6278377B1 (en) 1999-08-25 2001-08-21 Donnelly Corporation Indicator for vehicle accessory
US5950167A (en) * 1998-01-26 1999-09-07 Lucent Technologies Inc. Screen-less remote voice or tone-controlled computer program operations via telephone set
US6226612B1 (en) * 1998-01-30 2001-05-01 Motorola, Inc. Method of evaluating an utterance in a speech recognition system
US6385596B1 (en) * 1998-02-06 2002-05-07 Liquid Audio, Inc. Secure online music distribution system
US6160883A (en) 1998-03-04 2000-12-12 At&T Corporation Telecommunications network system and method
DE69912754D1 (de) 1998-03-09 2003-12-18 Lernout & Hauspie Speechprod Vorrichtung und verfahren zum gleichzeitigen multimodalen diktieren
US6119087A (en) 1998-03-13 2000-09-12 Nuance Communications System architecture for and method of voice processing
US6233559B1 (en) * 1998-04-01 2001-05-15 Motorola, Inc. Speech control of multiple applications using applets
US6420975B1 (en) 1999-08-25 2002-07-16 Donnelly Corporation Interior rearview mirror sound processing system
US6173279B1 (en) 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources
US6144938A (en) * 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
US6574597B1 (en) * 1998-05-08 2003-06-03 At&T Corp. Fully expanded context-dependent networks for speech recognition
US6236968B1 (en) 1998-05-14 2001-05-22 International Business Machines Corporation Sleep prevention dialog based car system
US20070094224A1 (en) 1998-05-28 2007-04-26 Lawrence Au Method and system for determining contextual meaning for network search applications
US7072826B1 (en) 1998-06-04 2006-07-04 Matsushita Electric Industrial Co., Ltd. Language conversion rule preparing device, language conversion device and program recording medium
US6219643B1 (en) 1998-06-26 2001-04-17 Nuance Communications, Inc. Method of analyzing dialogs in a natural language speech recognition system
US6175858B1 (en) 1998-07-13 2001-01-16 At&T Corp. Intelligent network messaging agent and method
US6393428B1 (en) 1998-07-13 2002-05-21 Microsoft Corporation Natural language information retrieval system
US6553372B1 (en) 1998-07-13 2003-04-22 Microsoft Corporation Natural language information retrieval system
US6269336B1 (en) 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
WO2000011576A1 (en) 1998-08-24 2000-03-02 Virtual Research Associates, Inc. Natural language sentence parser
US6208964B1 (en) * 1998-08-31 2001-03-27 Nortel Networks Limited Method and apparatus for providing unsupervised adaptation of transcriptions
US6434524B1 (en) 1998-09-09 2002-08-13 One Voice Technologies, Inc. Object interactive user interface using speech recognition and natural language processing
US6499013B1 (en) 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6049607A (en) 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus
US6405170B1 (en) 1998-09-22 2002-06-11 Speechworks International, Inc. Method and system of reviewing the behavior of an interactive speech recognition application
US6606598B1 (en) 1998-09-22 2003-08-12 Speechworks International, Inc. Statistical computing and reporting for interactive speech applications
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US6928614B1 (en) 1998-10-13 2005-08-09 Visteon Global Technologies, Inc. Mobile office with speech recognition
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
EP1123581A4 (en) 1998-10-21 2005-08-10 American Calcar Inc POSITION CAMERA AND GPS DATA EXCHANGE DEVICE
US6453292B2 (en) 1998-10-28 2002-09-17 International Business Machines Corporation Command boundary identifier for conversational natural language
US6028514A (en) 1998-10-30 2000-02-22 Lemelson Jerome H. Personal emergency, safety warning system and method
US6477200B1 (en) * 1998-11-09 2002-11-05 Broadcom Corporation Multi-pair gigabit ethernet transceiver
US8121891B2 (en) * 1998-11-12 2012-02-21 Accenture Global Services Gmbh Personalized product report
US6208972B1 (en) * 1998-12-23 2001-03-27 Richard Grant Method for integrating computer processes with an interface controlled by voice actuated grammars
US6195651B1 (en) * 1998-11-19 2001-02-27 Andersen Consulting Properties Bv System, method and article of manufacture for a tuned user application experience
US6246981B1 (en) 1998-11-25 2001-06-12 International Business Machines Corporation Natural language task-oriented dialog manager and method
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US6430285B1 (en) 1998-12-15 2002-08-06 At&T Corp. Method and apparatus for an automated caller interaction system
US6721001B1 (en) * 1998-12-16 2004-04-13 International Business Machines Corporation Digital camera with voice recognition annotation
US6233556B1 (en) 1998-12-16 2001-05-15 Nuance Communications Voice processing and verification system
US6754485B1 (en) 1998-12-23 2004-06-22 American Calcar Inc. Technique for effectively providing maintenance and information to vehicles
US6851115B1 (en) 1999-01-05 2005-02-01 Sri International Software-based architecture for communication and cooperation among distributed electronic agents
US7036128B1 (en) 1999-01-05 2006-04-25 Sri International Offices Using a community of distributed electronic agents to support a highly mobile, ambient computing environment
US6742021B1 (en) 1999-01-05 2004-05-25 Sri International, Inc. Navigating network-based electronic information using spoken input with multimodal error feedback
US6523061B1 (en) 1999-01-05 2003-02-18 Sri International, Inc. System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system
JP3822990B2 (ja) * 1999-01-07 2006-09-20 株式会社日立製作所 翻訳装置、記録媒体
US6429813B2 (en) 1999-01-14 2002-08-06 Navigation Technologies Corp. Method and system for providing end-user preferences with a navigation system
US6397181B1 (en) 1999-01-27 2002-05-28 Kent Ridge Digital Labs Method and apparatus for voice annotation and retrieval of multimedia data
US6556970B1 (en) * 1999-01-28 2003-04-29 Denso Corporation Apparatus for determining appropriate series of words carrying information to be recognized
US6278968B1 (en) 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6873837B1 (en) 1999-02-03 2005-03-29 Matsushita Electric Industrial Co., Ltd. Emergency reporting system and terminal apparatus therein
US6430531B1 (en) 1999-02-04 2002-08-06 Soliloquy, Inc. Bilateral speech system
JP4176228B2 (ja) 1999-03-15 2008-11-05 株式会社東芝 自然言語対話装置及び自然言語対話方法
US6643620B1 (en) 1999-03-15 2003-11-04 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
US6631346B1 (en) 1999-04-07 2003-10-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for natural language parsing using multiple passes and tags
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US6233561B1 (en) 1999-04-12 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method for goal-oriented speech translation in hand-held devices using meaning extraction and dialogue
US6570964B1 (en) 1999-04-16 2003-05-27 Nuance Communications Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system
US6314402B1 (en) 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6434523B1 (en) 1999-04-23 2002-08-13 Nuance Communications Creating and editing grammars for speech recognition graphically
US6804638B2 (en) * 1999-04-30 2004-10-12 Recent Memory Incorporated Device and method for selective recall and preservation of events prior to decision to record the events
US6356869B1 (en) 1999-04-30 2002-03-12 Nortel Networks Limited Method and apparatus for discourse management
US6505155B1 (en) 1999-05-06 2003-01-07 International Business Machines Corporation Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy
US6308151B1 (en) * 1999-05-14 2001-10-23 International Business Machines Corp. Method and system using a speech recognition system to dictate a body of text in response to an available body of text
US6604075B1 (en) * 1999-05-20 2003-08-05 Lucent Technologies Inc. Web-based voice dialog interface
GB9911971D0 (en) 1999-05-21 1999-07-21 Canon Kk A system, a server for a system and a machine for use in a system
US6584439B1 (en) 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
US7787907B2 (en) 1999-05-26 2010-08-31 Johnson Controls Technology Company System and method for using speech recognition with a vehicle control system
US20020032564A1 (en) 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US20020107694A1 (en) 1999-06-07 2002-08-08 Traptec Corporation Voice-recognition safety system for aircraft and method of using the same
US6374214B1 (en) * 1999-06-24 2002-04-16 International Business Machines Corp. Method and apparatus for excluding text phrases during re-dictation in a speech recognition system
DE60026637T2 (de) 1999-06-30 2006-10-05 International Business Machines Corp. Verfahren zur Erweiterung des Wortschatzes eines Spracherkennungssystems
US6321196B1 (en) 1999-07-02 2001-11-20 International Business Machines Corporation Phonetic spelling for speech recognition
CN1207664C (zh) * 1999-07-27 2005-06-22 国际商业机器公司 对语音识别结果中的错误进行校正的方法和语音识别系统
US7069220B2 (en) * 1999-08-13 2006-06-27 International Business Machines Corporation Method for determining and maintaining dialog focus in a conversational speech system
US6377913B1 (en) * 1999-08-13 2002-04-23 International Business Machines Corporation Method and system for multi-client access to a dialog system
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
US6901366B1 (en) * 1999-08-26 2005-05-31 Matsushita Electric Industrial Co., Ltd. System and method for assessing TV-related information over the internet
US6415257B1 (en) 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
EP1083545A3 (en) * 1999-09-09 2001-09-26 Xanavi Informatics Corporation Voice recognition of proper names in a navigation apparatus
US6658388B1 (en) 1999-09-10 2003-12-02 International Business Machines Corporation Personality generator for conversational systems
US7340040B1 (en) * 1999-09-13 2008-03-04 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for corporate-analysis related information
US6850603B1 (en) 1999-09-13 2005-02-01 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services
US6631351B1 (en) 1999-09-14 2003-10-07 Aidentity Matrix Smart toys
US6601026B2 (en) 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US20020049535A1 (en) 1999-09-20 2002-04-25 Ralf Rigo Wireless interactive voice-actuated mobile telematics system
US6587858B1 (en) 1999-09-30 2003-07-01 Steven Paul Strazza Systems and methods for the control of dynamic data and request criteria in a data repository
US6963759B1 (en) 1999-10-05 2005-11-08 Fastmobile, Inc. Speech recognition technique based on local interrupt detection
US6868385B1 (en) 1999-10-05 2005-03-15 Yomobile, Inc. Method and apparatus for the provision of information signals based upon speech recognition
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6442522B1 (en) 1999-10-12 2002-08-27 International Business Machines Corporation Bi-directional natural language system for interfacing with multiple back-end applications
US6721697B1 (en) 1999-10-18 2004-04-13 Sony Corporation Method and system for reducing lexical ambiguity
CA2748396A1 (en) 1999-10-19 2001-04-26 Sony Electronics Inc. Natural language interface control system
US6581103B1 (en) * 1999-10-22 2003-06-17 Dedicated Radio, Llc Method for internet radio broadcasting including listener requests of audio and/or video files with input dedications
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
AU1039301A (en) 1999-10-29 2001-05-08 British Telecommunications Public Limited Company Method and apparatus for processing queries
US6622119B1 (en) 1999-10-30 2003-09-16 International Business Machines Corporation Adaptive command predictor and method for a natural language dialog system
CA2390200A1 (en) * 1999-11-03 2001-05-10 Charles W. K. Gritton Integrated voice processing system for packet networks
US6681206B1 (en) * 1999-11-05 2004-01-20 At&T Corporation Method for generating morphemes
US8482535B2 (en) 1999-11-08 2013-07-09 Apple Inc. Programmable tactile touch screen displays and man-machine interfaces for improved vehicle instrumentation and telematics
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6633846B1 (en) 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
US6418210B1 (en) 1999-11-29 2002-07-09 At&T Corp Method and apparatus for providing information between a calling network and a called network
US6751612B1 (en) * 1999-11-29 2004-06-15 Xerox Corporation User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine
US6288319B1 (en) 1999-12-02 2001-09-11 Gary Catona Electronic greeting card with a custom audio mix
GB9928420D0 (en) * 1999-12-02 2000-01-26 Ibm Interactive voice response system
US6591239B1 (en) 1999-12-09 2003-07-08 Steris Inc. Voice controlled surgical suite
US6598018B1 (en) 1999-12-15 2003-07-22 Matsushita Electric Industrial Co., Ltd. Method for natural dialog interface to car devices
US6976229B1 (en) * 1999-12-16 2005-12-13 Ricoh Co., Ltd. Method and apparatus for storytelling with digital photographs
US6832230B1 (en) 1999-12-22 2004-12-14 Nokia Corporation Apparatus and associated method for downloading an application with a variable lifetime to a mobile terminal
US6920421B2 (en) * 1999-12-28 2005-07-19 Sony Corporation Model adaptive apparatus for performing adaptation of a model used in pattern recognition considering recentness of a received pattern data
US6678680B1 (en) * 2000-01-06 2004-01-13 Mark Woo Music search engine
US6701294B1 (en) * 2000-01-19 2004-03-02 Lucent Technologies, Inc. User interface for translating natural language inquiries into database queries and data presentations
US6829603B1 (en) 2000-02-02 2004-12-07 International Business Machines Corp. System, method and program product for interactive natural dialog
US6560590B1 (en) 2000-02-14 2003-05-06 Kana Software, Inc. Method and apparatus for multiple tiered matching of natural language queries to positions in a text corpus
US6434529B1 (en) 2000-02-16 2002-08-13 Sun Microsystems, Inc. System and method for referencing object instances and invoking methods on those object instances from within a speech recognition grammar
US7117199B2 (en) 2000-02-22 2006-10-03 Metacarta, Inc. Spatially coding and displaying information
US7110951B1 (en) 2000-03-03 2006-09-19 Dorothy Lemelson, legal representative System and method for enhancing speech intelligibility for the hearing impaired
US6466654B1 (en) 2000-03-06 2002-10-15 Avaya Technology Corp. Personal virtual assistant with semantic tagging
US7974875B1 (en) 2000-03-21 2011-07-05 Aol Inc. System and method for using voice over a telephone to access, process, and carry out transactions over the internet
US6510417B1 (en) * 2000-03-21 2003-01-21 America Online, Inc. System and method for voice access to internet-based information
US6868380B2 (en) * 2000-03-24 2005-03-15 Eliza Corporation Speech recognition system and method for generating phonotic estimates
EP1277201B1 (en) 2000-03-24 2007-10-10 Eliza Corporation Web-based speech recognition with scripting and semantic objects
AU2001249768A1 (en) 2000-04-02 2001-10-15 Tangis Corporation Soliciting information based on a computer user's context
US6980092B2 (en) 2000-04-06 2005-12-27 Gentex Corporation Vehicle rearview mirror assembly incorporating a communication system
EP1273004A1 (en) 2000-04-06 2003-01-08 One Voice Technologies Inc. Natural language and dialogue generation processing
US7177798B2 (en) 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results
US7734287B2 (en) 2000-04-10 2010-06-08 I/O Controls Corporation System for providing remote access to diagnostic information over a wide area network
US6726636B2 (en) 2000-04-12 2004-04-27 Loran Technologies, Inc. Breathalyzer with voice recognition
US6578022B1 (en) 2000-04-18 2003-06-10 Icplanet Corporation Interactive intelligent searching with executable suggestions
US6556973B1 (en) * 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
US7502672B1 (en) 2000-04-24 2009-03-10 Usa Technologies, Inc. Wireless vehicle diagnostics with service and part determination capabilities
US6560576B1 (en) 2000-04-25 2003-05-06 Nuance Communications Method and apparatus for providing active help to a user of a voice-enabled application
WO2001082031A2 (en) 2000-04-26 2001-11-01 Portable Internet Inc. Portable internet services
US6912498B2 (en) 2000-05-02 2005-06-28 Scansoft, Inc. Error correction in speech recognition by correcting text around selected area
US7577244B2 (en) 2000-05-16 2009-08-18 John Taschereau Method and system for providing geographically targeted information and advertising
WO2001093554A2 (en) * 2000-05-26 2001-12-06 Koninklijke Philips Electronics N.V. Method and device for acoustic echo cancellation combined with adaptive beamforming
US6487495B1 (en) 2000-06-02 2002-11-26 Navigation Technologies Corporation Navigation applications using related location-referenced keywords
US7082469B2 (en) 2000-06-09 2006-07-25 Gold Mustache Publishing, Inc. Method and system for electronic song dedication
WO2001097558A2 (en) * 2000-06-13 2001-12-20 Gn Resound Corporation Fixed polar-pattern-based adaptive directionality systems
AU2001268674B2 (en) * 2000-06-22 2007-04-26 Microsoft Technology Licensing, Llc Distributed computing services platform
JP3567864B2 (ja) 2000-07-21 2004-09-22 株式会社デンソー 音声認識装置及び記録媒体
US7143039B1 (en) 2000-08-11 2006-11-28 Tellme Networks, Inc. Providing menu and other services for an information processing system using a telephone or other audio interface
US6636790B1 (en) 2000-07-25 2003-10-21 Reynolds And Reynolds Holdings, Inc. Wireless diagnostic system and method for monitoring vehicles
DE10036851A1 (de) 2000-07-28 2002-02-28 Mannesmann Vdo Ag Verfahren zur Auswahl einer Ortsbezeichnung in einem Navigationssystem durch Spracheingabe
DE60133902D1 (zh) 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
US7092928B1 (en) 2000-07-31 2006-08-15 Quantum Leap Research, Inc. Intelligent portal engine
US7027975B1 (en) * 2000-08-08 2006-04-11 Object Services And Consulting, Inc. Guided natural language interface system and method
US7653748B2 (en) 2000-08-10 2010-01-26 Simplexity, Llc Systems, methods and computer program products for integrating advertising within web content
US6574624B1 (en) 2000-08-18 2003-06-03 International Business Machines Corporation Automatic topic identification and switch for natural language search of textual document collections
US20020052747A1 (en) * 2000-08-21 2002-05-02 Sarukkai Ramesh R. Method and system of interpreting and presenting web content using a voice browser
US7062488B1 (en) * 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
CN1226717C (zh) * 2000-08-30 2005-11-09 国际商业机器公司 自动新词提取方法和系统
EP1184841A1 (de) 2000-08-31 2002-03-06 Siemens Aktiengesellschaft Sprachgesteuerte Anordnung und Verfahren zur Spracheingabe und -erkennung
US6813341B1 (en) 2000-08-31 2004-11-02 Ivoice, Inc. Voice activated/voice responsive item locator
WO2002021334A1 (en) 2000-09-07 2002-03-14 Telefonaktiebolaget Lm Ericsson (Publ) Information supply system and control method thereof
US20040205671A1 (en) 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
JP2004509018A (ja) * 2000-09-21 2004-03-25 アメリカン カルカー インコーポレイティド 操作支援方法、ユーザ条件判断方法、タイヤ条件判断方法、視界測定方法、道路判断方法、モニタ装置、および操作装置
US7085708B2 (en) 2000-09-23 2006-08-01 Ravenflow, Inc. Computer system with natural language to machine language translator
US6704576B1 (en) 2000-09-27 2004-03-09 At&T Corp. Method and system for communicating multimedia content in a unicast, multicast, simulcast or broadcast environment
US6362748B1 (en) * 2000-09-27 2002-03-26 Lite Vision Corporation System for communicating among vehicles and a communication system control center
US7216080B2 (en) * 2000-09-29 2007-05-08 Mindfabric Holdings Llc Natural-language voice-activated personal assistant
JP2003044708A (ja) 2000-10-02 2003-02-14 Omron Corp 情報仲介システムとそれに用いられる情報仲介方法
US6922670B2 (en) * 2000-10-24 2005-07-26 Sanyo Electric Co., Ltd. User support apparatus and system using agents
US6721706B1 (en) * 2000-10-30 2004-04-13 Koninklijke Philips Electronics N.V. Environment-responsive user interface/entertainment device that simulates personal interaction
US6795808B1 (en) 2000-10-30 2004-09-21 Koninklijke Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and charges external database with relevant data
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
GB0027178D0 (en) * 2000-11-07 2000-12-27 Canon Kk Speech processing system
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
US7013308B1 (en) 2000-11-28 2006-03-14 Semscript Ltd. Knowledge storage and retrieval system and method
US20020065568A1 (en) * 2000-11-30 2002-05-30 Silfvast Robert Denton Plug-in modules for digital signal processor functionalities
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
US20020067839A1 (en) 2000-12-04 2002-06-06 Heinrich Timothy K. The wireless voice activated and recogintion car system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6456711B1 (en) 2000-12-12 2002-09-24 At&T Corp. Method for placing a call intended for an enhanced network user on hold while the enhanced network user is unavailable to take the call using a distributed feature architecture
US7170993B2 (en) 2000-12-19 2007-01-30 Lucent Technologies Inc. Methods and apparatus for automated monitoring and action taking based on decision support mechanism
US20020082911A1 (en) * 2000-12-22 2002-06-27 Dunn Charles L. Online revenue sharing
US6973427B2 (en) * 2000-12-26 2005-12-06 Microsoft Corporation Method for adding phonetic descriptions to a speech recognition lexicon
US20020087326A1 (en) 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented web page summarization method and system
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
DE10101282A1 (de) 2001-01-12 2002-07-18 Siemens Ag Notrufmeldung mittels mobiler Telekommunikationsgeräte
US6751591B1 (en) * 2001-01-22 2004-06-15 At&T Corp. Method and system for predicting understanding errors in a task classification system
US7069207B2 (en) 2001-01-26 2006-06-27 Microsoft Corporation Linguistically intelligent text compression
US7487110B2 (en) 2001-01-30 2009-02-03 International Business Machines Corporation Automotive information communication exchange system, method, and program product
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US20020107873A1 (en) 2001-02-07 2002-08-08 Bandag Licensing Corporation System and method for data collection, reporting, and analysis of fleet vehicle information
US7206418B2 (en) 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
EP1231788A1 (en) 2001-02-12 2002-08-14 Koninklijke Philips Electronics N.V. Arrangement for distributing content, profiling center, receiving device and method
US6549629B2 (en) 2001-02-21 2003-04-15 Digisonix Llc DVE system with normalized selection
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6754627B2 (en) 2001-03-01 2004-06-22 International Business Machines Corporation Detecting speech recognition errors in an embedded speech recognition system
US7024364B2 (en) 2001-03-09 2006-04-04 Bevocal, Inc. System, method and computer program product for looking up business addresses and directions based on a voice dial-up session
US20020173961A1 (en) 2001-03-09 2002-11-21 Guerra Lisa M. System, method and computer program product for dynamic, robust and fault tolerant audio output in a speech recognition framework
US20020133402A1 (en) 2001-03-13 2002-09-19 Scott Faber Apparatus and method for recruiting, communicating with, and paying participants of interactive advertising
WO2002073449A1 (en) * 2001-03-14 2002-09-19 At & T Corp. Automated sentence planning in a task classification system
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US6801897B2 (en) 2001-03-28 2004-10-05 International Business Machines Corporation Method of providing concise forms of natural commands
US7472075B2 (en) 2001-03-29 2008-12-30 Intellisist, Inc. System and method to associate broadcast radio content with a transaction via an internet server
US7406421B2 (en) 2001-10-26 2008-07-29 Intellisist Inc. Systems and methods for reviewing informational content in a vehicle
US6487494B2 (en) 2001-03-29 2002-11-26 Wingcast, Llc System and method for reducing the amount of repetitive data sent by a server to a client for vehicle navigation
US8175886B2 (en) 2001-03-29 2012-05-08 Intellisist, Inc. Determination of signal-processing approach based on signal destination characteristics
JP2002358095A (ja) * 2001-03-30 2002-12-13 Sony Corp 音声処理装置および音声処理方法、並びにプログラムおよび記録媒体
EP1451679A2 (en) 2001-03-30 2004-09-01 BRITISH TELECOMMUNICATIONS public limited company Multi-modal interface
FR2822994B1 (fr) 2001-03-30 2004-05-21 Bouygues Telecom Sa Assistance au conducteur d'un vehicule automobile
US6996531B2 (en) * 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US6885989B2 (en) 2001-04-02 2005-04-26 International Business Machines Corporation Method and system for collaborative speech recognition for small-area network
US6856990B2 (en) * 2001-04-09 2005-02-15 Intel Corporation Network dedication system
JP2002318132A (ja) 2001-04-23 2002-10-31 Hitachi Ltd 音声対話型ナビゲーションシステムおよび移動端末装置および音声対話サーバ
US7437295B2 (en) * 2001-04-27 2008-10-14 Accenture Llp Natural language processing for a location-based services system
US7970648B2 (en) 2001-04-27 2011-06-28 Accenture Global Services Limited Advertising campaign and business listing management for a location-based services system
US6950821B2 (en) 2001-05-04 2005-09-27 Sun Microsystems, Inc. System and method for resolving distributed network search queries to information providers
US20020173333A1 (en) 2001-05-18 2002-11-21 Buchholz Dale R. Method and apparatus for processing barge-in requests
US6944594B2 (en) 2001-05-30 2005-09-13 Bellsouth Intellectual Property Corporation Multi-context conversational environment system and method
JP2003005897A (ja) * 2001-06-20 2003-01-08 Alpine Electronics Inc 情報入力方法および装置
US6801604B2 (en) * 2001-06-25 2004-10-05 International Business Machines Corporation Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources
US20020198714A1 (en) 2001-06-26 2002-12-26 Guojun Zhou Statistical spoken dialog system
US20100029261A1 (en) 2001-06-27 2010-02-04 John Mikkelsen Virtual wireless data cable method, apparatus and system
US20050234727A1 (en) 2001-07-03 2005-10-20 Leo Chiu Method and apparatus for adapting a voice extensible markup language-enabled voice system for natural speech recognition and system response
US6983307B2 (en) * 2001-07-11 2006-01-03 Kirusa, Inc. Synchronization among plural browsers
US7123727B2 (en) * 2001-07-18 2006-10-17 Agere Systems Inc. Adaptive close-talking differential microphone array
US7283951B2 (en) 2001-08-14 2007-10-16 Insightful Corporation Method and system for enhanced data searching
US6757544B2 (en) 2001-08-15 2004-06-29 Motorola, Inc. System and method for determining a location relevant to a communication device and/or its associated user
US7920682B2 (en) 2001-08-21 2011-04-05 Byrne William J Dynamic interactive voice interface
US7305381B1 (en) 2001-09-14 2007-12-04 Ricoh Co., Ltd Asynchronous unconscious retrieval in a network of information appliances
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
US6721633B2 (en) 2001-09-28 2004-04-13 Robert Bosch Gmbh Method and device for interfacing a driver information system using a voice portal server
US7289606B2 (en) 2001-10-01 2007-10-30 Sandeep Sibal Mode-swapping in multi-modal telephonic applications
JP3997459B2 (ja) 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
US7640006B2 (en) 2001-10-03 2009-12-29 Accenture Global Services Gmbh Directory assistance with multi-modal messaging
US7254384B2 (en) * 2001-10-03 2007-08-07 Accenture Global Services Gmbh Multi-modal messaging
US20030069734A1 (en) 2001-10-05 2003-04-10 Everhart Charles Allen Technique for active voice recognition grammar adaptation for dynamic multimedia application
JP4065936B2 (ja) 2001-10-09 2008-03-26 独立行政法人情報通信研究機構 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム
US6501834B1 (en) 2001-11-21 2002-12-31 At&T Corp. Message sender status monitor
US20030101054A1 (en) 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
FR2833375B1 (fr) * 2001-12-07 2004-06-04 Amadeus Procede, dispositif d'adaptation de fichiers numeriques
US7174300B2 (en) 2001-12-11 2007-02-06 Lockheed Martin Corporation Dialog processing method and apparatus for uninhabited air vehicles
US7165028B2 (en) * 2001-12-12 2007-01-16 Texas Instruments Incorporated Method of speech recognition resistant to convolutive distortion and additive distortion
US7231343B1 (en) * 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
US20030120493A1 (en) 2001-12-21 2003-06-26 Gupta Sunil K. Method and system for updating and customizing recognition vocabulary
EP1324274A3 (en) 2001-12-28 2005-11-02 Matsushita Electric Industrial Co., Ltd. Vehicle information recording system
US7203644B2 (en) * 2001-12-31 2007-04-10 Intel Corporation Automating tuning of speech recognition systems
US7493259B2 (en) 2002-01-04 2009-02-17 Siebel Systems, Inc. Method for accessing data via voice
US7493559B1 (en) * 2002-01-09 2009-02-17 Ricoh Co., Ltd. System and method for direct multi-modal annotation of objects
US7117200B2 (en) 2002-01-11 2006-10-03 International Business Machines Corporation Synthesizing information-bearing content from multiple channels
US7111248B2 (en) 2002-01-15 2006-09-19 Openwave Systems Inc. Alphanumeric information input method
US7536297B2 (en) 2002-01-22 2009-05-19 International Business Machines Corporation System and method for hybrid text mining for finding abbreviations and their definitions
US7054817B2 (en) 2002-01-25 2006-05-30 Canon Europa N.V. User interface for speech model generation and testing
US20030144846A1 (en) 2002-01-31 2003-07-31 Denenberg Lawrence A. Method and system for modifying the behavior of an application based upon the application's grammar
US7130390B2 (en) 2002-02-01 2006-10-31 Microsoft Corporation Audio messaging system and method
US7177814B2 (en) 2002-02-07 2007-02-13 Sap Aktiengesellschaft Dynamic grammar for voice-enabled applications
US7058890B2 (en) 2002-02-13 2006-06-06 Siebel Systems, Inc. Method and system for enabling connectivity to a data system
US8249880B2 (en) 2002-02-14 2012-08-21 Intellisist, Inc. Real-time display of system instructions
US7587317B2 (en) 2002-02-15 2009-09-08 Microsoft Corporation Word training interface
JP3974419B2 (ja) 2002-02-18 2007-09-12 株式会社日立製作所 音声入力を用いた情報取得方法及び情報取得システム
US6704396B2 (en) 2002-02-27 2004-03-09 Sbc Technology Resources, Inc. Multi-modal communications method
US7301093B2 (en) 2002-02-27 2007-11-27 Neil D. Sater System and method that facilitates customizing media
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US7136875B2 (en) 2002-09-24 2006-11-14 Google, Inc. Serving advertisements based on content
US7072834B2 (en) * 2002-04-05 2006-07-04 Intel Corporation Adapting to adverse acoustic environment in speech processing using playback training data
US7197460B1 (en) 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
US6877001B2 (en) 2002-04-25 2005-04-05 Mitsubishi Electric Research Laboratories, Inc. Method and system for retrieving documents with spoken queries
US7167568B2 (en) 2002-05-02 2007-01-23 Microsoft Corporation Microphone array signal enhancement
US20030212558A1 (en) 2002-05-07 2003-11-13 Matula Valentine C. Method and apparatus for distributed interactive voice processing
US6915126B2 (en) 2002-05-08 2005-07-05 General Motors Corporation Method of activating a wireless communication system in a mobile vehicle
US20030212550A1 (en) 2002-05-10 2003-11-13 Ubale Anil W. Method, apparatus, and system for improving speech quality of voice-over-packets (VOP) systems
US20030212562A1 (en) 2002-05-13 2003-11-13 General Motors Corporation Manual barge-in for server-based in-vehicle voice recognition systems
JP2003329477A (ja) * 2002-05-15 2003-11-19 Pioneer Electronic Corp ナビゲーション装置及び対話型情報提供プログラム
US7107210B2 (en) * 2002-05-20 2006-09-12 Microsoft Corporation Method of noise reduction based on dynamic aspects of speech
US7127400B2 (en) 2002-05-22 2006-10-24 Bellsouth Intellectual Property Corporation Methods and systems for personal interactive voice response
US7546382B2 (en) 2002-05-28 2009-06-09 International Business Machines Corporation Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
US20040140989A1 (en) 2002-05-28 2004-07-22 John Papageorge Content subscription and delivery service
US20030233230A1 (en) * 2002-06-12 2003-12-18 Lucent Technologies Inc. System and method for representing and resolving ambiguity in spoken dialogue systems
US7143037B1 (en) 2002-06-12 2006-11-28 Cisco Technology, Inc. Spelling words using an arbitrary phonetic alphabet
US7548491B2 (en) 2002-06-13 2009-06-16 General Motors Corporation Personalized key system for a mobile vehicle
US7502737B2 (en) 2002-06-24 2009-03-10 Intel Corporation Multi-pass recognition of spoken dialogue
US20050021470A1 (en) 2002-06-25 2005-01-27 Bose Corporation Intelligent music track selection
US7177816B2 (en) 2002-07-05 2007-02-13 At&T Corp. System and method of handling problematic input during context-sensitive help for multi-modal dialog systems
US7177815B2 (en) * 2002-07-05 2007-02-13 At&T Corp. System and method of context-sensitive help for multi-modal dialog systems
US20040010358A1 (en) 2002-07-12 2004-01-15 General Motors Corporation Vehicle personalization through web portal
US7693720B2 (en) * 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
EP1391830A1 (fr) 2002-07-19 2004-02-25 Albert Inc. S.A. Système d'extraction d'informations dans un texte en langage naturel
EP1394692A1 (en) * 2002-08-05 2004-03-03 Alcatel Method, terminal, browser application, and mark-up language for multimodal interaction between a user and a terminal
US7236923B1 (en) 2002-08-07 2007-06-26 Itt Manufacturing Enterprises, Inc. Acronym extraction system and method of identifying acronyms and extracting corresponding expansions from text
US6741931B1 (en) * 2002-09-05 2004-05-25 Daimlerchrysler Corporation Vehicle navigation system with off-board server
US7328155B2 (en) 2002-09-25 2008-02-05 Toyota Infotechnology Center Co., Ltd. Method and system for speech recognition using grammar weighted based upon location information
US7184957B2 (en) * 2002-09-25 2007-02-27 Toyota Infotechnology Center Co., Ltd. Multiple pass speech recognition method and system
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US8793127B2 (en) * 2002-10-31 2014-07-29 Promptu Systems Corporation Method and apparatus for automatically determining speaker characteristics for speech-directed advertising or other enhancement of speech-controlled devices or services
US6739556B1 (en) 2002-11-20 2004-05-25 Raytheon Company Method and apparatus for providing an aircraft emergency safety control system
US7684985B2 (en) * 2002-12-10 2010-03-23 Richard Dominach Techniques for disambiguating speech input using multimodal interfaces
US6834265B2 (en) 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7890324B2 (en) 2002-12-19 2011-02-15 At&T Intellectual Property Ii, L.P. Context-sensitive interface widgets for multi-modal dialog systems
US20040158555A1 (en) 2003-02-11 2004-08-12 Terradigtal Systems Llc. Method for managing a collection of media objects
DE10306022B3 (de) 2003-02-13 2004-02-19 Siemens Ag Dreistufige Einzelworterkennung
GB2398913B (en) * 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
JP4103639B2 (ja) 2003-03-14 2008-06-18 セイコーエプソン株式会社 音響モデル作成方法および音響モデル作成装置ならびに音声認識装置
US7146319B2 (en) 2003-03-31 2006-12-05 Novauris Technologies Ltd. Phonetically based speech recognition system and method
US20050021826A1 (en) 2003-04-21 2005-01-27 Sunil Kumar Gateway controller for a multimodal system that provides inter-communication among different data and voice servers through various mobile devices, and interface for that controller
US7421393B1 (en) 2004-03-01 2008-09-02 At&T Corp. System for developing a dialog manager using modular spoken-dialog components
US20050015256A1 (en) * 2003-05-29 2005-01-20 Kargman James B. Method and apparatus for ordering food items, and in particular, pizza
JP2005003926A (ja) * 2003-06-11 2005-01-06 Sony Corp 情報処理装置および方法、並びにプログラム
KR100577387B1 (ko) 2003-08-06 2006-05-10 삼성전자주식회사 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
US7373102B2 (en) * 2003-08-11 2008-05-13 Educational Testing Service Cooccurrence and constructions
US20050043940A1 (en) * 2003-08-20 2005-02-24 Marvin Elder Preparing a data source for a natural language query
US20070162296A1 (en) 2003-10-06 2007-07-12 Utbk, Inc. Methods and apparatuses for audio advertisements
US7428497B2 (en) 2003-10-06 2008-09-23 Utbk, Inc. Methods and apparatuses for pay-per-call advertising in mobile/wireless applications
GB0325497D0 (en) 2003-10-31 2003-12-03 Vox Generation Ltd Automated speech application creation deployment and management
US7454608B2 (en) 2003-10-31 2008-11-18 International Business Machines Corporation Resource configuration in multi-modal distributed computing systems
US7697673B2 (en) 2003-11-17 2010-04-13 Apptera Inc. System for advertisement selection, placement and delivery within a multiple-tenant voice interaction service system
JP2005157494A (ja) * 2003-11-20 2005-06-16 Aruze Corp 会話制御装置及び会話制御方法
JP4558308B2 (ja) 2003-12-03 2010-10-06 ニュアンス コミュニケーションズ,インコーポレイテッド 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
US20050137877A1 (en) * 2003-12-17 2005-06-23 General Motors Corporation Method and system for enabling a device function of a vehicle
US7027586B2 (en) 2003-12-18 2006-04-11 Sbc Knowledge Ventures, L.P. Intelligently routing customer communications
US20050137850A1 (en) * 2003-12-23 2005-06-23 Intel Corporation Method for automation of programmable interfaces
US7386443B1 (en) * 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
WO2005076258A1 (ja) 2004-02-03 2005-08-18 Matsushita Electric Industrial Co., Ltd. ユーザ適応型装置およびその制御方法
US7542903B2 (en) 2004-02-18 2009-06-02 Fuji Xerox Co., Ltd. Systems and methods for determining predictive models of discourse functions
US20050216254A1 (en) 2004-03-24 2005-09-29 Gupta Anurag K System-resource-based multi-modal input fusion
US20050246174A1 (en) 2004-04-28 2005-11-03 Degolia Richard C Method and system for presenting dynamic commercial content to clients interacting with a voice extensible markup language system
US20050283752A1 (en) 2004-05-17 2005-12-22 Renate Fruchter DiVAS-a cross-media system for ubiquitous gesture-discourse-sketch knowledge capture and reuse
US20060206310A1 (en) 2004-06-29 2006-09-14 Damaka, Inc. System and method for natural language processing in a peer-to-peer hybrid communications network
DE102004037858A1 (de) 2004-08-04 2006-03-16 Harman Becker Automotive Systems Gmbh Navigationssystem mit sprachgesteuerter Angabe von Sonderzielen
US7480618B2 (en) 2004-09-02 2009-01-20 Microsoft Corporation Eliminating interference of noisy modality in a multimodal application
FR2875919A1 (fr) 2004-09-27 2006-03-31 France Telecom Agent rationnel dialoguant, systeme de dialogue intelligent l'utilisant, procede de pilotage d'un dialogue intelligent, et programme pour sa mise en oeuvre
US20060074660A1 (en) 2004-09-29 2006-04-06 France Telecom Method and apparatus for enhancing speech recognition accuracy by using geographic data to filter a set of words
US7376645B2 (en) * 2004-11-29 2008-05-20 The Intellection Group, Inc. Multimodal natural language query system and architecture for processing voice and proximity-based queries
US20070214182A1 (en) 2005-01-15 2007-09-13 Outland Research, Llc Establishment-based media and messaging service
US7873654B2 (en) 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US7437297B2 (en) 2005-01-27 2008-10-14 International Business Machines Corporation Systems and methods for predicting consequences of misinterpretation of user commands in automated systems
KR100718147B1 (ko) * 2005-02-01 2007-05-14 삼성전자주식회사 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법
US7831433B1 (en) 2005-02-03 2010-11-09 Hrl Laboratories, Llc System and method for using context in navigation dialog
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7283829B2 (en) 2005-03-25 2007-10-16 Cisco Technology, Inc. Management of call requests in multi-modal communication environments
US7813485B2 (en) 2005-05-26 2010-10-12 International Business Machines Corporation System and method for seamlessly integrating an interactive visual menu with an voice menu provided in an interactive voice response system
US7917365B2 (en) 2005-06-16 2011-03-29 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
US7873523B2 (en) * 2005-06-30 2011-01-18 Microsoft Corporation Computer implemented method of analyzing recognition results between a user and an interactive application utilizing inferred values instead of transcribed speech
EP1899952A4 (en) 2005-07-07 2009-07-22 Enable Inc V SYSTEM AND METHOD FOR SEARCHING CONTENT ON A NETWORK IN A MULTIMODAL SYSTEM FROM VOCAL KEYWORDS
US7424431B2 (en) 2005-07-11 2008-09-09 Stragent, Llc System, method and computer program product for adding voice activation and voice control to a media player
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US20070043569A1 (en) * 2005-08-19 2007-02-22 Intervoice Limited Partnership System and method for inheritance of advertised functionality in a user interactive system
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
EP1934971A4 (en) 2005-08-31 2010-10-27 Voicebox Technologies Inc DYNAMIC LANGUAGE SCRIPTURE
US7672852B2 (en) * 2005-09-29 2010-03-02 Microsoft Corporation Localization of prompts
US20070078708A1 (en) 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
US8626588B2 (en) 2005-09-30 2014-01-07 Google Inc. Advertising with audio content
US7477909B2 (en) 2005-10-31 2009-01-13 Nuance Communications, Inc. System and method for conducting a search using a wireless mobile device
US7587308B2 (en) 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
US20070135101A1 (en) 2005-12-08 2007-06-14 Comverse, Ltd. Enhanced visual IVR capabilities
US8325398B2 (en) 2005-12-22 2012-12-04 Canon Kabushiki Kaisha Image editing system, image management apparatus, and image editing program
US20070186165A1 (en) 2006-02-07 2007-08-09 Pudding Ltd. Method And Apparatus For Electronically Providing Advertisements
US20070203736A1 (en) 2006-02-28 2007-08-30 Commonwealth Intellectual Property Holdings, Inc. Interactive 411 Directory Assistance
JP5649303B2 (ja) 2006-03-30 2015-01-07 エスアールアイ インターナショナルSRI International メディア・ストリームに注釈を付ける方法および装置
US7533089B2 (en) 2006-06-27 2009-05-12 International Business Machines Corporation Hybrid approach for query recommendation in conversation systems
WO2008008729A2 (en) 2006-07-10 2008-01-17 Accenture Global Services Gmbh Mobile personal services platform for providing feedback
US7620551B2 (en) 2006-07-20 2009-11-17 Mspot, Inc. Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US8145493B2 (en) * 2006-09-11 2012-03-27 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8086463B2 (en) 2006-09-12 2011-12-27 Nuance Communications, Inc. Dynamically generating a vocal help prompt in a multimodal application
WO2008032329A2 (en) * 2006-09-13 2008-03-20 Alon Atsmon Providing content responsive to multimedia signals
US7788084B2 (en) 2006-09-19 2010-08-31 Xerox Corporation Labeling of work of art titles in text for natural language processing
US8073681B2 (en) * 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US20080109285A1 (en) 2006-10-26 2008-05-08 Mobile Content Networks, Inc. Techniques for determining relevant advertisements in response to queries
WO2008056251A2 (en) * 2006-11-10 2008-05-15 Audiogate Technologies Ltd. System and method for providing advertisement based on speech recognition
JP4833043B2 (ja) 2006-11-30 2011-12-07 ヤフー株式会社 ブログ又はクエリ・クリックを利用したアフィニティ装置
US7640272B2 (en) * 2006-12-07 2009-12-29 Microsoft Corporation Using automated content analysis for audio/video content consumption
US20080154604A1 (en) 2006-12-22 2008-06-26 Nokia Corporation System and method for providing context-based dynamic speech grammar generation for use in search applications
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8909532B2 (en) 2007-03-23 2014-12-09 Nuance Communications, Inc. Supporting multi-lingual user interaction with a multimodal application
US8060367B2 (en) 2007-06-26 2011-11-15 Targus Information Corporation Spatially indexed grammar and methods of use
US8219399B2 (en) 2007-07-11 2012-07-10 Garmin Switzerland Gmbh Automated speech recognition (ASR) tiling
DE102007044792B4 (de) 2007-09-19 2012-12-13 Siemens Ag Verfahren, Steuergerät und System zur Steuerung oder Bedienung
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8077975B2 (en) 2008-02-26 2011-12-13 Microsoft Corporation Handwriting symbol recognition accuracy using speech input
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US20090276700A1 (en) 2008-04-30 2009-11-05 Nokia Corporation Method, apparatus, and computer program product for determining user status indicators
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8909810B2 (en) 2008-08-05 2014-12-09 Isabella Products, Inc. Systems and methods for multimedia content sharing
US8224652B2 (en) 2008-09-26 2012-07-17 Microsoft Corporation Speech and text driven HMM-based body animation synthesis
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342290A (zh) * 1998-10-02 2002-03-27 国际商业机器公司 会话浏览器和会话系统
US6570555B1 (en) * 1998-12-30 2003-05-27 Fuji Xerox Co., Ltd. Method and apparatus for embodied conversational characters with multimodal input/output in an interface device
US6757718B1 (en) * 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
US6567797B1 (en) * 1999-01-26 2003-05-20 Xerox Corporation System and method for providing recommendations based on multi-modal user clusters
US6735592B1 (en) * 2000-11-16 2004-05-11 Discern Communications System, method, and computer program product for a network-based content exchange system
US20020188602A1 (en) * 2001-05-07 2002-12-12 Eastman Kodak Company Method for associating semantic information with multiple images in an image database environment
US20030112267A1 (en) * 2001-12-13 2003-06-19 Hewlett-Packard Company Multi-modal picture
US20040044516A1 (en) * 2002-06-03 2004-03-04 Kennewick Robert A. Systems and methods for responding to natural language speech utterance

Cited By (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853253A (zh) * 2009-03-30 2010-10-06 三星电子株式会社 在移动终端中管理多媒体内容的设备和方法
CN107092646A (zh) * 2009-04-14 2017-08-25 高通股份有限公司 用于使用移动装置进行图像辨识的系统和方法
WO2011030355A2 (en) * 2009-09-14 2011-03-17 Arun Jain Zolog intelligent human language interface for business software applications
WO2011030355A3 (en) * 2009-09-14 2011-05-05 Arun Jain Zolog intelligent human language interface for business software applications
GB2487023A (en) * 2009-09-14 2012-07-04 Arun Jain Zolog intelligent human language interface for business software applications
CN105808200A (zh) * 2010-01-18 2016-07-27 苹果公司 智能自动化助理
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
CN110110952A (zh) * 2011-06-03 2019-08-09 苹果公司 生成和处理代表待执行任务的任务项目
CN102385619A (zh) * 2011-10-19 2012-03-21 百度在线网络技术(北京)有限公司 一种根据语音输入信息提供访问建议的方法与设备
CN103188409A (zh) * 2011-12-29 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音自动应答云端服务器、系统及方法
WO2013097376A1 (zh) * 2011-12-31 2013-07-04 中兴通讯股份有限公司 一种为备份数据添加备注的方法及具有备份功能的终端
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
CN103514875A (zh) * 2012-06-29 2014-01-15 联想(北京)有限公司 语音数据的匹配方法和电子设备
CN106250508B (zh) * 2012-09-10 2019-07-23 谷歌有限责任公司 使用环境上下文回答问题
CN106250508A (zh) * 2012-09-10 2016-12-21 谷歌公司 使用环境上下文回答问题
CN102945120B (zh) * 2012-11-27 2015-09-02 南京恒知讯科技有限公司 一种基于儿童应用中的人机交互辅助系统及交互方法
CN102945120A (zh) * 2012-11-27 2013-02-27 南京恒知讯科技有限公司 一种基于儿童应用中的人机交互辅助系统及交互方法
CN105144136A (zh) * 2012-12-13 2015-12-09 微软技术许可有限责任公司 动作代理
CN106847258A (zh) * 2013-02-20 2017-06-13 谷歌公司 用于共享调适语音简档的方法和设备
CN103703481A (zh) * 2013-02-28 2014-04-02 观致汽车有限公司 一种日历事项制定、提醒及导航方法及其系统
CN105122353A (zh) * 2013-05-20 2015-12-02 英特尔公司 用于虚拟个人助理系统的自然人-计算机交互
US11181980B2 (en) 2013-05-20 2021-11-23 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
US11609631B2 (en) 2013-05-20 2023-03-21 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
CN105122353B (zh) * 2013-05-20 2019-07-09 英特尔公司 用于语音识别的计算装置和用于计算装置上的语音识别的方法
US10198069B2 (en) 2013-05-20 2019-02-05 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
CN104637492B (zh) * 2013-11-07 2020-03-17 大陆汽车系统公司 用于自动语音识别系统的共同讲话者调零
CN104637492A (zh) * 2013-11-07 2015-05-20 大陆汽车系统公司 用于自动语音识别系统的共同讲话者调零
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US10096085B2 (en) 2013-12-09 2018-10-09 Cj Cgv Co., Ltd. Method for generating images for multi-projection theater and image management apparatus using the same
CN104700352A (zh) * 2013-12-09 2015-06-10 Cjcgv株式会社 生成用于多投影剧院的图像的方法和图像管理设备
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
CN104732974B (zh) * 2013-12-19 2019-05-24 国家电网公司 智能录音识别系统
CN104732974A (zh) * 2013-12-19 2015-06-24 国家电网公司 智能录音识别系统
US10274937B2 (en) 2014-01-31 2019-04-30 AgBrain—Agritechnical Basic Research for Advanced Innovation GmbH Operating terminal of an agricultural machine with hypervisor software
WO2015113752A1 (de) * 2014-01-31 2015-08-06 AgBRAIN - AGRITECHNICAL BASIC RESEARCH FOR ADVANCED INNOVATION GMBH Bedienterminal einer landmaschine mit hypervisor-software
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
CN104216990A (zh) * 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
CN112270925A (zh) * 2014-09-14 2021-01-26 谷歌有限责任公司 用于创建可定制对话系统引擎的平台
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10789953B2 (en) 2014-10-01 2020-09-29 XBrain, Inc. Voice and connection platform
CN107004410B (zh) * 2014-10-01 2020-10-02 西布雷恩公司 语音和连接平台
CN107004410A (zh) * 2014-10-01 2017-08-01 西布雷恩公司 语音和连接平台
CN104503581A (zh) * 2014-12-26 2015-04-08 安徽寰智信息科技股份有限公司 一种基于视频交互系统的科普方法
CN107077504A (zh) * 2015-01-05 2017-08-18 国际商业机器公司 增补信息请求
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
CN107810387A (zh) * 2015-06-23 2018-03-16 谷歌有限责任公司 在汽车环境中的移动地理应用
CN105513593B (zh) * 2015-11-24 2019-09-17 南京师范大学 一种语音驱动的智能人机交互方法
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
CN105551490B (zh) * 2015-12-23 2019-09-10 中国电子科技集团公司第四十一研究所 一种电子测量仪器的智能语音交互系统及方法
CN105551490A (zh) * 2015-12-23 2016-05-04 中国电子科技集团公司第四十一研究所 一种电子测量仪器的智能语音交互系统及方法
CN105679318A (zh) * 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
CN107195298A (zh) * 2016-03-15 2017-09-22 通用汽车环球科技运作有限责任公司 根本原因分析以及校正系统和方法
US11646026B2 (en) 2016-05-06 2023-05-09 Sony Group Corporation Information processing system, and information processing method
CN109074397A (zh) * 2016-05-06 2018-12-21 索尼公司 信息处理系统和信息处理方法
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
CN107798055B (zh) * 2016-09-06 2021-07-20 国立大学法人京都大学 语音交互设备和使用语音交互设备的自动交互方法
CN107798055A (zh) * 2016-09-06 2018-03-13 国立大学法人京都大学 语音交互设备和使用语音交互设备的自动交互方法
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
CN109463004A (zh) * 2017-05-16 2019-03-12 苹果公司 数字助理服务的远场延伸
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
CN111095400A (zh) * 2017-07-28 2020-05-01 赛伦斯运营公司 选择系统和方法
CN110800044A (zh) * 2017-09-08 2020-02-14 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
CN110800044B (zh) * 2017-09-08 2024-04-05 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
CN107633844A (zh) * 2017-10-10 2018-01-26 杭州嘉楠耘智信息科技股份有限公司 设备控制方法及装置
CN109840320A (zh) * 2017-11-28 2019-06-04 微软技术许可有限责任公司 文本的定制化处理
CN109840320B (zh) * 2017-11-28 2023-08-25 微软技术许可有限责任公司 文本的定制化处理
US11810337B2 (en) 2018-01-04 2023-11-07 Microsoft Technology Licensing, Llc Providing emotional care in a session
CN110476169A (zh) * 2018-01-04 2019-11-19 微软技术许可有限责任公司 在会话中提供情感关怀
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
CN112313740A (zh) * 2018-04-20 2021-02-02 脸谱公司 聚合语义信息以提高对用户的理解
US11869231B2 (en) 2018-04-20 2024-01-09 Meta Platforms Technologies, Llc Auto-completion for gesture-input in assistant systems
US11887359B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Content suggestions for content digests for assistant systems
US11908181B2 (en) 2018-04-20 2024-02-20 Meta Platforms, Inc. Generating multi-perspective responses by assistant systems
US11908179B2 (en) 2018-04-20 2024-02-20 Meta Platforms, Inc. Suggestions for fallback social contacts for assistant systems
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
WO2020073656A1 (zh) * 2018-10-11 2020-04-16 平安科技(深圳)有限公司 人机交互方法、系统、计算机设备及存储介质
US11842574B2 (en) 2018-10-11 2023-12-12 Ping An Technology (Shenzhen) Co., Ltd. Man-machine interaction method and system, computer device, and storage medium
CN112970061A (zh) * 2018-11-14 2021-06-15 惠普发展公司,有限责任合伙企业 基于策略许可的内容
CN113168833A (zh) * 2018-12-13 2021-07-23 大众汽车股份公司 用于运行车辆的交互信息系统的方法以及车辆
CN111552517A (zh) * 2019-01-23 2020-08-18 阿里巴巴集团控股有限公司 应用程序启动方法、装置、电子设备及计算机存储介质
CN111552517B (zh) * 2019-01-23 2023-04-25 阿里巴巴集团控股有限公司 应用程序启动方法、装置、电子设备及计算机存储介质
CN110019688A (zh) * 2019-01-23 2019-07-16 艾肯特公司 对机器人进行训练的方法
CN112585642A (zh) * 2019-02-25 2021-03-30 株式会社酷比特机器人 信息处理系统和信息处理方法
CN111939559A (zh) * 2019-05-16 2020-11-17 北京车和家信息技术有限公司 车载语音游戏的控制方法和装置
CN110277086B (zh) * 2019-06-25 2021-11-19 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN110277086A (zh) * 2019-06-25 2019-09-24 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN110277090A (zh) * 2019-07-04 2019-09-24 苏州思必驰信息科技有限公司 用户个人的发音词典模型的自适应修正方法及系统
CN110400564A (zh) * 2019-08-21 2019-11-01 科大国创软件股份有限公司 一种基于栈的聊天机器人对话管理方法
US11948563B1 (en) 2019-10-18 2024-04-02 Meta Platforms, Inc. Conversation summarization during user-control task execution for assistant systems
CN110889161A (zh) * 2019-12-11 2020-03-17 清华大学 一种声控建筑信息模型三维显示系统和方法
CN111028836B (zh) * 2019-12-16 2022-08-19 华南理工大学广州学院 一种智能声控电子仪表台的控制系统及其控制方法
CN111028836A (zh) * 2019-12-16 2020-04-17 华南理工大学广州学院 一种智能声控电子仪表台的控制系统及其控制方法
CN115064168A (zh) * 2022-08-17 2022-09-16 广州小鹏汽车科技有限公司 语音交互方法、服务器和存储介质
CN115064168B (zh) * 2022-08-17 2022-12-13 广州小鹏汽车科技有限公司 语音交互方法、服务器和存储介质
CN117409781A (zh) * 2023-12-14 2024-01-16 深圳市恒利数码科技有限公司 一种基于智能机顶盒的人机交互管理系统
CN117409781B (zh) * 2023-12-14 2024-03-12 深圳市恒利数码科技有限公司 一种基于智能机顶盒的人机交互管理系统

Also Published As

Publication number Publication date
EP1929466A2 (en) 2008-06-11
EP2325837A2 (en) 2011-05-25
US7949529B2 (en) 2011-05-24
WO2007027546A2 (en) 2007-03-08
EP1929466A4 (en) 2010-09-15
US20070050191A1 (en) 2007-03-01
WO2007027546A3 (en) 2007-12-13
US8849652B2 (en) 2014-09-30
US8195468B2 (en) 2012-06-05
EP2325837A3 (en) 2011-06-29
CN101292282B (zh) 2016-01-06
US20130253929A1 (en) 2013-09-26
US20110231182A1 (en) 2011-09-22
US9495957B2 (en) 2016-11-15
US20120278073A1 (en) 2012-11-01
US20140365222A1 (en) 2014-12-11
US8447607B2 (en) 2013-05-21

Similar Documents

Publication Publication Date Title
CN101292282B (zh) 支持自然语言人机交互的移动系统和方法
US9031845B2 (en) Mobile systems and methods for responding to natural language speech utterance
CN101297355B (zh) 响应自然语言语音口头表达的系统和方法
US8332224B2 (en) System and method of supporting adaptive misrecognition conversational speech
US9734825B2 (en) Methods and apparatus for determining a domain based on the content and context of a natural language utterance
US20230135179A1 (en) Systems and Methods for Implementing Smart Assistant Systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200302

Address after: Massachusetts, USA

Patentee after: Nuance Communications, Inc.

Address before: Washington, USA

Patentee before: Vois Box Technology

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160106

CF01 Termination of patent right due to non-payment of annual fee