CN1762116A - 用于遥控音频装置的方法 - Google Patents
用于遥控音频装置的方法 Download PDFInfo
- Publication number
- CN1762116A CN1762116A CNA2004800072292A CN200480007229A CN1762116A CN 1762116 A CN1762116 A CN 1762116A CN A2004800072292 A CNA2004800072292 A CN A2004800072292A CN 200480007229 A CN200480007229 A CN 200480007229A CN 1762116 A CN1762116 A CN 1762116A
- Authority
- CN
- China
- Prior art keywords
- audio
- audio data
- control
- data sample
- data stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/28—Arrangements for simultaneous broadcast of plural pieces of information
- H04H20/30—Arrangements for simultaneous broadcast of plural pieces of information by a single channel
- H04H20/31—Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/09—Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
- H04H60/13—Arrangements for device control affected by the broadcast information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
- H04Q9/02—Automatically-operated arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/10—Aspects of broadcast communication characterised by the type of broadcast system
- H04H2201/20—Aspects of broadcast communication characterised by the type of broadcast system digital audio broadcasting [DAB]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/48—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
Abstract
描述了一种用于遥控音频装置(1)的方法,所述音频装置(1)接收来自传输系统的音频数据流(A)。以音频数据样本(AM)形式存在于音频数据流(A)内的控制命令被发送到音频装置(1)。借助于在音频装置(1)中(或上)的音频样本识别系统(2)来分析所接收的音频数据流(A)。所识别的音频数据样本(AM)被转换为控制数据(SD,ST),并且取决于所述控制数据(SD,ST),以确定的方式激活所述音频装置(1)的确定组件(7,8)。
Description
本发明涉及一种用于遥控音频装置的方法。在此文本中提及的“音频装置”意味着任何装置,其能够接收音频数据,所述音频数据经由发送装置发送—通常来自音频内容提供商,并且把它们分发给用户和/或存储或进一步处理它们,例如收音机、装备有各自接收装置的计算机或音频/视频装置,诸如电视、DVD记录器、录像机等。此外,本发明涉及一种用于依照此方法来控制音频装置的控制装置,以及模拟装置,其可以依照这种控制方法使用。此外,本发明涉及各自的音频装置,其可以借助这种方法来遥控。
多数情况下希望能够从传输装置或音频内容提供商端至少部分地遥控音频装置。依照这种方式,例如,所述装置从播放本地存储的音频数据切换到播放所发送的音频数据可以被触发,或者可以确保在音频装置的显示器上自动播放确定的信息。这种典型示例是近来在大部分汽车收音机中实现的RDS(无线电数据系统),所述RDS用来在收音机的显示器上输出接收信道信息或交通信息。至此依照已知的遥控方法,以特定的数据形式来编码为遥控所需要的控制数据。然后所编码的控制数据经由特定的数据信道被发送到音频装置,依照本地功能由音频装置解码并执行,例如在显示器上输出的新闻。首先,依照这种方法,除用于发送音频数据的音频信道之外,需要附加数据信道。另外,必须依照指定的形式来编码控制数据。因此在音频提供商方面没有为此专门训练的人,在没有适当的编码装置的情况下,不能够执行所期望的遥控。
本发明的目的是提出用于在开始所提及类型的音频装置的候选、简单且成本有效的遥控方法。
此目的是通过用于遥控音频装置的方法来实现的,其中控制命令在发送到所述装置的音频数据流内以音频数据样本的形式被发送到所述音频装置。然后所接收的音频数据流借助于音频样本识别系统来在音频装置中分析,并且识别的音频数据样本被转换为控制数据。最后,取决于控制数据,依照确定的方式来指示音频装置的确定组件来执行本地动作。这里术语“控制命令”被理解为由几个子命令组成的控制命令序列。
可按照这种方法控制的适当音频装置,除用于音频数据流的接收部件之外,必须具有音频样本识别系统,用于分析所接收的音频流,以便识别在音频数据流内以音频数据样本形式存在的控制命令。此音频样本识别系统必须具有适当的解释部件,用于把所识别的音频数据样本转换为控制数据,以便根据所述控制数据来控制所述音频装置的确定组件。
本发明可以依照非常简单的方式从远程位置经由任何音频信道来影响音频装置的不同功能。从而不需要独立的数据信道。因此所述控制方法相对成本有效。然而,就音频装置而言只要求适当的音频样本识别系统,其中通常简单的系统就足够了,特别是在可能的控制命令数目是有限的情况。
从属权利要求特别包含了对本发明有利的设计和修改。
为了保持音频样本识别系统的(计算)开销尽可能低,在权利要求2中建议相对于确定的键音频(key audio)数据样本来首先预分析所接收的音频数据流。只有在识别确定的键音频数据样本时,才更精确地分析随后的音频数据。优选的是,音频样本识别系统可以具有两级配置,其中音频样本识别系统的一部分只执行预分析并且把进入的音频数据流与向音频样本识别系统给出的非常有限数目的可能的键音频数据样本相比较。所述音频样本识别系统的第二级只是在接收到这种键音频数据样本时才被激活,执行音频数据流的更昂贵的分析。优选的是,对应于控制命令的音频数据样本又靠近适当的键音频数据样本,以致如果已经识别所有控制数据那么所述装置可以登记,并且可以再次使音频样本识别系统的更昂贵的第二级不活动。
原则上,音频数据样本可以由诸如语音、音乐、单音、噪音等之类的任何音频数据组成。然而特别在优选实施例中,语音识别系统被用作音频样本识别系统。音频数据样本可以是简单的语音命令或句子,所述语音命令或句子由语音识别系统识别并且随后被解释以便从中提取控制数据,借此可以随后操作音频装置的组件以便执行期望的本地动作。这种系统的优点是,首先,适当的具有满意质量的语音识别系统已经是可用的。另外,当使用自然语言时不需要使用特定的编码来遥控装置。因此即便在用户方的人没有特定的技术条件(例如程序调制器、新闻阅读器等)时也可以以期望的方式使用音频装置。
依照本发明的方法可以使发送器端(特别是音频内容提供商)能够控制音频装置,只要所涉及的控制动作为音频装置允许或支持。例如,根据设计出的控制命令,用户界面的确定操作元件可以被分配特定功能,即可以以期望的方式来编程所述装置的确定的功能键或自定义功能键。此外,取决于控制命令,可以运行音频装置的光输出器件(即LED显示等)以便以可视形式向用户提供任何期望的信息。
优选的是,取决于所接收的键音频数据样本和/或所接收的与其余音频数据流一样的控制数据,对应于所述控制数据的音频数据样本并不向用户输出或本地存储以供稍后使用,而是预先被从音频数据流中过滤出来。如果此过滤功能可以被关掉,那么这会是明智的。这样,取决于音频数据样本的种类,所述音频数据样本可以被一起输出或滤出。这里在优选实施例中以适当的形式向用户输出这些语音命令也可能是明智的,在所述实施例中控制命令的传输以自然语言出现。例如,显示的信息可以具有附加的音频输出,或可以向用户通知经由遥控触发的本地动作,诸如编程自定义功能键等。
在发送器端,例如假设在音频内容提供商端,所述控制命令(如果是以自然语言的话)可以借助于适当的语音输入装置(诸如麦克风)输入并且与要发送的音频数据流结合。从而在创建确定的节目内容时可以直接以语音方式输入控制命令。
作为选择,所述控制命令还可以首先依照非音频表示来形成继而转换为音频数据样本。随后,这些音频数据样本可以与要发送到音频装置的音频数据流结合。用于遥控音频装置的控制装置指向适当的音频合成器(例如,语音合成器),以便把非音频格式的控制命令转换为音频数据样本。优选的是,这种音频数据合成器可以是例如用计算机实现的软件模块。
例如非音频格式表示可以是编程语言中的命令。另外,控制装置具有集成工具,用于使音频数据样本与要发送的音频数据流结合。
原则上,发送方在产生音频数据样本(即,在音频内容提供商处)时,可以随时测试音频装置接受确定的音频数据样本时的行为,其中首先向所述音频内容提供商发送所述音频数据。然而优选的是,控制装置例如以软件模块的形式具有特定的模拟装置,以便检查以音频数据样本的形式而存在的控制数据,其中所述软件模块具有对应于音频装置的音频样本识别系统。特别地是这种模拟装置还可以用来在音频装置上检查把语音输入麦克风的文本作为音频数据流中的自然语言控制命令的效果。在连续并正确使用这种模拟装置期间,还可以防止音频装置错误地解释音频数据样本从而防止来自遥控的错误操作。
参考附图将要阐明本发明的这些及其它方面。
附图如下:
图1示出了依照本发明音频装置的简化示意电路框图,
图2示出了用于控制如图1所示的依照本发明音频装置的示意电路框图,
图3示出了用于举例说明传输并解释音频数据样本的流程图。
在图1中示出的音频装置示出了接收部件6,用于接收音频数据流A,所述音频数据流A由例如常规的无线电系统之类的传输系统(未示出)发送。这里采用的无线电系统意指向其用户(即听众或观众)发送的任何系统,优选是数字可听收音机和/或电视节目内容或多媒体内容。可以采用任何期望的方式来完成节目内容的传输,诸如陆地和/或卫星支持的无线电网络之类的无线方式,和/或诸如宽带电缆之类的线路方式。
首先所输入的音频数据流A被转送到音频样本识别系统2,所述音频样本识别系统2是如图1所示的实施例中的语音识别系统。此语音识别系统2具有语音识别处理器3,所述语音识别处理器3识别从音频数据流A到达的确定音频数据样本AM,继而把它们转送到语音识别系统2的第二部分,和具有解释部件4。解释部件4解释所述音频数据样本AM—在这种情况下是所识别的语音或话音命令—并且向它们分配确定的控制命令SD,ST。
这里把语音识别系统2作为音频装置1中的控制装置10的组件示出。此控制装置10把由语音识别系统的解释部件4所确定的控制命令SD、ST转换为适合于各自控制的组件7、8的形式,并且把这些控制命令SD、ST转送到各自的组件7、8。然后组件7、8对所述命令适当地作出反应。
在本实施例中,组件7是通常的显示器7。根据发送到显示器7的控制数据SD,显示器7示出确定的信息。另一个组件8是用户界面,诸如键盘或自定义功能键,其借助于控制命令ST来编程。
控制装置10并且特别是语音识别系统2可以在计算机部件中完全地或部分地分别以软件或软件模块的形式来实现,所述计算机部件例如是音频装置1的中央处理器。已经借助于中央处理器等中的软件模块来控制的音频装置,还可以另外装备—如果有足够可用的计算能力可用的话—这种语音识别系统以便借助于音频数据样本来遥控。然而,因此要求把所接收的音频数据流A馈送到处理器或语音识别系统。
音频数据A经由控制装置10循环并且如果需要的话,在滤出包含控制命令的音频数据样本AM之后,再经由输出装置部分地输出,这里所述输出装置是简单的扬声器9。作为选择(取决于所述装置),所接收音频数据流A的直接输出可以遵循一个不变的特征,如在接收器6的输出和音频装置1的扬声器端输出之间的分隔箭头连接所示。
除在图1中示出的组件之外,这种音频装置1显然具有通常存在于音频装置中的另外组件。然而,为了清楚起见而没有示出它们。
优选的是,像这样来设置语音识别系统2以致其最初只对确定的关键词或句子起反应,并且只有当识别这些关键词时才把下列语音数据解释为控制命令。而且这种控制命令的序列可以由另一关键词或关键句结束。这样做的优点是语音识别系统2不必始终完全有效,而只需执行与可能的关键词或关键句的比较。这还降低了任何不希望有的错误编程的概率。
图2示出了用于控制如图1所示的音频装置的控制装置17的可能的实施例,可以将其安装在传输系统部分。
为了产生对应于控制命令S的音频数据样本AM,一方面此控制装置17具有控制命令产生器11,其中例如可以借助于键盘或其它用户界面以非音频格式表示来产生所述控制命令S。这些控制命令S被传递到音频合成器—在目前的情况下是语音合成器12,然后所述音频合成器产生音频数据样本,所述音频数据样本稍后在音频装置1中产生期望的本地动作。
然后此音频数据样本AM被传送到模拟器14,所述模拟器14具有语音识别系统18,所述语音识别系统18以与音频装置1中的语音识别系统2类似的方式工作并且示出控制命令产生器11的操作符,是否音频装置1将产生他所期望的动作。
如果音频数据样本AM已经被检查过了,那么它将被传送到积分器15,所述积分器15使音频数据样本AM与音频数据流A结合。然后此音频数据流A经由传输部件16发送到用户或音频装置1。作为选择,在目前的情况下的音频数据样本AM—因为其是自然语言—还可以借助于麦克风13被直接输入。然后要求扬声器得知相应的命令并且得知所述命令怎样由音频装置1或语音识别系统2来解释,并且哪个动作将被所涉及的命令触发。明智地,经由麦克风13输入的语音命令应当在与音频数据流结合之前,预先在模拟器14中测试。
作为选择,还可以使用模拟器14作为分离装置。那么扬声器可以首先经由麦克风13把语音命令AM直接输入到模拟器14中并且在那里进行测试。还可以在创建确定的音频内容时,结合适当的语音命令形式的音频样本AM,例如广播剧或信息广播。然后至少可以借助于模拟器14来测试音频内容中的相关位置,并且随后可以经由传输装置16来发送所完成的内容,所述内容包括所包含的控制命令S。
为了避免通过有缺陷语音输入的文本而导致的错误编程,优选的是,在发送之前在模拟器14中检查整个音频内容。优选的是,应当在短延迟内发送实时传输,以便还可能在模拟装置14中预先检查。否则,在优选实施例的情况下还可以通过使用适当的关键词来完全地使遥控功能无效,以便其可以简单地通过输入某个关键词来重新激活。
参考图3,将再次解释操作方法。在第一步骤中,在传输系统部分产生音频数据样本AM。然后把此音频数据样本AM插入音频数据流中。音频数据样本的产生可以与创建整个音频内容或完整的音频数据流同时进行。经由传输系统所述音频数据流被发送到各自的音频装置。在音频装置1已经接收所述音频数据流之后,系统试图识别在语音识别系统2内的确定的音频数据样本。借助于解释部件,所识别的音频数据样本AM被转换为控制数据。在图3示出的实施例中,然后这些控制数据在相对于几个操作选项解释时被重新查看。
首先,检查控制数据以便看看在把音频数据流发送给用户之前是否(要)过滤对应于控制命令的音频数据样本。如果是这样的话,并不一起发送音频数据样本AM。否则在音频数据流内所述音频数据样本AM通过声音被发送给用户。
此外,检查以便看看控制数据是否将导致对音频装置显示的任何控制。如果是这样的话,据此修改所述显示,例如在显示器上的输出信息。否则显示保持不变。
相对于用户界面进行另一检查。如果重新编程用户界面将借助于控制数据进行,那么在所述用户界面上进行适当的编程,即例如向确定的键或键组合分配确定的功能。否则用户界面保持不变。
原则上,所有这些测试还可以被桥接或短接。这样,例如可以一直输出包括音频数据样本的音频数据,所述音频数据样本包含控制数据。
据此实施例显而易见的是,本发明提供了就音频内容提供商而言,在不需要特定的数据信道或其它编码的情况下,以简单的方式来控制或编程音频装置的可能性。只要求以自然口头语言的形式来使控制命令公式化。
因此本发明还特别适于实现交互的无线电节目,其中各自的听众或观众具有主动参与节目计划的机会。
此例子是听众调查,特定演出是否带来任何响应。然后,例如可以在节目演出结束时发送句子:“使用下列组合键用于听众调查:键1‘是’,键2‘否’。现在请按键。”这里例如术语“键分配”是关键词,其由音频装置的语音识别系统识别,在所述语音识别系统上更精确地检查音频数据流的下一部分。然后所识别的音频数据样本键1‘是’、键2‘否’被识别为控制命令。然后产生相应的控制数据,所述控制数据被发送到音频装置的键盘。被指定为“1”的确定键被分配诸如按压此键之类的功能,对应于“是”信号的信号报告经由返回信道被发送到音频内容提供商。同时,被指定为“2”的键被分配诸如按压此键之类的功能,适当的“否”信号被返回。句子“现在请按键”又被识别为关键句,所述关键句向音频装置发信号通知实际控制命令已经终止并且下一音频数据并不打算遥控或远程编程,而是涉及正常的音频数据,所述音频数据将被发送给用户。
另一种可能性是使用本发明来进行交互式电视游戏,其中观众可以决定故事的进展。从而在电视游戏中可以提示观众按下确定的键或键组合,以便故事以确定的形式进展。此提示在语音识别系统中被同时识别继,并且通过使用键盘来对所述装置如此解释或编程,以至于当按压相应的键组合时系统切换到某个信道,在所述信道上正在以期望的模式播放所述故事的其余部分。
最后,可以再次指出存在于附图以及说明书中的方法、音频装置或广播控制装置只是实施例,在不脱离本发明框架的情况下,专家可以对其进行相当程度上的修改。从而,甚至可以把更多方法步骤添加到所详细描述的过程中。此外,在附图中分别示出的功能组件(例如控制命令产生器和模拟装置)原则上可以用一个单处理器或另一通用部件来实现。这里为了完整性应当指出,诸如“一个”和“一种”之类的词语的使用并不排除所涉及部件存在多个的情况,并且术语“包括”的使用也并不排除其它元件或步骤的存在。
Claims (11)
1.一种用于遥控音频装置(1)的方法,所述音频装置(1)接收来自传输系统的音频数据流,其中
-音频数据流(A)内的控制命令以音频数据样本(AM)的形式被发送到音频装置(1)
-并且借助于音频样本识别系统(2)在音频装置(1)上或在音频装置(1)中分析所接收的音频数据流(A)
-并且把所识别的音频数据样本(AM)转换为控制数据(SD,ST)
-并且取决于控制数据(SD,ST),以确定的方式来控制音频装置(1)的确定组件(7,8)。
2.如权利要求1所述的方法,其特征在于首先相对于确定的键音频数据样本来预先分析所接收的音频数据流(A),并且当识别确定的键音频数据样本时,分析随后的音频数据以便确定被分配给控制数据(SD,ST)的音频数据样本(AM)。
3.如权利要求1或2所述的方法,其特征在于借助于语音识别系统(2)来分析所接收的音频数据流(A)。
4.如权利要求1到3中任何一个所述的方法,其特征在于根据所述控制数据(ST)来向用户界面(8)的确定操作元件分配确定的功能。
5.如权利要求1到4中任何一个所述的方法,其特征在于根据控制数据(SO)来控制音频装置(1)的光输出器件(7)。
6.如权利要求1到5中任何一个所述的方法,其特征在于根据所接收的键音频数据样本和/或所接收的控制数据,在音频数据流(A)被发送给用户之前滤出对应于控制数据的音频数据样本(AM)。
7.如权利要求1到6中任何一个所述的方法,其特征在于控制命令(5)首先组成为非音频格式表示,继而被转换为音频数据样本(AM)并且与要发送到音频装置(1)的音频数据流(A)结合。
8.如权利要求1到7中任何一个所述的方法,其特征在于借助于包括对应于音频装置(1)的音频样本识别系统的模拟装置(14),以音频数据样本(AM)形式存在的控制命令(S)在结合到音频数据流(A)之前和/或在传输到音频装置(1)之前被检查。
9.一种音频装置(1),包括
-接收部件(6),用于接收音频数据流(A),和
-音频样本识别系统(2),用于分析所接收的音频数据流(A),以便识别在所述音频数据流(A)内以音频数据样本(AM)形式存在的控制命令,所述音频样本识别系统(2)包括解释部件(4),用于把所识别的音频数据样本(AM)转换为控制数据(SP,SR),以便取决于所述控制数据(SP,SR),以确定的方式来激活音频装置(1)的确定组件(7,8)。
10.一种用于控制如权利要求9所述的音频装置(1)的控制装置(17),包括音频合成器(12),用于把控制命令(5)从非音频格式表示转换为音频数据样本(AM),和集成装置(15),用于把音频数据样本(AM)与音频数据流(A)结合以便发送到音频装置(1)。
11.一种用于控制如权利要求1所述的音频装置(1)的控制装置(10)的模拟装置(14),所述模拟装置(14)包括对应于所述音频装置(1)的音频样本识别系统(2),用于检查以音频数据样本(AM)形式存在的控制命令(S)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03100669.5 | 2003-03-17 | ||
EP03100669 | 2003-03-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1762116A true CN1762116A (zh) | 2006-04-19 |
Family
ID=33016952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800072292A Pending CN1762116A (zh) | 2003-03-17 | 2004-03-08 | 用于遥控音频装置的方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20060206335A1 (zh) |
EP (1) | EP1606898A1 (zh) |
JP (1) | JP2006524357A (zh) |
KR (1) | KR20050110021A (zh) |
CN (1) | CN1762116A (zh) |
WO (1) | WO2004084443A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951272A (zh) * | 2014-03-25 | 2015-09-30 | 通用汽车环球科技运作有限责任公司 | 用于应用控制的将所接收的图形命令和文本命令转换为语音命令的方法和装置 |
CN107993655A (zh) * | 2017-12-03 | 2018-05-04 | 厦门声连网信息科技有限公司 | 一种声音处理系统、方法及声音识别装置和声音接收装置 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8521737B2 (en) | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US8276088B2 (en) | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US8195659B2 (en) | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US7970171B2 (en) | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8335789B2 (en) | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8144921B2 (en) | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US8156427B2 (en) * | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US8184155B2 (en) | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US8332401B2 (en) | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8156115B1 (en) | 2007-07-11 | 2012-04-10 | Ricoh Co. Ltd. | Document-based networking with mixed media reality |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US8676810B2 (en) | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9020966B2 (en) * | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
JP5039214B2 (ja) * | 2011-02-17 | 2012-10-03 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
KR20220002750A (ko) | 2011-12-07 | 2022-01-06 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
KR101627785B1 (ko) * | 2013-05-31 | 2016-06-07 | 전자부품연구원 | 오디오 신호와 커맨드의 복합 처리 방법 및 이를 적용한 오디오 시스템 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2518101A1 (de) * | 1975-04-23 | 1976-11-04 | Int Standard Electric Corp | Verfahren zur senderseitigen fernsteuerung der lautstaerke in empfaengern eines rundfunkuebertragungssystems |
NL8702749A (nl) * | 1987-11-18 | 1989-06-16 | Philips Nv | Afstandsbedieningssysteem met ontwaak signaal. |
US5369440A (en) * | 1992-11-19 | 1994-11-29 | Sussman; Barry | System and method for automatically controlling the audio output of a television |
US6035177A (en) * | 1996-02-26 | 2000-03-07 | Donald W. Moses | Simultaneous transmission of ancillary and audio signals by means of perceptual coding |
US6931451B1 (en) * | 1996-10-03 | 2005-08-16 | Gotuit Media Corp. | Systems and methods for modifying broadcast programming |
US6317714B1 (en) * | 1997-02-04 | 2001-11-13 | Microsoft Corporation | Controller and associated mechanical characters operable for continuously performing received control data while engaging in bidirectional communications over a single communications channel |
US6246989B1 (en) * | 1997-07-24 | 2001-06-12 | Intervoice Limited Partnership | System and method for providing an adaptive dialog function choice model for various communication devices |
US6011854A (en) * | 1997-09-18 | 2000-01-04 | Sony Corporation | Automatic recognition of audio information in a broadcast program |
US6240347B1 (en) * | 1998-10-13 | 2001-05-29 | Ford Global Technologies, Inc. | Vehicle accessory control with integrated voice and manual activation |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US6415257B1 (en) * | 1999-08-26 | 2002-07-02 | Matsushita Electric Industrial Co., Ltd. | System for identifying and adapting a TV-user profile by means of speech technology |
US6553345B1 (en) * | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
DE10004002A1 (de) * | 2000-01-29 | 2001-08-09 | Bosch Gmbh Robert | Verfahren zum Verdecken von Unterbrechnungen der Wiedergabe empfangener Rundfunksignale |
US7047191B2 (en) * | 2000-03-06 | 2006-05-16 | Rochester Institute Of Technology | Method and system for providing automated captioning for AV signals |
US6671671B1 (en) * | 2000-04-10 | 2003-12-30 | Lucent Technologies Inc. | System and method for transmitting data from customer premise equipment sans modulation and demodulation |
US6772123B2 (en) * | 2000-11-30 | 2004-08-03 | 3Com Corporation | Method and system for performing speech recognition for an internet appliance using a remotely located speech recognition application |
GB2375907A (en) * | 2001-05-14 | 2002-11-27 | British Broadcasting Corp | An automated recognition system |
-
2004
- 2004-03-08 JP JP2006506679A patent/JP2006524357A/ja not_active Withdrawn
- 2004-03-08 KR KR1020057017461A patent/KR20050110021A/ko not_active Application Discontinuation
- 2004-03-08 EP EP04718376A patent/EP1606898A1/en not_active Withdrawn
- 2004-03-08 WO PCT/IB2004/050211 patent/WO2004084443A1/en not_active Application Discontinuation
- 2004-03-08 CN CNA2004800072292A patent/CN1762116A/zh active Pending
- 2004-03-08 US US10/549,236 patent/US20060206335A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951272A (zh) * | 2014-03-25 | 2015-09-30 | 通用汽车环球科技运作有限责任公司 | 用于应用控制的将所接收的图形命令和文本命令转换为语音命令的方法和装置 |
CN104951272B (zh) * | 2014-03-25 | 2018-12-14 | 通用汽车环球科技运作有限责任公司 | 用于应用控制的将所接收的图形命令和文本命令转换为语音命令的方法和装置 |
CN107993655A (zh) * | 2017-12-03 | 2018-05-04 | 厦门声连网信息科技有限公司 | 一种声音处理系统、方法及声音识别装置和声音接收装置 |
WO2019104889A1 (zh) * | 2017-12-03 | 2019-06-06 | 厦门声连网信息科技有限公司 | 一种声音处理系统、方法及声音识别装置和声音接收装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006524357A (ja) | 2006-10-26 |
EP1606898A1 (en) | 2005-12-21 |
US20060206335A1 (en) | 2006-09-14 |
KR20050110021A (ko) | 2005-11-22 |
WO2004084443A1 (en) | 2004-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1762116A (zh) | 用于遥控音频装置的方法 | |
CN1185623C (zh) | 消费类电子设备的音控方法 | |
CN1220176C (zh) | 用于一种语音识别设备的训练或适配方法 | |
CN100559463C (zh) | 声音识别用辞典编制装置和声音识别装置 | |
US6959276B2 (en) | Including the category of environmental noise when processing speech signals | |
US9251142B2 (en) | Mobile speech-to-speech interpretation system | |
US9570073B2 (en) | Remote control audio link | |
EP1246166B1 (en) | Speech recognition based captioning system | |
CN1145927C (zh) | 为设备和应用的同时使用合并语音接口的方法 | |
JP4459267B2 (ja) | 辞書データ生成装置及び電子機器 | |
CN109478408B (zh) | 用于广播环境中的话语识别应用的话语增强 | |
US20180157462A1 (en) | Apparatus, systems and methods for audio content diagnostics | |
JP2019535044A (ja) | ハイブリッド音声認識複合性能自動評価システム | |
US7039590B2 (en) | General remote using spoken commands | |
US20070118373A1 (en) | System and method for generating closed captions | |
EP2826261B1 (en) | Spatial audio signal filtering | |
JP2019185062A (ja) | 音声インタラクション方法、端末機器及びコンピュータ読み取り可能な記憶媒体 | |
CN108062212A (zh) | 一种基于场景的语音操作方法及装置 | |
US8725505B2 (en) | Verb error recovery in speech recognition | |
US20120116748A1 (en) | Voice Recognition and Feedback System | |
GB2405018A (en) | Text to speech for electronic programme guide | |
CN101645716A (zh) | 一种具有语音识别功能的车载通讯系统及其识别方法 | |
KR100672518B1 (ko) | 음성인식 기능을 갖는 티브이 | |
CN114203156A (zh) | 音频识别方法、音频识别装置、电子设备和存储介质 | |
KR20200071996A (ko) | 학습 단말기와 서버를 이용한 언어 학습 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |