CN101160620B - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法 - Google Patents

数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法 Download PDF

Info

Publication number
CN101160620B
CN101160620B CN2006800126732A CN200680012673A CN101160620B CN 101160620 B CN101160620 B CN 101160620B CN 2006800126732 A CN2006800126732 A CN 2006800126732A CN 200680012673 A CN200680012673 A CN 200680012673A CN 101160620 B CN101160620 B CN 101160620B
Authority
CN
China
Prior art keywords
acoustic signal
data
unit
transmission data
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800126732A
Other languages
English (en)
Other versions
CN101160620A (zh
Inventor
松冈保静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of CN101160620A publication Critical patent/CN101160620A/zh
Application granted granted Critical
Publication of CN101160620B publication Critical patent/CN101160620B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Abstract

本发明提供数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法。数据嵌入装置构成为具有:相位调节部,其根据嵌入传送数据的帧单位,来对音响信号进行相位调节;以及合成部,其在进行了相位调节的音响信号中嵌入传送数据。并且,数据提取装置构成为具有:去除部,其去除嵌入有传送数据的音响信号的低频成分,来生成低频去除音响信号;同步部,其根据在音响信号中嵌入传送数据时的帧单位,使由去除部所生成的低频去除音响信号同步;以及提取部,其从由同步部取得同步的低频去除音响信号中提取传送数据。

Description

数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
技术领域
本发明涉及用于在音响信号中嵌入任意的传送数据的数据嵌入装置和数据嵌入方法,以及用于提取嵌入在音响信号中的任意传送数据的数据提取装置和数据提取方法。
背景技术
以往已知有如下的数字水印技术(Digital Watermarking):在例如音乐、声音等音响信号中嵌入例如著作权信息等传送数据,而几乎不对其音质造成影响(例如参照下述非专利文献1或2)。
作为该数字水印技术公知有各种技术,例如在非专利文献1中记载有利用人类的难以对短回音成分(反射音)感知的听觉特性的数字水印技术。并且,已知有利用人类的对相位变化比较迟钝的听觉特性的数字水印技术。
对于在音响信号中嵌入传送数据并通过有线通信路径来传送的情况,上述利用人类的听觉特性的数字水印技术是有效的。但是,例如在从扬声器向麦克风空中传播嵌入有传送数据的音响信号的情况下,难以应用上述数字水印技术。其原因为,上述数字水印技术中的回音成分和相位由于扬声器和麦克风各自的机械特性以及空中传播特性而产生各种变化。
另一方面,作为对空中传播音响信号的情况有效的数字水印技术,已知有使用非专利文献2和专利文献1所记载的扩频的方式。在该使用扩频的方式中,在音响信号中嵌入乘以规定的扩展码序列后的传送数据,将其传送到接收目的地。
非专利文献1:D.Gruhl,A.Lu and W.Bender;“Echo Hiding”,Information Hiding,pp.295-315,1996
非专利文献2:L.Boney,A.H.Tewfik and K.N.Hamdy;“DigitalWatermarks for audio signals”,IEEE Intl.Conf.on Multimedia Computingand Systems,pp.473-480,1996.
专利文献1:国际公开第02/45286号文本
但是,在该使用扩频的方式中,例如在音响信号和扩展码序列的相关性强的情况下,难以从所接收的音响信号中提取被嵌入的传送信号。其结果,在对被嵌入并发送的传送信号进行解码时,信号识别的错误增加。
发明内容
本发明是鉴于上述情况而产生的,其目的在于提供可在音响信号中适当地嵌入任意传送数据的数据嵌入装置和数据嵌入方法,以及可适当地提取嵌入在音响信号中的任意传送数据的数据提取装置和数据提取方法。
为了解决上述课题,本发明的数据嵌入装置构成为具有:相位调节单元,其根据嵌入任意传送数据的帧单位,来对音响信号进行相位调节;以及嵌入单元,其在由相位调节单元进行了相位调节的音响信号中嵌入传送数据;所述相位调节单元将所述音响信号变换为频域信号,对所述频域信号进行相位调节:逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率,并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值,在所述传送数据的数据位为0时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强,在所述传送数据的数据位为1时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。
另外,本发明的数据嵌入方法构成为具有以下步骤:相位调节步骤,在该步骤中,相位调节单元根据嵌入任意传送数据的帧单位,来对音响信号进行相位调节;以及嵌入步骤,在该步骤中,嵌入单元在通过相位调节步骤进行了相位调节的音响信号中嵌入传送数据;在所述相位调节步骤中,所述相位调节单元将所述音响信号变换为频域信号,对所述频域信号进行相位调节:逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率,并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值,在所述传送数据的数据位为0时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强,在所述传送数据的数据位为1时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。
另外,本发明的数据提取装置构成为具有:第1去除单元,其去除嵌入有任意传送数据的音响信号的低频成分,来生成第1低频去除音响信号;第1同步单元,其根据在音响信号中嵌入传送数据时的帧单位,使由第1去除单元所生成的第1低频去除音响信号同步;以及第1提取单元,其将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从由第1同步单元取得同步的第1低频去除音响信号中提取传送数据。
另外,本发明的数据提取装置构成为具有:第2同步单元,其根据在音响信号中嵌入任意传送数据时的帧单位,使音响信号同步;第2去除单元,其去除由第2同步单元取得同步的音响信号的低频成分,来生成第2低频去除音响信号;以及第2提取单元,其将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从由第2去除单元所生成的第2低频去除音响信号中提取传送数据。
另外,本发明的数据提取方法构成为具有以下步骤:第1去除步骤,在该步骤中,第1去除单元去除嵌入有任意传送数据的音响信号的低频成分,来生成第1低频去除音响信号;第1同步步骤,在该步骤中,第1同步单元根据在音响信号中嵌入传送数据时的帧单位,使通过第1去除步骤所生成的第1低频去除音响信号同步;以及第1提取步骤,在该步骤中,第1提取单元将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从通过第1同步步骤取得同步的第1低频去除音响信号中提取传送数据。
另外,本发明的数据提取方法构成为具有以下步骤:第2同步步骤,在该步骤中,第2同步单元根据在音响信号中嵌入任意传送数据时的帧单位,使音响信号同步;第2去除步骤,在该步骤中,第2去除单元去除通过第2同步步骤取得同步的音响信号的低频成分,生成第2低频去除音响信号;以及第2提取步骤,在该步骤中,第2提取单元将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从通过第2去除步骤所生成的第2低频去除音响信号中提取传送数据。
根据本发明的数据嵌入装置、数据嵌入方法、数据提取装置以及数据提取方法,作为传送数据的发送侧的数据嵌入装置根据嵌入传送数据的帧单位,对音响信号的相位进行调节后嵌入传送数据,以使作为传送数据的接收侧的数据提取装置易于提取传送数据。而且,在数据提取装置中,根据对所接收的音响信号进行了相位调节的该帧单位来进行帧同步之后,进行传送数据的提取。由此,数据提取装置易于提取数据嵌入装置所嵌入的传送数据,能够减少对所提取的传送数据的识别错误。
另外,第1去除单元去除数据提取装置所接收的音响信号的低频成分。低频成分的相位偏移对人类的听觉造成的影响很大,并且相位调节的效果小。因此,通过预先去除低频成分,然后进行以后的处理,从而能够适当地提取传送数据,而不会对音响数据的音质造成影响。
另外,在由第2同步单元取得音响信号的同步后,去除音响信号的低频成分。在由第2同步单元进行同步时,如果使用包含音响信号的低频成分的所有频率成分,则易于检测出同步的开头点,能够降低同步点的检测错误。
另外,在本发明的数据嵌入装置中,数据嵌入装置也可以具有分割单元,该分割单元将音响信号分割为多个子带信号,相位调节单元根据帧单位,来对由分割单元所分割的子带信号进行相位调节,数据嵌入装置也可以具有重构单元,该重构单元将由相位调节单元进行相位调节的子带信号重构为一个音响信号,嵌入单元在由重构单元重构的一个音响信号中嵌入传送数据。由此,因为能够针对每个子带进行极细的相位调节,所以能够增大由本发明的相位调节单元进行的相位调节的效果。
另外,在本发明的数据嵌入装置中,相位调节单元也可以使音响信号的时间序列偏移规定的采样时间。由此,通过使音响信号的时间序列不延迟几个采样时间而是提前,从而能够容易地对音响信号进行相位调节。
另外,在本发明的数据嵌入装置中,相位调节单元也可以将音响信号变换为频域信号,对频域信号进行相位调节。这样,将音响信号变换为频域,操作各频谱的实数项和虚数项,从而能够容易地对音响信号进行相位调节。
另外,在本发明的数据嵌入装置中,也可以具有平滑单元,该平滑单元在作为音响信号的规定帧和与该规定帧在时间上相邻的其他帧的边界的部分,对没有进行相位调节的音响信号和由相位调节单元进行了相位调节的相位调节音响信号进行合成。通过在帧边界部分,分别对没有进行相位调节的音响信号和相位调节音响信号乘以一定的比率来进行合成,能够去除相位调节时所产生的噪声。
根据本发明,能够在音响信号中适当地嵌入任意传送数据,并且适当地提取嵌入在音响信号中的任意传送数据。
附图说明
图1是数据嵌入提取系统1的概略结构图。
图2是用于说明嵌入装置101的动作的框图。
图3是表示音响信号A1的频谱和频率屏蔽阈值的线图。
图4是表示音响信号A1的频谱、频率屏蔽阈值和扩展信号D1的频谱的线图。
图5是表示音响信号A1的频谱、频率屏蔽阈值和频率加权扩展信号D2的频谱的线图。
图6是用于说明提取装置112的动作的框图。
图7是用于说明数据嵌入装置100和数据提取装置110的动作的流程图。
图8是数据嵌入提取系统2的概略结构图。
图9是用于说明嵌入装置201的动作的框图。
图10是用于说明提取装置212的动作的框图。
图11是用于说明数据嵌入装置200和数据提取装置210的动作的流程图。
标号说明
1、2...数据嵌入提取系统,100、200...数据嵌入装置,101、201...嵌入装置,102、203...相位调节部,103、205...平滑部,104、206...滤波器部,105、207...合成部,106、208...扬声器,110、210...数据提取装置,111、211...麦克风,112、212...提取装置,113、214...去除部,114、213...同步部,115、215...提取部,116、216...纠错部,202...分割部,204...重构部。
具体实施方式
通过参照仅用于例示而示出的附图并考虑以下详细的记叙,能够容易地理解本发明的思想。接着,参照附图说明本发明的实施方式。可能的情况下,对同一部分附加同一标号,并省略重复的说明。
[第1实施方式]
下面,说明本发明的第1实施方式的数据嵌入提取系统1。图1是数据嵌入提取系统1的概略结构图。如图1所示,数据嵌入提取系统1构成为具有数据嵌入装置100和数据提取装置110。数据嵌入装置100例如是用于在音乐等音响信号中嵌入任意传送数据的装置,例如将著作权信息等作为水印数据而嵌入在音响信号中。并且,数据提取装置110是用于提取嵌入在音响信号中的传送数据的装置。下面,详细说明构成数据嵌入提取系统1的各结构要素。
如图1所示,数据嵌入装置100构成为具有嵌入装置101和扬声器106。嵌入装置101用于在音响信号中嵌入传送数据,其构成为具有相位调节部102(相位调节单元)、平滑部103(平滑单元)、滤波器部104、以及合成部105(嵌入单元)。并且,扬声器106用于向数据提取装置110空中传播嵌入有传送数据的合成音响信号。该扬声器106作为能够产生例如人类可听频域即20Hz~20kHz左右的振动频率的装置,使用通常的音响信号输出装置。下面,参照图2~图5详细说明构成该数据嵌入装置100的各结构要素。
图2是用于说明嵌入装置101的动作的框图。首先,以规定的帧单位将音响信号A1输入到相位调节部102中。所谓该规定的帧单位是在数据嵌入装置100和数据提取装置110之间预先适当设定的单位,是之后利用合成部105在音响数据A1中嵌入传送数据C时的帧单位。相位调节部102对所输入的帧的时间序列信号进行相位调节。
更具体而言,相位调节部102通过傅立叶变换将所输入的帧的时间序列信号变换为频域的频谱序列。然后,相位调节部102一边逐渐改变各频谱的系数的实数项和虚数项的比率,一边计算音响信号A1和扩展码序列B的相关值。另外,该扩展码序列B是为了对传送数据C进行扩展而预先适当设定的。然后,在所嵌入的传送数据C的数据位为0时,相位调节部102调节音响信号A1的相位,以使在帧的开头点在正方向上相关值变强。并且,在所嵌入的传送数据C的数据位为1时,相位调节部102调节音响信号A1的相位,以使在帧的开头点在负方向上相关值变强。
这样,以帧单位来进行相位调节而生成的相位调节音响信号A2的相位在相邻的前后帧中不连续。因此,平滑部103对帧的边界部分的相位的不连续进行平滑化,降低由于相位不连续而产生的噪声。更具体而言,平滑部103在帧的边界部分的附近,分别对没有进行相位调节的音响信号A1和进行了相位调节的相位调节音响信号A2乘以一定的比率来进行合成,生成平滑化信号A3
例如,在使用于对帧前后的100个样本的区间进行平滑化的情况下,对没有进行相位调节的音响信号A1i乘以(100-i)/100,并且对进行了相位调节的相位调节音响信号A2i乘以i/100,来对它们进行合成,从而生成从帧的开头起第i个样本的平滑化信号A3i。另外,生成从帧的最末尾起第i个样本的平滑化信号A3时,也使用同样的方法。平滑部103将所生成的平滑化信号A3输出到滤波器部104以及合成部105。
滤波器部104以相同的帧单位通过FFT(快速傅立叶变换)将由平滑部103所生成的平滑化信号A3变换为频域,计算出频率屏蔽阈值。另外,对于此时的频率屏蔽阈值的计算,使用公知的心理听觉模型。图3表示通过该心理听觉模型所计算出的频率屏蔽阈值。在图3中,用实线所示的线图X表示音响信号A1的频谱,用虚线所示的线图Y表示频率屏蔽阈值。并且,滤波器部104根据所计算出的频率屏蔽阈值,对具有与该频率屏蔽阈值相同频率特性的直线相位的频率响应进行傅立叶逆变换,从而形成频率屏蔽滤波器(masking filter)。
滤波器部104被输入对传送数据C乘以扩展码序列B并扩展到整个频带的扩展信号D1。然后,滤波器部104对扩展信号D1使用频率屏蔽滤波器,在不超过屏蔽阈值的范围内对其滤波的结果进行振幅调节,从而根据频率屏蔽阈值生成对各频谱进行加权的频率加权扩展信号D2。然后,滤波器部104将所生成的频率加权扩展信号D2输出到合成部105。
合成部105对从滤波器部104输入的频率加权扩展信号D2和从平滑部103输入的平滑化信号A3进行合成,从而生成合成音响信号E1。然后,在将合成部105所生成的合成音响信号E1输出到扬声器106时,扬声器106向接收目的地的数据提取装置110空中传播该合成音响信号E1
在图4中,在图3所示的音响信号A1的频谱(用线图X表示)和频率屏蔽阈值(用线图Y表示)上,追加记载有扩展信号D1的频谱(用线图Z1表示)。另外,为了区分线图X和线图Z1,在图4中用细实线表示线图X,用粗实线表示线图Z1。在该图4中,因为扩展信号D1的频谱在低频部分中比屏蔽阈值低很多,而在高频成分中大于屏蔽阈值,所以扩展信号D1的增益效率不高,并且还能够感知到噪声。
另一方面,在图5中,在图3所示的音响信号A1的频谱(用线图X表示)和频率屏蔽阈值(用线图Y表示)上,追加记载有频率加权扩展信号D2的频谱(用线图Z2表示)。另外,为了区分线图X和线图Z2,在图5中用细实线表示线图X,用粗实线表示线图Z2。这样,通过对扩展信号D1进行加权,能够嵌入传送数据C(扩展信号D2)直到屏蔽阈值边界。
返回图1,数据提取装置110构成为具有麦克风111、提取装置112和纠错部116。麦克风111用于接收从数据嵌入装置100的扬声器106空中传播来的合成音响信号E1,使用通常的音响信号获取装置。并且,提取装置112用于提取嵌入在麦克风111所接收的合成音响信号E1中的传送数据C0,该提取装置112构成为具有去除部113(第1去除单元)、同步部114(第1同步单元)和提取部115(第1提取单元)。并且,纠错部116用于根据所提取出的传送数据C0进行纠错,并还原成原来的传送数据C。下面,参照图6详细说明构成该数据提取装置110的各结构要素。
图6是用于说明该提取装置112的动作的框图。首先,麦克风111将从数据嵌入装置100的扬声器106接收到的合成音响信号E1输入到去除部113。去除部113由所谓的高通滤波器构成,从所输入的合成音响信号E1中去除低频成分,来生成低频去除音响信号(第1低频去除音响信号)E2。这样,通过去除部113预先去除与扩展码序列B的相关强的低频成分,从而能够降低对传送数据C的识别错误率。去除部113将所生成的低频去除音响信号E2输出到同步部114。另外,第1实施方式的去除部113由数字滤波器构成,该数字滤波器对麦克风111所接收到的合成音响信号E1进行A/D变换,并对该A/D变换后的信号进行滤波处理。
同步部114从去除部113被输入低频去除音响信号E2,根据数据嵌入装置100在音响数据A1中嵌入传送数据C时的帧单位,使低频去除音响信号E2同步。更具体而言,同步部114逐次偏移几个样本来计算出所输入的低频去除音响信号E2和扩展码序列B的相关值,检测出相关值最高的点来作为帧的开头点(同步点)。同步部114将检测出同步点的低频去除音响信号E2输出到提取部115。
提取部115根据由同步部114所检测出的同步点,对低频去除音响信号E2进行帧分割。然后,针对所分割的每个帧乘以扩展码序列B,根据所计算出的相关值来提取出传送数据C0。更具体而言,如果所计算出的相关值为正,则提取部115将0识别为传送数据C0,如果所计算出的相关值为负,则提取部115将1识别为传送数据C0。提取部115将所识别出的传送数据C0输出到纠错部116,纠错部116根据所输入的传送数据C0进行纠错,并还原成原来的传送数据C。
接着,参照图7说明第1实施方式的数据嵌入提取系统1的控制流程。图7是用于说明由数据嵌入装置100在音响数据A1中嵌入传送数据C,并由数据提取装置110还原传送数据C的动作的流程图。
首先,以规定的帧单位来将音响信号A1输入到相位调节部102中,对所输入的帧的时间序列信号进行相位调节(步骤S101)。接着,利用平滑部103对在步骤S101中进行相位调节而得到的相位调节音响信号A2进行平滑化(步骤S102)。
接着,将在步骤S102中进行平滑化而得到的平滑化信号A3变换为频域,计算出频率屏蔽阈值(步骤S103和步骤S104)。根据在步骤S104中计算的频率屏蔽阈值,形成频率屏蔽滤波器(步骤S105)。
接着,对在步骤S105中形成的频率屏蔽滤波器,输入对传送数据C乘以扩展码序列B并扩展为整个频带的扩展信号D1,来进行滤波(步骤S106)。然后,在不超过屏蔽阈值的范围内对步骤S106中的滤波结果进行振幅调节,生成频率加权扩展信号D2(步骤S107)。
对在步骤S107中生成的频率加权扩展信号D2和在步骤S102中生成的平滑化信号A3进行合成(步骤S108)。然后,将在步骤S108中合成的合成音响信号E1利用扬声器106空中传播到接收目的地的数据提取装置110(步骤S109)。
在步骤S109中发送的合成音响信号E1被输入到数据提取装置110的麦克风111(步骤S110)。接着,通过滤波从在步骤S110中输入的合成音响信号E1中去除低频成分,生成低频去除音响信号E2(步骤S111)。
接着,根据在音响数据A1中嵌入传送数据C时的帧单位,使在步骤S111中生成的低频去除音响信号E2同步(步骤S112)。
从在步骤S112中取得同步的低频去除音响信号E2中提取传送数据C0(步骤S113)。当将在步骤S113中提取出的传送数据C0输入到纠错部116来纠正识别错误时,还原成原来的传送数据C(步骤S114)。
接着,说明第1实施方式的作用和效果。根据第1实施方式的数据嵌入提取系统1,作为传送数据C的发送侧的数据嵌入装置100根据嵌入传送数据C的帧单位,对音响信号A1的相位进行调节,然后嵌入传送数据C,以使作为传送数据C的接收侧的数据提取装置110易于提取传送数据C。而且,在数据提取装置110中,根据对所接收的合成音响信号E1进行相位调节的该帧单位,使帧同步后进行传送数据C的还原。由此,数据提取装置110易于提取数据嵌入装置100所嵌入的传送数据C,能够减少对所提取的传送数据C的识别错误。
另外,在第1实施方式中,去除部113去除数据提取装置110所接收的合成音响信号E1的低频成分。低频成分的相位偏移对人类的听觉造成的影响很大,并且相位调节的效果小。因此,通过预先去除低频成分,然后进行以后的处理,从而能够适当地提取传送数据C,而不会对音响数据A1的音质造成影响。
并且,在第1实施方式中,相位调节部102通过傅立叶变换而将音响信号A1变换成频域的频谱序列,改变各频谱的系数的实数项和虚数项的比率,从而能够容易地对音响信号A1进行相位调节。
并且,在第1实施方式中,平滑部103对帧的边界部分的相位的不连续进行平滑化。由此,能够去除相位调节时由于相位不连续而产生的噪声。
[第2实施方式]
下面,说明本发明的第2实施方式的数据嵌入提取系统2。图8是数据嵌入提取系统2的概略结构图。如图8所示,数据嵌入提取系统2构成为具有数据嵌入装置200和数据提取装置210。下面,参照图8~图10详细说明构成该数据嵌入提取系统2的各结构要素。图9是用于说明数据嵌入装置200的嵌入装置201的动作的框图。并且,图10是用于说明数据提取装置210的提取装置212的动作的框图。另外,对与第1实施方式重复的部分省略说明。
如图8所示,数据嵌入装置200构成为具有嵌入装置201和扬声器,嵌入装置201具有分割部202(分割单元)、相位调节部203(相位调节单元)、重构部204(重构单元)、平滑部205(平滑单元)、滤波器部206、以及合成部(嵌入单元)207。首先,如图9所示,将音响信号A1输入到分割部202。分割部202将输入的音响信号A1分割为各频带的每个子带,生成子带信号(A11,A12,...,A1n)。然后,分割部202将所生成的子带信号(A11,A12,...,A1n)输出到相位调节部203。
相位调节部203分别对从分割部202输入的各频带的子带信号(A11,A12,...,A1n)独立地进行相位调节。更具体而言,相位调节部203根据嵌入传送数据C的帧单位,一边使子带信号(A11,A12,...,A1n)逐次延迟几个样本,一边计算与扩展码序列B的相关值。然后,为了使得在同步点在正方向上相关值变高,在嵌入传送数据C的帧中,即在所嵌入的传送数据C的数据位为0的帧中,延迟几个样本,以使与扩展码序列B的相关值在正方向上变高。
并且,为了在同步点在负方向上相关值变高,在嵌入传送数据C以使的帧中,即在所嵌入的传送数据C的数据位为1的帧中,延迟几个样本,以使与扩展码序列B的相关值在负方向上变高。相位调节部203将进行相位调节而得到的相位调节子带信号(A21,A22,...,A2n)输出到重构部204。另外,在低频的子带信号中,因为即使延迟几个样本相关值也几乎不变化,所以有时不进行相位调节而保持相位连续性的方法是高效的。
重构部204从相位调节部203被输入相位调节子带信号(A21,A22,...,A2n),重构为一个音响信号。重构部204将所重构的一个音响信号输出到平滑部205,平滑部205对帧的边界部分的相位的不连续进行平滑化,降低因相位不连续而产生的噪声。
返回图8,数据提取装置210构成为具有麦克风211、提取装置212和纠错部216,提取装置212具有同步部213(第2同步单元)、去除部214(第2去除单元)和提取部215(第2提取单元)。
首先,如图10所示,将麦克风211从数据嵌入装置200的扬声器接所收到的合成音响信号E1输入到同步部213。同步部213根据数据嵌入装置200在音响数据A1中嵌入传送数据C时的帧单位,使所输入的合成音响信号E1同步。更具体而言,同步部213逐次偏移几个样本来计算所输入的合成音响信号E1和扩展码序列B的相关值,将相关值最高的点识别为帧的开头点(同步点)。同步部213将检测出同步点的合成音响信号E1输出到去除部214。
去除部214由所谓的高通滤波器构成,被输入检测出同步点的合成音响信号E1,去除低频成分,来生成低频去除音响信号(第2低频去除音响信号)E3。去除部214将所生成的低频去除音响信号E3输出到提取部215。
提取部215根据由同步部213所检测出的同步点,对从去除部214输入的低频去除音响信号E3进行帧分割。然后,针对所分割的每个帧乘以扩展码序列B,根据所计算出的相关值来提取出传送数据C0。更具体而言,如果所计算出的相关值为正,则提取部215将0识别为传送数据C0,如果所计算出的相关值为负,则提取部215将1识别为传送数据C0。提取部215将所识别出的传送数据C0输出到纠错部216,纠错部216根据所输入的传送数据C0进行纠错,并还原成原来的传送数据C。
接着,参照图11说明第2实施方式的数据嵌入提取系统2的控制流程。图11是用于说明由数据嵌入装置200在音响数据A1嵌入传送数据C,并由数据提取装置210还原传送数据C的动作的流程图。
首先,将输入到分割部202的音响信号A1分割成各频带的每个子带,生成子带信号(A11,A12,...,A1n)(步骤S201)。接着,分别对在步骤S201中生成的子带信号(A11,A12,...,A1n)独立地进行相位调节(步骤S202)。
接着,将在步骤S202中针对每个子带独立地进行了相位调节的相位调节子带信号(A21,A22,...,A2n)重构为一个音响信号(步骤S203)。然后,利用平滑部205对在步骤S203中所重构的一个音响信号进行平滑化(步骤S204)。
接着,将在步骤S204中进行平滑化而得到的平滑化信号A3变换为频域,计算频率屏蔽阈值(步骤S205和步骤S206)。根据在步骤S206中计算的频率屏蔽阈值,形成频率屏蔽滤波器(步骤S207)。
接着,对在步骤S207中形成的频率屏蔽滤波器,输入对传送数据C乘以扩展码序列B而扩展到整个频带的扩展信号D1,来进行滤波(步骤S208)。然后,在不超过屏蔽阈值的范围内对步骤S208中的滤波结果进行振幅调节,生成频率加权扩展信号D2(步骤S209)。
对在步骤S209中生成的频率加权扩展信号D2和在步骤S204中生成的平滑化信号A3进行合成(步骤S210)。然后,利用扬声器将在步骤S210中所合成的合成音响信号E1空中传播到接收目的地的数据提取装置210(步骤S211)。
将在步骤S211中发送的合成音响信号E1输入到数据提取装置210的麦克风211(步骤S212)。接着,根据在音响数据A1中嵌入传送数据C时的帧单位,使在步骤S212中输入的合成音响信号E1同步(步骤S213)。
接着,通过滤波从在步骤S213中取得同步的合成音响信号E1中去除低频成分,生成低频去除音响信号E3(步骤S214)。接着,根据通过步骤S213所检测出的同步点,从通过步骤S214所生成的低频去除音响信号E3中提取传送数据C0(步骤S215)。然后,当将在步骤S215中提取出的传送数据C0输入到纠错部216来纠正识别错误时,还原成原来的传送数据C(步骤S216)。
接着,说明第2实施方式的作用和效果。根据第2实施方式的数据嵌入提取系统2,将所输入的音响信号A1分给成各频带的每个子带,分别对所分割的子带信号(A11,A12,...,A1n)独立地进行相位调节。由此,因为能够针对每个子带进行极细的相位调节,所以能够增大由相位调节部203进行的相位调节的效果。
并且,在第2实施方式中,通过使子带信号(A11,A12,...,A1n)的时间序列不延迟几个采样时间而是提前,能够容易地对子带信号(A11,A12,...,A1n)进行相位调节。
并且,在第2实施方式中,在由同步部213取得合成音响信号E1的同步后,去除合成音响信号E1的低频成分。在进行同步时,如果使用包含合成音响信号E1的低频成分的所有频率成分,则易于检测同步的开头点,能够降低开头点的检测错误。
以上,说明了本发明的优选实施方式,但本发明当然不限于上述实施方式。
例如,也能够实现将第1实施方式的数据嵌入装置100和第2实施方式的数据提取装置210组合的数据嵌入提取系统、将第2实施方式的数据嵌入装置200和第1实施方式的数据提取装置110组合的数据嵌入提取系统。
并且,第1实施方式的去除部113也可以由直接对所输入的信号进行滤波处理的模拟滤波器来构成,对滤波后的信号进行A/D变换后输出。

Claims (9)

1.一种数据嵌入装置,其特征在于,该数据嵌入装置具有:
相位调节单元,其根据嵌入任意传送数据的帧单位,来对音响信号进行相位调节;以及
嵌入单元,其在由所述相位调节单元进行了相位调节的音响信号中嵌入所述传送数据;
所述相位调节单元将所述音响信号变换为频域信号,对所述频域信号进行相位调节:逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率,并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值,在所述传送数据的数据位为0时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强,在所述传送数据的数据位为1时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。
2.根据权利要求1所述的数据嵌入装置,其特征在于,
所述数据嵌入装置具有分割单元,该分割单元将所述音响信号分割为多个子带信号,
所述相位调节单元根据所述帧单位,对由所述分割单元所分割的所述子带信号进行相位调节,
所述数据嵌入装置具有重构单元,该重构单元将由所述相位调节单元进行了相位调节的子带信号重构为一个音响信号,
所述嵌入单元在由所述重构单元重构的所述一个音响信号中嵌入所述传送数据。
3.根据权利要求1所述的数据嵌入装置,其特征在于,
所述相位调节单元使所述音响信号的时间序列偏移规定的采样时间。
4.根据权利要求1所述的数据嵌入装置,其特征在于,
该数据嵌入装置具有平滑单元,该平滑单元在作为所述音响信号的规定帧和与该规定帧在时间上相邻的其他帧的边界的部分,对没有进行相位调节的音响信号和由所述相位调节单元进行了相位调节的相位调节音响信号进行合成。
5.一种数据提取装置,其特征在于,该数据提取装置具有:
第1去除单元,其去除嵌入有任意传送数据的音响信号的低频成分,来生成第1低频去除音响信号;
第1同步单元,其根据在所述音响信号中嵌入所述传送数据时的帧单位,使由所述第1去除单元所生成的所述第1低频去除音响信号同步;以及
第1提取单元,其将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从由所述第1同步单元取得同步的第1低频去除音响信号中提取所述传送数据。
6.一种数据提取装置,其特征在于,该数据提取装置具有:
第2同步单元,其根据在音响信号中嵌入任意传送数据时的帧单位,使所述音响信号同步;
第2去除单元,其去除由所述第2同步单元取得同步的音响信号的低频成分,来生成第2低频去除音响信号;以及
第2提取单元,其将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从由所述第2去除单元所生成的所述第2低频去除音响信号中提取所述传送数据。
7.一种数据嵌入方法,其特征在于,该数据嵌入方法具有以下步骤:
相位调节步骤,在该步骤中,相位调节单元根据嵌入任意传送数据的帧单位,来对音响信号进行相位调节;以及
嵌入步骤,在该步骤中,嵌入单元在通过所述相位调节步骤进行了相位调节的音响信号中嵌入所述传送数据;
在所述相位调节步骤中,所述相位调节单元将所述音响信号变换为频域信号,对所述频域信号进行相位调节:逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率,并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值,在所述传送数据的数据位为0时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强,在所述传送数据的数据位为1时,调节所述音响信号的相位,使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。
8.一种数据提取方法,其特征在于,该数据提取方法具有以下步骤:
第1去除步骤,在该步骤中,第1去除单元去除嵌入有任意传送数据的音响信号的低频成分,来生成第1低频去除音响信号;
第1同步步骤,在该步骤中,第1同步单元根据在所述音响信号中嵌入所述传送数据时的帧单位,使通过所述第1去除步骤所生成的所述第1低频去除音响信号同步;以及
第1提取步骤,在该步骤中,第1提取单元将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从通过所述第1同步步骤取得同步的第1低频去除音响信号中提取所述传送数据。
9.一种数据提取方法,其特征在于,该数据提取方法具有以下步骤:
第2同步步骤,在该步骤中,第2同步单元根据在音响信号中嵌入任意传送数据时的帧单位,使所述音响信号同步;
第2去除步骤,在该步骤中,第2去除单元去除通过所述第2同步步骤取得同步的音响信号的低频成分,生成第2低频去除音响信号;以及
第2提取步骤,在该步骤中,第2提取单元将每个帧乘以扩展序列,根据所述音响信号和所述扩展序列的相关值,当该相关值为正时,将所述传送数据识别为0,当该相关值为负时,将所述传送数据识别为1,从通过所述第2去除步骤所生成的所述第2低频去除音响信号中提取所述传送数据。
CN2006800126732A 2005-07-11 2006-07-07 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法 Expired - Fee Related CN101160620B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005202130A JP4896455B2 (ja) 2005-07-11 2005-07-11 データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
JP202130/2005 2005-07-11
PCT/JP2006/313570 WO2007007666A1 (ja) 2005-07-11 2006-07-07 データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法

Publications (2)

Publication Number Publication Date
CN101160620A CN101160620A (zh) 2008-04-09
CN101160620B true CN101160620B (zh) 2011-07-20

Family

ID=37637059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800126732A Expired - Fee Related CN101160620B (zh) 2005-07-11 2006-07-07 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法

Country Status (5)

Country Link
US (1) US8428756B2 (zh)
EP (1) EP1914721B1 (zh)
JP (1) JP4896455B2 (zh)
CN (1) CN101160620B (zh)
WO (1) WO2007007666A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7639985B2 (en) * 2006-03-02 2009-12-29 Pc-Tel, Inc. Use of SCH bursts for co-channel interference measurements
JP4910921B2 (ja) * 2007-07-17 2012-04-04 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP4910920B2 (ja) * 2007-07-17 2012-04-04 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP5004094B2 (ja) * 2008-03-04 2012-08-22 国立大学法人北陸先端科学技術大学院大学 電子透かし埋込装置及び電子透かし検出装置、並びに電子透かし埋込方法及び電子透かし検出方法
JP5332345B2 (ja) * 2008-06-30 2013-11-06 ヤマハ株式会社 キャリア信号から電子透かし情報を抽出する装置、方法およびプログラム
US8942388B2 (en) * 2008-08-08 2015-01-27 Yamaha Corporation Modulation device and demodulation device
CN102124514B (zh) * 2008-08-14 2012-11-28 Sk电信有限公司 用于音频频段中的数据接收和发送的系统和方法
JP5857644B2 (ja) * 2011-11-10 2016-02-10 富士通株式会社 音データ送受信システム、送信装置、受信装置、音データ送信方法及び受信方法
EP2947650A1 (en) * 2013-01-18 2015-11-25 Kabushiki Kaisha Toshiba Speech synthesizer, electronic watermark information detection device, speech synthesis method, electronic watermark information detection method, speech synthesis program, and electronic watermark information detection program
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
KR101567333B1 (ko) * 2014-04-25 2015-11-10 주식회사 크레스프리 IoT 디바이스의 통신 설정을 위한 이동통신 단말기와 통신설정모듈 및 이동통신 단말기를 이용한 IoT 디바이스의 통신 설정 방법
US11081106B2 (en) * 2017-08-25 2021-08-03 Microsoft Technology Licensing, Llc Contextual spoken language understanding in a spoken dialogue system
CN112290975B (zh) * 2019-07-24 2021-09-03 北京邮电大学 一种用于音频信息隐藏系统的噪声估计接收方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1437169A (zh) * 2002-02-04 2003-08-20 富士通株式会社 对于语音代码进行数据嵌入/抽取方法、装置以及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919479A (en) * 1972-09-21 1975-11-11 First National Bank Of Boston Broadcast signal identification system
US5490511A (en) * 1992-01-14 1996-02-13 Ge Yokogawa Medical Systems, Ltd Digital phase shifting apparatus
JPH11110913A (ja) * 1997-10-01 1999-04-23 Sony Corp 音声情報伝送装置及び方法、並びに音声情報受信装置及び方法、並びに記録媒体
WO2000057399A1 (fr) 1999-03-19 2000-09-28 Sony Corporation Procede d'inclusion d'information additionnelle et dispositif a cet effet, et procede de decodage d'information additionnelle et dispositif a cet effet
GB9917985D0 (en) * 1999-07-30 1999-09-29 Scient Generics Ltd Acoustic communication system
US6968564B1 (en) * 2000-04-06 2005-11-22 Nielsen Media Research, Inc. Multi-band spectral audio encoding
ATE308858T1 (de) * 2000-08-16 2005-11-15 Dolby Lab Licensing Corp Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video- kodiersystem in antwort auf zusätzliche information
AU2211102A (en) 2000-11-30 2002-06-11 Scient Generics Ltd Acoustic communication system
JP2003216171A (ja) * 2002-01-21 2003-07-30 Kenwood Corp 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム
JP2004341066A (ja) * 2003-05-13 2004-12-02 Mitsubishi Electric Corp 電子透かし埋め込み装置及び電子透かし検出装置
WO2005034398A2 (en) * 2003-06-19 2005-04-14 University Of Rochester Data hiding via phase manipulation of audio signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1437169A (zh) * 2002-02-04 2003-08-20 富士通株式会社 对于语音代码进行数据嵌入/抽取方法、装置以及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JP特开2004-341066A 2004.12.02
JP特开平11-110913A 1999.04.23
Shyh-shisw Kuo et.al.COVERT AUDIO WATERMARKING USING PERCEPTUALLY TUNED SIGNAL INDEPENDENT MULTIBAND PHASE MODULATION.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》.2002,第2卷第1753-1756页. *

Also Published As

Publication number Publication date
EP1914721A1 (en) 2008-04-23
EP1914721A4 (en) 2008-12-17
WO2007007666A1 (ja) 2007-01-18
CN101160620A (zh) 2008-04-09
JP4896455B2 (ja) 2012-03-14
JP2007017900A (ja) 2007-01-25
US20090018680A1 (en) 2009-01-15
US8428756B2 (en) 2013-04-23
EP1914721B1 (en) 2011-10-05

Similar Documents

Publication Publication Date Title
CN101160620B (zh) 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
CN100458949C (zh) 处理带水印多媒体信号的方法和设备、多媒体信号接收机
CN101271690B (zh) 保护音频数据的音频扩频水印处理方法
JP3274667B2 (ja) オーディオデータへ付加情報を埋め込む方法およびシステム
EP2192794A1 (en) Improvements in hearing aid algorithms
CN105976823B (zh) 基于相位编码的自适应音频水印方法及系统
WO2007120765A3 (en) System and method for automatically producing haptic events from a digital audio signal
WO2005101898A3 (en) A method and system for sound source separation
JP2001100773A5 (zh)
EP2910015A1 (en) Methods and systems for clock correction and/or synchronization for audio media measurement systems
RU2666647C2 (ru) Генератор водяного знака, декодер водяного знака, способ генерации сигнала водяного знака на основе данных двоичного сообщения, способ формирования данных двоичного сообщения на основе сигнала с водяным знаком и компьютерная программа с использованием двухмерного расширения битов
CN104658542A (zh) 基于正交的加性扩频音频水印嵌入方法、检测方法及系统
CN113782041B (zh) 一种基于音频变频域的嵌入和定位水印的方法
Baras et al. Controlling the inaudibility and maximizing the robustness in an audio annotation watermarking system
EP1493154B1 (en) Time domain watermarking of multimedia signals
KR20120112884A (ko) 바이너리 메시지 데이터를 제공하는 워터마크 디코더 및 방법
JP2005522080A (ja) ウォーターマークの時間スケールのサーチ
KR100814792B1 (ko) 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법
WO2004075162A3 (en) Method apparatus and system for processing acoustic signals
Park et al. Speech authentication system using digital watermarking and pattern recovery
US20050147248A1 (en) Window shaping functions for watermarking of multimedia signals
KR101943535B1 (ko) 스위칭 목적들을 위한 디지털 스위칭 신호 시퀀스,상기 디지털 스위칭 신호 시퀀스를 디지털 오디오 정보 신호 내에 포함시키기 위한 장치,및 상기 스위칭 신호 시퀀스가 제공된 상기 정보 신호를 수신하기 위한 장치
JP2005141738A (ja) 環境内に空間分散された複数の非同期センサからの信号を同期させる方法および信号を同期させるシステム
JP4028676B2 (ja) 音響信号伝送装置および音響信号伝送方法、ならびに、音響信号の埋め込みデータを抽出するデータ抽出装置およびデータ抽出方法
Zhang et al. An audio covert communication system for anolog channels

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110720

Termination date: 20190707