CN101160620B

CN101160620B - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法

Info

Publication number: CN101160620B
Application number: CN2006800126732A
Authority: CN
Inventors: 松冈保静
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2005-07-11
Filing date: 2006-07-07
Publication date: 2011-07-20
Anticipated expiration: 2026-07-07
Also published as: EP1914721A1; EP1914721A4; WO2007007666A1; CN101160620A; JP4896455B2; JP2007017900A; US20090018680A1; US8428756B2; EP1914721B1

Abstract

本发明提供数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法。数据嵌入装置构成为具有：相位调节部，其根据嵌入传送数据的帧单位，来对音响信号进行相位调节；以及合成部，其在进行了相位调节的音响信号中嵌入传送数据。并且，数据提取装置构成为具有：去除部，其去除嵌入有传送数据的音响信号的低频成分，来生成低频去除音响信号；同步部，其根据在音响信号中嵌入传送数据时的帧单位，使由去除部所生成的低频去除音响信号同步；以及提取部，其从由同步部取得同步的低频去除音响信号中提取传送数据。

Description

数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法

技术领域

本发明涉及用于在音响信号中嵌入任意的传送数据的数据嵌入装置和数据嵌入方法，以及用于提取嵌入在音响信号中的任意传送数据的数据提取装置和数据提取方法。

背景技术

以往已知有如下的数字水印技术(Digital Watermarking)：在例如音乐、声音等音响信号中嵌入例如著作权信息等传送数据，而几乎不对其音质造成影响(例如参照下述非专利文献1或2)。

作为该数字水印技术公知有各种技术，例如在非专利文献1中记载有利用人类的难以对短回音成分(反射音)感知的听觉特性的数字水印技术。并且，已知有利用人类的对相位变化比较迟钝的听觉特性的数字水印技术。

对于在音响信号中嵌入传送数据并通过有线通信路径来传送的情况，上述利用人类的听觉特性的数字水印技术是有效的。但是，例如在从扬声器向麦克风空中传播嵌入有传送数据的音响信号的情况下，难以应用上述数字水印技术。其原因为，上述数字水印技术中的回音成分和相位由于扬声器和麦克风各自的机械特性以及空中传播特性而产生各种变化。

另一方面，作为对空中传播音响信号的情况有效的数字水印技术，已知有使用非专利文献2和专利文献1所记载的扩频的方式。在该使用扩频的方式中，在音响信号中嵌入乘以规定的扩展码序列后的传送数据，将其传送到接收目的地。

非专利文献1：D.Gruhl，A.Lu and W.Bender；“Echo Hiding”，Information Hiding，pp.295-315，1996

非专利文献2：L.Boney，A.H.Tewfik and K.N.Hamdy；“DigitalWatermarks for audio signals”，IEEE Intl.Conf.on Multimedia Computingand Systems，pp.473-480，1996.

专利文献1：国际公开第02/45286号文本

但是，在该使用扩频的方式中，例如在音响信号和扩展码序列的相关性强的情况下，难以从所接收的音响信号中提取被嵌入的传送信号。其结果，在对被嵌入并发送的传送信号进行解码时，信号识别的错误增加。

发明内容

本发明是鉴于上述情况而产生的，其目的在于提供可在音响信号中适当地嵌入任意传送数据的数据嵌入装置和数据嵌入方法，以及可适当地提取嵌入在音响信号中的任意传送数据的数据提取装置和数据提取方法。

为了解决上述课题，本发明的数据嵌入装置构成为具有：相位调节单元，其根据嵌入任意传送数据的帧单位，来对音响信号进行相位调节；以及嵌入单元，其在由相位调节单元进行了相位调节的音响信号中嵌入传送数据；所述相位调节单元将所述音响信号变换为频域信号，对所述频域信号进行相位调节：逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率，并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值，在所述传送数据的数据位为0时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强，在所述传送数据的数据位为1时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。

另外，本发明的数据嵌入方法构成为具有以下步骤：相位调节步骤，在该步骤中，相位调节单元根据嵌入任意传送数据的帧单位，来对音响信号进行相位调节；以及嵌入步骤，在该步骤中，嵌入单元在通过相位调节步骤进行了相位调节的音响信号中嵌入传送数据；在所述相位调节步骤中，所述相位调节单元将所述音响信号变换为频域信号，对所述频域信号进行相位调节：逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率，并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值，在所述传送数据的数据位为0时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强，在所述传送数据的数据位为1时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。

另外，本发明的数据提取装置构成为具有：第1去除单元，其去除嵌入有任意传送数据的音响信号的低频成分，来生成第1低频去除音响信号；第1同步单元，其根据在音响信号中嵌入传送数据时的帧单位，使由第1去除单元所生成的第1低频去除音响信号同步；以及第1提取单元，其将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从由第1同步单元取得同步的第1低频去除音响信号中提取传送数据。

另外，本发明的数据提取装置构成为具有：第2同步单元，其根据在音响信号中嵌入任意传送数据时的帧单位，使音响信号同步；第2去除单元，其去除由第2同步单元取得同步的音响信号的低频成分，来生成第2低频去除音响信号；以及第2提取单元，其将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从由第2去除单元所生成的第2低频去除音响信号中提取传送数据。

另外，本发明的数据提取方法构成为具有以下步骤：第1去除步骤，在该步骤中，第1去除单元去除嵌入有任意传送数据的音响信号的低频成分，来生成第1低频去除音响信号；第1同步步骤，在该步骤中，第1同步单元根据在音响信号中嵌入传送数据时的帧单位，使通过第1去除步骤所生成的第1低频去除音响信号同步；以及第1提取步骤，在该步骤中，第1提取单元将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从通过第1同步步骤取得同步的第1低频去除音响信号中提取传送数据。

另外，本发明的数据提取方法构成为具有以下步骤：第2同步步骤，在该步骤中，第2同步单元根据在音响信号中嵌入任意传送数据时的帧单位，使音响信号同步；第2去除步骤，在该步骤中，第2去除单元去除通过第2同步步骤取得同步的音响信号的低频成分，生成第2低频去除音响信号；以及第2提取步骤，在该步骤中，第2提取单元将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从通过第2去除步骤所生成的第2低频去除音响信号中提取传送数据。

根据本发明的数据嵌入装置、数据嵌入方法、数据提取装置以及数据提取方法，作为传送数据的发送侧的数据嵌入装置根据嵌入传送数据的帧单位，对音响信号的相位进行调节后嵌入传送数据，以使作为传送数据的接收侧的数据提取装置易于提取传送数据。而且，在数据提取装置中，根据对所接收的音响信号进行了相位调节的该帧单位来进行帧同步之后，进行传送数据的提取。由此，数据提取装置易于提取数据嵌入装置所嵌入的传送数据，能够减少对所提取的传送数据的识别错误。

另外，第1去除单元去除数据提取装置所接收的音响信号的低频成分。低频成分的相位偏移对人类的听觉造成的影响很大，并且相位调节的效果小。因此，通过预先去除低频成分，然后进行以后的处理，从而能够适当地提取传送数据，而不会对音响数据的音质造成影响。

另外，在由第2同步单元取得音响信号的同步后，去除音响信号的低频成分。在由第2同步单元进行同步时，如果使用包含音响信号的低频成分的所有频率成分，则易于检测出同步的开头点，能够降低同步点的检测错误。

另外，在本发明的数据嵌入装置中，数据嵌入装置也可以具有分割单元，该分割单元将音响信号分割为多个子带信号，相位调节单元根据帧单位，来对由分割单元所分割的子带信号进行相位调节，数据嵌入装置也可以具有重构单元，该重构单元将由相位调节单元进行相位调节的子带信号重构为一个音响信号，嵌入单元在由重构单元重构的一个音响信号中嵌入传送数据。由此，因为能够针对每个子带进行极细的相位调节，所以能够增大由本发明的相位调节单元进行的相位调节的效果。

另外，在本发明的数据嵌入装置中，相位调节单元也可以使音响信号的时间序列偏移规定的采样时间。由此，通过使音响信号的时间序列不延迟几个采样时间而是提前，从而能够容易地对音响信号进行相位调节。

另外，在本发明的数据嵌入装置中，相位调节单元也可以将音响信号变换为频域信号，对频域信号进行相位调节。这样，将音响信号变换为频域，操作各频谱的实数项和虚数项，从而能够容易地对音响信号进行相位调节。

另外，在本发明的数据嵌入装置中，也可以具有平滑单元，该平滑单元在作为音响信号的规定帧和与该规定帧在时间上相邻的其他帧的边界的部分，对没有进行相位调节的音响信号和由相位调节单元进行了相位调节的相位调节音响信号进行合成。通过在帧边界部分，分别对没有进行相位调节的音响信号和相位调节音响信号乘以一定的比率来进行合成，能够去除相位调节时所产生的噪声。

根据本发明，能够在音响信号中适当地嵌入任意传送数据，并且适当地提取嵌入在音响信号中的任意传送数据。

附图说明

图1是数据嵌入提取系统1的概略结构图。

图2是用于说明嵌入装置101的动作的框图。

图3是表示音响信号A₁的频谱和频率屏蔽阈值的线图。

图4是表示音响信号A₁的频谱、频率屏蔽阈值和扩展信号D₁的频谱的线图。

图5是表示音响信号A₁的频谱、频率屏蔽阈值和频率加权扩展信号D₂的频谱的线图。

图6是用于说明提取装置112的动作的框图。

图7是用于说明数据嵌入装置100和数据提取装置110的动作的流程图。

图8是数据嵌入提取系统2的概略结构图。

图9是用于说明嵌入装置201的动作的框图。

图10是用于说明提取装置212的动作的框图。

图11是用于说明数据嵌入装置200和数据提取装置210的动作的流程图。

标号说明

1、2...数据嵌入提取系统，100、200...数据嵌入装置，101、201...嵌入装置，102、203...相位调节部，103、205...平滑部，104、206...滤波器部，105、207...合成部，106、208...扬声器，110、210...数据提取装置，111、211...麦克风，112、212...提取装置，113、214...去除部，114、213...同步部，115、215...提取部，116、216...纠错部，202...分割部，204...重构部。

具体实施方式

通过参照仅用于例示而示出的附图并考虑以下详细的记叙，能够容易地理解本发明的思想。接着，参照附图说明本发明的实施方式。可能的情况下，对同一部分附加同一标号，并省略重复的说明。

[第1实施方式]

下面，说明本发明的第1实施方式的数据嵌入提取系统1。图1是数据嵌入提取系统1的概略结构图。如图1所示，数据嵌入提取系统1构成为具有数据嵌入装置100和数据提取装置110。数据嵌入装置100例如是用于在音乐等音响信号中嵌入任意传送数据的装置，例如将著作权信息等作为水印数据而嵌入在音响信号中。并且，数据提取装置110是用于提取嵌入在音响信号中的传送数据的装置。下面，详细说明构成数据嵌入提取系统1的各结构要素。

如图1所示，数据嵌入装置100构成为具有嵌入装置101和扬声器106。嵌入装置101用于在音响信号中嵌入传送数据，其构成为具有相位调节部102(相位调节单元)、平滑部103(平滑单元)、滤波器部104、以及合成部105(嵌入单元)。并且，扬声器106用于向数据提取装置110空中传播嵌入有传送数据的合成音响信号。该扬声器106作为能够产生例如人类可听频域即20Hz～20kHz左右的振动频率的装置，使用通常的音响信号输出装置。下面，参照图2～图5详细说明构成该数据嵌入装置100的各结构要素。

图2是用于说明嵌入装置101的动作的框图。首先，以规定的帧单位将音响信号A₁输入到相位调节部102中。所谓该规定的帧单位是在数据嵌入装置100和数据提取装置110之间预先适当设定的单位，是之后利用合成部105在音响数据A₁中嵌入传送数据C时的帧单位。相位调节部102对所输入的帧的时间序列信号进行相位调节。

更具体而言，相位调节部102通过傅立叶变换将所输入的帧的时间序列信号变换为频域的频谱序列。然后，相位调节部102一边逐渐改变各频谱的系数的实数项和虚数项的比率，一边计算音响信号A₁和扩展码序列B的相关值。另外，该扩展码序列B是为了对传送数据C进行扩展而预先适当设定的。然后，在所嵌入的传送数据C的数据位为0时，相位调节部102调节音响信号A₁的相位，以使在帧的开头点在正方向上相关值变强。并且，在所嵌入的传送数据C的数据位为1时，相位调节部102调节音响信号A₁的相位，以使在帧的开头点在负方向上相关值变强。

这样，以帧单位来进行相位调节而生成的相位调节音响信号A₂的相位在相邻的前后帧中不连续。因此，平滑部103对帧的边界部分的相位的不连续进行平滑化，降低由于相位不连续而产生的噪声。更具体而言，平滑部103在帧的边界部分的附近，分别对没有进行相位调节的音响信号A₁和进行了相位调节的相位调节音响信号A₂乘以一定的比率来进行合成，生成平滑化信号A₃。

例如，在使用于对帧前后的100个样本的区间进行平滑化的情况下，对没有进行相位调节的音响信号A_1i乘以(100-i)/100，并且对进行了相位调节的相位调节音响信号A_2i乘以i/100，来对它们进行合成，从而生成从帧的开头起第i个样本的平滑化信号A_3i。另外，生成从帧的最末尾起第i个样本的平滑化信号A₃时，也使用同样的方法。平滑部103将所生成的平滑化信号A₃输出到滤波器部104以及合成部105。

滤波器部104以相同的帧单位通过FFT(快速傅立叶变换)将由平滑部103所生成的平滑化信号A₃变换为频域，计算出频率屏蔽阈值。另外，对于此时的频率屏蔽阈值的计算，使用公知的心理听觉模型。图3表示通过该心理听觉模型所计算出的频率屏蔽阈值。在图3中，用实线所示的线图X表示音响信号A₁的频谱，用虚线所示的线图Y表示频率屏蔽阈值。并且，滤波器部104根据所计算出的频率屏蔽阈值，对具有与该频率屏蔽阈值相同频率特性的直线相位的频率响应进行傅立叶逆变换，从而形成频率屏蔽滤波器(masking filter)。

滤波器部104被输入对传送数据C乘以扩展码序列B并扩展到整个频带的扩展信号D₁。然后，滤波器部104对扩展信号D₁使用频率屏蔽滤波器，在不超过屏蔽阈值的范围内对其滤波的结果进行振幅调节，从而根据频率屏蔽阈值生成对各频谱进行加权的频率加权扩展信号D₂。然后，滤波器部104将所生成的频率加权扩展信号D₂输出到合成部105。

合成部105对从滤波器部104输入的频率加权扩展信号D₂和从平滑部103输入的平滑化信号A₃进行合成，从而生成合成音响信号E₁。然后，在将合成部105所生成的合成音响信号E₁输出到扬声器106时，扬声器106向接收目的地的数据提取装置110空中传播该合成音响信号E₁。

在图4中，在图3所示的音响信号A₁的频谱(用线图X表示)和频率屏蔽阈值(用线图Y表示)上，追加记载有扩展信号D₁的频谱(用线图Z₁表示)。另外，为了区分线图X和线图Z₁，在图4中用细实线表示线图X，用粗实线表示线图Z₁。在该图4中，因为扩展信号D₁的频谱在低频部分中比屏蔽阈值低很多，而在高频成分中大于屏蔽阈值，所以扩展信号D₁的增益效率不高，并且还能够感知到噪声。

另一方面，在图5中，在图3所示的音响信号A₁的频谱(用线图X表示)和频率屏蔽阈值(用线图Y表示)上，追加记载有频率加权扩展信号D₂的频谱(用线图Z₂表示)。另外，为了区分线图X和线图Z₂，在图5中用细实线表示线图X，用粗实线表示线图Z₂。这样，通过对扩展信号D₁进行加权，能够嵌入传送数据C(扩展信号D₂)直到屏蔽阈值边界。

返回图1，数据提取装置110构成为具有麦克风111、提取装置112和纠错部116。麦克风111用于接收从数据嵌入装置100的扬声器106空中传播来的合成音响信号E₁，使用通常的音响信号获取装置。并且，提取装置112用于提取嵌入在麦克风111所接收的合成音响信号E₁中的传送数据C₀，该提取装置112构成为具有去除部113(第1去除单元)、同步部114(第1同步单元)和提取部115(第1提取单元)。并且，纠错部116用于根据所提取出的传送数据C₀进行纠错，并还原成原来的传送数据C。下面，参照图6详细说明构成该数据提取装置110的各结构要素。

图6是用于说明该提取装置112的动作的框图。首先，麦克风111将从数据嵌入装置100的扬声器106接收到的合成音响信号E₁输入到去除部113。去除部113由所谓的高通滤波器构成，从所输入的合成音响信号E₁中去除低频成分，来生成低频去除音响信号(第1低频去除音响信号)E₂。这样，通过去除部113预先去除与扩展码序列B的相关强的低频成分，从而能够降低对传送数据C的识别错误率。去除部113将所生成的低频去除音响信号E₂输出到同步部114。另外，第1实施方式的去除部113由数字滤波器构成，该数字滤波器对麦克风111所接收到的合成音响信号E₁进行A/D变换，并对该A/D变换后的信号进行滤波处理。

同步部114从去除部113被输入低频去除音响信号E₂，根据数据嵌入装置100在音响数据A₁中嵌入传送数据C时的帧单位，使低频去除音响信号E₂同步。更具体而言，同步部114逐次偏移几个样本来计算出所输入的低频去除音响信号E₂和扩展码序列B的相关值，检测出相关值最高的点来作为帧的开头点(同步点)。同步部114将检测出同步点的低频去除音响信号E₂输出到提取部115。

提取部115根据由同步部114所检测出的同步点，对低频去除音响信号E₂进行帧分割。然后，针对所分割的每个帧乘以扩展码序列B，根据所计算出的相关值来提取出传送数据C₀。更具体而言，如果所计算出的相关值为正，则提取部115将0识别为传送数据C₀，如果所计算出的相关值为负，则提取部115将1识别为传送数据C₀。提取部115将所识别出的传送数据C₀输出到纠错部116，纠错部116根据所输入的传送数据C₀进行纠错，并还原成原来的传送数据C。

接着，参照图7说明第1实施方式的数据嵌入提取系统1的控制流程。图7是用于说明由数据嵌入装置100在音响数据A₁中嵌入传送数据C，并由数据提取装置110还原传送数据C的动作的流程图。

首先，以规定的帧单位来将音响信号A₁输入到相位调节部102中，对所输入的帧的时间序列信号进行相位调节(步骤S101)。接着，利用平滑部103对在步骤S101中进行相位调节而得到的相位调节音响信号A₂进行平滑化(步骤S102)。

接着，将在步骤S102中进行平滑化而得到的平滑化信号A₃变换为频域，计算出频率屏蔽阈值(步骤S103和步骤S104)。根据在步骤S104中计算的频率屏蔽阈值，形成频率屏蔽滤波器(步骤S105)。

接着，对在步骤S105中形成的频率屏蔽滤波器，输入对传送数据C乘以扩展码序列B并扩展为整个频带的扩展信号D₁，来进行滤波(步骤S106)。然后，在不超过屏蔽阈值的范围内对步骤S106中的滤波结果进行振幅调节，生成频率加权扩展信号D₂(步骤S107)。

对在步骤S107中生成的频率加权扩展信号D₂和在步骤S102中生成的平滑化信号A₃进行合成(步骤S108)。然后，将在步骤S108中合成的合成音响信号E₁利用扬声器106空中传播到接收目的地的数据提取装置110(步骤S109)。

在步骤S109中发送的合成音响信号E₁被输入到数据提取装置110的麦克风111(步骤S110)。接着，通过滤波从在步骤S110中输入的合成音响信号E₁中去除低频成分，生成低频去除音响信号E₂(步骤S111)。

接着，根据在音响数据A₁中嵌入传送数据C时的帧单位，使在步骤S111中生成的低频去除音响信号E₂同步(步骤S112)。

从在步骤S112中取得同步的低频去除音响信号E₂中提取传送数据C₀(步骤S113)。当将在步骤S113中提取出的传送数据C₀输入到纠错部116来纠正识别错误时，还原成原来的传送数据C(步骤S114)。

接着，说明第1实施方式的作用和效果。根据第1实施方式的数据嵌入提取系统1，作为传送数据C的发送侧的数据嵌入装置100根据嵌入传送数据C的帧单位，对音响信号A₁的相位进行调节，然后嵌入传送数据C，以使作为传送数据C的接收侧的数据提取装置110易于提取传送数据C。而且，在数据提取装置110中，根据对所接收的合成音响信号E₁进行相位调节的该帧单位，使帧同步后进行传送数据C的还原。由此，数据提取装置110易于提取数据嵌入装置100所嵌入的传送数据C，能够减少对所提取的传送数据C的识别错误。

另外，在第1实施方式中，去除部113去除数据提取装置110所接收的合成音响信号E₁的低频成分。低频成分的相位偏移对人类的听觉造成的影响很大，并且相位调节的效果小。因此，通过预先去除低频成分，然后进行以后的处理，从而能够适当地提取传送数据C，而不会对音响数据A₁的音质造成影响。

并且，在第1实施方式中，相位调节部102通过傅立叶变换而将音响信号A₁变换成频域的频谱序列，改变各频谱的系数的实数项和虚数项的比率，从而能够容易地对音响信号A₁进行相位调节。

并且，在第1实施方式中，平滑部103对帧的边界部分的相位的不连续进行平滑化。由此，能够去除相位调节时由于相位不连续而产生的噪声。

[第2实施方式]

下面，说明本发明的第2实施方式的数据嵌入提取系统2。图8是数据嵌入提取系统2的概略结构图。如图8所示，数据嵌入提取系统2构成为具有数据嵌入装置200和数据提取装置210。下面，参照图8～图10详细说明构成该数据嵌入提取系统2的各结构要素。图9是用于说明数据嵌入装置200的嵌入装置201的动作的框图。并且，图10是用于说明数据提取装置210的提取装置212的动作的框图。另外，对与第1实施方式重复的部分省略说明。

如图8所示，数据嵌入装置200构成为具有嵌入装置201和扬声器，嵌入装置201具有分割部202(分割单元)、相位调节部203(相位调节单元)、重构部204(重构单元)、平滑部205(平滑单元)、滤波器部206、以及合成部(嵌入单元)207。首先，如图9所示，将音响信号A₁输入到分割部202。分割部202将输入的音响信号A₁分割为各频带的每个子带，生成子带信号(A₁₁，A₁₂，...，A_1n)。然后，分割部202将所生成的子带信号(A₁₁，A₁₂，...，A_1n)输出到相位调节部203。

相位调节部203分别对从分割部202输入的各频带的子带信号(A₁₁，A₁₂，...，A_1n)独立地进行相位调节。更具体而言，相位调节部203根据嵌入传送数据C的帧单位，一边使子带信号(A₁₁，A₁₂，...，A_1n)逐次延迟几个样本，一边计算与扩展码序列B的相关值。然后，为了使得在同步点在正方向上相关值变高，在嵌入传送数据C的帧中，即在所嵌入的传送数据C的数据位为0的帧中，延迟几个样本，以使与扩展码序列B的相关值在正方向上变高。

并且，为了在同步点在负方向上相关值变高，在嵌入传送数据C以使的帧中，即在所嵌入的传送数据C的数据位为1的帧中，延迟几个样本，以使与扩展码序列B的相关值在负方向上变高。相位调节部203将进行相位调节而得到的相位调节子带信号(A₂₁，A₂₂，...，A_2n)输出到重构部204。另外，在低频的子带信号中，因为即使延迟几个样本相关值也几乎不变化，所以有时不进行相位调节而保持相位连续性的方法是高效的。

重构部204从相位调节部203被输入相位调节子带信号(A₂₁，A₂₂，...，A_2n)，重构为一个音响信号。重构部204将所重构的一个音响信号输出到平滑部205，平滑部205对帧的边界部分的相位的不连续进行平滑化，降低因相位不连续而产生的噪声。

返回图8，数据提取装置210构成为具有麦克风211、提取装置212和纠错部216，提取装置212具有同步部213(第2同步单元)、去除部214(第2去除单元)和提取部215(第2提取单元)。

首先，如图10所示，将麦克风211从数据嵌入装置200的扬声器接所收到的合成音响信号E₁输入到同步部213。同步部213根据数据嵌入装置200在音响数据A₁中嵌入传送数据C时的帧单位，使所输入的合成音响信号E₁同步。更具体而言，同步部213逐次偏移几个样本来计算所输入的合成音响信号E₁和扩展码序列B的相关值，将相关值最高的点识别为帧的开头点(同步点)。同步部213将检测出同步点的合成音响信号E₁输出到去除部214。

去除部214由所谓的高通滤波器构成，被输入检测出同步点的合成音响信号E₁，去除低频成分，来生成低频去除音响信号(第2低频去除音响信号)E₃。去除部214将所生成的低频去除音响信号E₃输出到提取部215。

提取部215根据由同步部213所检测出的同步点，对从去除部214输入的低频去除音响信号E₃进行帧分割。然后，针对所分割的每个帧乘以扩展码序列B，根据所计算出的相关值来提取出传送数据C₀。更具体而言，如果所计算出的相关值为正，则提取部215将0识别为传送数据C₀，如果所计算出的相关值为负，则提取部215将1识别为传送数据C₀。提取部215将所识别出的传送数据C₀输出到纠错部216，纠错部216根据所输入的传送数据C₀进行纠错，并还原成原来的传送数据C。

接着，参照图11说明第2实施方式的数据嵌入提取系统2的控制流程。图11是用于说明由数据嵌入装置200在音响数据A₁嵌入传送数据C，并由数据提取装置210还原传送数据C的动作的流程图。

首先，将输入到分割部202的音响信号A₁分割成各频带的每个子带，生成子带信号(A₁₁，A₁₂，...，A_1n)(步骤S201)。接着，分别对在步骤S201中生成的子带信号(A₁₁，A₁₂，...，A_1n)独立地进行相位调节(步骤S202)。

接着，将在步骤S202中针对每个子带独立地进行了相位调节的相位调节子带信号(A₂₁，A₂₂，...，A_2n)重构为一个音响信号(步骤S203)。然后，利用平滑部205对在步骤S203中所重构的一个音响信号进行平滑化(步骤S204)。

接着，将在步骤S204中进行平滑化而得到的平滑化信号A₃变换为频域，计算频率屏蔽阈值(步骤S205和步骤S206)。根据在步骤S206中计算的频率屏蔽阈值，形成频率屏蔽滤波器(步骤S207)。

接着，对在步骤S207中形成的频率屏蔽滤波器，输入对传送数据C乘以扩展码序列B而扩展到整个频带的扩展信号D₁，来进行滤波(步骤S208)。然后，在不超过屏蔽阈值的范围内对步骤S208中的滤波结果进行振幅调节，生成频率加权扩展信号D₂(步骤S209)。

对在步骤S209中生成的频率加权扩展信号D₂和在步骤S204中生成的平滑化信号A₃进行合成(步骤S210)。然后，利用扬声器将在步骤S210中所合成的合成音响信号E₁空中传播到接收目的地的数据提取装置210(步骤S211)。

将在步骤S211中发送的合成音响信号E₁输入到数据提取装置210的麦克风211(步骤S212)。接着，根据在音响数据A₁中嵌入传送数据C时的帧单位，使在步骤S212中输入的合成音响信号E₁同步(步骤S213)。

接着，通过滤波从在步骤S213中取得同步的合成音响信号E₁中去除低频成分，生成低频去除音响信号E₃(步骤S214)。接着，根据通过步骤S213所检测出的同步点，从通过步骤S214所生成的低频去除音响信号E₃中提取传送数据C₀(步骤S215)。然后，当将在步骤S215中提取出的传送数据C₀输入到纠错部216来纠正识别错误时，还原成原来的传送数据C(步骤S216)。

接着，说明第2实施方式的作用和效果。根据第2实施方式的数据嵌入提取系统2，将所输入的音响信号A₁分给成各频带的每个子带，分别对所分割的子带信号(A₁₁，A₁₂，...，A_1n)独立地进行相位调节。由此，因为能够针对每个子带进行极细的相位调节，所以能够增大由相位调节部203进行的相位调节的效果。

并且，在第2实施方式中，通过使子带信号(A₁₁，A₁₂，...，A_1n)的时间序列不延迟几个采样时间而是提前，能够容易地对子带信号(A₁₁，A₁₂，...，A_1n)进行相位调节。

并且，在第2实施方式中，在由同步部213取得合成音响信号E₁的同步后，去除合成音响信号E₁的低频成分。在进行同步时，如果使用包含合成音响信号E₁的低频成分的所有频率成分，则易于检测同步的开头点，能够降低开头点的检测错误。

以上，说明了本发明的优选实施方式，但本发明当然不限于上述实施方式。

例如，也能够实现将第1实施方式的数据嵌入装置100和第2实施方式的数据提取装置210组合的数据嵌入提取系统、将第2实施方式的数据嵌入装置200和第1实施方式的数据提取装置110组合的数据嵌入提取系统。

并且，第1实施方式的去除部113也可以由直接对所输入的信号进行滤波处理的模拟滤波器来构成，对滤波后的信号进行A/D变换后输出。

Claims

1.一种数据嵌入装置，其特征在于，该数据嵌入装置具有：

相位调节单元，其根据嵌入任意传送数据的帧单位，来对音响信号进行相位调节；以及

嵌入单元，其在由所述相位调节单元进行了相位调节的音响信号中嵌入所述传送数据；

所述相位调节单元将所述音响信号变换为频域信号，对所述频域信号进行相位调节：逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率，并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值，在所述传送数据的数据位为0时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强，在所述传送数据的数据位为1时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。

2.根据权利要求1所述的数据嵌入装置，其特征在于，

所述数据嵌入装置具有分割单元，该分割单元将所述音响信号分割为多个子带信号，

所述相位调节单元根据所述帧单位，对由所述分割单元所分割的所述子带信号进行相位调节，

所述数据嵌入装置具有重构单元，该重构单元将由所述相位调节单元进行了相位调节的子带信号重构为一个音响信号，

所述嵌入单元在由所述重构单元重构的所述一个音响信号中嵌入所述传送数据。

3.根据权利要求1所述的数据嵌入装置，其特征在于，

所述相位调节单元使所述音响信号的时间序列偏移规定的采样时间。

4.根据权利要求1所述的数据嵌入装置，其特征在于，

该数据嵌入装置具有平滑单元，该平滑单元在作为所述音响信号的规定帧和与该规定帧在时间上相邻的其他帧的边界的部分，对没有进行相位调节的音响信号和由所述相位调节单元进行了相位调节的相位调节音响信号进行合成。

5.一种数据提取装置，其特征在于，该数据提取装置具有：

第1去除单元，其去除嵌入有任意传送数据的音响信号的低频成分，来生成第1低频去除音响信号；

第1同步单元，其根据在所述音响信号中嵌入所述传送数据时的帧单位，使由所述第1去除单元所生成的所述第1低频去除音响信号同步；以及

第1提取单元，其将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从由所述第1同步单元取得同步的第1低频去除音响信号中提取所述传送数据。

6.一种数据提取装置，其特征在于，该数据提取装置具有：

第2同步单元，其根据在音响信号中嵌入任意传送数据时的帧单位，使所述音响信号同步；

第2去除单元，其去除由所述第2同步单元取得同步的音响信号的低频成分，来生成第2低频去除音响信号；以及

第2提取单元，其将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从由所述第2去除单元所生成的所述第2低频去除音响信号中提取所述传送数据。

7.一种数据嵌入方法，其特征在于，该数据嵌入方法具有以下步骤：

相位调节步骤，在该步骤中，相位调节单元根据嵌入任意传送数据的帧单位，来对音响信号进行相位调节；以及

嵌入步骤，在该步骤中，嵌入单元在通过所述相位调节步骤进行了相位调节的音响信号中嵌入所述传送数据；

在所述相位调节步骤中，所述相位调节单元将所述音响信号变换为频域信号，对所述频域信号进行相位调节：逐渐改变所述频域信号各频谱的系数的实数项和虚数项的比率，并计算所述音响信号与对所述传送数据进行扩展而预设的扩展序列的相关值，在所述传送数据的数据位为0时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在正方向上变强，在所述传送数据的数据位为1时，调节所述音响信号的相位，使所述音响信号和所述扩展序列的相关值在所述帧的开头点在负方向上变强。

8.一种数据提取方法，其特征在于，该数据提取方法具有以下步骤：

第1去除步骤，在该步骤中，第1去除单元去除嵌入有任意传送数据的音响信号的低频成分，来生成第1低频去除音响信号；

第1同步步骤，在该步骤中，第1同步单元根据在所述音响信号中嵌入所述传送数据时的帧单位，使通过所述第1去除步骤所生成的所述第1低频去除音响信号同步；以及

第1提取步骤，在该步骤中，第1提取单元将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从通过所述第1同步步骤取得同步的第1低频去除音响信号中提取所述传送数据。

9.一种数据提取方法，其特征在于，该数据提取方法具有以下步骤：

第2同步步骤，在该步骤中，第2同步单元根据在音响信号中嵌入任意传送数据时的帧单位，使所述音响信号同步；

第2去除步骤，在该步骤中，第2去除单元去除通过所述第2同步步骤取得同步的音响信号的低频成分，生成第2低频去除音响信号；以及

第2提取步骤，在该步骤中，第2提取单元将每个帧乘以扩展序列，根据所述音响信号和所述扩展序列的相关值，当该相关值为正时，将所述传送数据识别为0，当该相关值为负时，将所述传送数据识别为1，从通过所述第2去除步骤所生成的所述第2低频去除音响信号中提取所述传送数据。