CN1123866C - 一种语音编/解码方法和装置 - Google Patents
一种语音编/解码方法和装置 Download PDFInfo
- Publication number
- CN1123866C CN1123866C CN98105557A CN98105557A CN1123866C CN 1123866 C CN1123866 C CN 1123866C CN 98105557 A CN98105557 A CN 98105557A CN 98105557 A CN98105557 A CN 98105557A CN 1123866 C CN1123866 C CN 1123866C
- Authority
- CN
- China
- Prior art keywords
- parameter
- vector
- subframes
- surplus
- subframe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Abstract
一种将语音编码成经卫星信道传输的90毫秒位帧的方法及声码器。将语音信号量化后的数字样本分到各子帧中并估计每一子帧的谱幅度参数。将子帧序列中两个连续子帧结合成一块并统一量化它们的谱幅度参数。统一量化结合一块两子帧中作为谱幅度参数和预测谱幅度参数之差的余量参数,矢量量化器将其量化为一组编码谱位。将冗余差错控制位加到每块的编码谱位上以防止其出现位错误,并将两连续块中这些数据位结合到90毫秒位帧中。
Description
技术领域
本发明涉及语音编码与解码。
背景技术
语音的编码和解码有大量的应用并有了广泛的研究。通常,一种语音编码,比如语音压缩,寻求在没有实际地降低语音质量和可懂性的前提下,能降低表达语音信号所需的数据率。语音压缩技术可以用语音编码器实现。
语音编码器一般包括编码器和解码器。编码器由数字化的语音信号生成压缩的位流,例如一个麦克风产生的模拟信号通过一个模/数变换器所生成的信号。解码器将压缩的位流转换成语音的数字表达方式以适于通过数/模变换器和扬声器将语音信号重现。在许多应用中,编码器和解码器是分开的,位流在二者之间的信道上传输。
语音编码器的一个关键参数是编码器所达到的压缩量,它可以用编码器产生位流的位速率来衡量。编码器的位速率一般是所需逼真度(即:语音质量)和所用语音编码器类型的函数。不同类型的编码器被设计为在高速率(8kbs以上),中速率(3~8kbs)和低速率(低于3kbs)下工作。近来,中速率和低速率的语音编码器在大范围的移动通信应用(例如:蜂窝电话,卫星电话,地面移动无线电话,和飞行中的电话)中受到注意。这些应用典型地需要高质量语音和容忍由声学噪声和通道噪声(如:位错误)造成的影响。
声码器是一种明显极适合用于移动通信的语音编码器。声码器将语音模拟成一个系统在短时间间隔内对一激励的响应。声码器的实例包括线性预测声码器,同态声码器,通道声码器,正弦变换编码器(“STC”),多带激励(“MBE”)声码器,和改进多带激励(“IMBE”)声码器。在这些声码器中,语音被分为许多短段(典型值为10~40ms),每段由一组模型参数来表征。这些参数一般表达每个语音段的几个基本单元,如:段音调、声音状态和谱包络。声码器可以用大量的已知方法之一来表达这些参数中的每一个。例如音调可以表达为音调周期、基音频率、或长期预测延迟。类似地,声音状态可以表达为一个或多个浊音/清音判决,声音概率度量、或周期性能量对随机性能量的比值。频谱包络经常表达为全极点滤波器响应,也可以表达为一组频谱幅度或其它频谱度量值。
既然允许用少量参数来表达一个语音段,那么基于模型的语音编码器,比如声码器,一般能够在中到低的数据率下运行。然而,基于模型的系统的质量依赖于底层模型的精度。所以,如果要求这些语音编码器得到高的语音质量的话就必须使用高逼真度的模型。
由Griffin和Lim开发的多带激励语音模型展示给人们的性能是可提供高质量的语音并可在中到低的位速率上良好地工作。这一模型采用一个灵活的声音结构,这一结构允许它产生听起来更自然的语音,而且更能容忍声学背景噪声的出现。这些特性使得MBE语音模型被大量的商用移动通信所采用。
MBE语音模型用一个基音频率,一组二进制浊音/清音(V/UV)的度规(metric)和一组谱幅度来表达语音段。MBE模型对于较传统模型的一个基本优势是在语音表达上。MBE模型将传统的每段单V/UV判决推广为一组判决,每一判决代表一特定频带上的声音状态。语音模型中这种增加的灵活性使得MBE模型可以更好地适应混合声音,比如一些摩擦音。另外,这种增加的灵活性使得被声学背景噪声所污染的语音可以更精确地表达出来。广泛的测试显示了这种推广提高了语音的质量和可懂性。
基于MBE语音编码器中的编码器为每个语音段估计一组模型参数。MBE模型参数包括:一个基音频率(音调周期的倒数)、一组表征声音状态的V/UV度规或判决、和一组表征谱包络的谱幅度。为每段估计了MBE模型参数后,编码器对参数进行数字化以产生一数据位帧。在交错处理并传输所生成位流到相应解码器之前,编码器可以用纠错码/检错码选择性地保护一些位。
解码器将收到的位流转换回各个帧。作为此变换的一部分,解码器可以进行解交错处理和差错控制解码以检错和纠错。然后,解码器用位帧重构MBE模型参数,解码器利用这些参数合成一语音信号,这一信号感觉上极象原语音信号。解码器可以合成各个浊音和清音份,然后可以增加浊音和清音成份来产生最终的语音信号。
在基于MBE的系统中,编码器用谱幅度表征所估计的基音频率的每一谐波的谱包络。典型地,根据包含相应谐波的频带是否已被定为浊音或清音,将每一谐波标识为浊音或清音。然后编码器为每一谐波频率估计一个谱幅度。当一谐波频率已被定为浊音,编码器可以使用幅度估计器,此估计器有别于一个谐波频率已被定为清音时所用的幅度估计器。在解码器一方,要识别浊音和清音的谐波,并且各个浊音和清音成份用不同的程序合成。清音成份可用加权重叠相加方法来合成,以滤除白噪声信号。此滤波器设置为将定为浊音部分的频率区域归零,而将其它区域与被定为清音部分的谱幅度进行匹配。浊音成份用一个可调谐振荡器组来合成,其中给每一个被标识为浊音的谐波分配一个振荡器。对瞬时幅度、频率和相位进行内插以与相邻段的相应参数匹配。
基于MBE的语音编码器包括IMBETM语音编码器和AMBE语音编码器。AMBE语音编码器是作为早期基于MBE技术的改进型而开发的。它包含一个估计激励参数(基音频率和V/UV判决)的更强方法,此方法可更好地跟踪实际语音中出现的变化与噪声。AMBE语音编码器采用了一个滤波器组和一个非线性方法来产生一组通道输出,此滤波器组一般包括十六个通道。由通道输出可以可靠地估计出激励参数。结合并处理通道输出来估计基音频率,然后处理在几个(如:八个)声音频带中每一频带的这些输出,来估计每一浊音段的一个V/UV判决(或其它声音度规)。
AMBE语音编码器也可以不依赖于声音判决来估计谱幅度。做这一步,语音编码器要为每一加窗的语音子帧做快速付利叶变换(FFT),然后在频率值为估计的基音频率的倍数的频率范围内平均能量。此方法可以进一步包括补偿处理,以在估计的谱幅度中去掉由FFT采样间隔所引入的人为因数。
AMBE语音编码器也可包含一个相位合成成份,在没有从编码器到解码器清晰地传输相位信息的情况下,再生成用于浊音语音合成中的相位信息。与IMBETM语音编码器的情况相似,可以应用基于V/UV判决的随机相位合成。另一方面,解码器可以对重构的谱幅度进行一平滑核心操作(smoothing kernel)以产生相位信息,这样产生的信号在感觉上比用随机产生相位信息的方法产生的信号更接近于原语音。
以上所提到的这些技术在以下的文献中有所描述:Flanagan,《语音分析,合成和识别》,Springer-Verlag,1972,378页~386页(描述一个基于频率的语音分析-合成系统);Jayant等,《波形的数字编码》,Prentice-Hall,1984,(描述通常的语音编码);美国专利4,885,790号(描述一个正弦处理方法);美国专利5,054,072号(描述一个正弦编码方法);Almeida等,“浊音语音的非定点模型”,IEEE TASSP,Vol.ASSP-31,No.3,June 1983,664-667页,(描述谐波模型和相关的编码器);Almeida等,“可变-频率合成:一个改进的谐波编码方案”,IEEE Proc.ICASSP 84,27.5.1-27.5.4页(描述一个多项式的浊音合成方法);Quatieri等,“基于正弦表示的语音变换”,IEEE TASSP,Vol,ASSP34,No.6,Dec.1986,1449-1986页(描述一个基于正弦表示的分析-合成技术);McAulay等,“基于语音正弦表示的中速率编码”,Proc.ICASSP 85,945-948页,Tampa,FL,March 26-29,1985(描述一个正弦变换的语音编码器);Griffin,“多带激励声码器”,博士论文,M.I.T.,1987(描述多带激励(MBE)语音模型和一个8000bps的MBE语音编码器);Hardwick,“一个4.8kbps的多带激励语音编码器”,硕士论文,M.I.T.,May 1988(描述一个4800bps的多带激励语音编码器);电信工业联合会(TIA),“APCO方案25声码器描述”,Version 1.3,July 15,1993,IS102BABA(描述一个在APCO方案25标准下的7.2kbps的IMBETM语音编码器);美国专利5,081,681号(描述IMBETM随机相位分析);美国专利5,247,579号(描述一种减轻通道错误的方法和基于MBE语音编码器的共振峰强化方法);美国专利5,226,084号(描述基于MBE语音编码器的量化和错误减轻方法);美国专利5,517,511号(描述基于MBE语音编码器的位优先级处理和FEC差错控制方法).
发明内容
本发明的目的是提供一种用于卫星通信系统的新AMBE语音编码器,它可从经移动卫星信道传输的一个低数据率位流生成高质量的语音。这一语音编码器同时具有低数据率,高声音质量,和对背景噪声和信道位错误的容忍力。本发明有希望提高在移动卫星通信的语音编码方面的技术水平。新语音编码器利用新的双子帧谱幅度量化器实现高性能,其中的量化器统一地量化估计出的连续两个子帧的谱幅度。此量化器达到的逼真度可与前面的现有技术系统相比拟,而它用于量化谱幅度参数的位数却较少。AMBE语音编码器在以下文献中有一般性描述:美国专利申请No.08/222,119,申请日为April 4,1994,标题为“激励参数的估计”;美国专利申请No.08/392,188,申请日为February 22,1995,标题为“多带激励语音编码器的谱表示”;和美国专利申请No.08/392,099,申请日为February 22,1995,标题为“利用再生成相位信息的语音合成”,列出的这些文献供参考。
本发明的一个一般特征是,一种将语音编码为在卫星信道中传输的90毫秒位帧的方法。语音信号被数字化为一列数字语音样本,数字语音样本被分到标称时间间隔为22.5毫秒的一列子帧中,同时为每一子帧估计出一组模型参数。一个子帧的模型参数包括一组表示子帧谱信息的谱幅度参数。在此子帧序列中的两个连续子帧结合为一块,一块中两子帧的谱幅度参数被统一地量化。统一量化包括用前一块中的量化的谱幅度参数生成预测的谱幅度参数,计算作为该块的谱幅度参数和预测谱幅度参数之差的余量参数,将一块中的两子帧的余量参数结合,并用矢量量化器将余量参数量化为一组编码的谱位。然后,将冗余差错控制位加到每一块的编码谱位上以防止该块中的编码谱位出现位错误。然后,两个连续块中的附加冗余差错控制位和编码谱位被结合到一个用于在卫星信道中传输的90毫秒的位帧上。
本发明的实施例可以包括如下的一个或多个特点。一块中两子帧的余量参数的结合可包括将每一子帧的余量参数分到各频率块中,对一个频率块中的余量参数实施线性变换,以生成每一子帧的一组变换余量系数,将全部频率块中的少数变换余量系数集合成一个PRBA矢量,并且将每一频率块中剩下的变换余量系数集合成本频率块的一个HOC矢量。对每个子帧的PRBA矢量实施变换可以产生PRBA变换矢量,并且可计算一块的子帧中PRBA变换矢量的矢量和差,来结合变换PRBA矢量。相似地,也可计算每一频率块的矢量和差,来结合本频率块的两子帧的两个HOC矢量。
谱幅度参数可以表示多带激励(“MBE”)语音模型中估计的对数谱幅度。谱幅度可从一个不依赖于声音状态计算的谱中估计出。预测的谱幅度参数可通过对前一块最后一帧的量化谱幅度的线性内插施加小于一的增益来形成。
每块的差错控制位可用包含Golay(格雷)码和Hamming(汉明)码的块码生成。例如:这些码可包含一个[24,12]扩展Golay码,三个[23,12]Golay码,和两个[15,11]Hamming码。
对每个频率块,采用离散余弦变换(DCT)后在两个最低阶的DCT系数上执行一线性2×2变换,可算出变换余量系数。四个频率块可用于此计算,每一频率块的长度近似与子帧中的谱幅度参数的数目成正比。
矢量量化器可包括一个对于PRBA矢量和采用8位加6位加7位的三分路矢量量化器,还包括一个对于PRBA矢量差采用8位加6位的两分路相位量化器。位帧可包括表示由矢量量化器引入的变换余量系数中错误的附加位。
本发明的另一个一般特征是,一种将语音编码为一个在卫星信道中传输的90毫秒位帧的系统。该系统包括:一个数字化器,将语音信号转换成数字语音样本序列;一个子帧发生器,将数字语音样本分到子帧序列中,每个子帧包括许多数字语音样本;一个模型参数估计器,估计每一子帧的包括一组谱幅度参数的一组模型参数;一个结合器,将子帧序列中的两个连续子帧结合成一个块;一个双帧谱幅度量化器,统一地量化此块中的两个子帧的参数。统一量化包括如下过程:由前一块的量化谱幅度参数生成预测谱幅度参数,计算作为谱幅度参数和预测谱幅度参数之差的余量参数,结合一块中两子帧的余量参数,用矢量量化器将结合的余量参数量化为一组编码谱位。此系统也包括:一个差错码编码器,它将冗余差错控制位加到每一块的编码谱位,以保证一块中至少一部分编码谱位没有位错误;还有一个结合器,它将两个连续块的附加冗余差错控制位和编码谱位结合成一个用于在卫星信道中传输的90毫秒位帧。
本发明的再一般特征是,如上文所述,一种从编码的90毫秒帧中解码语音的方法。解码过程包括:将一个位帧分成两个位块,其中每一位块代表两个语音子帧。差错控制解码应用于每一位块,采用本块中的冗余差错控制位来生成至少部分地防止出现位错误的差错解码位,此位。差错解码位用来为一块的两子帧统一地重构谱幅度参数。统一重构包括:用矢量量化器码本重构一组结合余量参数,由此可为两子帧计算出各个余量参数;从前一块的重构谱幅度参数中生成预测谱幅度参数;并且将各个余量参数加到预测谱幅度参数,来生成此块中的每一子帧的重构谱幅度参数。然后用子帧的重构谱幅度参数为每一子帧合成数字语音样本。
本发明的又一般特征是,一种从经卫星信道接收的90毫秒位帧中解码语音的解码器。解码器包括一个分割器,把位帧分成两个位块。每一位块代表两个语音子帧。差错控制解码器用包含于位块中的冗余差错控制位对每个位块进行差错解码,以生成至少部分地防止出现位错误的差错解码位。双帧谱幅度重构器为一块中两子帧统一地重构谱幅度参数,其中统一重构包括:用矢量量化器码本重构一组结合余量参数,由此可为两子帧计算出各个余量参数;从前一块的重构谱幅度参数中生成预测谱幅度参数;并且将各个余量参数加到预测谱幅度参数,以生成此块中每一帧的重构谱幅度参数。合成器用子帧的重构谱幅度参数为每一子帧合成数字语音样本。
附图说明
本发明的其它特点及优势可在下面的参考附图的描述以及后附权利要求书中明显地看出来。
图1是卫星系统简化框图。
图2是图1所示系统的一个通信链路的框图。
图3和图4是图1所示系统的编码器和解码器的框图。
图5是图3所示编码器组件的总框图。
图6是编码器的声音和单音检测功能的流程图。
图7是图5所示编码器的双子帧幅度量化器的框图。
图8是图7所示的幅度量化器的平均矢量量化器的框图。
具体实施方式
本发明的实施例在上下文中描述为一个新的AMBE语音编码器,或声码器,用在IRIDIUM移动卫星通信系统30上,如图1所示。IRIDIUM是一个全球移动卫星通信系统,它由66颗低地球轨道卫星40组成。IRIDIUM通过手持或机载用户终端(比如:移动电话)45提供语音通信。
参考图2,信息传输顶点的用户终端通过麦克风60和模数(A/D)变换器70以8kHz的频率采样语音50,完成语音50数字化工作,实现声音通信。数字化的语音信号通过下文述及的语音编码器80而得到处理。然后发送器90将信号送到通信链路上。在通信链路的另一端,接收器100把信号接收下来并送到解码器110。解码器把信号转换为合成数字语音信号。然后,数模(D/A)变换器120将合成数字语音信号转换为模拟语音信号,此信号由扬声器130转换为可听的语音140。
通信链路用脉冲传输时分复用(TDMA)传送一个90ms的帧。支持两种不同的声音数据率:3467bps的半速率模式(每90ms的帧312位)和6933bps的全速率模式(每90ms的帧624位)。每帧的位被分成语音编码和前向纠错(“FEC”)编码以降低通过卫星信道时经常出现的位错误的概率。
参考图3,每个终端的语音编码器包括一个编码器80和一个解码器110。编码器包括三个主功能块:语音分析200、参数量化210、和错误纠正编码220。相似地,如图4所示,解码器分成错误纠正解码器230,参数重构240(比如:逆量化)和语音合成250等功能块。
语音编码器可在两个不同的数据率下工作:4933bps的全速率和2289bps的半速率。这些数据率代表声音或源位而不计FEC位。FEC位使得全速率和半速率的声码器的数据率分别提高到6933bps和3467bps,如上所述。系统使用一个90ms的声音帧的大小,此帧被分成四个22.5ms的子帧。语音分析与合成是基于子帧执行的,而量化和FEC编码是基于包含两个子帧的45ms的量化块执行的。使用量化和FEC编码的45ms块导致半速率系统中每块有103声音位加53个FEC位,而全速率系统中每块有222个声音位加90个FEC位。另一方面,声音位和FEC位的数目仅可在一个性能影响效果平缓的范围内进行调整。半速率系统中,FEC位在76位到36位的范围内作相应的调整时,就可实现声音位80位到120位范围内的调整。相似地,在全速率系统中,FEC位在132位到52位变化时,声音位就可在180位到260位的范围内调整。量化块中的声音位和FEC位结合而形成一个90ms的帧。
编码器80首先进行语音分析200。语音分析的第一步是每帧的滤波器组处理,紧接着是每帧的MBE模型参数的估计。此步包括用分析窗将输入信号分成重叠的22.5ms的子帧。对于每一个22.5ms子帧,一个MBE子帧参数估计器估计出一组包括一个基音频率(音调周期的倒数)、一组浊音/清音判断(V/UV)和一组谱幅度的模型参数。这些参数用AMBE技术产生。AMBE语音编码器在以下文献中有一般性描述:美国专利申请No.08/222,119,申请日为April 4,1994,标题为“激励参数的估计”;美国专利申请No.08/392,188,申请日为February 22,1995,标题为“多带激励语音编码器的谱表示”;和美国专利申请No.08/392,099,申请日为February 22,1995,标题为“用再生成相位信息合成语音”,列出的所有文献供参考。
另外,全速率声码器包括一个时间片ID,以帮助识别在接收器端无序到达的TDMA包,接收器可用这一信息在解码之前将信息调整到正确的顺序。全面描述了语音信号的语音参数被送到编码器的量化器210块,以作进一步的处理。
参考图5,只要为一帧中的两个连续22.5ms子帧估计出子帧模型参数300和305,基音频率和浊音量化器310就把为两子帧估计出的基音频率编码为一个基音频率位的序列,而且把浊音/清音(V/UV)判决(或其它声音度规)编码为声音位序列。
在所描述的实施例中,用十位来量化和编码两个基音频率。典型地,基音频率被基本估计限制在大约[0.008,0.05]的范围内,此处1.0为奈奎斯特频率(8kHz),并且基本量化器被限制在一个相似的范围。既然一给定子帧的量化基音频率的倒数一般与L成正比,L为此子帧的谱幅度数(L=带宽/基音频率),基音频率的最高有效位(MSB)一般对位错误有敏感性,所以在FEC编码中赋予高级优先级。
上述实施例在半速率时用八位且在全速率时用十六位来对两子帧的声音信息编码。声音量化器利用分配的位在选定的八个声音频带的各频带上编码二进制声音状态(如:1=浊音,0=清音),此处声音状态由语音分析时估计的声音度规确定。这些声音位对位错误有中度的敏感性,所以在FEC编码时就分配了中级优先级。
在结合器330中,结合基音频率位和声音位与由双子帧幅度量化器320来的量化谱幅度位,并且为45ms的块执行前向纠错(FEC)。然后,在结合器340中形成90ms的帧,它将两个连续的45ms的量化块结合成一个单独帧350。
编码器含有一个自适应声音活动检测器(VAD),它用程序600将每个22.5ms的子帧分类为声音类、背景噪声类、或单音类。如图6所示,VAD算法用本地信息区别声音子帧和背景噪声(步骤605)。如果每一45ms块的两子帧被分为噪声类(步骤610),那么编码器将当前的背景噪声量化成特定的噪声块(步骤615)。当组成一个90ms帧的两个45ms块同时被分成噪声类时,系统可选择不传输此帧到解码器而且解码器将用以前接收到的噪声数据填补丢失的帧。这种语音活性传输技术用仅传输必要的声音帧和个别的噪声帧的方法,提高了系统的性能。
本编码器的特点也在于支持DTMF、呼叫进程(如:拨号,占线和回铃)和单个单音的单音检测和传输。编码器检查每个22.5ms子帧以确定当前子帧是否包括一个有效的单音信号。如果在45ms块中的两个子帧中的一个中检测到单音(步骤620),编码器就量化在一个如表1所示的特定单音块中检测到的单音参数(幅度和指数)(步骤625),并在将此块传输到解码器作后续分析之前进行FEC编码。如果没有检测到单音,就对一个标准的声音块进行量化,如下所述(步骤630)。
表1:单音块中位表示
半 速 率 | 全 速 率 | ||
b[ ]单元 # | 值 | b[ ]单元 # | 值 |
0-34-910-1213-1415-1920-2728-3536-43.. | 1516幅度的3个MSB0幅度的5个LSB检测的单音指数检测的单音指数检测的单音指数.. | 0-78-1516-1819-2021-2526-3334-4142-49.. | 212212幅度的3个MSB0幅度的5个LSB检测的单音指数检测的单音指数检测的单音指数.. |
84-9192-99100-102 | 检测的单音指数检测的单音指数0 | 194-201202-209210-221 | 检测的单音指数检测的单音指数0 |
声码器包含VAD和单音检测以将每个45ms的块分成以下几类:标准声音块,特定单音块,或特定噪声块。当一个45ms块没有分类为特定单音块,那么组成该块的子帧对的(由VAD确定的)声音和噪声信息被量化。将可用位(半速率为156,全速率为312)分配给模型参数和FEC编码,如表2所示,此处时间片ID是一个特定的用于全速率接收机的参数,用它可以确定接收时次序混乱的帧的正确次序。恢复用于激励参数(基音频率和声音度规)、FEC编码和时间片ID的位后,在半速率系统中有85位提供给谱幅度,而在全速率系统中则有183位提供给谱幅度。为支持具有最小附加复杂度的全速率系统,全速率幅度量化器使用与半速率系统相同的量化器,再加上一个用标量量化来编码未量化谱幅度和半速率量化器量化输出之差的差错量化器。
表2 45ms声音或噪声块的位分配
声码器参数 | 位数(半速率) | 位数(全速率) |
基音频率声音度规增益PRBA矢量HOC矢量时间片IDFEC | 1085+5=108+6+7+8+6=354×(7+3)=40012+3×11+2×4=53 | 16165+5+2×2=148+6+7+8+6+2×12=594×(7+3)+2×(9+9+9+8)=11072×12+6×11=90 |
总计 | 156 | 312 |
双子帧量化器用来量化谱幅度。此量化器结合了对数压缩扩展、谱估计、离散余弦变换(DCT)及矢量和标量量化方法。以每位的逼真度来衡量,它效率高且复杂度适当。此量化器可以看作一个两维的预测变换编码器。
图7示例了双子帧幅度量化器,它接收自两连续22.5ms子帧的MBE参数估计器来的输入1a和1b。输入1a代表奇数22.5ms子帧的谱幅度并给定一个标号1。子帧号1的幅度数标为L1。输入1b代表偶数22.5ms子帧的谱幅度并给定一个标号0。子帧号0的幅度数标为L0。
输入1a通过一个对数压缩扩展器2a,对包含在输入1a的L1个幅度中每一个作以2为底的对数运算,同时以下列方式产生有L1单元的另一个矢量:
y[i]=log2(x[i]) (i=1,2,…,L1)
此处,y[i]表示信号3a。扩展器2b对包含在输入1b的L0个幅度中的每一个作以2为底的对数运算,并以相似的方式产生有L1单元的另一个矢量:
y[i]=log2(x[i]) (i=1,2,…,L0)此处y[i]表示输入信号3b。
在压缩扩展器2a和2b之后,均值计算器4a和4b计算每一子帧的均值5a与5b。均值,或增益值,代表子帧的平均语音电平。在每帧中,通过计算两个子帧每一个的对数谱幅度的均值并在这一子帧中加上依赖于谐波数目的偏移量来确定二增益值5a,5b。
对数谱幅度3a的均值计算方法为: 此处的输出y代表均值信号5a。
对数谱幅度3b的均值4b计算方法相似,为: 此处的输出y代表均值信号5b。
均值信号5a和5b由一个量化器6来量化,图8示例了此量化器,图中均值信号5a和5b被分别称作均值1和均值2。首先,平均器810平均这两个均值信号。平均器的输出为0.5×(均值1+均值2)。然后,平均值由一个五位的均匀标量量化器820量化。量化器820的输出形成量化器6的输出的首先五位。然后,量化器的输出位被五位逆均匀标量量化器830作逆量化。减法器835在输入值均值1和均值2中减去逆量化器830的输出,以产生给五位矢量量化器840的输入。这两个输入就构成了一个要量化的二维矢量(z1和z2)。此矢量与附录A(增益VQ码本(5位))的表中每一个二维矢量(由x1(n)和x2(n)组成)相比较。可用平方距离e对二者进行比较,如下式:
e(n)=[x1(n)-z1]2+[x2(n)-z2]2,(n=0,1,…,31)附录A中使平方距离e最小的矢量选出来产生块6输出的最后五位。矢量量化器840的输出的五位与五位均匀标量量化器的五位输出通过结合器850结合起来。结合器850输出为10位,它构成块6的输出,此输出用作图7中结合器22的一个输入,其标号为21c。
进一步参考量化器的主信号通路,对数压缩扩展的输入信号3a和3b通过结合器7a和7b减去由量化器的反馈部分而来的预测器的值33a和33b,生成一个D1(1)信号8a和一个D1(0)信号8b。
下一步,利用附录O的查找表,将信号8a和8b分到四个频率块中。根据被分子帧的幅度总数,此表提供分配给四个频率块中每一个的幅度数。因为任一子帧的幅度总数在最小值9和最大值56之间变化,所以此表包含了相同范围的值。将每个频率块的长度调节到互相的比例为0.2∶0.225∶0.275∶0.3,同时使长度和等于当前子帧的谱幅度数。
然后,每一频率块经过一个离散余弦变换器(DCT)9a或9b以高效地对每一频率块中的数据解相关。每一频率块中的头两个DCT系数10a或10b被分出,并通过一个2×2的旋转运算12a或12b以生成变换系数13a或13b。然后,对变换系数13a和13b执行一个八点DCT14a或14b,以产生一个PRBA矢量15a或15b。每一频率块的剩余DCT系数11a和11b形成一组四个变长度高阶系数(HOC)矢量。
如上所述,频率分割后,每块经离散余弦变换器9a和9b处理。DCT块使用的输入项数量W、和每一项的值x(0),x(1),…,x(W-1),如下式: y(0)和y(1)的值(由10a确定)与其它的输出y(2)到y(W-1)(由11a确定)是分开的。
然后,利用一个旋转算法作一个2×2的旋转运算12a和12b以将二单元的输入矢量10a和10b(x(0),x(1))转换成二单元的输出矢量13a和13b(y(0),y(1)),如下式:
y(0)=x(0)+sqrt(2)×x(1),与
y(1)=x(0)-sqrt(2)×x(1).
然后,根据下式对由13a和13b来的四个二单元矢量,作一个八点(x(0),x(1),…,x(7))的DCT: 输出y(k)是一个八单元的PRBA矢量15a和15b。
只要单个子帧幅度的预测和DCT变换完成了,两个PRBA矢量就被量化。首先用和差转换16把两个八单元矢量结合成一个和矢量和一个差矢量。具体是,和/差操作16是在两个八单元PRBA矢量15a和15b上执行,产生一个16单元矢量17,其中,15a和15b分别由x和y来代表,17由z来代表,如下式:
z(i)=x(i)+y(i),和
z(8+i)=x(i)-y(i), i=0,1,…,7.
然后,这些矢量用一个分散矢量量化器20a进行量化,这里,和矢量的单元1-2、3-4,5-7分别用8位,6位和7位,而差矢量中的单元1-3和4-7分别用8位和6位。因为每一矢量的单元0在功能上等效于分别量化所得的增益值,所以它被忽略掉。
PRBA分散矢量量化器20a量化PRBA和差矢量17,产生一个量化矢量21a。二单元z(1)和z(2)构成一个待量化的二维矢量。此矢量与(由附录B的表(“PRBA和[1,2]VQ码本(8位)”)中x1(n)和x2(n)组成的)每个二维矢量比较。可用平方距离e进行比较,如下式:
e(n)=[x1(n)-z(1)]2+[x2(n)-z(2)]2, n=0,1,…,255.在附录B中选出使平方距离e最小的矢量,以产生输出矢量21a的首先8位。
下一步,二单元z(3)和z(4)构成一个二维矢量进行量化。此矢量与(由附录C的表(“PRBA和[3,4]VQ码本(6位)”)中x1(n)和x2(n)组成的)每一个二维矢量比较。用平方距离e进行比较,如下式:
e(n)=[x1(n)-z(3)]2+[x2(n)-z(4)]2, n=0,1,…,63.在附录C中选出使平方距离e最小的矢量,以产生输出矢量21a的跟着的6位。
下一步,三单元z(5),z(6)和z(7)构成一个三维矢量作量化。此矢量与(由附录D的表(“PRBA和[5,7]VQ码本(7位)”)中x1(n),x2(n)和x3(n)组成的)每个三维矢量比较。可用平方距离e进行比较,如下式:
e(n)=[x1(n)-z(5)]2+[x2(n)-z(6)]2+[x3(n)-z(7)]2,n=0,1,…,127.在附录D中选出使平方距离e最小的矢量,以产生输出矢量21a的跟着的7位。
下一步,三单元z(9),z(10)和z(11)构成一个三维矢量作量化。此矢量与(由附录E的表(“PRBA差[1,3]VQ码本(8位)”)中x1(n),x2(n)和x3(n)组成的)每个三维矢量比较。可用平方距离e进行比较,如下式:
e(n)=[x1(n)-z(9)]2+[x2(n)-z(10)]2+[x3(n)-z(11)]2, n=0,1,…,255.在附录E中选出使平方距离e最小的矢量,以产生输出矢量21a的跟着的8位。
最后,四单元z(12),z(13),z(14)和z(15)构成一个四维矢量作量化。此矢量与(由附录F的表(“PRBA差[4,7]VQ码本(6位)”)中x1(n),x2(n),x3(n)和x4(n)组成的)每个四维矢量比较。可用平方距离e进行比较,如下式:
e(n)=[x1(n)-z(12)]2+[x2(n)-z(13)]2+[x3(n)-z(14)]2+[x4(n)-z(15)]2,
n=0,1,…,63.在附录F中选出使平方距离e最小的矢量,以产生输出矢量21a的最后6位。
HOC矢量的量化与PRBA矢量相似。首先,对应于四个频率块中的每一个,相应两子帧中的HOC矢量对用一个和-差变换18结合起来,其中,和-差变换18为每个频率块产生一个和-差矢量19。
分别对每一个频率块在两个HOC矢量11a和11b上执行和/差操作,产生一个矢量zm:
J=max(Bm0,Bm1)-2
K=min(Bm0,Bm1)-2
zm(i)=0.5[x(i)+y(i)] 1≤i≤K
如果L0>L1,zm(i)=y(i)
否则zm(i)=x(i), K<i≤J
zm(J+i)=0.5[x(i)-y(i)] 0≤i≤K此处,Bm0和Bm1分别是子帧零和子帧一的第m个频率块的长度,如附录O所列出,为每个频率块确定z(即m等于0到3)。为所有的四个频率块(m等于0到3)结合J+K个单元的和差矢量zm,以形成HOC的和/差矢量19。
由于每个HOC矢量的大小不同,所以和差矢量也具有变化的而且可能是不同的长度。在矢量量化步骤中通过忽略每个矢量的前四个单元之外的单元来处理这一问题。剩余的单元作矢量量化,和矢量用七位,差矢量用三位。矢量量化执行后,对量化后的和差矢量进行原始和-差变换的逆变换。由于对全部四个频率块应用了此过程,所以总共四十位(4×(7+3))用来对两子帧对应的HOC矢量作矢量量化。
HOC分散矢量量化器20b分别在全部四个频率块上量化HOC和差矢量19。首先,代表第m个频率块的矢量zm分别与附录中相应和差码本的每个备选矢量相比较。一个码本按它所对应的频率块标识,并标识出它是一个和码还是一个差码。那么,附录G的“HOC和0VQ码本(7位)”代表频率块0的和码本。其它的码本是附录H(“HOC差0VQ码本(3位)”),附录I(“HOC和1VQ码本(7位)”),附录J(“HOC差1VQ码本(3位)”),附录K(“HOC和2VQ码本(7位)”),附录L(“HOC差2VQ码本(3位)”),附录M(“HOC和2VQ码本(7位)”),附录N(“HOC差3VQ码本(3位)”)。每个频率块的矢量zm与相应和码本的每个备选矢量的比较用平方距离表示,其中,对每个备选和矢量(由x1(n),x2(n),x3(n)和x4(n)组成)用e1n计算,如下式: 对每个备选差矢量(由x1(n),x2(n),x3(n)和x4(n)组成)用e2m计算,如下式: 此处,按前文所述计算J和K。
相应和记录码本中能使平方距离e1n最小的一个备选和矢量的指数n用七位表示。而能使平方距离e2m最小的一个备选差矢量的指数m用三位表示。在全部四个频率块中结合这十位,形成40个HOC的输出位21b。
块22多路复合量化的PRBA矢量21a、量化均值21b、和量化均值21c,以生成输出位23。这些位23是双子帧幅度量化器的最终输出位,同时提供给量化器的反馈部份。
双子帧量化器的反馈部份块24代表图中标为Q的大框中执行功能的逆功能。块24根据量化位23产生D1(1)和D1(0)(8a和8b)的估计值25a和25b。在标为Q的大框中没有量化误差的前提下,这些估计将等于D1(1)和D1(0)。
块26将一个等于0.8×P1(1)的标量预测值33a加到D1(1)25a的估计值,以产生一个估计值M1(1)27。块28将估计值M1(1)27延时一帧(40ms),以产生估计值M1(-1)29。
然后,预测器块30内插并再采样估计的幅度,生成L1个估计幅度,之后从L1个估计幅度中的每个减去估计幅度的均值以生成P1(1)输出31a。接着,对输入的估计幅度内插和再采样来产生L0个估计幅度,从L0个估计幅度中的每个减去估计幅度的均值以生成P1(0)输出31b。
块32a对每一个P1(1)31a中的幅度乘以0.8,以生成输出矢量33a,此矢量用于反馈单元结合器块7a中。同样地,块32b对每一个P1(0)31b中的幅度乘以0.8以生成输出矢量33b,此矢量用于反馈单元结合器块7b中。这一处理过程的输出是量化幅度输出矢量23,然后,此输出与如上文所述的其它两个子帧的输出矢量结合起来。
只要编码器为每个45ms块量化了模型参数,量化的位就要在传输之前被赋予优先级,作FEC编码,并作交错处理。首先,根据量化位对位错误的估计敏感度的次序赋予其优先级。实验显示PRBA和HOC的和矢量一般要比相应的差矢量对位错误更敏感。而且,PRBA和矢量一般比HOC和矢量更敏感。在一个优先级方案中利用了这些相关的敏感度。通常地,给平均基音频率和平均增益位分配最高的优先级,其次为PRBA和位和HOC和位,再次为PRBA差位和HOC差位,最后为剩下的一些位。
然后,利用[24,12]扩展Golay码、[23,12]Golay码和[15,11]Hamming码的混合码,给较敏感的位加上较高冗余度,而给较不敏感的位加上较低冗余度或不加冗余度。半速率系统采用一个[24,12]Golay码,后有三个[23,12]Golay码,再后是两个[15,11]Hamming码,剩下的33位不受保护。全速率系统采用两个[24,12]Golay码,后有六个[23,12]Golay码,剩下的126位不支持。这种分配的设计是为了高效地使用对FEC可用的有限的位数。最后一步是在每个45ms块中交错处理FEC编码位,以分散短突发错误的影响。然后,两个连续45ms块的交错位被结合到一个形成编码器输出位流的90ms帧中。
编码位流信号在信道中传送并接收后,设计相应的解码器来从编码的位流中再现高质量的语音。解码器首先将每个90ms的帧分为两个45ms的量化块。之后,解码器对每一块进行解交错,并进行纠错解码,以纠正和/或检测某些可能的位错误模式。为得到通过移动卫星信道的足够的性能,所有纠错码一般被解码到其最高的纠错能力。下一步,解码器用FEC解码位为此块再组合量化位,从这些位中重构代表此块的两子帧的模型参数。
AMBE解码器用重构对数谱幅度合成一组相位,声音合成器用这些相位生成感觉自然的语音。使用合成相位信息大大地降低了与在编码器与解码器之间直接传送此信息或等效物的系统有关的数据传输速率。然后,解码器对重构的谱幅度采用谱加强措施,以提高语音信号的感觉质量。如果本地估计的通道参数指示可能有不可纠正的位错误存在,则解码器进一步检测位错误并平滑重构参数。加强及平滑的模型参数(基音频率,V/UV判决,谱幅度和合成相位)用于语音合成。
重构参数形成解码器的语音合成器算法的输入,此算法将顺序的模型参数帧内插成平滑的22.5ms的语音段。合成算法用一组谐波振荡器(或一个高频率的FFT等效器)合成浊音语音。它被加到一个加权的叠加算法的输出以合成清音语音。这些总和形成合成语音信号,输出到一个D/A变换器,再到扬声器上重放。然而,此合成语音信号可能在逐个采样点的意义上与原始信号并不接近,但是一个人听上去感觉是相同的。
其它的实施例也包含在权利要求书的范围之内。
附录A
增益VQ码本(5位)值表
n | x1(n) | x2(n) |
0 | -6696 | 6699 |
1 | -5724 | 5641 |
2 | -4860 | 4854 |
3 | -3861 | 3824 |
4 | -3132 | 3091 |
5 | -2538 | 2630 |
6 | -2052 | 2088 |
7 | -1890 | 1491 |
8 | -1269 | 1627 |
9 | -1350 | 1003 |
10 | -756 | 1111 |
11 | -864 | 514 |
12 | -324 | 623 |
13 | -486 | 162 |
14 | -297 | -109 |
15 | 54 | 379 |
16 | 21 | -49 |
17 | 326 | 122 |
18 | 21 | -441 |
19 | 522 | -196 |
20 | 348 | -686 |
21 | 826 | -466 |
22 | 630 | -1005 |
23 | 1000 | -1323 |
24 | 1174 | -809 |
25 | 1631 | -1274 |
26 | 1479 | -1789 |
27 | 2088 | -1960 |
28 | 2566 | -2524 |
29 | 3132 | -3185 |
30 | 3958 | -3994 |
31 | 5546 | -5978 |
附录B
PRBA和[1,2]VQ码本(8位)值表
附录C
PRBA和[3,4]VQ码本(6位)值表
n | x1(n) | x2(n) |
0 | -1320 | -848 |
1 | -820 | -743 |
2 | -440 | -972 |
3 | -424 | -584 |
4 | -715 | -456 |
5 | -1155 | -335 |
6 | -627 | -243 |
7 | -402 | -183 |
8 | -165 | -459 |
9 | -385 | -378 |
10 | -160 | -716 |
11 | 77 | -594 |
12 | -198 | -277 |
13 | -204 | -115 |
14 | -6 | -362 |
15 | -22 | -173 |
16 | -841 | -86 |
17 | -1178 | 206 |
18 | -551 | 20 |
19 | -414 | 209 |
20 | -713 | 252 |
21 | -770 | 665 |
22 | -433 | 473 |
23 | -361 | 818 |
24 | -338 | 17 |
25 | -148 | 49 |
26 | -5 | -33 |
27 | -10 | 124 |
28 | -195 | 234 |
29 | -129 | 469 |
30 | 9 | 316 |
31 | -43 | 647 |
n | x1(n) | x2(n) |
32 | 203 | -961 |
33 | 184 | -397 |
34 | 370 | -550 |
35 | 358 | -279 |
36 | 135 | -199 |
37 | 135 | -5 |
38 | 277 | -111 |
39 | 444 | -92 |
40 | 661 | -744 |
41 | 593 | -355 |
42 | 1193 | -634 |
43 | 933 | -432 |
44 | 797 | -191 |
45 | 611 | -66 |
46 | 1125 | -130 |
47 | 1700 | -24 |
48 | 143 | 183 |
49 | 288 | 262 |
50 | 307 | 60 |
51 | 478 | 153 |
52 | 189 | 457 |
53 | 78 | 967 |
54 | 445 | 393 |
55 | 386 | 693 |
56 | 819 | 67 |
57 | 681 | 266 |
58 | 1023 | 273 |
59 | 1351 | 281 |
60 | 708 | 551 |
61 | 734 | 1016 |
62 | 983 | 618 |
63 | 1751 | 723 |
附录D
PRBA和[5,7]VQ码本(7位)值表
附录E
PRBA差[1,3]VQ码本(8位)值表
附录F
PRBA差[4,7]VQ码本(6位)值表
n | x1(n) | x2(n) | x3(n) | x4(n) |
0 | -279 | -330 | -261 | 7 |
1 | -465 | -242 | -9 | 7 |
2 | -248 | -66 | -189 | 7 |
3 | -279 | -44 | 27 | 217 |
4 | -217 | -198 | -189 | -233 |
5 | -155 | -154 | -81 | -53 |
6 | -62 | -110 | -117 | 157 |
7 | 0 | -44 | -153 | -53 |
8 | -186 | -110 | 63 | -203 |
9 | -310 | 0 | 207 | -53 |
10 | -155 | -242 | 99 | 187 |
11 | -155 | -88 | 63 | 7 |
12 | -124 | -330 | 27 | -23 |
13 | 0 | -110 | 207 | -113 |
14 | -62 | -22 | 27 | 157 |
15 | -93 | 0 | 279 | 127 |
16 | -413 | 48 | -93 | -115 |
17 | -203 | 96 | -56 | -23 |
18 | -443 | 168 | -130 | 138 |
19 | -143 | 288 | -130 | 115 |
20 | -113 | 0 | -93 | -138 |
21 | -53 | 240 | -241 | -115 |
22 | -83 | 72 | -130 | 92 |
23 | -53 | 192 | -19 | -23 |
24 | -113 | 48 | 129 | -92 |
25 | -323 | 240 | 129 | -92 |
26 | -83 | 72 | 92 | 46 |
27 | -263 | 120 | 92 | 69 |
28 | -23 | 168 | 314 | -69 |
29 | -53 | 360 | 92 | -138 |
30 | -23 | 0 | -19 | 0 |
31 | 7 | 192 | 55 | 207 |
n | x1(n) | x2(n) | x3(n) | x4(n) |
32 | 7 | -275 | -296 | -45 |
33 | 63 | -209 | -72 | -15 |
34 | 91 | -253 | -8 | 225 |
35 | 91 | -55 | -40 | 45 |
36 | 119 | -99 | -72 | -225 |
37 | 427 | -77 | -72 | -135 |
38 | 399 | -121 | -200 | 105 |
39 | 175 | -33 | -104 | -75 |
40 | 7 | -99 | 24 | -75 |
41 | 91 | 11 | 88 | -15 |
42 | 119 | -165 | 152 | 45 |
43 | 35 | -55 | 88 | 75 |
44 | 231 | -319 | 120 | -105 |
45 | 231 | -55 | 184 | -165 |
46 | 259 | -143 | -8 | 15 |
47 | 371 | -11 | 152 | 45 |
48 | 60 | 71 | -63 | -55 |
49 | 12 | 159 | -63 | -241 |
50 | 60 | 71 | -21 | 69 |
51 | 60 | 115 | -105 | 162 |
52 | 108 | 5 | -357 | -148 |
53 | 372 | 93 | -231 | -179 |
54 | 132 | 5 | -231 | 100 |
55 | 180 | 225 | -147 | 7 |
56 | 36 | 27 | 63 | -148 |
57 | 60 | 203 | 105 | -24 |
58 | 108 | 93 | 189 | 100 |
59 | 156 | 335 | 273 | 69 |
60 | 204 | 93 | 21 | 38 |
61 | 252 | 159 | 63 | -148 |
62 | 180 | 5 | 21 | 224 |
63 | 348 | 269 | 63 | 69 |
附录G
HOC和0VQ码本(7位)值表
附录H
HOC差0VQ码本(3位)值表
n | x1(n) | x2(n) | x3(n) | x4(n) |
0 | -558 | -117 | 0 | 0 |
1 | -248 | 195 | 88 | -22 |
2 | -186 | -312 | -176 | -44 |
3 | 0 | 0 | 0 | 77 |
4 | 0 | -117 | 154 | -88 |
5 | 62 | 156 | -176 | -55 |
6 | 310 | -156 | -66 | 22 |
7 | 372 | 273 | 110 | 33 |
附录I
附录J
HOC差1VQ码本(3位)值表
n | x1(n) | x2(n) | x3(n) | x4(n) |
0 | -173 | -285 | 5 | 28 |
1 | -35 | 19 | -179 | 76 |
2 | -357 | 57 | 51 | -20 |
3 | -127 | 285 | 51 | -20 |
4 | 11 | -19 | 5 | -116 |
5 | 333 | -171 | -41 | 28 |
6 | 11 | -19 | 143 | 124 |
7 | 333 | 209 | -41 | -36 |
附录K
附录L
HOC差2VQ码本(3位)值表
n | x1(n) | x2(n) | x3(n) | x4(n) |
0 | -224 | -237 | 15 | -9 |
1 | -36 | -27 | -195 | -27 |
2 | -365 | 113 | 36 | 9 |
3 | -36 | 288 | -27 | -9 |
4 | 58 | 8 | 57 | 171 |
5 | 199 | -237 | 57 | -9 |
6 | -36 | 8 | 120 | -81 |
7 | 340 | 113 | -48 | -9 |
附录M
附录N
HOC差3VQ码本(3位)值表
n | x1(n) | x2(n) | x3(n) | x4(n) |
0 | -94 | -248 | 60 | 0 |
1 | 0 | -17 | -100 | -90 |
2 | -376 | -17 | 40 | 18 |
3 | -141 | 247 | -80 | 36 |
4 | 47 | -50 | -80 | 162 |
5 | 329 | -182 | 20 | -18 |
6 | 0 | 49 | 200 | 0 |
7 | 282 | 181 | -20 | -18 |
附录O
频率块大小表
子帧幅度总数 | 频率块1幅度数 | 频率块2幅度数 | 频率块3幅度数 | 频率块4幅度数 |
9 | 2 | 2 | 2 | 3 |
10 | 2 | 2 | 3 | 3 |
11 | 2 | 3 | 3 | 3 |
12 | 2 | 3 | 3 | 4 |
13 | 3 | 3 | 3 | 4 |
14 | 3 | 3 | 4 | 4 |
15 | 3 | 3 | 4 | 5 |
16 | 3 | 4 | 4 | 5 |
17 | 3 | 4 | 5 | 5 |
18 | 4 | 4 | 5 | 5 |
19 | 4 | 4 | 5 | 6 |
20 | 4 | 4 | 6 | 6 |
21 | 4 | 5 | 6 | 6 |
22 | 4 | 5 | 6 | 7 |
23 | 5 | 5 | 6 | 7 |
24 | 5 | 5 | 7 | 7 |
25 | 5 | 6 | 7 | 7 |
26 | 5 | 6 | 7 | 8 |
27 | 5 | 6 | 8 | 8 |
28 | 6 | 6 | 8 | 8 |
29 | 6 | 6 | 8 | 9 |
30 | 6 | 7 | 8 | 9 |
31 | 6 | 7 | 9 | 9 |
32 | 6 | 7 | 9 | 10 |
33 | 7 | 7 | 9 | 10 |
34 | 7 | 8 | 9 | 10 |
35 | 7 | 8 | 10 | 10 |
36 | 7 | 8 | 10 | 11 |
37 | 8 | 8 | 10 | 11 |
38 | 8 | 9 | 10 | 11 |
39 | 8 | 9 | 11 | 11 |
40 | 8 | 9 | 11 | 12 |
41 | 8 | 9 | 11 | 13 |
42 | 8 | 9 | 12 | 13 |
43 | 8 | 10 | 12 | 13 |
44 | 9 | 10 | 12 | 13 |
45 | 9 | 10 | 12 | 14 |
46 | 9 | 10 | 13 | 14 |
47 | 9 | 11 | 13 | 14 |
48 | 10 | 11 | 13 | 14 |
49 | 10 | 11 | 13 | 15 |
50 | 10 | 11 | 14 | 15 |
51 | 10 | 12 | 14 | 15 |
52 | 10 | 12 | 14 | 16 |
53 | 11 | 12 | 14 | 16 |
54 | 11 | 12 | 15 | 16 |
55 | 11 | 12 | 15 | 17 |
56 | 11 | 13 | 15 | 17 |
Claims (30)
1.一种将语音编码为经卫星信道传输的90毫秒位帧的方法,此方法包括如下步骤:
将一个语音信号数字化为一列数字语音样本;
将数字语音样本分到一列子帧中,每一子帧包含许多个数字语音样本;
为每一子帧估计一组模型参数,其中模型参数包含一组代表此子帧谱信息的谱幅度参数;
将该子帧序列中的两个连续子帧结合为一个块;
统一地量化一块中的两子帧的谱幅度参数,其中统一量化包括从前一块的量化谱幅度参数中形成预测谱幅度参数,计算作为谱幅度参数和预测谱幅度参数之差的余量参数,结合一块两子帧中的余量参数,并用许多矢量量化器将结合的余量参数量化为一组编码的谱位;
给每块的编码谱位增加冗余差错控制位,以防止该块中的至少部分编码谱位出现位错误;和
将两个连续块中的增加的冗余差错控制位和编码谱位结合为一个经卫星信道传输的90毫秒位帧。
2.如权利要求1所述的方法,其中一块中两子帧的余量参数的结合进一步包括:
将每个子帧中的余量参数分到许多频率块中;
对每个频率块中的余量参数执行一个线性变换,以生成每一子帧的一组变换余量系数;
将所有频率块中的少数变换余量系数组合成一个PRBA矢量,并将每一频率块中的剩下的变换余量系数组合成一个该频率块的HOC矢量;
变换PRBA矢量以生成一个变换PRBA矢量,并计算矢量的和差以结合两子帧中的两个变换PRBA矢量;和
计算每一频率块的矢量和差,以结合此频率块的两子帧的两个HOC矢量。
3.如权利要求1或2所述的方法,其中谱幅度参数代表一个多带激励语音模型估计的对数谱幅度。
4.如权利要求3所述的方法,其中谱幅度参数是从不依赖于声音状态所计算的谱中估计出来的。
5.如权利要求1或2所述的方法,其中预测谱幅度参数是将小于一的增益施加到对前一块的最后子帧的量化谱幅度进行的线性插值而形成的。
6.如权利要求1或2所述的方法,其中每块的冗余差错控制位由包括Golay码和Hamming码的许多块码形成。
7.如权利要求6所述的方法,其中那些块码包括一个[24,12]扩展Golay码,三个[23,12]Golay码,和两个[15,11]Hamming码。
8.如权利要求2所述的方法,其中每个频率块的变换余量系数是用离散余弦变换之后跟一个在两个最低阶DCT系数上进行线性2乘2变换而计算出的。
9.如权利要求8所述的方法,其中使用四个频率块,并且每个频率块的长度近似与该子帧中谱幅度参数的数目成正比。
10.如权利要求2所述的方法,其中那些矢量量化器包括:一个三分路矢量量化器,它对于PRBA矢量和使用8位加6位加7位;和一个两分路矢量量化器,它对于PRBA矢量差使用8位加6位。
11.如权利要求10所述的方法,其中位帧包括附加位,它代表由矢量量化器引入的变换余量系数中的误差。
12.如权利要求1或2所述的方法,其中子帧序列标称发生间隔为每个子帧22.5毫秒。
13.如权利要求12所述的方法,其中位帧在半速率模式中由312位组成,在全速率模式中由624位组成。
14.一种从经卫星信道接收到的90毫秒位帧中解码出语音的方法,此方法包括以下步骤:
将位帧分成两个位块,其中每一位块代表两个语音子帧;
使用每块中的冗余差错控制位对每一位块实施差错控制解码,以生成至少部分地防止出现位错误的差错解码位;
利用差错解码位统一地重构一块中两子帧的谱幅度参数,其中的统一重构包括使用许多矢量量化器码本重构一组结合余量参数并由此计算两子帧的各个余量参数,从前一块的重构的谱幅度参数中形成预测谱幅度参数,并在预测谱幅度参数中加上各个余量参数,以形成此块中每个子帧的重构谱幅度参数;和
用每个子帧的重构谱幅度参数合成此子帧的许多数字语音样本。
15.如权利要求14所述的方法,其中从一块的结合余量参数计算两子帧的各个余量参数还包含步骤:
将此块的结合余量参数分到一些频率块中;
形成该块的变换PRBA和差矢量;
从结合余量参数形成每个频率块的HOC和差矢量;
对变换PRBA和差矢量进行逆和差运算及逆变换,以形成两子帧的PRBA矢量;和
对HOC和差矢量进行逆和差运算,以形成每个频率块的两子帧的HOC矢量;和
结合每一子帧的每一频率块的PRBA矢量和HOC矢量以形成此块中的两子帧的各个余量参数。
16.如权利要求14或15所述的方法,其中重构谱幅度参数代表一个多带激励语音模型的对数谱幅度。
17.如权利要求14或15所述的方法,还包含一个解码器,它利用重构的谱幅度参数合成一组相位参数。
18.如权利要求14或15所述的方法,其中预测谱幅度参数是将小于一的增益施加到对前一块的最后子帧的量化谱幅度进行的线性插值而形成的。
19.如权利要求14或15所述的方法,其中每块的差错控制位是由包括Golay码和Hamming码的一些块码形成的。
20.如权利要求19所述的方法,其中那些块码包括一个[24,12]扩展Golay码,三个[23,12]Golay码,和两个[15,11]Hamming码。
21.如权利要求15所述的方法,其中每个频率块的变换余量系数是用离散余弦变换之后跟一个在两个最低阶DCT系数上的线性2乘2变换而计算出的。
22.如权利要求21所述的方法,其中使用四个频率块,并且每个频率块的长度近似与该子帧中谱幅度参数的数目成正比。
23.如权利要求15所述的方法,其中那些矢量量化器码本包括:一个三分路矢量量化器码本,它对于PRBA和矢量使用8位加6位加7位;和一个两分路矢量量化器码本,它对于PRBA差矢量使用8位加6位。
24.如权利要求23所述的方法,其中位帧包括附加的位,它代表由矢量量化器码本引入的变换余量系数中的误差。
25.如权利要求14或15所述的方法,其中子帧的标称持续时间为22.5毫秒。
26.如权利要求25所述的方法,其中位帧在半速率模式中由312位组成,在全速率模式中由624位组成。
27.一个将语音编码为在卫星信道中传输的90毫秒位帧的编码器,包括:
一个数字化器,设置为将一个语音信号转换成一列数字语音样本;
一个子帧发生器,设置为将数字语音样本分到一列子帧中,每个子帧包括多个数字语音样本;
一个模型参数估计器,设置为估计每个子帧的一组模型参数,其中,模型参数包含一组代表本子帧的谱信息的谱幅度参数;
一个结合器,设置为将该子帧序列中的两个连续子帧结合成一块;
一个双帧谱幅度量化器,设置为统一量化此块的两子帧的参数,其中,统一量化包括从前一块的量化谱幅度参数中形成预测谱幅度参数,计算作为谱幅度参数和预测谱幅度参数之差的余量参数,结合一块的两子帧的余量参数,并用许多矢量量化器将结合的余量参数量化为一组编码的谱位;
一个差错码编码器,设置为在每一块的编码谱位中增加差错控制位以防止此块中的至少部分编码谱位出现位错误;和
一个结合器,设置为将两个连续块中的增加的冗余差错控制位和编码谱位结合成一个经卫星信道传输的90毫秒位帧。
28.如权利要求27所述的编码器,其中双帧谱幅度量化器设置为用如下方法结合此块中两子帧的余量参数:
将每一子帧的余量参数分到一些频率块中;
对每个频率块中的余量参数实施一个线性变换,以生成每个子帧的一组变换余量系数;
将所有频率块中的少数变换余量系数组合成一个PRBA矢量,并将每一频率块中的剩下的变换余量系数组合成一个该频率块的HOC矢量;
变换PRBA矢量以生成一个变换PRBA矢量,并计算矢量的和差以结合两子帧中的两个变换PRBA矢量;和
计算每一频率块的矢量和差以结合此频率块的两子帧的两个HOC矢量。
29.一个从经卫星信道接收到的90毫秒位帧中解码语音的解码器,包括:
一个分割器,设置为将位帧分成两个位块,其中每一位块代表两个语音子帧;
一个差错控制解码器,设置为使用包含于此块中的冗余差错控制位对每一位块实施差错控制解码,以生成至少部分地防止出现位错误的差错解码位;
一个双帧谱幅度重构器,设置为统一重构一块中两子帧的谱幅度参数,其中统一重构包括使用许多矢量量化器码本重构一组结合余量参数,并由此计算两子帧的各个余量参数,从前一块的重构的谱幅度参数中形成预测谱幅度参数,并在预测谱幅度参数中加上各个余量参数,以形成此块中每个子帧的重构谱幅度参数;和
一个合成器,设置为利用每个子帧的重构谱幅度参数合成此子帧的多个数字语音样本。
30.如权利要求29所述的解码器,其中双帧谱幅度量化器设置为通过如下步骤来从一块的结合余量参数中计算两子帧的各个余量参数:
将此块的结合余量参数分到一些频率块中;
形成此块的变换PRBA和差矢量;
从结合余量参数中形成每个频率块的一个HOC和差矢量;
对变换PRBA和差矢量进行逆和差运算及逆变换,以生成两子帧的PRBA矢量;和
对HOC和差矢量进行逆和差运算,以生成每个频率块的两子帧的HOC矢量;和
结合每个子帧的每个频率块的PRBA矢量和HOC矢量,以生成此块的两子帧的各个余量参数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US818137 | 1992-01-08 | ||
US08/818,137 US6131084A (en) | 1997-03-14 | 1997-03-14 | Dual subframe quantization of spectral magnitudes |
US818,137 | 1997-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1193786A CN1193786A (zh) | 1998-09-23 |
CN1123866C true CN1123866C (zh) | 2003-10-08 |
Family
ID=25224767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98105557A Expired - Lifetime CN1123866C (zh) | 1997-03-14 | 1998-03-13 | 一种语音编/解码方法和装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6131084A (zh) |
JP (1) | JP4275761B2 (zh) |
KR (1) | KR100531266B1 (zh) |
CN (1) | CN1123866C (zh) |
BR (1) | BR9803683A (zh) |
FR (1) | FR2760885B1 (zh) |
GB (1) | GB2324689B (zh) |
RU (1) | RU2214048C2 (zh) |
Families Citing this family (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6765904B1 (en) | 1999-08-10 | 2004-07-20 | Texas Instruments Incorporated | Packet networks |
WO1999017279A1 (en) * | 1997-09-30 | 1999-04-08 | Siemens Aktiengesellschaft | A method of encoding a speech signal |
US6199037B1 (en) * | 1997-12-04 | 2001-03-06 | Digital Voice Systems, Inc. | Joint quantization of speech subframe voicing metrics and fundamental frequencies |
AU730123B2 (en) * | 1997-12-08 | 2001-02-22 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for processing sound signal |
US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US7392180B1 (en) * | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
FR2784218B1 (fr) * | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
WO2000022606A1 (en) * | 1998-10-13 | 2000-04-20 | Motorola Inc. | Method and system for determining a vector index to represent a plurality of speech parameters in signal processing for identifying an utterance |
JP2000308167A (ja) * | 1999-04-20 | 2000-11-02 | Mitsubishi Electric Corp | 音声符号化装置 |
US6757256B1 (en) | 1999-08-10 | 2004-06-29 | Texas Instruments Incorporated | Process of sending packets of real-time information |
US6801499B1 (en) * | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Diversity schemes for packet communications |
US6744757B1 (en) | 1999-08-10 | 2004-06-01 | Texas Instruments Incorporated | Private branch exchange systems for packet communications |
US6678267B1 (en) | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
US6804244B1 (en) | 1999-08-10 | 2004-10-12 | Texas Instruments Incorporated | Integrated circuits for packet communications |
US6801532B1 (en) * | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Packet reconstruction processes for packet communications |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
KR100383668B1 (ko) * | 2000-09-19 | 2003-05-14 | 한국전자통신연구원 | 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법 |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7243295B2 (en) * | 2001-06-12 | 2007-07-10 | Intel Corporation | Low complexity channel decoders |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
US7970606B2 (en) * | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
US7634399B2 (en) * | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
US8359197B2 (en) * | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
DE102004007191B3 (de) | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007184B3 (de) | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US7668712B2 (en) | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7522730B2 (en) * | 2004-04-14 | 2009-04-21 | M/A-Com, Inc. | Universal microphone for secure radio communication |
KR101037931B1 (ko) * | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
DE602005017302D1 (de) * | 2004-11-30 | 2009-12-03 | Agere Systems Inc | Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix |
JP5106115B2 (ja) * | 2004-11-30 | 2012-12-26 | アギア システムズ インコーポレーテッド | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
JP4849297B2 (ja) * | 2005-04-26 | 2012-01-11 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP1905004A2 (en) | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Method of encoding and decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
MX2008000122A (es) | 2005-06-30 | 2008-03-18 | Lg Electronics Inc | Metodo y aparato para codificar y descodificar una senal de audio. |
CA2613731C (en) | 2005-06-30 | 2012-09-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2009500656A (ja) * | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
ES2433316T3 (es) * | 2005-07-19 | 2013-12-10 | Koninklijke Philips N.V. | Generación de señales de audio de multiples canales |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
KR101169280B1 (ko) | 2005-08-30 | 2012-08-02 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US7765104B2 (en) | 2005-08-30 | 2010-07-27 | Lg Electronics Inc. | Slot position coding of residual signals of spatial audio coding application |
US8068569B2 (en) | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
KR100857112B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
KR101169281B1 (ko) | 2005-10-05 | 2012-08-02 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩 방법 및 이의 장치 |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US7934137B2 (en) | 2006-02-06 | 2011-04-26 | Qualcomm Incorporated | Message remapping and encoding |
EP1848165A3 (en) * | 2006-04-19 | 2011-05-04 | Samsung Electronics Co., Ltd. | Relay service in a multi-hop relay broadband wireless access communication system |
UA91827C2 (en) * | 2006-09-29 | 2010-09-10 | Общество С Ограниченной Ответственностью "Парисет" | Method of multi-component coding and decoding electric signals of different origin |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101062353B1 (ko) * | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
JP5209637B2 (ja) | 2006-12-07 | 2013-06-12 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
US8036886B2 (en) | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
JP4254866B2 (ja) * | 2007-01-31 | 2009-04-15 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
EP2210253A4 (en) * | 2007-11-21 | 2010-12-01 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
RU2439720C1 (ru) | 2007-12-18 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
US8195452B2 (en) * | 2008-06-12 | 2012-06-05 | Nokia Corporation | High-quality encoding at low-bit rates |
EP2410522B1 (en) * | 2008-07-11 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, method for encoding an audio signal and computer program |
CN102144256B (zh) * | 2008-07-17 | 2013-08-28 | 诺基亚公司 | 用于针对矢量量化器的快速最近邻搜索的方法和设备 |
EP3217395B1 (en) | 2008-10-29 | 2023-10-11 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
US9275644B2 (en) * | 2012-01-20 | 2016-03-01 | Qualcomm Incorporated | Devices for redundant frame coding and decoding |
US8737645B2 (en) * | 2012-10-10 | 2014-05-27 | Archibald Doty | Increasing perceived signal strength using persistence of hearing characteristics |
KR101764726B1 (ko) | 2013-02-20 | 2017-08-14 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중 중첩 부분을 이용하여 인코딩된 신호를 생성하거나 인코딩된 오디오 신호를 디코딩하는 장치 및 방법 |
EP2830058A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
MX355258B (es) * | 2013-10-18 | 2018-04-11 | Fraunhofer Ges Forschung | Concepto para codificar una señal de audio y decodificar una señal de audio usando información determinista y de tipo ruido. |
EP3058568B1 (en) * | 2013-10-18 | 2021-01-13 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
RU2691122C1 (ru) * | 2018-06-13 | 2019-06-11 | Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) | Способ и устройство компандирования звуковых вещательных сигналов |
US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3706929A (en) * | 1971-01-04 | 1972-12-19 | Philco Ford Corp | Combined modem and vocoder pipeline processor |
US3982070A (en) * | 1974-06-05 | 1976-09-21 | Bell Telephone Laboratories, Incorporated | Phase vocoder speech synthesis system |
US3975587A (en) * | 1974-09-13 | 1976-08-17 | International Telephone And Telegraph Corporation | Digital vocoder |
US4091237A (en) * | 1975-10-06 | 1978-05-23 | Lockheed Missiles & Space Company, Inc. | Bi-Phase harmonic histogram pitch extractor |
US4422459A (en) * | 1980-11-18 | 1983-12-27 | University Patents, Inc. | Electrocardiographic means and method for detecting potential ventricular tachycardia |
EP0076234B1 (de) * | 1981-09-24 | 1985-09-04 | GRETAG Aktiengesellschaft | Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung |
AU570439B2 (en) * | 1983-03-28 | 1988-03-17 | Compression Labs, Inc. | A combined intraframe and interframe transform coding system |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US4583549A (en) * | 1984-05-30 | 1986-04-22 | Samir Manoli | ECG electrode pad |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US5067158A (en) * | 1985-06-11 | 1991-11-19 | Texas Instruments Incorporated | Linear predictive residual representation via non-iterative spectral reconstruction |
US4879748A (en) * | 1985-08-28 | 1989-11-07 | American Telephone And Telegraph Company | Parallel processing pitch detector |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5095392A (en) * | 1988-01-27 | 1992-03-10 | Matsushita Electric Industrial Co., Ltd. | Digital signal magnetic recording/reproducing apparatus using multi-level QAM modulation and maximum likelihood decoding |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4821119A (en) * | 1988-05-04 | 1989-04-11 | Bell Communications Research, Inc. | Method and apparatus for low bit-rate interframe video coding |
US4979110A (en) * | 1988-09-22 | 1990-12-18 | Massachusetts Institute Of Technology | Characterizing the statistical properties of a biological signal |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
JPH0782359B2 (ja) * | 1989-04-21 | 1995-09-06 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置及び音声符号化・復号化装置 |
WO1990013112A1 (en) * | 1989-04-25 | 1990-11-01 | Kabushiki Kaisha Toshiba | Voice encoder |
US5036515A (en) * | 1989-05-30 | 1991-07-30 | Motorola, Inc. | Bit error rate detection |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5081681B1 (en) * | 1989-11-30 | 1995-08-15 | Digital Voice Systems Inc | Method and apparatus for phase synthesis for speech processing |
US5511073A (en) * | 1990-06-25 | 1996-04-23 | Qualcomm Incorporated | Method and apparatus for the formatting of data for transmission |
US5216747A (en) * | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
DE69328450T2 (de) * | 1992-06-29 | 2001-01-18 | Nippon Telegraph & Telephone | Verfahren und Vorrichtung zur Sprachkodierung |
US5596659A (en) * | 1992-09-01 | 1997-01-21 | Apple Computer, Inc. | Preprocessing and postprocessing for vector quantization |
AU5682494A (en) * | 1992-11-30 | 1994-06-22 | Digital Voice Systems, Inc. | Method and apparatus for quantization of harmonic amplitudes |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
JP2655046B2 (ja) * | 1993-09-13 | 1997-09-17 | 日本電気株式会社 | ベクトル量子化装置 |
US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US5696873A (en) * | 1996-03-18 | 1997-12-09 | Advanced Micro Devices, Inc. | Vocoder system and method for performing pitch estimation using an adaptive correlation sample window |
-
1997
- 1997-03-14 US US08/818,137 patent/US6131084A/en not_active Expired - Lifetime
-
1998
- 1998-03-13 FR FR9803119A patent/FR2760885B1/fr not_active Expired - Lifetime
- 1998-03-13 CN CN98105557A patent/CN1123866C/zh not_active Expired - Lifetime
- 1998-03-13 BR BR9803683-1A patent/BR9803683A/pt not_active Application Discontinuation
- 1998-03-13 KR KR1019980008546A patent/KR100531266B1/ko not_active IP Right Cessation
- 1998-03-13 JP JP06340098A patent/JP4275761B2/ja not_active Expired - Lifetime
- 1998-03-13 RU RU98104951/09A patent/RU2214048C2/ru active
- 1998-03-16 GB GB9805682A patent/GB2324689B/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1193786A (zh) | 1998-09-23 |
FR2760885B1 (fr) | 2000-12-29 |
GB2324689B (en) | 2001-09-19 |
KR100531266B1 (ko) | 2006-03-27 |
BR9803683A (pt) | 1999-10-19 |
GB9805682D0 (en) | 1998-05-13 |
KR19980080249A (ko) | 1998-11-25 |
JP4275761B2 (ja) | 2009-06-10 |
RU2214048C2 (ru) | 2003-10-10 |
GB2324689A (en) | 1998-10-28 |
JPH10293600A (ja) | 1998-11-04 |
US6131084A (en) | 2000-10-10 |
FR2760885A1 (fr) | 1998-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1123866C (zh) | 一种语音编/解码方法和装置 | |
CN1154283C (zh) | 编码方法和装置以及解码方法和装置 | |
US7957963B2 (en) | Voice transcoder | |
CN1158647C (zh) | 话音编码设备的频谱幅度量化 | |
CN1132154C (zh) | 多信道信号编码和解码 | |
CN1136537C (zh) | 用再生相位信息合成语言的方法和装置 | |
US6161089A (en) | Multi-subframe quantization of spectral parameters | |
JP4218134B2 (ja) | 復号装置及び方法、並びにプログラム提供媒体 | |
JP4101957B2 (ja) | 音声パラメータの合同量子化 | |
US8359197B2 (en) | Half-rate vocoder | |
US7840402B2 (en) | Audio encoding device, audio decoding device, and method thereof | |
JP2001222297A (ja) | マルチバンドハーモニック変換コーダ | |
US8386267B2 (en) | Stereo signal encoding device, stereo signal decoding device and methods for them | |
CN1432176A (zh) | 用于预测量化有声语音的方法和设备 | |
CN1288557A (zh) | 解码方法和包括自适应后置滤波器的系统 | |
CN1228867A (zh) | 改善串联声码器话音质量的方法与设备 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN104123946A (zh) | 用于在与语音信号相关联的包中包含识别符的系统及方法 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
JP2004287397A (ja) | 相互使用可能なボコーダ | |
CN1334952A (zh) | 用于改善编码通信信号性能的编码增强特性 | |
CN1200404C (zh) | 具有脉冲序列约束的码激励线性预测语音编码器译码器 | |
CN1192357C (zh) | 用于语音编码的自适应规则 | |
US20050228652A1 (en) | Fixed sound source vector generation method and fixed sound source codebook | |
JP2005215502A (ja) | 符号化装置、復号化装置、およびこれらの方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20031008 |