EP1755110A2 - Method and device for adaptive reduction of noise signals and background signals in a speech processing system - Google Patents

Method and device for adaptive reduction of noise signals and background signals in a speech processing system Download PDF

Info

Publication number
EP1755110A2
EP1755110A2 EP06014433A EP06014433A EP1755110A2 EP 1755110 A2 EP1755110 A2 EP 1755110A2 EP 06014433 A EP06014433 A EP 06014433A EP 06014433 A EP06014433 A EP 06014433A EP 1755110 A2 EP1755110 A2 EP 1755110A2
Authority
EP
European Patent Office
Prior art keywords
prediction
filter
coefficients
input signal
audio input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP06014433A
Other languages
German (de)
French (fr)
Other versions
EP1755110A3 (en
Inventor
Jörn Fischer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Entropic Communications LLC
Original Assignee
TDK Micronas GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TDK Micronas GmbH filed Critical TDK Micronas GmbH
Publication of EP1755110A2 publication Critical patent/EP1755110A2/en
Publication of EP1755110A3 publication Critical patent/EP1755110A3/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

The method involves filtering an audio-input signal under application of adaptive filters (F1, F2), preferably of FIR configuration, for producing predicted-output signals with reduced noise. The filter is implemented under application of several coefficients for formation of several prediction errors and for the formation of the errors from several of prediction errors (sv1-sv4). The amount of coefficients is continuously reduced by several reduction parameters. An independent claim is also included for a device for reduction of noise signals and background signals in a speech processing system.

Description

Die Erfindung bezieht sich auf ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit den oberbegrifflichen Merkmalen des Patentanspruchs 1 bzw. auf eine Vorrichtung zum Durchführen eines solchen Verfahrens mit den oberbegrifflichen Merkmalen des Patentanspruchs 18.The invention relates to a method for reducing noise and background signals in a speech processing system with the preamble features of claim 1 and to an apparatus for performing such a method with the preamble features of claim 18.

In sprachverarbeitenden Systemen, wie z.B. Systemen zur Spracherkennung, Sprachdetektion oder Sprachkomprimierung, mindern Störungen wie Rauschen und nicht zur Sprache gehörende Hintergrundgeräusche die Qualität der Sprachverarbeitung z.B. hinsichtlich der Erkennung oder Kompression der in einem Eingangssignal enthaltenen Sprach- bzw. Sprachsignalanteile. Diese störenden Hintergrundsignale sollen mit möglichst wenig Rechenaufwand eliminiert werden.In speech processing systems, e.g. Systems for speech recognition, speech detection or speech compression, noise such as noise and non-speech background noise reduce the quality of speech processing, e.g. in terms of the detection or compression of the speech or speech signal components contained in an input signal. These disturbing background signals should be eliminated with as little computational effort as possible.

Zur Reduktion von Rausch- und Hintergrundsignalen in sprachverarbeitenden Systemen werden Filtervorrichtungen eingesetzt welche mittels mindestens eines Audioeingangs, eines Audioausgangs, eines Speichers und eines Prozessors oder eines feldprogrammierbaren Bausteins oder eines ASIC (Application-Specified-Integrated-Circuit / Anwendungs-spezifische integrierte Schaltung) ein Filterverfahren ausführen.For reducing noise and background signals in speech processing systems, filter devices are employed which include at least one audio input, an audio output, a memory and a processor or a field programmable device or an application-specific integrated circuit (ASIC) Perform filtering procedure.

Mittels eines aufwändigen Verfahrens unter Einsatz einer spektralen Subtraktion wird in EP 1080465 und in US 6,820,053 zur Reduktion von Rausch- und Hintergrundsignalen ein Spektrum eines Audiosignals mit Hilfe der Fourier-Transformation berechnet und z. B. ein langsam ansteigender Anteil abgezogen. Durch Rücktransformation in den Zeitbereich wird nachfolgend ein rauschreduziertes Ausgangssignal erhalten. Der Rechenaufwand ist bei diesem Verfahren ist nachteilhaft hoch. Außerdem ist der Speicherplatzverbrauch sehr hoch. Außerdem lassen sich bei der spektralen Subtraktion die verwendeten Parameter zum Teil sehr schlecht an andere Sampleraten anpassen.By means of a complex process using a spectral subtraction is in EP 1080465 and in US 6,820,053 For the reduction of noise and background signals, a spectrum of an audio signal is calculated using the Fourier transform and z. B. deducted a slowly increasing proportion. By inverse transformation into the time domain, a noise-reduced output signal is subsequently obtained. The computational effort is disadvantageous in this process is disadvantageous. In addition, the storage space consumption is very high. In addition, the parameters used in the spectral subtraction can be very poorly adapted to other sample rates.

Zur Reduktion von Rausch- und Hintergrundsignalen gibt es weitere Verfahren, wie das center clipping (zentrales Klipping), bei dem eine Autokorrelation des Signals gebildet und als Information des Rauschgehalts des Eingangssignals benutzt wird, Verfahren, die gemäß US 5,583,968 oder US 6,820,053 mit neuronalen Netzen arbeiten, welche aufwändig trainiert werden müssen oder Verfahren, gemäß z.B. US 5,500,903 die mit mehreren Mikrofonen arbeiten, um Rauschen und Sprachsignale zu trennen. Mindestens aber wird eine Abschätzung der Rauschamplituden durchgeführt. Der Rechenaufwand einer Fouriertransformation (FFT) ist O(n log(n)), der einer Autokorrelation O(n2), der des hier vorgestellten gesamten Verfahrens liegt bei O(n).To reduce noise and background signals, there are other methods, such as center clipping, in which an autocorrelation of the signal is formed and used as information of the noise content of the input signal US 5,583,968 or US 6,820,053 work with neural networks, which must be trained consuming or procedures, according to eg US 5,500,903 working with multiple microphones to separate noise and speech signals. At least, however, an estimate of the noise amplitudes is performed. The computational effort of a Fourier transform (FFT) is O (n log (n)), that of an autocorrelation O (n 2 ), that of the entire method presented here is O (n).

Allgemein bekannt ist dabei der Einsatz eines FIR-Filters (FIR: Finite Impulse Response / Finite Impulsantwort), das darauf trainiert ist, das Eingangssignal aus z.B. Sprache und Rauschen möglichst gut aus den vergangenen n Werten vorherzusagen, wobei dies unter Einsatz einer LPC (Linear Predictive Coding / lineare Vorhersage-Kodierung) durchgeführt wird. Die Ausgabewerte des Filters sind diese vorhergesagten Werte. Die Beträge von Koeffizienten c(i) eines solchen Filters steigen bei Rauschsignalen im Mittel langsamer als bei Sprachsignalen, wobei die Koeffizienten berechnet werden gemäß c i t + 1 = c i t + μ e s t - i

Figure imgb0001
mit µ << 1, z.B. µ = 0,01 als einer Lernrate, s(t) als einem Audio-Eingangssignal zur Zeit t, e = s(t) - sv(t) als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler vom Audio-Eingangssignal, sv(t) als Ausgangssignal aus einer Summe der Terme ci(t-1) . s(t-i), d.h. der einzelnen Vorhersagefehler über alle i von 1 bis N, N als Anzahl der Koeffizienten und ci(t) als einem individuellen Koeffizienten mit einem Parameter i zur Zeit t.Commonly known is the use of an FIR filter (Finite Impulse Response / Finite impulse response), which is trained to predict the input signal from eg speech and noise as well as possible from the past n values, this using an LPC (Linear Predictive coding / linear prediction coding). The output values of the filter are these predicted values. The magnitudes of coefficients c (i) of such a filter increase on average more slowly in the case of noise signals than on speech signals, the coefficients being calculated in accordance with FIG c i t + 1 = c i t + μ e s t - i
Figure imgb0001
with μ << 1, eg μ = 0.01 as a learning rate, s (t) as an audio input signal at time t, e = s (t) - sv (t) as an error from a difference of all individual prediction errors from Audio input signal, sv (t) as output from a Sum of the terms c i (t-1). s (ti), ie the individual prediction error over all i from 1 to N, N as the number of coefficients and c i (t) as an individual coefficient with a parameter i at time t.

Die Aufgabe der Erfindung besteht darin, ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System bzw. eine Vorrichtung zum Durchführen eines solchen Verfahrens hinsichtlich der Anwendbarkeit zu verbessern, insbesondere flexibler einsetzbar zu machen.The object of the invention is to improve a method for the reduction of noise and background signals in a voice-processing system or a device for carrying out such a method in terms of applicability, in particular to make it more flexible.

Diese Aufgabe wird durch ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit den Merkmalen des Patentanspruchs 1 bzw. auf eine Vorrichtung zum Durchführen eines solchen Verfahrens mit den Merkmalen des Patentanspruchs 18 gelöst. Vorteilhafte Ausgestaltungen sind Gegenstand von abhängigen Ansprüchen.This object is achieved by a method for reducing noise and background signals in a voice-processing system having the features of patent claim 1 or to an apparatus for carrying out such a method having the features of patent claim 18. Advantageous embodiments are the subject of dependent claims.

Bevorzugt wird demgemäss ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, bei dem ein Audio-Eingangssignal gefiltert wird mittels einer Filterung unter Einsatz eines adaptiven Filters zum Erzeugen eines Vorhersage-Ausgangssignals mit reduziertem Rauschen, wobei das Filtern durchgeführt wird unter Einsatz einer Vielzahl von Koeffizienten zur Bildung einer Vielzahl von Vorhersagefehlern und zur Bildung eines Fehlers aus der Vielzahl von Vorhersagefehlern, wobei mittels einer Vielzahl von Reduktionsparametern die Beträge der Koeffizienten kontinuierlich reduziert werden.Accordingly, a method of reducing noise and background signals in a voice processing system in which an audio input signal is filtered by means of filtering using an adaptive filter to generate a predicted output signal with reduced noise, wherein the filtering is performed using, is accordingly preferred a plurality of coefficients for forming a plurality of prediction errors and for forming one of the plurality of prediction errors, wherein by means of a plurality of reduction parameters, the amounts of the coefficients are continuously reduced.

Bevorzugt wird insbesondere ein Verfahren, bei dem die kontinuierliche Reduktion der Koeffizienten dadurch erzeugt wird, dass die Koeffizienten mit einem Faktor kleiner 1 multipliziert werden, insbesondere mit einem Faktor zwischen 0,8 und 1,0 multipliziert werden.In particular, a method is preferred in which the continuous reduction of the coefficients is produced by multiplying the coefficients by a factor smaller than 1, in particular by multiplying by a factor between 0.8 and 1.0.

Bevorzugt wird insbesondere ein Verfahren, bei dem die Koeffizienten ci(t) berechnet werden gemäß c i t + 1 = c i t + μ e s t - i - k c i t

Figure imgb0002
mit

  • k mit 0 > k << 1, insbesondere k <= 0,0001, als einem Reduktionsparameter,
  • µ << 1, insbesondere µ <= 0,01, als einer Lernrate,
  • s(t) als einem Audio-Eingangssignal zu einer Zeit t,
  • e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler (sv1 - sv4) vom Audio-Eingangssignal s(t),
  • sv(t) als dem Vorhersage-Ausgangssignal aus einer Summe aller einzelnen Vorhersagefehler, mit N als Anzahl der Koeffizienten ci(t) und
  • ci(t) als individuellem Koeffizient mit einem Index i zur Zeit t.
In particular, a method in which the coefficients c i (t) are calculated is preferred c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0002
With
  • k with 0> k << 1, in particular k <= 0.0001, as a reduction parameter,
  • μ << 1, in particular μ <= 0.01, as a learning rate,
  • s (t) as an audio input signal at a time t,
  • e as an error from a difference of all individual prediction errors (sv1 - sv4) from the audio input signal s (t),
  • sv (t) as the prediction output from a sum of all the individual prediction errors, with N as the number of coefficients c i (t) and
  • c i (t) as an individual coefficient with an index i at time t.

Bevorzugt wird insbesondere ein solches Verfahren, bei dem die Koeffizienten berechnet werden gemäß c i t + 1 = c i t + μ e s t - i - k c i t

Figure imgb0003
mit

  • Figure imgb0004
    und
  • Figure imgb0005
In particular, such a method is preferred in which the coefficients are calculated in accordance with c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0003
With
  • Figure imgb0004
    and
  • Figure imgb0005

Bevorzugt wird insbesondere ein Verfahren, bei dem das Vorhersage-Ausgangssignal als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für eine nachfolgende zweite Filterung verwendet wird zum Erzeugen einer zweiten Vorhersage. Bevorzugt wird insbesondere ein solches Verfahren, bei dem die zweite Filterung mittels einer Vorhersagefilterung mit einer zweiten, insbesondere für sich bekannten Filterung mit einem Satz von zweiten Koeffizienten durchgeführt wird, wobei eine Lernrate zum Anpassen der Koeffizienten um einige Zehnerpotenzen kleiner gewählt wird als eine Lernrate der ersten Filterung.In particular, a method is preferred in which the predicted output signal is used as a prediction of the reduced noise audio input signal as an input to a subsequent second filtering to produce a second prediction. In particular, such a method is preferred in which the second filtering is carried out by means of predictive filtering with a second, known per se filtering with a set of second coefficients, wherein a learning rate for adjusting the coefficients by a few powers of ten is chosen to be less than a learning rate of first filtering.

Bevorzugt wird insbesondere ein Verfahren, bei dem die zweite Vorhersage dann vom Vorhersage-Ausgangssignal abgezogen wird, um lang anhaltende Hintergrundgeräusche zu eliminieren.In particular, a method is preferred in which the second prediction is then subtracted from the prediction output signal in order to eliminate long-lasting background noise.

Bevorzugt wird insbesondere ein Verfahren, bei dem eine Lernregel zum Bestimmen der weiteren Koeffizienten unsymmetrisch gestaltet wird, so dass der Betrag der weiteren Koeffizienten im Betrag stärker fallen als steigen und schnell auf Null absinken kann aber nur mit kleiner Steigung ansteigt.In particular, a method is preferred in which a learning rule for determining the further coefficients is asymmetrical, so that the magnitude of the further coefficients falls more sharply in magnitude than can rise and drop rapidly to zero, but increases only with a small slope.

Bevorzugt wird insbesondere ein Verfahren, bei dem statt des Audio-Eingangssignals zum Bestimmen individueller Vorhersagefahler nur dessen Vorzeichen benutzt wird, um kleine Signale nicht zu benachteiligen.In particular, a method is preferred in which, instead of the audio input signal for determining individual prediction errors, only its sign is used so as not to disadvantage small signals.

Bevorzugt wird insbesondere ein Verfahren, bei dem die Koeffizienten begrenzt werden zum Vermeiden eines Abdriftens der Koeffizienten, insbesondere auf einen Bereich von z.B. -4 ... 4, wenn das Audio-Eingangssignal von -1 ... 1 normiert ist.Particularly preferred is a method in which the coefficients are limited to avoid drifting of the coefficients, in particular to a range of e.g. -4 ... 4, if the audio input signal is standardized from -1 ... 1.

Bevorzugt wird insbesondere ein Verfahren, bei dem ein Maximum eines Sprachsignalanteils des Audio-Eingangssignals detektiert wird und das Ausgangssignal wieder auf dieses Maximum insbesondere schleppend normiert wird.In particular, a method is preferred in which a maximum of a speech signal component of the audio input signal is detected and the output signal is normalized, in particular sluggishly, to this maximum.

Bevorzugt wird insbesondere ein Verfahren, bei dem das Ausgabesignal der ersten und/oder der zweiten Filterung im Verhältnis zu deren Eingabesignal insbesondere gleichzeitig als ein Maß für das Vorhandensein von Sprache im Eingabesignal verwendet wird.In particular, a method is preferred in which the output signal of the first and / or the second filtering in relation to their input signal is used in particular simultaneously as a measure of the presence of speech in the input signal.

Bevorzugt wird insbesondere ein Verfahren, bei dem für die erste und/oder die zweite Filterung ein Filter verwendet wird, das mittels einer LMS-Adaption (Least Mean Squares Adaption) eine Fehlervorhersage durchführt. Bevorzugt wird insbesondere ein Verfahren, bei dem für die erste und/oder die zweite Filterung ein FIR-Filter verwendet wird.In particular, a method is preferred in which a filter is used for the first and / or the second filtering, which performs an error prediction by means of an LMS adaptation (Least Mean Squares Adaption). In particular, it is preferred a method in which an FIR filter is used for the first and / or the second filtering.

Bevorzugt wird insbesondere ein Verfahren, bei dem mit dem Vorhersage-Ausgangssignal eine sigmoide Funktion multipliziert wird zum Vermeiden eines Übersteuerns des Signals im Fall einer schlechten Vorhersage.In particular, a method is preferred in which a sigmoid function is multiplied by the predicted output signal to avoid overdriving the signal in the case of a bad prediction.

Bevorzugt wird insbesondere ein Verfahren, bei welchem dem Vorhersage-Ausgangssignal als Originalsignals das Audio-Eingangssignal zugemischt wird zum Erzeugen eines natürlicheren Klangs.Particularly preferred is a method in which the predicted output signal as the original signal, the audio input signal is mixed to produce a more natural sound.

Bevorzugt wird insbesondere ein Verfahren, bei dem zum Durchführen des Verfahrens ein feldprogrammierbarer Baustein oder eine ASIC (Application-Specified-Integrated-Circuit) entsprechend programmiert wird.In particular, a method is preferred in which a field-programmable component or an ASIC (Application-Specified-Integrated-Circuit) is correspondingly programmed for carrying out the method.

Bevorzugt wird demgemäss eine Vorrichtung, insbesondere Vorrichtung zum Durchführen eines Verfahrens, zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, mit einem Audio-Eingang zum Eingeben eines Audio-Eingangssignals einem adaptiven Filter zum Filtern Audio-Eingangssignals zum Erzeugen eines Vorhersage-Ausgangssignals mit reduziertem Rauschen, mit einem Speicher zum Speichern einer Vielzahl von Koeffizienten für das Filter, wobei das Filter ausgebildet oder geschaltet ist zur Bildung einer Vielzahl von Vorhersagefehlern und zur Bildung eines Fehlers aus der Vielzahl von Vorhersagefehlern, wobei eine Koeffizienten-Bereitstellungsanordnung ausgebildet oder geschaltet ist mittels zumindest einem Reduktionsparameter die Beträge der Koeffizienten kontinuierlich zu reduzieren.Accordingly, what is preferred is an apparatus, in particular apparatus for carrying out a method for reducing noise and background signals in a speech processing system, having an audio input for inputting an audio input signal to an adaptive filter for filtering audio input signal to produce a prediction output signal with reduced noise, with a memory for storing a plurality of coefficients for the filter, wherein the filter is configured or switched to form a plurality of prediction errors and to form an error of the plurality of prediction errors, wherein a coefficient providing arrangement is formed or switched by means of at least one reduction parameter to reduce the amounts of the coefficients continuously.

Bevorzugt wird insbesondere eine Vorrichtung, bei der die Koeffizienten-Bereitstellungsanordnung zum Multiplizieren der Koeffizienten mit dem Reduktionsparameter als einem Faktor kleiner 1, insbesondere mit einem Faktor zwischen 0,8 und 1,0 ausgebildet oder geschaltet ist.In particular, a device is preferred in which the coefficient providing arrangement for multiplying the coefficients by the reduction parameter as a factor less than 1, in particular with a factor between 0.8 and 1.0 is formed or connected.

Bevorzugt wird insbesondere eine Vorrichtung, bei welcher einer ersten Filterstufe mit dem Filter als erstem Filter eine zweite Filterstufe mit einem zweiten Filter nachgeschaltet ist zum Zuführen des Vorhersage-Ausgangssignals als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für den zweiten Filter zum Erzeugen einer zweiten Vorhersage.In particular, a device is preferred in which a first filter stage with the filter as the first filter is followed by a second filter stage with a second filter for supplying the predicted output signal as a prediction of the audio input signal with reduced noise as an input signal for the second filter for generating a second prediction.

Bevorzugt wird insbesondere eine Vorrichtung mit einer Subtraktionsschaltung zum Abziehen einer Summe aus Fehler-Vorhersagen der zweiten Filterung vom Vorhersage-Ausgangssignal zum Erzeugen der Vorhersage.Particularly preferred is a device having a subtraction circuit for subtracting a sum of error predictions of the second filtering from the prediction output signal to produce the prediction.

Bevorzugt wird insbesondere eine Vorrichtung, bei der das zweite Filter durch ein LMS-Adaptions-Filter zum Durchführen einer Fehlervorhersage ausgebildet oder geschaltet ist.In particular, a device is preferred in which the second filter is designed or switched by an LMS adaptation filter for carrying out an error prediction.

Bevorzugt wird insbesondere eine Vorrichtung, bei der das erste Filter und/oder das zweite Filter durch ein FIR-Filter zum Durchführen einer Signalvorhersage ausgebildet oder geschaltet ist.In particular, a device is preferred in which the first filter and / or the second filter is formed or switched by an FIR filter for performing a signal prediction.

Bevorzugt wird insbesondere eine Vorrichtung, welche durch einen feldprogrammierbaren Baustein oder einen ASIC ausgebildet ist.In particular, a device which is formed by a field-programmable component or an ASIC is preferred.

Bevorzugt wird insbesondere eine Vorrichtung mit einem Multiplizierer zum Wichten des optional zeitlich verzögerten Audio-Eingangssignal oder zum Wichten des Vorhersage-Ausgangssignals mit einem Wichtungsfaktor kleiner Eins, insbesondere etwa 0,1 und einem Addierer zum Addieren des gewichteten Signals auf das Vorhersage-Ausgangssignal oder auf die Vorhersage zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals.In particular, a device is provided with a multiplier for weighting the optionally time delayed audio input signal or for weighting the prediction output signal with a weighting factor less than one, in particular about 0.1 and an adder for adding the weighted signal to the prediction output signal or the Prediction for generating a noise-reduced audio output signal.

Gegenüber EP 1080465 und US 6,820,053 ist der Rechenaufwand bei dem hier bevorzugten Verfahren um ein Vielfaches geringer. Außerdem ist der Speicherplatzverbrauch um ein Vielfaches geringer. Außerdem entfällt das Problem der sehr schlechten Anpassung der verwendeten Parameter an andere Sampleraten wie bei der spektralen Subtraktion.Across from EP 1080465 and US 6,820,053 is the computational effort in the preferred method here many times lower. In addition, the storage space consumption is many times lower. In addition, the problem of very poor adaptation of the parameters used to other sample rates as in spectral subtraction is eliminated.

Im Vergleich zu den verschiedenen bekannten Verfahren ist der Rechenaufwand sehr viel geringer. Während bei einer Fouriertransformation der Rechenaufwand bei O(n log(n)) liegt und der Rechenaufwand einer Autokorrelation bei O(n2) liegt, liegt der Rechenaufwand des hier bevorzugten Verfahrens gesamten Verfahrens beider Filterstufen zusammen nur bei O(n), wobei n eine Anzahl abgetasteter Samples (Stützstellen) des Eingangssignals und O eine allgemeine Funktion des Filteraufwands ist.Compared to the various known methods, the computational effort is much lower. Whereas in a Fourier transformation the computation outlay is O (n log (n)) and the computational cost of an autocorrelation is O (n 2 ), the computational effort of the preferred method of the entire method of both filter stages is only O (n), where n a number of sampled samples (nodes) of the input signal and O is a general function of the filter overhead.

Durch die besonders bevorzugte Filteranordnung ergibt sich eine Vielzahl an Vorteilen. Ein Sprachsignal wird nur um ein einziges Sample verzögert. Eine Adaption ist für rauschen instantan und für lang anhaltende Hintergrundgeräusche ist die Adaption vorzugsweise etwa 0,2 s bis 5,0 s verzögert.The particularly preferred filter arrangement results in a large number of advantages. A speech signal is only delayed by a single sample. An adaptation is for noises instantaneously and for long-lasting background noises, the adaptation is preferably delayed about 0.2 s to 5.0 s.

Das Verfahren ist wesentlich weniger rechenaufwändig als übliche Verfahren. Schon mit insbesondere nur vier Koeffizienten erhält man respektable Ergebnisse, so dass nur vier Multiplikationen und vier Additionen für die Vorhersage eines Samples berechnet werden müssen und nur vier bis fünf weitere Operationen für die Adaption der Filterkoeffizienten erforderlich sind.The method is much less computationally expensive than conventional methods. Especially with only four coefficients one obtains respectable results, so that only four multiplications and four additions have to be calculated for the prediction of one sample and only four to five further operations for the adaptation of the filter coefficients are required.

Hinzu kommt ein geringerer Speicherplatzverbrauch als für übliche Verfahren, wie z.B. der spektralen Subtraktion.
Ermöglicht wird ein einfaches Justieren der Parameter auch bei verschiedenen Sampleraten. Außerdem kann die Stärke der Filterung für Rauschen und für lang anhaltende Hintergrundsignale separat eingestellt werden.
In addition, there is a lower memory consumption than for conventional methods, such as the spectral subtraction.
A simple adjustment of the parameters is also possible with different sample rates. In addition, the amount of filtering for noise and for long-lasting background signals can be set separately.

Ein Ausführungsbeispiel wird nachfolgend anhand der Zeichnung näher erläutert. Es zeigen:

Fig. 1
eine bevorzugte Filteranordnung sur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit zwei hintereinander geschalteten Filterstufen,
Fig. 2
vergrößert dargestellt die erste der biden Filterstufen und
Fig. 3
vergrößert dargestellt die zweite der beiden Filterstufen.
An embodiment will be explained in more detail with reference to the drawing. Show it:
Fig. 1
a preferred filter arrangement sur reduction of noise and background signals in a voice processing system with two filter stages connected in series,
Fig. 2
enlarged the first of the biden filter stages and
Fig. 3
shown enlarged the second of the two filter stages.

Wie aus Fig. 1 ersichtlich, besteht das besonders bevorzugte Verfahren aus zwei adaptiven Filtern F1, F2, welche als eine erste und eine zweite Filterstufe hintereinander geschaltet sind. Eigenständig vorteilhaft ist jedoch bereits der Einsatz nur der ersten Filterstufe.As can be seen from FIG. 1, the particularly preferred method consists of two adaptive filters F1, F2, which are connected in series as a first and a second filter stage. Autonomously advantageous, however, is already the use of only the first filter stage.

In die besonders bevorzugte Schaltungsanordnung wird über einen Audio-Eingang 1 ein Audio-Eingangssignal s(t) eingegeben. Das Audio-Eingangssignal wird einer Gruppe von Verzögerungsgliedern 2 angelegt, welche z. B. als Puffer ausgebildet sind und den jeweils anliegenden Wert des Audio-Eingangssignals s(t) um jeweils einen Takt verzögern. Außerdem wird das Audio-Eingangssignal s(t) einem ersten Addierer 3 zugeführt. Die mittels der Verzögerungsglieder 2 verzögerten Werte s(t-1) - s(t-4) werden von dem jeweiligen Verzögerungsglied 2 aus jeweils dem nächsten der Verzögerungsglieder 2 sowie jeweils zwei entsprechenden Multiplizierern zweier Gruppen aus Multiplizierern 4 angelegt. Der Gruppe zweiter Multiplizierer 5 wird an einen weiteren Multiplikationseingang jeweils ein Koeffizient c1 - c4 als Filterkoeffizient eines adaptiven Filters angelegt. Die Multiplikationsergebnisse der Gruppe zweiter Multiplizierer 5 werden als individuelle Vorhersagefehler sv1 - sv4 an einen zweiten Addierer 6 ausgegeben. Eine zeitliche Abfolge der Additionswerte des zweiten Addierers 6 bildet ein Vorhersage-Ausgangssignal sv(t).In the particularly preferred circuit arrangement, an audio input signal s (t) is input via an audio input 1. The audio input signal is applied to a group of delay elements 2, which z. B. are formed as a buffer and delay the respective applied value of the audio input signal s (t) by one clock. In addition, the audio input signal s (t) is supplied to a first adder 3. The values s (t-1) -s (t-4) delayed by means of the delay elements 2 are output from the respective delay element 2 to the next of the delay elements 2 and respectively two corresponding multipliers of two groups of multipliers 4 created. The group of second multipliers 5 is applied to a further multiplication input in each case a coefficient c1 - c4 as a filter coefficient of an adaptive filter. The multiplication results of the group of second multipliers 5 are output to a second adder 6 as individual prediction errors sv1-sv4. A time sequence of the addition values of the second adder 6 forms a prediction output sv (t).

Die Abfolge der Werte des Vorhersage-Ausgangssignals sv(t) werden gemäß einer ersten vorteilhaften Ausführungsform direkt ausgegeben, um ein Ausgangssignal o(t) zu bilden (Fig. 2).The sequence of values of the predicted output signal sv (t) are directly output according to a first advantageous embodiment to form an output signal o (t) (FIG. 2).

Die Abfolge der Werte des Vorhersage-Ausgangssignals sv(t) werden außerdem dem als Subtraktionsschaltung ausgebildeten ersten Addierer 3 an einem Subtraktionseingang angelegt, um diese Werte vom momentanen späteren Wert des Audio-Eingangssignals s(t) abzuziehen. Das Subtraktionsergebnis des ersten Addierers 3 bildet einen Fehler e aus einer entsprechenden Abfolge einzelner Fehlerwerte. Dieser Fehler e wird einem dritten Multiplizierer 8 angelegt, an dessen zweitem Multiplikationseingang ein Wert einer Lernrate µ mit vorzugsweise µ ≈ 0,01 angelegt. Das Multiplikationsergebnis wird den Eingängen der Gruppe erster Multiplizierer 4 zur Multiplikation mit den verzögerten Werten s(t-1) - s(t-4) angelegt.The sequence of values of the predicted output sv (t) are also applied to the first adder 3 formed as a subtraction circuit at a subtraction input to subtract these values from the current later value of the audio input signal s (t). The subtraction result of the first adder 3 forms an error e from a corresponding sequence of individual error values. This error e is applied to a third multiplier 8, at the second multiplication input of which a value of a learning rate μ with preferably μ≈0.01 is applied. The multiplication result is applied to the inputs of the group of first multipliers 4 for multiplication by the delayed values s (t-1) -s (t-4).

Die Multiplikationsergebnisse der Gruppe erster Multiplizierer 4 werden einer Gruppe aus dritten Addierern 10 zugeführt, welche einen Eingang einer Koeffizienten-Bereitstellungsanordnung 9 ausbilden. Die Ausgangswerte der Gruppe dritter Addierer 10 bilden die Koeffizienten c1 - c3 aus, welche den entsprechenden Multiplizierern 5 der Gruppe zweiter Multiplizierer 5 angelegt werden. Außerdem werden diese Koeffizienten c1 - c4 jeweils einem Addierer 11 einer Gruppe vierter Addierer 11 und jeweils einem Multiplizierer 12 einer Gruppe vierter Multiplizierer 12 angelegt. An die Gruppe vierter Multiplizierer 12 wird an einen Multiplikationseingang ein Reduktionsparameter k angelegt, wobei der Wert des Reduktionsparameters k beispielsweise 0,0001 beträgt. Durch den Reduktionsparameter k wird entsprechend der jeweilige Wert der Koeffizienten c1 - c4 um diesen Faktor reduziert. Das entsprechende Multiplikationsergebnis der vierten Multiplizierer 12 wird dem jeweiligen der als Subtraktionschaltung ausgebildeten vierten Addierer 11, dem zuvor der entsprechende Koeffizient c1 - c4 angelegt wurde, an einem Subtraktionseingang angelegt. Der Ausgangswert der jeweiligen Addierer 11 der vierten Gruppe Addierer 11 wird einem weiteren Eingang des entsprechenden dritten Addierers der Gruppe dritter Addierer 10 angelegt. Dabei wird von der Gruppe dritter Addierer 10 der jeweilige Additionswert der Gruppe vierter Addierer 11 auf den jeweils angelegten und verzögerten Audio-Signaleingangswert s(t-1) - s(t-4) aufaddiert, um die Koeffizienten zu lernen.The multiplication results of the group of first multipliers 4 are supplied to a group of third adders 10, which form an input of a coefficient providing arrangement 9. The output values of the group of third adders 10 form the coefficients c1 - c3, which are applied to the corresponding multipliers 5 of the group of second multipliers 5. In addition, these coefficients c1-c4 are each applied to an adder 11 of a group of fourth adders 11 and in each case to a multiplier 12 of a group of fourth multipliers 12. To the group of fourth multipliers 12 For example, a reduction parameter k is applied to a multiplication input, wherein the value of the reduction parameter k is, for example, 0.0001. By means of the reduction parameter k, the respective value of the coefficients c1-c4 is correspondingly reduced by this factor. The corresponding multiplication result of the fourth multipliers 12 is applied to the respective one of the fourth adder 11 formed as a subtraction circuit, to which the corresponding coefficient c1-c4 has previously been applied, at a subtraction input. The output value of the respective adders 11 of the fourth group adder 11 is applied to another input of the corresponding third adder of the group of third adders 10. In this case, the group of third adders 10 adds the respective addition value of the group of fourth adders 11 to the respectively applied and delayed audio signal input value s (t-1) -s (t-4) in order to learn the coefficients.

Mittels eines Addierers 7 kann dem Vorhersage-Ausgangssignal sv(t) zur Bildung des Ausgangssignals o(t) optional ein gewichteter Wert aufaddiert werden, der direkt vom momentanen oder optional von einem entsprechend verzögerten Wert des Audio-Eingangssignals s(t) gebildet wird. Der gewichtete Wert wird durch einen Wichtungs-Multiplizierer 15 bereitgestellt, der das Eingangssignal s(t) mit einem Faktor η < 1, insbesondere η ≈ 0,1 multipliziert.By means of an adder 7, the prediction output signal sv (t) for forming the output signal o (t) can optionally be added with a weighted value formed directly from the instantaneous or optionally from a correspondingly delayed value of the audio input signal s (t). The weighted value is provided by a weighting multiplier 15, which multiplies the input signal s (t) by a factor η <1, in particular η ≈ 0.1.

Vorzugsweise wird das Vorhersage-Ausgangssignal sv(t) bzw. das Ausgangssignal o(t) nicht als endgültiges Ausgangssignal ausgegeben sondern als Eingangssignal für eine zweite Filterstufe mit dem zweiten Filter F2 bereitgestellt.Preferably, the predicted output sv (t) or the output o (t) is not output as a final output but provided as an input to a second filter stage with the second filter F2.

Wie dies in Fig. 3 dargestellt ist, handelt es sich bei dem zweiten Filter F2 wiederum um eine adaptive Filteranordnung, wobei deren Aufbau vorzugsweise im Wesentlichen gleich dem Aufbau der ersten Filterstufe ist. Nachfolgend werden daher lediglich Unterschiede zu der ersten Filterstufe beschrieben. Die jeweiligen Komponenten und Signale bzw. Werte sind mit einem Stern zur Unterscheidung entsprechender Komponenten und Signale bzw. Werte der ersten Filterstufe gekennzeichnet.As shown in Fig. 3, the second filter F2 is again an adaptive filter arrangement, the construction of which is preferably substantially equal to the structure of the first filter stage. Therefore, only differences to the first filter stage will be described below. The respective components and signals or values are with a Star for distinguishing the corresponding components and signals or values of the first filter stage characterized.

Unterschiedlich ist die Erzeugung der Koeffizienten c*1 - c*4 in einer gegenüber der ersten Filterstufe modifizierten Koeffizienten-Bereitstellungseinrichtung 9*. Die Koeffizienten c*1 - c*4 werden in für sich bekannter Art und Weise eines z. B. adaptiven FIR-Filter ohne eine Multiplikation mit einem Reduktionsparameter k gebildet. Ein weiterer Unterschied gegenüber sowohl der ersten Filterstufe des ersten Filters F1 als auch einem herkömmlichen FIR-Filter besteht darin, dass der Wert einer Lernrate µ* für den zweiten Filter F2 kleiner, insbesondere deutlich kleiner als der Wert der Lernrate µ des ersten Filters F1 gewählt wird.Different is the generation of the coefficients c * 1 - c * 4 in a comparison with the first filter stage modified coefficient providing means 9 *. The coefficients c * 1 - c * 4 are in a known manner of a z. B. adaptive FIR filter formed without a multiplication with a reduction parameter k. Another difference compared to both the first filter stage of the first filter F1 and a conventional FIR filter is that the value of a learning rate μ * for the second filter F2 smaller, especially much smaller than the value of the learning rate μ of the first filter F1 is selected becomes.

Das Ausgangsergebnis des zweiten Filters F2 wird entsprechend durch einen zweiten Addierer 6* des zweiten Filters F2 bereitgestellt und dem Eingangssignal bzw. dem entsprechenden Eingangswert des Eingangssignals sv(t) des zweiten Filters F2 mittels eines fünften Addierers 13* aufaddiert bzw. vorzugsweise davon subtrahiert im Fall eines bevorzugt als Subtraktionsschaltung ausgebildeten Addierers 6*. Das Ausgangsergebnis des fünften Addierers 13* bildet eine zweite Vorhersage sv*(t) als ein zweites Vorhersage-Ausgangssignal aus. Vorzugsweise werden die Werte der Vorhersage sv*(t) mittels eines sechsten Addierers 14* dem optional zeitlich verzögerten und gewichteten Audio-Eingangssignal s(t) bzw. sv(t) aufaddiert zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals o*(t). Zur Wichtung dient eine Multiplikation des Audio-Eingangssignals s(t) mit einem Wichtungsfaktor η* <1, insbesondere η ≈ 0,1 in einem Multiplizierer 15*, der dem sechsten Addierer 14* vorgeschaltet ist. Zum Steuern der Verfahrensschritte weist die Anordnung in üblicher Art und Weise weitere Komponenten auf oder ist an weitere Komponenten wie z.B. einen Prozessor für Steuerfunktionen und einen Taktgeber zum Bereitstellen eines Taktsignals angeschlossen. Zum Speichern der Koeffizienten c1 - c4, c*1 - c*4 und ggfs. weiterer Werte weist die Anordnung einen Speicher auf oder kann auf einen Speicher zugreifen.The output result of the second filter F2 is correspondingly provided by a second adder 6 * of the second filter F2 and added to the input signal or the corresponding input value of the input signal sv (t) of the second filter F2 by means of a fifth adder 13 * or preferably subtracted therefrom Case of an adder 6 *, preferably designed as a subtraction circuit. The output of the fifth adder 13 * forms a second prediction sv * (t) as a second prediction output. Preferably, the values of the prediction sv * (t) are added to the optionally time-delayed and weighted audio input signal s (t) or sv (t) by means of a sixth adder 14 * to produce a noise-reduced audio output signal o * (t). For the purpose of weighting, a multiplication of the audio input signal s (t) with a weighting factor η * <1, in particular η ≈ 0.1 in a multiplier 15 *, which precedes the sixth adder 14 *. In order to control the method steps, the arrangement has further components in a conventional manner or is connected to further components such as a processor for control functions and a clock generator for providing a clock signal. To store the coefficients c1 - c4, c * 1 - c * 4 and, if necessary, other values, the arrangement has a memory or can access a memory.

Das erste Filter F1 reduziert das Rauschen über den gesamten wahrgenommenen Frequenzbereich. Dabei wird ein modifiziertes adaptives FIR-Filter, darauf trainiert, das Audio-Eingangssignal s(t), das z.B. Sprache und Rauschen enthält, möglichst gut aus den vergangenen n Werten vorherzusagen. Die Ausgabe sind die vorhergesagten Werte als das Vorhersage-Ausgangssignal sv(t). Die Beträge der allgemeinen Koeffizienten ci(t) mit gemäß Fig. 1 einem Index i = 1, 2, 3, 4 und entsprechend den Koeffizienten C1 - C4 eines solchen ersten Filters F1 steigen bei Rauschsignalen langsamer als bei Sprachsignalen.The first filter F1 reduces the noise over the entire perceived frequency range. Here, a modified adaptive FIR filter is trained to predict the audio input signal s (t) containing eg speech and noise as well as possible from the past n values. The output is the predicted values as the prediction output sv (t). The amounts of the general coefficients c i (t) according to FIG. 1 with an index i = 1, 2, 3, 4 and corresponding to the coefficients C 1 -C 4 of such a first filter F1 increase more slowly with noise signals than with speech signals.

Das Filtern erfolgt in Analogie zur LPC. Statt der einer Delta-Regel oder einem LMS- Lernschritt gemäß dem Stand der Technik wird nun ein modifiziertes Filterverfahren eingesetzt, bei dem die Koeffizienten ci(t) allgemein gemäß einer neuen Lernregel berechnet werden gemäß c i t + 1 = c i t + μ e s t - i - k c i t

Figure imgb0006
mit e = S t - sv t ,
Figure imgb0007
sv t = i = 1 N c i ( t - 1 ) s t - i und
Figure imgb0008
und mit k mit 0 > k << 1, z.B. k = 0,0001, als einem Reduktionsparameter, mit µ << 1, z.B. µ = 0,01, als einer Lernrate, mit s(t) als einem Audio-Eingangssignal zur Zeit t, mit e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler vom Audio-Eingangssignal, mit sv(t) als einem Vorhersage-Ausgangssignal aus einer Summe der Koeffizienten multipliziert mit den zugehörigen verzögerten Signalen, mit N als Anzahl der Koeffizienten ci(t) und mit ci(t) als individuellem Koeffizient mit einem Parameter bzw. Index i zur Zeit t.The filtering is done in analogy to the LPC. Instead of a delta rule or an LMS learning step according to the prior art, a modified filtering method is now used in which the coefficients c i (t) are generally calculated according to a new learning rule c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0006
With e = S t - sv t .
Figure imgb0007
sv t = Σ i = 1 ... N c i ( t - 1 ) s t - i and
Figure imgb0008
and with k with 0> k << 1, eg k = 0.0001, as a reduction parameter, with μ << 1, eg μ = 0.01, as a learning rate, with s (t) as an audio input signal to Time t, with e as an error of a difference of all individual prediction errors from the audio input signal, with sv (t) as a prediction output signal of a sum of the coefficients multiplied by the associated delayed signals, with N as the number of coefficients c i ( t) and with c i (t) as an individual coefficient with a parameter or index i at time t.

Gemäß der Lernregel unter Einsatz des Reduktionsparameters k werden die Beträge der Koeffizienten ci(t) kontinuierlich reduziert, was bei Rauschsignalen zu kleineren vorhergesagten Amplituden führt als bei Sprachsignalen. Dabei wird mit dem Reduktionsparameter k festgelegt, wie stark das Rauschen unterdrückt werden soll.According to the learning rule using the reduction parameter k, the amounts of the coefficients c i (t) are continuously reduced, resulting in smaller predicted amplitudes in noise signals than in speech signals. It is determined with the reduction parameter k, how much the noise should be suppressed.

Das zweite Filter F2 reduziert lang anhaltende Hintergrundgeräusche. Dabei wird ausgenutzt, dass die Energie von Sprachsignalanteilen im Audio-Eingangssignal s(t) in einzelnen Frequenzbändern immer wieder auf Null abfällt, wohingegen lang anhaltende Töne eher eine gleichbleibende Energie im Frequenzband haben. Ein adaptives FIR-Filter mit extrem kleiner Lernrate von z.B. µ = 0,000001 wird nun für eine Vorhersage mittels insbesondere LPC so langsam adaptiert, dass der Sprachsignalanteil im Audio-Eingangssignal s(t) mit sehr viel geringerer Amplitude vorhergesagt wird als lang anhaltende Signale. Abschließend wird die derart in dem zweiten Filter F2 erlangte Vorhersage sv*(t) vom Eingangssignal s(t) abgezogen, so dass die lang anhaltenden Signale aus dem Eingangssignal s(t) eliminiert oder zumindest stark reduziert werden.The second filter F2 reduces long-lasting background noise. It exploits the fact that the energy of speech signal components in the audio input signal s (t) repeatedly falls to zero in individual frequency bands, whereas long-lasting tones tend to have a constant energy in the frequency band. An adaptive FIR filter with extremely low learning rate of e.g. μ = 0.000001 is now adapted so slowly for prediction by means of LPC in particular that the speech signal component in the audio input signal s (t) is predicted with much lower amplitude than long-lasting signals. Finally, the prediction sv * (t) thus obtained in the second filter F2 is subtracted from the input signal s (t), so that the long-lasting signals from the input signal s (t) are eliminated or at least greatly reduced.

Das erste und das zweite Filter F1, F2 wirken besonders effizient, wenn sie hintereinander auf das Eingangssignal s(t) ausgeführt werden, wie dies in Fig. 1 dargestellt ist. Dabei wird erst das erste Filter F1 ausgeführt und dessen Ausgangs- bzw. Vorhersage-Ausgangssignal sv(t) als Eingangssignal an das zweite Filter F2 zur weiteren zusätzlichen Filterung geleitet.The first and second filters F1, F2 are particularly efficient when executed one after the other on the input signal s (t), as shown in FIG. In this case, first the first filter F1 is executed and its output or predicted output signal sv (t) is passed as an input signal to the second filter F2 for further additional filtering.

Fig. 1 zeigt schematisch einen Amplitudenverlauf a über der Zeit t eines beispielhaften Eingangssignal s(t) im Zeitbereich vor und nach der Filterung durch das erste Filter F1 zur Rauschunterdrückung. Während das Eingangssignal s(t) Sprache und Rauschen enthält, enthält das Vorhersage-Ausgangssignal sv(t) des ersten Filters F1 Sprache und ein demgegenüber reduziertes Rauschen.1 schematically shows an amplitude curve a over the time t of an exemplary input signal s (t) in the time domain before and after the filtering by the first filter F1 for noise suppression. While the input signal s (t) includes speech and noise, the prediction output sv (t) of the first filter F1 includes speech and a reduced noise.

Fig. 2 zeigt schematisch einen Amplitudenverlauf a über der Zeit t eines beispielhaften Eingangssignals s(t) bzw. des Vorhersage-Ausgangssignals sv(t) im Frequenzbereich vor und nach der Filterung durch das zweite Filter F2 zur Unterdrückung von lang anhaltenden Hintergrundgeräuschen. Dabei entspricht die x-Achse der Zeit t, die y-Achse einer Frequenz f und eine Helligkeit entspricht einer Amplitude. Erkennbar ist ein Spektrum eines markanten 2kHz-Ton im Hintergrund vor dem zweiten Filter F2 gegenüber einem Spektrum mit reduziertem 2kHz-Ton nach dem zweiten Filter F2.Fig. 2 shows schematically an amplitude curve a over the time t of an exemplary input signal s (t) and the prediction output signal sv (t) in the frequency range before and after the filtering by the second filter F2 for the suppression of long-lasting background noise. In this case, the x-axis corresponds to the time t, the y-axis corresponds to a frequency f and a brightness corresponds to an amplitude. Recognizable is a spectrum of a prominent 2 kHz tone in the background in front of the second filter F2 compared to a spectrum with a reduced 2 kHz tone after the second filter F2.

Anstelle einer kontinuierlichen Reduktion der Koeffizienten C1 - C4 gemäß Formel (2) kann die Reduktion der Koeffizienten ci(t) alternativ oder zusätzlich auch dadurch erzeugt werden, dass die Koeffizienten ci(t) mit einem festen oder variablen Faktor zwischen insbesondere 0,8 und 1,0 multipliziert werden.Instead of a continuous reduction of the coefficients C1-C4 according to formula (2), the reduction of the coefficients c i (t) can alternatively or additionally also be produced by the coefficients c i (t) having a fixed or variable factor between in particular 0, 8 and 1.0 are multiplied.

Vorteilhaft ist ein Verfahren bzw. eine Vorrichtung bei der nach dem Einsatz des ersten Filters F1 mit dessen Vorhersage-Ausgangssignal sv(t) eine sigmoide Funktion, z.B. ein Tangenshyperbolikus, multipliziert wird, die bei einer schlechten Vorhersage ein Übersteuern des Signals vermeidet.Advantageously, a method and apparatus, respectively, in which a sigmoidal function, e. G. (T), is applied after the first filter F1 has been used with its predicted output sv (t). a hyperangular hyperbaric, which avoids overdriving the signal in case of a bad prediction.

Vorteilhaft ist ein Verfahren bzw. eine Vorrichtung, wenn dem Vorhersage-Ausgangssignal (sv(t)) als Originalsignals das Audio-Eingangssignal (s(t)) zugemischt wird zum Erzeugen eines natürlicheren Klangs.A method and a device are advantageous if the audio input signal (s (t)) is added to the prediction output signal (sv (t)) as the original signal in order to produce a more natural sound.

Anstelle eines einzigen Reduktionsparameters k für alle Koeffizienten c1 - c4 können auch mehrere Reduktionsparameter für die verschiedenen Koeffizienten c1 - c4 individuell festgelegt oder bestimmt werden. Insbesondere können der oder die Reduktionsparameter k auch abhängig von z.B. dem empfangenen Audio-Eingangssignal variiert werden.Instead of a single reduction parameter k for all coefficients c1-c4, a plurality of reduction parameters for the different coefficients c1-c4 can also be determined or determined individually. In particular, the reduction parameter or k can also be dependent on e.g. be varied according to the received audio input signal.

Claims (27)

Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, bei dem - ein Audio-Eingangssignal (s(t)) gefiltert wird mittels einer Filterung unter Einsatz eines adaptiven Filters zum Erzeugen eines Vorhersage-Ausgangssignals (sv(t)) mit reduziertem Rauschen, - wobei das Filtern durchgeführt wird unter Einsatz einer Vielzahl von Koeffizienten (ci(t); c1 - c4) zur Bildung einer Vielzahl von Vorhersagefehlern (sv1 - sv4) und zur Bildung eines Fehlers (e) aus der Vielzahl von Vorhersagefehlern (sv1 - sv4), dadurch gekennzeichnet, dass - mittels einer Vielzahl von Reduktionsparametern (k) die Beträge der Koeffizienten (ci(t); c1 - c4) fortlaufend reduziert werden. Method for reducing noise and background signals in a speech processing system, in which an audio input signal (s (t)) is filtered by means of filtering using an adaptive filter to produce a predicted output signal (sv (t)) with reduced noise, wherein the filtering is performed using a plurality of coefficients (c i (t); c1-c4) to form a plurality of prediction errors (sv1-sv4) and to form an error (e) from the plurality of prediction errors (sv1-sv4) SV4), characterized in that - By means of a plurality of reduction parameters (k), the amounts of the coefficients (c i (t); c1 - c4) are continuously reduced. Verfahren nach Anspruch 1, bei dem die kontinuierliche Reduktion der Koeffizienten (ci(t)) dadurch erzeugt wird, dass die Koeffizienten (ci(t)) mit einem Faktor kleiner 1 multipliziert werden, insbesondere mit einem Faktor zwischen 0,8 und 1,0 multipliziert werden.Method according to Claim 1, in which the continuous reduction of the coefficients (c i (t)) is produced by multiplying the coefficients (c i (t)) by a factor of less than 1, in particular by a factor between 0.8 and 1.0 multiplied. Verfahren nach Anspruch 1 oder 2, bei dem die Koeffizienten (ci(t)) berechnet werden gemäß c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0009
mit - k mit 0 > k << 1, insbesondere k <= 0,0001, als einem Reduktionsparameter, - p << 1, insbesondere µ <= 0,01, als einer Lernrate, - s(t) als einem Audio-Eingangssignal zu einer Zeit t, - e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler (sv1 - sv4) vom Audio-Eingangssignal s(t), - sv(t) als dem Vorhersage-Ausgangssignal aus einer Summe aller einzelnen Vorhersagefehler, mit N als Anzahl der Koeffizienten ci(t) und - ci(t) als individuellem Koeffizient mit einem Index i zur Zeit t.
Method according to Claim 1 or 2, in which the coefficients (c i (t)) are calculated in accordance with c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0009
With k with 0> k << 1, in particular k <= 0.0001, as a reduction parameter, p << 1, in particular μ <= 0.01, as a learning rate, s (t) as an audio input signal at a time t, e as an error from a difference of all individual prediction errors (sv1-sv4) from the audio input signal s (t), sv (t) as the prediction output from a sum of all single prediction error, with N as the number of coefficients c i (t) and - c i (t) as an individual coefficient with an index i at time t.
Verfahren nach Anspruch 3, bei dem die Koeffizienten (ci(t)) berechnet werden gemäß c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0010
mit
Figure imgb0011
und
Figure imgb0012
The method of claim 3, wherein the coefficients (c i (t)) are calculated according to c i t + 1 = c i t + μ e s t - i - k c i t
Figure imgb0010
With
Figure imgb0011
and
Figure imgb0012
Verfahren nach einem vorstehenden Anspruch, bei dem das Vorhersage-Ausgangssignal (sv(t)) als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für eine nachfolgende zweite Filterung (F2) verwendet wird zum Erzeugen einer zweiten Vorhersage (sv*(t)).A method according to any preceding claim, wherein the predicted output signal (sv (t)) is used as a prediction of the reduced noise audio input signal as an input to a subsequent second filtering (F2) to produce a second prediction (sv * (t )). Verfahren nach Anspruch 5, bei dem die zweite Filterung (F2) mittels einer Vorhersagefilterung mit einer zweiten, insbesondere für sich bekannten Filterung mit einem Satz von zweiten Koeffizienten (ci(t), c*1 - c*4)) durchgeführt wird, wobei eine Lernrate (µ*) zum Anpassen der Koeffizienten um einige Zehnerpotenzen kleiner gewählt wird als eine Lernrate (µ) der ersten Filterung (F1).Method according to Claim 5, in which the second filtering (F2) is carried out by means of prediction filtering with a second, in particular per se known, filtering with a set of second coefficients (c i (t), c * 1-c * 4)), wherein a learning rate (μ *) for adjusting the coefficients by a few powers of ten is chosen smaller than a learning rate (μ) of the first filtering (F1). Verfahren nach Anspruch 5 oder 6, bei dem die zweite Vorhersage (sv*(t)) dann vom Vorhersage-Ausgangssignal (sv(t)) abgezogen wird.The method of claim 5 or 6, wherein the second prediction (sv * (t)) is then subtracted from the predicted output signal (sv (t)). Verfahren nach einem der Ansprüche 5 bis 7, bei dem eine Lernregel zum Bestimmen der weiteren Koeffizienten (ci*(t); c*1 - c*4) unsymmetrisch gestaltet wird, so dass der Betrag der weiteren Koeffizienten (ci*(t); c*1 - c*4) im Betrag stärker fallen als steigen und schnell auf Null absinken kann aber nur mit kleiner Steigung ansteigt.Method according to one of Claims 5 to 7, in which a learning rule for determining the further coefficients (c i * (t); c * 1 - c * 4) is made asymmetrical, such that the magnitude of the further coefficients (c i * ( t); c * 1 - c * 4) fall more in the amount than rise and fall rapidly to zero but can only increase with a small slope. Verfahren nach einem vorstehenden Anspruch, bei dem statt des Audio-Eingangssignals (S(t)) zum Bestimmen individueller Vorhersagefehler (sv1 - sv4) nur dessen Vorzeichen benutzt wird.Method according to any preceding claim, wherein instead of the audio input signal (S (t)) for determining individual prediction errors (sv1 - sv4) only its sign is used. Verfahren nach einem vorstehenden Anspruch, bei dem die Koeffizienten (ci(t); c1 - c4) begrenzt werden zum Vermeiden eines Abdriftens der Koeffizienten, insbesondere von -4 ... 4, wenn das Audio-Eingangssignal von -1 ... 1 normiert ist.A method as claimed in any preceding claim, wherein the coefficients (c i (t); c1-c4) are limited to avoid drifting the coefficients, in particular -4 ... 4, when the audio input signal is -1 ... 1 is normalized. Verfahren nach einem vorstehenden Anspruch, bei dem ein Maximum eines Sprachsignalanteils des Audio-Eingangssignals (s(t)) detektiert wird und das Ausgangssignal (o(t)) wieder auf dieses Maximum normiert wird.Method according to one of the preceding claims, wherein a maximum of a speech signal component of the audio input signal (s (t)) is detected and the output signal (o (t)) is normalized again to this maximum. Verfahren nach einem vorstehenden Anspruch, bei dem das Ausgabesignal (sv(t); sv*(t)) der ersten und/oder der zweiten Filterung im Verhältnis zu deren Eingabesignal (s(t); sv(t)) als ein Maß für das Vorhandensein von Sprache im Eingabesignal verwendet wird.A method as claimed in any preceding claim, wherein the output signal (sv (t); sv * (t)) of the first and / or second filtering in relation to its input signal (s (t); sv (t)) is a measure of the presence of speech is used in the input signal. Verfahren nach einem vorstehenden Anspruch, bei dem für die erste und/oder die zweite Filterung ein Filter verwendet wird, das mittels einer LMS-Adaption (Least Mean Squares Adaption) eine Fehlervorhersage durchführt.Method according to one of the preceding claims, in which a filter which performs an error prediction by means of a Least Mean Square Adaptation (LMS) adaptation is used for the first and / or the second filtering. Verfahren nach einem vorstehenden Anspruch, bei dem für die erste und/oder die zweite Filterung ein FIR-Filter verwendet wird.Method according to any preceding claim, wherein an FIR filter is used for the first and / or the second filtering. Verfahren nach einem vorstehenden Anspruch, bei dem mit dem Vorhersage-Ausgangssignal (sv(t)) eine sigmoide Funktion multipliziert wird zum Vermeiden eines Übersteuerns des Signals im Fall einer schlechten Vorhersage.A method as claimed in any preceding claim, wherein a sigmoidal function is multiplied by the predicted output signal (sv (t)) to avoid overdriving the signal in the case of a bad prediction. Verfahren nach einem vorstehenden Anspruch, bei welchem dem Vorhersage-Ausgangssignal (sv(t)) das Audio-Eingangssignal (s(t)) zugemischt wird.A method according to any preceding claim, wherein the audio input signal (s (t)) is mixed in with the predicted output signal (sv (t)). Verfahren nach einem vorstehenden Anspruch, bei dem zum Durchführen des Verfahrens ein feldprogrammierbarer Baustein oder eine ASIC (Application-Specified-Integrated-Circuit) entsprechend programmiert wird.A method according to any preceding claim, wherein a field programmable device or an ASIC (Application-Specified-Integrated-Circuit) is programmed accordingly to perform the method. Vorrichtung zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, mit - einem Audio-Eingang (1) zum Eingeben eines Audio-Eingangssignals (s(t)), - einem adaptiven Filter (F1) zum Filtern Audio-Eingangssignals (s(t)) zum Erzeugen eines Vorhersage-Ausgangssignals (sv(t)) mit reduziertem Rauschen, - mit einem Speicher zum Speichern einer Vielzahl von Koeffizienten (ci(t); C1 - C4) für das Filter (F1), - wobei das Filter (F1) ausgebildet oder geschaltet ist zur Bildung einer Vielzahl von Vorhersagefehlern (sv1 - sv4) und zur Bildung eines Fehlers (e) aus der Vielzahl von Vorhersagefehlern (sv1 - sv4), dadurch gekennzeichnet, dass - eine Koeffizienten-Bereitstellungsanordnung (9) ausgebildet oder geschaltet ist mittels zumindest einem Reduktionsparameter (k) die Beträge der Koeffizienten (ci(t); C1 - C4) fortlaufend zu reduzieren. Device for reducing noise and background signals in a speech processing system, with an audio input (1) for inputting an audio input signal (s (t)), an adaptive filter (F1) for filtering audio input signal (s (t)) for generating a predicted output signal (sv (t)) with reduced noise, a memory for storing a plurality of coefficients (c i (t); C1-C4) for the filter (F1), - wherein the filter (F1) is designed or switched to form a plurality of prediction errors (sv1 - sv4) and to form an error (e) from the plurality of prediction errors (sv1 - sv4), characterized in that - A coefficient-providing arrangement (9) is formed or connected by means of at least one reduction parameter (k) to reduce the amounts of the coefficients (c i (t); C1 - C4) continuously. Vorrichtung nach Anspruch 18, bei der die Koeffizienten-Bereitstellungsanordnung (9) zum Multiplizieren der Koeffizienten (ci(t)) mit dem Reduktionsparameter (k) als einem Faktor k kleiner 1, insbesondere mit einem Faktor zwischen 0,8 und 1,0 ausgebildet oder geschaltet ist.Apparatus according to claim 18, wherein the coefficient providing means (9) for multiplying the coefficients (c i (t)) by the reduction parameter (k) as a factor k is less than 1, in particular with a factor between 0.8 and 1.0 is formed or switched. Vorrichtung nach Anspruch 18 oder 19, bei welcher einer ersten Filterstufe mit dem Filter als erstem Filter (F1) eine zweite Filterstufe mit einem zweiten Filter (F2) nachgeschaltet ist zum Zuführen des Vorhersage-Ausgangssignals (sv(t)) als eine Vorhersage des Audio-Eingangssignals (s(t)) mit reduziertem Rauschen als Eingangssignal für den zweiten Filter (F2) zum Erzeugen einer zweiten Vorhersage (sv*(t)).Apparatus according to claim 18 or 19, in which a first filter stage with the filter as the first filter (F1) is followed by a second filter stage with a second filter (F2) is for supplying the predicted output signal (sv (t)) as a prediction of the reduced noise audio input signal (s (t)) as an input to the second filter (F2) to produce a second prediction (sv * (t)) , Vorrichtung nach Anspruch 20 mit einem Addierer (13) zum Addieren einer Summe aus Fehler-Vorhersagen (sv*1 - sv*4) des zweiten Filters (F2) vom Vorhersage-Ausgangssignal (sv(t)) der ersten Filters (F1) zum Erzeugen der Vorhersage (sv*(t)).Apparatus according to claim 20, further comprising an adder (13) for adding a sum of error predictions (sv * 1 -sv * 4) of the second filter (F2) from the prediction output signal (sv (t)) of the first filter (F1) to Generating the prediction (sv * (t)). Vorrichtung nach einem der Ansprüche 18 bis 21, bei der das zweite Filter (F2) durch ein LMS-Adaptions-Filter zum Durchführen einer Fehlervorhersage ausgebildet oder geschaltet ist.Apparatus according to any one of claims 18 to 21, wherein the second filter (F2) is formed or switched by an LMS adaptation filter to perform error prediction. Vorrichtung nach einem der Ansprüche 18 bis 21, bei der das erste Filter (F1) und/oder das zweite Filter (F2) durch ein FIR-Filter zum Durchführen einer Signalvorhersage ausgebildet oder geschaltet ist.Apparatus according to any one of claims 18 to 21, wherein the first filter (F1) and / or the second filter (F2) is formed or switched by a FIR filter for performing signal prediction. Vorrichtung nach einem der Ansprüche 18 bis 22, welche durch einen feldprogrammierbaren Baustein oder einen ASIC ausgebildet ist.Device according to one of claims 18 to 22, which is formed by a field programmable device or an ASIC. Vorrichtung nach einem der Ansprüche 18 bis 24 mit einer Subtraktionsschaltung (14) zum Abziehen der Werte der Vorhersage (sv*(t)) von Werten des Audio-Eingangssignals (s(t)) zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals (o*(t)).Apparatus according to any one of claims 18 to 24, including a subtraction circuit (14) for subtracting the values of the prediction (sv * (t)) of values of the audio input signal (s (t)) to produce a noise-reduced audio output signal (o * ( t)). Vorrichtung nach einem der Ansprüche 18 bis 25 mit - einem Multiplizierer (15; 15*) zum Wichten des optional zeitlich verzögerten Audio-Eingangssignal (s(t)) oder zum Wichten des Vorhersage-Ausgangssignals (sv(t)) mit einem Wichtungsfaktor (η; η*) kleiner Eins, insbesondere etwa 0,1 und - einem Addierer (7; 14*) zum Addieren des gewichteten Signals auf das Vorhersage-Ausgangssignal (sv(t)) oder auf die Vorhersage (sv*(t)) zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals (o(t); o*(t)). Device according to one of claims 18 to 25 with - a multiplier (15; 15 *) for weighting the optional time-delayed audio input signal (s (t)) or weighting the prediction output signal (sv (t)) with a weighting factor (η; η *) less than one, in particular about 0.1 and an adder (7; 14 *) for adding the weighted signal to the predicted output signal (sv (t)) or the prediction (sv * (t)) for generating a noise-reduced audio output signal (o (t); o * (t)). Vorrichtung nach einem der Ansprüche 18 - 26, die zum Durchführen eines Verfahrens nach einem der Ansprüche 1 - 17 ausgebildet ist.Apparatus according to any one of claims 18-26, adapted to carry out a method according to any one of claims 1-17.
EP06014433A 2005-08-19 2006-07-12 Method and device for adaptive reduction of noise signals and background signals in a speech processing system Withdrawn EP1755110A3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005039621A DE102005039621A1 (en) 2005-08-19 2005-08-19 Method and apparatus for the adaptive reduction of noise and background signals in a speech processing system

Publications (2)

Publication Number Publication Date
EP1755110A2 true EP1755110A2 (en) 2007-02-21
EP1755110A3 EP1755110A3 (en) 2009-05-06

Family

ID=36821493

Family Applications (1)

Application Number Title Priority Date Filing Date
EP06014433A Withdrawn EP1755110A3 (en) 2005-08-19 2006-07-12 Method and device for adaptive reduction of noise signals and background signals in a speech processing system

Country Status (3)

Country Link
US (2) US7822602B2 (en)
EP (1) EP1755110A3 (en)
DE (1) DE102005039621A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10354557B4 (en) * 2003-11-21 2007-11-29 Infineon Technologies Ag Method and apparatus for predicting noise contained in a received signal and a digital receiver
DE102005039621A1 (en) * 2005-08-19 2007-03-01 Micronas Gmbh Method and apparatus for the adaptive reduction of noise and background signals in a speech processing system
DE102009025541B3 (en) * 2009-06-19 2011-02-10 Plath Gmbh Device for removal and reduction of broadband noise, during signal reprocessing of spectrum of broad band detector, has determination device determining significance of spectral line based on comparison of power values with parameter
KR20140052661A (en) * 2012-10-25 2014-05-07 현대모비스 주식회사 Microphone system for vehicle using parallel signal processing
US10757450B2 (en) 2017-10-05 2020-08-25 Cable Television Laboratories, Inc System and methods for data compression and nonuniform quantizers
US10686466B2 (en) 2017-10-05 2020-06-16 Cable Television Laboratories, Inc. System and methods for data compression and nonuniform quantizers

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5500903A (en) 1992-12-30 1996-03-19 Sextant Avionique Method for vectorial noise-reduction in speech, and implementation device
US5583968A (en) 1993-03-29 1996-12-10 Alcatel N.V. Noise reduction for speech recognition
EP1080465A1 (en) 1998-05-27 2001-03-07 Telefonaktiebolaget Lm Ericsson Signal noise reduction by spectral substraction using linear convolution and causal filtering
US6820053B1 (en) 1999-10-06 2004-11-16 Dietmar Ruwisch Method and apparatus for suppressing audible noise in speech transmission

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4403298A (en) * 1981-06-15 1983-09-06 Bell Telephone Laboratories, Incorporated Adaptive techniques for automatic frequency determination and measurement
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
CA1331644C (en) * 1988-06-25 1994-08-23 Yoshihiro Yamamura Scrambled communication system using adaptive transversal filters for descrambling received signals
EP0420269A3 (en) * 1989-09-28 1992-12-30 Fujitsu Limited Adaptive digital filter including low-pass filter
US5148488A (en) * 1989-11-17 1992-09-15 Nynex Corporation Method and filter for enhancing a noisy speech signal
JP2573389B2 (en) * 1990-03-23 1997-01-22 晴夫 浜田 Electronic silencing method and device
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
JP2541044B2 (en) * 1991-08-29 1996-10-09 真作 森 Adaptive filter device
US5412735A (en) * 1992-02-27 1995-05-02 Central Institute For The Deaf Adaptive noise reduction circuit for a sound reproduction system
US5402496A (en) * 1992-07-13 1995-03-28 Minnesota Mining And Manufacturing Company Auditory prosthesis, noise suppression apparatus and feedback suppression apparatus having focused adaptive filtering
US5590241A (en) * 1993-04-30 1996-12-31 Motorola Inc. Speech processing system and method for enhancing a speech signal in a noisy environment
UA41893C2 (en) * 1993-05-05 2001-10-15 Конінклійке Філіпс Електронікс Н.В. Transfer system, terminal unit, coding device, decoding device and adaptive filter
CA2125220C (en) * 1993-06-08 2000-08-15 Joji Kane Noise suppressing apparatus capable of preventing deterioration in high frequency signal characteristic after noise suppression and in balanced signal transmitting system
DE69327900T2 (en) * 1993-06-09 2000-07-06 St Microelectronics Srl Adaptive method for removing ghost images in video signals
US5689572A (en) * 1993-12-08 1997-11-18 Hitachi, Ltd. Method of actively controlling noise, and apparatus thereof
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5627896A (en) * 1994-06-18 1997-05-06 Lord Corporation Active control of noise and vibration
JPH08125593A (en) * 1994-10-28 1996-05-17 Fujitsu Ltd Estimating device for filter factor
US5706402A (en) * 1994-11-29 1998-01-06 The Salk Institute For Biological Studies Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy
DE19639703C2 (en) * 1996-09-26 1999-05-20 Siemens Ag Method and arrangement for echo cancellation
US6151397A (en) * 1997-05-16 2000-11-21 Motorola, Inc. Method and system for reducing undesired signals in a communication environment
US6154547A (en) * 1998-05-07 2000-11-28 Visteon Global Technologies, Inc. Adaptive noise reduction filter with continuously variable sliding bandwidth
US6717991B1 (en) * 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6597732B1 (en) * 1999-01-14 2003-07-22 Eric Morgan Dowling High-speed modem with uplink remote-echo canceller
EP1088304A1 (en) * 1999-04-05 2001-04-04 Hughes Electronics Corporation A frequency domain interpolative speech codec system
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7092537B1 (en) * 1999-12-07 2006-08-15 Texas Instruments Incorporated Digital self-adapting graphic equalizer and method
JP3964092B2 (en) * 2000-02-17 2007-08-22 アルパイン株式会社 Audio adaptive equalizer and filter coefficient determination method
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US6975689B1 (en) * 2000-03-30 2005-12-13 Mcdonald James Douglas Digital modulation signal receiver with adaptive channel equalization employing discrete fourier transforms
US6484133B1 (en) * 2000-03-31 2002-11-19 The University Of Chicago Sensor response rate accelerator
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6999628B2 (en) * 2002-03-28 2006-02-14 Microsoft Corporation Tarp filter
US7167568B2 (en) * 2002-05-02 2007-01-23 Microsoft Corporation Microphone array signal enhancement
US7433908B2 (en) * 2002-07-16 2008-10-07 Tellabs Operations, Inc. Selective-partial-update proportionate normalized least-mean-square adaptive filtering for network echo cancellation
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
CN100435231C (en) * 2002-12-02 2008-11-19 松下电器产业株式会社 Adaptive equalization circuit and adaptive equalization method
JP4333369B2 (en) * 2004-01-07 2009-09-16 株式会社デンソー Noise removing device, voice recognition device, and car navigation device
DE102004025471A1 (en) * 2004-05-21 2005-12-15 Micronas Gmbh A method or adaptive filter for processing a sequence of input data of a radio system
US7426464B2 (en) * 2004-07-15 2008-09-16 Bitwave Pte Ltd. Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition
US7142665B2 (en) * 2004-07-16 2006-11-28 Freescale Semiconductor, Inc. Automatic gain control for an adaptive finite impulse response and method therefore
US7734466B2 (en) * 2005-06-20 2010-06-08 Motorola, Inc. Reduced complexity recursive least square lattice structure adaptive filter by means of limited recursion of the backward and forward error prediction squares
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
DE102005039621A1 (en) * 2005-08-19 2007-03-01 Micronas Gmbh Method and apparatus for the adaptive reduction of noise and background signals in a speech processing system
US20070297619A1 (en) * 2006-06-26 2007-12-27 Bose Corporation*Ewc* Active noise reduction engine speed determining
US8194873B2 (en) * 2006-06-26 2012-06-05 Davis Pan Active noise reduction adaptive filter leakage adjusting

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5500903A (en) 1992-12-30 1996-03-19 Sextant Avionique Method for vectorial noise-reduction in speech, and implementation device
US5583968A (en) 1993-03-29 1996-12-10 Alcatel N.V. Noise reduction for speech recognition
EP1080465A1 (en) 1998-05-27 2001-03-07 Telefonaktiebolaget Lm Ericsson Signal noise reduction by spectral substraction using linear convolution and causal filtering
US6820053B1 (en) 1999-10-06 2004-11-16 Dietmar Ruwisch Method and apparatus for suppressing audible noise in speech transmission

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Adaptive filter Theory 4th Edition", 1 January 2002, PRENTICE HALL INFORMATION AND SYSTEM SCIENCES SERIES, New Jersey, USA, article SIMON HAYKIN: "Chapter 5: Least-Mean-Square Adaptive Filters", pages: 231 - 319, XP055360696 *
CARTES DAVID A ET AL: "Experimental evaluation of leaky least-mean-square algorithms for active noise reduction in communication headsetsa)", THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, AMERICAN INSTITUTE OF PHYSICS FOR THE ACOUSTICAL SOCIETY OF AMERICA, NEW YORK, NY, US, vol. 111, no. 4, 1 April 2002 (2002-04-01), pages 1758 - 1771, XP012002840, ISSN: 0001-4966, DOI: 10.1121/1.1448314 *

Also Published As

Publication number Publication date
US20110022382A1 (en) 2011-01-27
US8352256B2 (en) 2013-01-08
DE102005039621A1 (en) 2007-03-01
US7822602B2 (en) 2010-10-26
US20070043559A1 (en) 2007-02-22
EP1755110A3 (en) 2009-05-06

Similar Documents

Publication Publication Date Title
DE112009000805B4 (en) noise reduction
DE3510660C2 (en)
DE69619284T3 (en) Device for expanding the voice bandwidth
DE69131776T2 (en) METHOD FOR VOICE ANALYSIS AND SYNTHESIS
DE2945414C2 (en) Speech signal prediction processor and method of processing a speech power signal
DE3101851C2 (en) Device for recognizing speech
DE2626793B2 (en) Electrical circuitry for determining the voiced or unvoiced state of a speech signal
DE4330243A1 (en) Speech processing facility
EP1525576B1 (en) Arrangement and method for the generation of a complex spectral representation of a time-discrete signal
DE102008042579A1 (en) Method for error concealment in case of incorrect transmission of voice data
EP1755110A2 (en) Method and device for adaptive reduction of noise signals and background signals in a speech processing system
EP3089481B1 (en) Method for frequency-dependent noise suppression in an input signal
EP1280138A1 (en) Method for audio signals analysis
DE2636032C3 (en) Electrical circuit arrangement for extracting the fundamental oscillation period from a speech signal
EP1014340A2 (en) Method and device for processing noisy audio signals
DE4031638A1 (en) VOICE RECOGNITION DEVICE
DE2020753A1 (en) Device for recognizing given speech sounds
DE19581667C2 (en) Speech recognition system and method for speech recognition
EP2080197B1 (en) Apparatus for noise suppression in an audio signal
EP0772764B1 (en) Process and device for determining the tonality of an audio signal
EP0874352A2 (en) Voice activity detection
DE10157535B4 (en) Method and apparatus for reducing random, continuous, transient disturbances in audio signals
EP3065417A1 (en) Method for suppressing interference noise in an acoustic system
DE60224100T2 (en) GENERATION OF LSF VECTORS
DE60110541T2 (en) Method for speech recognition with noise-dependent normalization of the variance

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA HR MK YU

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA HR MK RS

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: TRIDENT MICROSYSTEMS (FAR EAST) LTD.

17P Request for examination filed

Effective date: 20091102

17Q First examination report despatched

Effective date: 20091204

AKX Designation fees paid

Designated state(s): DE GB NL

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: ENTROPIC COMMUNICATIONS, INC.

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20180201