DE60300374T2 - Sprachaktiviertes Musikwiedergabesystem - Google Patents

Sprachaktiviertes Musikwiedergabesystem Download PDF

Info

Publication number
DE60300374T2
DE60300374T2 DE60300374T DE60300374T DE60300374T2 DE 60300374 T2 DE60300374 T2 DE 60300374T2 DE 60300374 T DE60300374 T DE 60300374T DE 60300374 T DE60300374 T DE 60300374T DE 60300374 T2 DE60300374 T2 DE 60300374T2
Authority
DE
Germany
Prior art keywords
playlist
database
records
question
tuned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60300374T
Other languages
English (en)
Other versions
DE60300374D1 (de
Inventor
Peter P. Winchester Wolf
Michael A. Casey
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE60300374D1 publication Critical patent/DE60300374D1/de
Application granted granted Critical
Publication of DE60300374T2 publication Critical patent/DE60300374T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H5/00Instruments in which the tones are generated by means of electronic generators
    • G10H5/005Voice controlled instruments

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft allgemein das Durchsuchen und Wiederauffinden eines Audioinhalts und spezieller das Wiederauffinden von aufgezeichneter Musik in einer Datenbank unter Verwendung von gesprochenen Abfragen.
  • 2. Beschreibung des Standes der Technik
  • Mit dem Erscheinen fortgeschrittener, digitaler Kompressionstechniken und hochleistungsfähiger Speicher ist es jetzt möglich, sehr große Musikbibliotheken in sehr kleinen Geräten zu speichern. Wiedergabegeräte für Medien können Tausende moderner Musikstücke speichern.
  • Traditionelle Schnittstellen, bei denen der Benutzer sowohl die gewünschten Aufzeichnungsmedien als auch spezielle „Spuren" per Hand auswählen muss, funktionieren für solche Geräte nicht, insbesondere wenn der Benutzer beim Zuhören mit anderen Aktivitäten in Anspruch genommen ist. Außerdem kann die moderne Musikbibliothek in einer Weise eigens zu diesem Zweck gesammelt werden, die es einem Benutzer auch unmöglich machen kann genau zu wissen, was in der Bibliothek gespeichert ist.
  • Einige Verfahren im Stand der Technik, die es einem Benutzer ermöglichen, auf Musik in einer Datenbank zuzugreifen, enthalten eine Spracherkennungstechnologie, wobei jedoch die Ergebnisse nur auf spezielle Soundtracks oder Dateien beschränkt sind, die von dem Benutzer manuell geordnete Soundtracks enthalten, siehe z.B. „Wie Sie Ihr MXP 100 nutzen und sich daran erfreuen" e.Digital Corporation, 2001.
  • Deshalb müssen neue Einrichtungen zum Organisieren und Zugreifen von in einer großen Musikbibliothek gespeicherten Aufzeichnungen zur Verfügung gestellt werden.
  • ABRISS DER ERFINDUNG
  • Die Erfindung stellt ein Verfahren und System zum Auswählen von in einer Datenbank gespeicherten Aufzeichnungen bereit.
  • Eine gesprochene Abfrage wird als ein phonetisches Gitter dargestellt, wobei Pfade durch das phonetische Gitter zu einem Satz von Textabfragen umgewandelt werden. Die Datenbank wird aufgesucht, um eine Wiedergabeliste von Aufzeichnungen, die auf den Satz von Textabfragen abgestimmt ist, zu erzeugen und anschließend werden Klangproben der Aufzeichnungen in der Wiedergabeliste abgespielt. Eine spezielle Klangprobe wird als akustische Abfrage zum Aufsuchen der Datenbank ausgewählt, um die Wiedergabeliste mit einer Aufzeichnung, die mit der akustischen Abfrage abgestimmt ist, zu aktualisieren. Klangproben der Aufzeichnungen in der aktualisierten Wiedergabeliste werden abgespielt und eine spezielle Klangprobe der aktualisierten Wiedergabeliste wird ausgewählt. Dann wird eine der Klangprobe zugeordnete spezielle Aufzeichnung abgespielt.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Es werden bevorzugte Ausführungen der vorliegenden Erfindung auf Basis der folgenden Figuren ausführlich beschrieben, in denen zeigen:
  • 1 ein sprachaktiviertes Musikwiedergabesystem gemäß der Erfindung; und
  • 2 ein Ablaufdiagramm zum Durchsuchen und Wiederauffinden von Tonaufzeichnungen gemäß der Erfindung.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGEN
  • Systemstruktur
  • 1 zeigt das erfindungsgemäße Musikwiedergabesystem 100. Das System umfasst einen Prozessor 110, einen Speicher 120, ein Mikrofon 130, einen Schalter 140 und einen oder mehrere miteinander verbundene Lautsprecher 150.
  • Der Prozessor 110 ist im Wesentlichen herkömmlich und führt Softwareprogramme aus, die im Speicher 120 gespeichert sind. Der Prozessor 110 enthält eine Audiokarte, die digitale Daten in Audiosignale umwandeln kann. Der Speicher 120 kann verschiedene Formen einschließlich RAM, ROM, Plattenspeicher und blockweise löschbarer Speicher aufweisen. Der Schalter 140 kann auf verschiedene Weise z.B. zum Drücken, Kippen, Schieben usw. ausgeführt sein, um den nachstehend ausführlich dargestellten Funktionen zu entsprechen. Das System 100 kann tragbar oder in einem Fahrzeug befestigt sein. Die Verbindungen können drahtlos sein.
  • 2 zeigt zusätzliche Einzelheiten des Systems 100, die einen Spracherkenner 210, einen Textabfrage-Generator 220, eine Textsuchmaschine 230, einen Scanner 240 und eine akustische Suchmaschine 250 enthalten. Diese werden durch Softwaremodule realisiert, die in dem Speicher 120 gespeichert sind und durch den Prozessor 110 ausgeführt werden.
  • Der Speicher 120 speichert außerdem einen Datenbank 260 von Aufzeichnungen 270. Jede Aufzeichnung 270 enthält zugeordnete Textdeskriptoren 271, eine Audioaufzeichnung 272 und eine Klangprobe 273 der Aufzeichnung 272. Der Schalter 140 und das Mikrofon 130 stellen eine Eingabe für den Spracherkenner 210 und den Scanner 240 bereit. Der Lautsprecher 150 spielt Klangproben und Aufzeichnungen so ab, wie sie durch den Benutzer ausgewählt wurden. Der Lautsprecher 150 kann außerdem verwendet werden, um dem System Statusinformationen zu liefern.
  • Systembetrieb
  • Die Erfindung wird nachstehend gemäß den Ansprüchen 1 und 10 weiter erläutert.
  • Wie in einem Verfahren 200 in 2 dargestellt ist, empfängt der Spracherkenner 210 über das Mikrofon 130 eine gesprochene Benutzerabfrage. Der Schalter 140 kann verwendet werden, um das Mikrofon zu betätigen. Der Spracherkenner 210 stellt die gesprochene Abfrage als ein phonetisches Gitter 211 dar. Knoten in dem Gitter stellen phonetische Primitive (Darstellungselemente) wie Wörter, Silben oder Phoneme dar, und Kanten zeigen mögliche Sequenzen der Primitiven an.
  • Der Textabfrage-Generator 220 wandelt das Gitter 211 um in einen Satz von Textabfragen 221, die die Pfade durch das Gitter wie wahrscheinliche textliche Darstellungen der gesprochenen Abfrage darstellen, siehe Wolf et al. „The MERL spoken query information retrieval system. A system for retrieving pertinent documents from a spoken query" ("Das MERL-Informationswiedergewinnungssystem mit gesprochener Abfrage. Ein System zur Wiedergewinnung von sachbezogenen Dokumenten aus einer gesprochenen Abfrage"), in IEEE International Conference on Multimedia and EXPO (ICME), 26. August 2002. Als weiteres Beispiel wird in dem am 28. Mai 2002 veröffentlichten US-Patent 6 397 181 eine Wiedergewinnung des Inhalts digitaler Medien erreicht, indem eine Sprechabfrage zu einem Wortgitter umgewandelt und daraus eine engere Wahl erzeugt wird. Die engere Wahl wird anschließend genutzt, um das Suchergebnis zu erzeugen.
  • Die Textsuchmaschine 230 sucht die Aufzeichnungen 270 in der Datenbank 260 auf, um eine Wiedergabeliste 231 zu generieren, indem die Textabfragen 221 mit den Textdeskriptoren 271 von jeder Aufzeichnung 270 verglichen werden. Die Wiedergabeliste zeigt Aufzeichnungen mit Textdeskriptoren an, die mit der Textabfrage 221 abgestimmt sind. Die Wiedergabeliste kann entsprechend Textdeskriptoren, einer Bestimmtheit der Textabfrage oder einer zufälligen Reihenfolge geordnet werden.
  • Der Scanner 240 spielt die Klangprobe 273 jeder Aufzeichnung 270 in der Reihenfolge der Wiedergabeliste 231 mittels Lautsprecher 150 ab. Der Benutzer kann eine Klangprobe aus der Wiedergabeliste auswählen, indem er einen Befehl 242 unter Verwendung des Mikrofons 130 oder des Schalters 140 eingibt. Der Befehl spielt entweder die entsprechende Aufzeichnung 272 ab oder aktualisiert die Wiedergabeliste.
  • Zum Aktualisieren der Wiedergabeliste bildet die ausgewählte Klangprobe eine akustische Abfrage 241. Die akustische Suchmaschine 250 sucht die Aufzeichnungen 270 auf und aktualisiert die Wiedergabeliste mit Aufzeichnungen 270, die mit der akustischen Abfrage 241 abgestimmt sind, siehe Casey „MPEG-7 Sound Recognition Tools" („MPEG-7 Tonerkennung-Software") in IEEE Transactions on Circuits and Systems for Video Technology, Juni 2001. Wiederum kann die Wiedergabeliste 231 geordnet oder zufällig sein.
  • Der Scanner 240 kann dann die Klangproben der Aufzeichnungen in der aktualisierten Wiedergabeliste 231 abspielen. Als andere Möglichkeit kann der Benutzer an den Scanner einen Befehl ausgeben, indem das Mikrofon oder der Schalter verwendet wird, um eine beliebige oder jede Aufzeichnung, die durch die aktualisierte Wiedergabeliste angegeben ist, in beliebiger Reihenfolge abzuspielen.
  • Obwohl die Erfindung durch Beispiele bevorzugter Ausführungen beschrieben worden ist, soll verständlich werden, dass verschiedene andere Anpassungen und Modifizierungen innerhalb von Geist und Umfang der Erfindung vorgenommen werden können.

Claims (11)

  1. Verfahren zur Auswahl von Aufzeichnungen aus einer in einem Speicher (120) gespeicherten Datenbank (260), welches aufweist: Darstellen (210) einer gesprochenen Frage als ein phonetisches Gitter (211); Umwandeln (220) von Pfaden durch das phonetische Gitter (211) in einen Satz von Textfragen (221); Durchsuchen (230) der Datenbank (260) zur Erzeugung einer Wiedergabeliste (231) von Aufzeichnungen (271), die mit dem Satz von Textfragen (221) abgestimmt sind; Wiedergeben (240) von Mustern der Aufzeichnungen (273) auf der Wiedergabeliste; und Auswählen (240) eines besonderen Musters als eine akustische Frage (241); Durchsuchen (250) der Datenbank (260) zur Aktualisierung der Wiedergabeliste (231) mit Aufzeichnungen (272), die auf die akustische Frage (241) abgestimmt sind; Wiedergeben (240) von Mustern der Aufzeichnungen (273) auf der aktualisierten Wiedergabeliste (231); und Auswählen (242) eines besonderen Musters der aktualisierten Wiedergabeliste (231), um eine besondere assoziierte Aufzeichnung wiederzugeben.
  2. Verfahren nach Anspruch 1, weiterhin aufweisend: Aufrechterhalten von Verzeichnissen (270) in der Datenbank (260), wobei jedes Verzeichnis (270) eine Aufzeichnung (272), ein Muster der Auf zeichnung (273) und assoziierte Textbeschreibungssätze (271) enthält.
  3. Verfahren nach Anspruch 2, bei dem der Schritt des Durchsuchens (230) der Datenbank (260) zum Erzeugen der Wiedergabeliste (231) weiterhin aufweist: Vergleichen des Satzes von Textfragen (221) mit den assoziierten Textbeschreibungssätzen (271) in jedem Verzeichnis (270); und Identifizieren von Verzeichnissen (270) mit assoziierten Textbeschreibungssätzen (271), die mit dem Satz von Textfragen (221) abgestimmt sind.
  4. Verfahren nach Anspruch 2, weiterhin aufweisend: Ordnen (230) der Wiedergabeliste (231) entsprechend den Textbeschreibungssätzen (271).
  5. Verfahren nach Anspruch 2 weiterhin aufweisend: Ordnen (230) der Wiedergabeliste (231) entsprechend einer Bestimmtheit der Textfrage (221).
  6. Verfahren nach Anspruch 2 weiterhin aufweisen: Ordnen (230) der Wiedergabeliste (231) entsprechend einer zufälligen Reihenfolge.
  7. Verfahren nach Anspruch 1, bei dem die Schritte des Auswählens als Antwort auf einen Befehl (241) initiiert werden.
  8. Verfahren nach Anspruch 7, bei der Befehl (242) ein gesprochener Befehl (130) ist.
  9. Verfahren nach Anspruch 7, bei dem der Befehl mechanisch (140) eingegeben wird.
  10. Vorrichtung zum Auswählen von Aufzeichnungen aus einer in einem Speicher (120) gespeicherten Da tenbank (26), welche aufweist: einen Spracherkenner (210) zum Darstellen einer gesprochenen Frage als ein phonetisches Gitter (211); Mittel (220) zum Umwandeln von Pfaden durch das phonetische Gitter (211) in einen Satz von Textfragen (221); Mittel (230) zum Durchsuchen der Datenbank (260) für die Erzeugung einer Wiedergabeliste (231) von Aufzeichnungen (272), die mit dem Satz von Textfragen (221) abgestimmt sind; einen Abtaster (241) zum Wiedergeben von Mustern der Aufzeichnungen (273) in der Wiedergabeliste (231), wobei der Abtaster (240) einen Lautsprecher (150) enthält; Mittel (250) zum Aktualisieren der Wiedergabeliste (231) mit Aufzeichnungen (272) in der Datenbank (260), die mit einer akustischen Frage (241) abgestimmt sind; und Mittel (242) zum Auswählen eines besonderen Musters aus der Wiedergabeliste (231), mit zwei Moden, wobei in einem ersten Modus die Mittel in der Lage sind, ein besonderes Muster als die akustische Frage (241) auszuwählen, und in einem zweiten Modus die Mittel in der Lage sind, ein besonderes Muster, das mit einer Aufzeichnung in der Datenbank (260) assoziiert ist, die mit der akustischen Frage (241) abgestimmt ist, auszuwählen.
  11. Vorrichtung nach Anspruch 10, bei der eine Verbindung mit dem Speicher (120) drahtlos ist.
DE60300374T 2002-09-30 2003-09-25 Sprachaktiviertes Musikwiedergabesystem Expired - Lifetime DE60300374T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/260,477 US20040064306A1 (en) 2002-09-30 2002-09-30 Voice activated music playback system
US260477 2002-09-30

Publications (2)

Publication Number Publication Date
DE60300374D1 DE60300374D1 (de) 2005-04-14
DE60300374T2 true DE60300374T2 (de) 2006-02-09

Family

ID=31977923

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60300374T Expired - Lifetime DE60300374T2 (de) 2002-09-30 2003-09-25 Sprachaktiviertes Musikwiedergabesystem

Country Status (4)

Country Link
US (1) US20040064306A1 (de)
EP (1) EP1403852B1 (de)
JP (1) JP2004265376A (de)
DE (1) DE60300374T2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009024570A1 (de) * 2009-06-08 2010-12-16 Bayerische Motoren Werke Aktiengesellschaft Verfahren zum Organisieren der Wiedergabe von Medienstücken

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826945B2 (en) 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US20080177734A1 (en) * 2006-02-10 2008-07-24 Schwenke Derek L Method for Presenting Result Sets for Probabilistic Queries
US20070198514A1 (en) * 2006-02-10 2007-08-23 Schwenke Derek L Method for presenting result sets for probabilistic queries
KR100760301B1 (ko) * 2006-02-23 2007-09-19 삼성전자주식회사 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치
KR100735820B1 (ko) * 2006-03-02 2007-07-06 삼성전자주식회사 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치
US7499858B2 (en) * 2006-08-18 2009-03-03 Talkhouse Llc Methods of information retrieval
US20080130699A1 (en) * 2006-12-05 2008-06-05 Motorola, Inc. Content selection using speech recognition
US7801729B2 (en) * 2007-03-13 2010-09-21 Sensory, Inc. Using multiple attributes to create a voice search playlist
US8285776B2 (en) * 2007-06-01 2012-10-09 Napo Enterprises, Llc System and method for processing a received media item recommendation message comprising recommender presence information
US9060034B2 (en) 2007-11-09 2015-06-16 Napo Enterprises, Llc System and method of filtering recommenders in a media item recommendation system
US8200602B2 (en) * 2009-02-02 2012-06-12 Napo Enterprises, Llc System and method for creating thematic listening experiences in a networked peer media recommendation environment
JP2012215673A (ja) * 2011-03-31 2012-11-08 Toshiba Corp 音声処理装置、及び音声処理方法
US10133537B2 (en) 2014-09-25 2018-11-20 Honeywell International Inc. Method of integrating a home entertainment system with life style systems which include searching and playing music using voice commands based upon humming or singing
CN105843921A (zh) * 2016-03-25 2016-08-10 福建星网视易信息系统有限公司 一种抓取热歌的方法和装置
CN107895016B (zh) * 2017-11-14 2022-02-15 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2226233C (en) * 1997-01-21 2006-05-09 At&T Corp. Systems and methods for determinizing and minimizing a finite state transducer for speech recognition
JPH11242496A (ja) * 1998-02-26 1999-09-07 Kobe Steel Ltd 情報再生装置
US6446080B1 (en) * 1998-05-08 2002-09-03 Sony Corporation Method for creating, modifying, and playing a custom playlist, saved as a virtual CD, to be played by a digital audio/visual actuator device
US6185527B1 (en) * 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
GB2361339B (en) * 1999-01-27 2003-08-06 Kent Ridge Digital Labs Method and apparatus for voice annotation and retrieval of multimedia data
JP2000250574A (ja) * 1999-03-03 2000-09-14 Sony Corp コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法
JP4491700B2 (ja) * 1999-08-26 2010-06-30 ソニー株式会社 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
JP2001075985A (ja) * 1999-09-03 2001-03-23 Sony Corp 音楽検索装置
JP2001075992A (ja) * 1999-09-07 2001-03-23 Hitachi Ltd 音響検索方法及び装置、並びに、コンピュータ読みとり可能な記録媒体
JP3597735B2 (ja) * 1999-10-12 2004-12-08 日本電信電話株式会社 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
US6526411B1 (en) * 1999-11-15 2003-02-25 Sean Ward System and method for creating dynamic playlists
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
JP2002063209A (ja) * 2000-08-22 2002-02-28 Sony Corp 情報処理装置および方法、情報システム、並びに記録媒体
FI20002161A (fi) * 2000-09-29 2002-03-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä melodian tunnistamiseksi
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
JP2002157255A (ja) * 2000-11-21 2002-05-31 Sony Corp 楽曲検索装置及び方法
WO2002048917A1 (fr) * 2000-12-12 2002-06-20 Sony Corporation Dispositif d'enregistrement/reproduction et procede, stockage de support
JP2002183152A (ja) * 2000-12-18 2002-06-28 Jinyama Shunichi 音楽検索装置及び方法並びに音楽検索用ソフトウェアを記録した記録媒体
US20020077988A1 (en) * 2000-12-19 2002-06-20 Sasaki Gary D. Distributing digital content
JP4027051B2 (ja) * 2001-03-22 2007-12-26 松下電器産業株式会社 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体
US6965770B2 (en) * 2001-09-13 2005-11-15 Nokia Corporation Dynamic content delivery responsive to user requests
US6941324B2 (en) * 2002-03-21 2005-09-06 Microsoft Corporation Methods and systems for processing playlists
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
US6907397B2 (en) * 2002-09-16 2005-06-14 Matsushita Electric Industrial Co., Ltd. System and method of media file access and retrieval using speech recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009024570A1 (de) * 2009-06-08 2010-12-16 Bayerische Motoren Werke Aktiengesellschaft Verfahren zum Organisieren der Wiedergabe von Medienstücken

Also Published As

Publication number Publication date
DE60300374D1 (de) 2005-04-14
EP1403852B1 (de) 2005-03-09
EP1403852A1 (de) 2004-03-31
JP2004265376A (ja) 2004-09-24
US20040064306A1 (en) 2004-04-01

Similar Documents

Publication Publication Date Title
DE60300374T2 (de) Sprachaktiviertes Musikwiedergabesystem
DE69327188T2 (de) Einrichtung für automatische Spracherkennung
JPH10507555A (ja) デジタル・オーディオとビデオ・データを走り読みするための方法とそのシステム
DE60020773T2 (de) Graphische Benutzeroberfläche und Verfahren zur Änderung von Aussprachen in Sprachsynthese und -Erkennungssystemen
DE60203436T2 (de) Verfahren und System zum Erkennen, Indizieren und Suchen von akustischen Signalen
DE10049841B4 (de) Aufzeichnungs- und Wiedergabegerät und Verfahren, Übertragungs-/Empfangsgerät und Übertragungs-/Empfangsverfahren
DE112007001774B4 (de) Verfahren und System zum Durchsuchen von Musik
EP1821286B1 (de) Vorrichtung, System und Verfahren zur Extraktion des Aufbaus von Liedtexten durch Identifizierung von darin sich wiederholenden Mustern
US20060206327A1 (en) Voice-controlled data system
EP0678851A1 (de) Vorrichtung zum Vertrieb von Musikinformationen in digitaler Form
DE10054583C2 (de) Verfahren und Vorrichtung zum Aufzeichnen, Suchen und Wiedergeben von Notizen
CN1682279A (zh) 利用语音识别访问和检索媒体文件的系统和方法
WO2006103633A1 (en) Synthesis of composite news stories
DE60207217T2 (de) Verfahren zum ermöglichen der sprachinteraktion mit einer internet-seite
CN105808780B (zh) 歌曲识别方法及设备
DE60128372T2 (de) Verfahren und system zur verbesserung der genauigkeit in einem spracherkennungssystem
Papaodysseus et al. A new approach to the automatic recognition of musical recordings
CN113691909A (zh) 具有音频处理推荐的数字音频工作站
DE69837428T2 (de) Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer
KR20010037652A (ko) 오디오 색인화 장치 및 그 방법과 그를 이용한 오디오 검색 시스템 및 그 방법
EP1359566A1 (de) Verfahren und Anordnung zur sprachbasierten Nutzung von Speichersystemen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
DE19723966A1 (de) Tragbares elektronisches Lesegerät zum ausschließlichen Abspielen eines magnetischen oder optischen Aufzeichnungsmediums und Verfahren dafür
DE10011297C2 (de) Verfahren zum Erstellen und Übertragen einer Anfrage an eine Datenbank
DE112009000771T5 (de) Inhaltswiedergabevorrichtung und -programm
DE19652259A1 (de) Verfahren zur Speicherung von Nachrichten auf einer Chipkarte und Gerät zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
8320 Willingness to grant licences declared (paragraph 23)
8364 No opposition during term of opposition