DE69837428T2 - Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer - Google Patents

Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer Download PDF

Info

Publication number
DE69837428T2
DE69837428T2 DE69837428T DE69837428T DE69837428T2 DE 69837428 T2 DE69837428 T2 DE 69837428T2 DE 69837428 T DE69837428 T DE 69837428T DE 69837428 T DE69837428 T DE 69837428T DE 69837428 T2 DE69837428 T2 DE 69837428T2
Authority
DE
Germany
Prior art keywords
speech
information
parameters
speech synthesis
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69837428T
Other languages
English (en)
Other versions
DE69837428D1 (de
Inventor
Takashi Kabushiki Kaisha Optrom SHIGETOMI
Tetsuo Kabushiki Kaisha Optrom SAITO
Tsunematsu Advanced Electronics K.K. KOMAKI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IntelligentDisc Inc
Original Assignee
IntelligentDisc Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IntelligentDisc Inc filed Critical IntelligentDisc Inc
Publication of DE69837428D1 publication Critical patent/DE69837428D1/de
Application granted granted Critical
Publication of DE69837428T2 publication Critical patent/DE69837428T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B23/00Record carriers not specific to the method of recording or reproducing; Accessories, e.g. containers, specially adapted for co-operation with the recording or reproducing apparatus ; Intermediate mediums; Apparatus or processes specially adapted for their manufacture
    • G11B23/0014Record carriers not specific to the method of recording or reproducing; Accessories, e.g. containers, specially adapted for co-operation with the recording or reproducing apparatus ; Intermediate mediums; Apparatus or processes specially adapted for their manufacture record carriers not specifically of filamentary or web form
    • G11B23/0021Record carriers not specific to the method of recording or reproducing; Accessories, e.g. containers, specially adapted for co-operation with the recording or reproducing apparatus ; Intermediate mediums; Apparatus or processes specially adapted for their manufacture record carriers not specifically of filamentary or web form discs
    • G11B23/0028Details
    • G11B23/0035Details means incorporated in the disc, e.g. hub, to enable its guiding, loading or driving
    • G11B23/0042Details means incorporated in the disc, e.g. hub, to enable its guiding, loading or driving with provision for auxiliary features
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Machine Translation (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Optical Record Carriers And Manufacture Thereof (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

  • Technisches Gebiet
  • Die Erfindung betrifft ein Speichermedium mit einem Informationen speichernden Informationsspeicherblock und einem Informationen verarbeitenden Elektronikschaltungsblock, z. B. eine mit einer Elektronikschaltung versehene optische Platte (im folgenden intelligente Platte (ID) genannt), sowie eine Sprachsynthesevorrichtung, die Sprache auf der Grundlage von Informationen synthetisiert, die auf dem Speichermedium gespeichert sind, und durch den Elektronikschaltungsblock gesteuert wird.
  • Hintergrund der Technik
  • Herkömmliche Sprachsynthesevorrichtungen geben Sprache wieder durch Verbinden von Klängen aus einer Maschinenwörter-Datenbank, die Phoneme in Wellenformen speichert, und einer Klangquellen-Datenbank, die aus korrigierten Klängen extrahierte Klänge speichert. Da in letzter Zeit das Studium der Klangquellen-Datenbank vorangeschritten ist, wird es möglich, Klänge zu reproduzieren, die so erzeugt werden, daß sie die Stimme einer spezifischen Person imitieren.
  • Dennoch wird es notwendig, verschiedene Typen von Klangquellen auch in Abhängigkeit von Zuständen von Verbindungsklängen zu erstellen, um den gleichen Klang zu erzeugen und um so mehr charakteristische Sprache wiederzugeben. Damit wird ein riesiges Datenvolumen erforderlich, weshalb der derzeitige Ansatz nur zur Demonstration zum Einsatz kommt und nicht praktisch umgesetzt wird.
  • Die JP-A-9-34491 offenbart ein Fahrzeugnavigationssystem, bei dem dann, wenn ein Fahrzeug einen solchen Punkt wie eine Kreuzung erreicht, eine Steuerung den geographischen Namen A des Punkts von einer CD-ROM ausliest und ihn zusammen mit Informationen, die zur Sprachsynthese erforderlich sind (d. h. den geographischen Namen A des Punkts und einen feststehenden Satz wie "Sie befinden sich bei ..."), zu einer Sprachsynthesevorrichtung sendet. Die Sprachsynthesevorrichtung verfügt über einen Abschnitt zum Erzeugen von phonetischen Informationen und Rhythmusinformationen für eine solche Substitution wie "Sie befinden sich bei A". Der Abschnitt sendet diese Informationen zu einem Rhythmusverarbeitungsabschnitt zum Berechnen verschiedener Parameter, z. B. Tonhöhenmuster und zeitliche Dauer jedes Phonems der Substitution. Diese Parameter werden zur Sprachsynthese der Substitution verwendet.
  • Die JP-A-63-217569 offenbart eine intelligente Platte mit eingebautem Steuerabschnitt.
  • Offenbarung der Erfindung
  • Bereitgestellt wird durch die Erfindung eine Sprachsynthesevorrichtung nach Anspruch 1, die zuvor beschriebene herkömmliche Mängel überwindet und verschiedene Wort- und Stimmentypen, z. B. Dialekt, auf der Grundlage kompakterer Datenbanken synthetisiert, sowie ein Speichermedium, das eine die Sprachsynthesevorrichtung ermöglichende Elektronikschaltung hat. Weiterhin stellt die Erfindung auch ein Computersystem mit der zuvor beschriebenen Sprachsynthesevorrichtung bereit, z. B. für ein Fahrzeugnavigationssystem u. ä.
  • Zur Lösung dieser Aufgabe hat das Speichermedium der Erfindung einen Informationen speichernden Informationsspeicherblock und einen Informationen verarbeitenden Elektronikschaltungsblock. Zudem ist das Medium dadurch gekennzeichnet, daß der Informationsspeicherblock mindestens Parameter zum Steuern der Sprachsynthese in einer externen Vorrichtung speichert und der Elektronikschaltungsblock eine Einrichtung zum Auswählen der Parameter in Entsprechung zu Informationen hat, die sprachlich zu synthetisieren sind. Hierbei speichert der Informationsspeicherblock ferner die Informationen, die sprachlich zu synthetisieren sind. Zusätzlich speichert der Informationsspeicherblock eine Stimmendatenbank, die bei der Sprachsynthese zu verwenden ist. Ferner ist das Speichermedium eine optische Platte.
  • Zudem weist eine Sprachsynthesevorrichtung der Erfindung ein Speichermedium mit einem Informationsspeicherblock zum Speichern von Informationen und einem Elektronikschaltungsblock zum Verarbeiten von Informationen auf. Die Vorrichtung ist dadurch gekennzeichnet, daß der Informationsspeicherblock des Speichermediums mindestens Parameter zum Steuern der Sprachsynthese in einer externen Vorrichtung speichert und der Elektronikschaltungsblock eine Einrichtung zum Auswählen der Parameter in Entsprechung zu Informationen hat, die sprachlich zu synthetisieren sind. Hierbei speichert der Informationsspeicherblock ferner die Informationen, die sprachlich zu synthetisieren sind. Zusätzlich speichert der Informationsspeicherblock eine Stimmendatenbank, die bei der Sprachsynthese zu verwenden ist.
  • Eine Sprachsynthesevorrichtung der Erfindung ist dadurch gekennzeichnet, daß sie aufweist: eine Unterscheidungseinrichtung zum Beurteilen, ob ein Speichermedium mit einem Informationen speichernden Informationsspeicherblock und einem Informationen verarbeitenden Elektronikschaltungsblock eingelegt ist, und eine Sprachsyntheseeinrichtung zum Synthetisieren von Sprache mit Hilfe des Speichermediums, wenn das Speichermedium eingelegt ist, und zum Synthetisieren von Sprache ohne Gebrauch des Speichermediums, wenn das Speichermedium nicht eingelegt ist. Das Speichermedium ist eine optische Platte.
  • Zusätzlich weist ein Computersystem der Erfindung eine Sprachsynthesevorrichtung auf. Weiterhin ist das Computersystem dadurch gekennzeichnet, daß die Sprachsynthesevorrichtung ein Speichermedium mit einem Informationsspeicherblock zum Speichern von Informationen und einem Elektronikschaltungsblock zum Verarbeiten von Informationen aufweist. Ferner ist das System dadurch gekennzeichnet, daß der Informationsspeicherblock des Speichermediums mindestens Parameter zum Steuern der Sprachsynthese in einer externen Vorrichtung speichert und der Elektronikschaltungsblock des Speichermediums eine Einrichtung zum Auswählen der Parameter in Entsprechung zu Informationen hat, die sprachlich zu synthetisieren sind. Das Speichermedium ist eine optische Platte.
  • Zudem weist ein Fahrzeugnavigationssystem der Erfindung eine Sprachsynthesevorrichtung auf. Ferner ist das Fahrzeugnavigationssystem dadurch gekennzeichnet, daß die Sprachsynthesevorrichtung ein Speichermedium mit einem Informationsspeicherblock zum Speichern von Informationen und einem Elektronikschaltungsblock zum Verarbeiten von Informationen aufweist. Ferner ist das Fahrzeugnavigationssystem dadurch gekennzeichnet, daß der Informationsspeicherblock des Speichermediums mindestens Parameter zum Steuern der Sprachsynthese in einer externen Vorrichtung speichert und der Elektronikschaltungsblock des Speichermediums eine Einrichtung zum Auswählen der Parameter in Entsprechung zu Informationen hat, die sprachlich zu synthetisieren sind. Das Speichermedium ist eine optische Platte.
  • Die Erfindung kann eine Sprachsynthesevorrichtung zum Synthetisieren verschiedener Typen von Stimmen, z. B. eines Dialekts; und Wörtern auf der Grundlage kompakterer Datenbanken sowie ein Speichermedium bereitstellen, das eine die Sprachsynthesevorrichtung ermöglichende Elektronikschaltung hat. Weiterhin stellt die Erfindung auch ein Computersystem mit der Sprachsynthesevorrichtung, z. B. als Fahrzeugnavigationssystem, bereit.
  • Kurze Beschreibung der Zeichnung
  • 1 zeigt eine intelligente optische Platte, die eine Art von ID dieser Ausführungsform ist;
  • 2 ist ein Blockschaltbild des Aufbaus einer Sprachsynthesevorrichtung dieser Ausführungsform;
  • 3 zeigt ein Beispiel für die gespeicherten Inhalte eines Plattenblocks 3 dieser Ausführungsform;
  • 4 zeigt ein Aufbaubeispiel von Dokumenteninformationen dieser Ausführungsform;
  • 5 ist ein Plan eines Betriebsablaufbeispiels für einen autonomen Typ von Sprachsynthesevorrichtung;
  • 6 zeigt ein weiteres Beispiel für die gespeicherten Inhalte eines Plattenblocks 3 dieser Ausführungsform; und
  • 7 ist ein Plan eines Betriebsablaufbeispiels für eine in ein System eingebaute Sprachsynthesevorrichtung.
  • Bevorzugte Ausführungsform der Erfindung
  • Zur näheren Erläuterung der Erfindung werden im folgenden Ausführungsformen der Erfindung anhand der beigefügten Zeichnungen beschrieben.
  • 1 zeigt eine intelligente optische Platte, die eine Art von ID dieser Ausführungsform ist. Die ID 1 verfügt über einen Platten-"Block" 3, der eine Informationen speichernde Plattenoberfläche ist, und einen intelligenten Schaltungsblock 2, der z. B. im Mittelabschnitt des Plattenblocks 3 gemäß 1 angeordnet ist. Obwohl hier der Schaltungsblock 2 im Mittelabschnitt der Platte liegt, ist die Lage nicht speziell beschränkt, z. B. kann er auch auf einer dafür bestimmten Seite der Plattenflächen oder in einer Mittelschicht einer in mehreren Schichten hergestellten Platte liegen.
  • 2 ist ein Blockschaltbild des Aufbaus einer Sprachsynthesevorrichtung dieser Ausführungsform. Die Bezugszahl 10 bezeichnet einen Spracherzeugungsblock, der folgendes besitzt: einen Dokumentenprozessor 12, der Informationen zur Sprachsynthese aus eingegebenen Dokumenteninformationen (Code) erzeugt, einen Sprachsynthesizer 14, der Sprache entsprechend einer Ausgabe des Dokumentenprozessors 12 auf der Grundlage einer Maschinenwörter-Datenbank und einer Klangquellen-Datenbank (im folgenden auch Stimmensatz genannt) synthetisiert und ausgibt, und eine Sprachverbindungssteuerung 13, die den Dokumentenprozessor 12 und Sprachsynthesizer 14 steuert. Die Sprachverbindungssteuerung 13 empfängt Sprachverbindungsinformationen und Dokumentenverbindungsinformationen, die aus dem Plattenblock 3 der ID 1 ausgelesen werden, und weist den Dokumentenprozessor an, Wörter zu sortieren, einzusetzen und zu löschen. Weiterhin instruiert die Steuerung 13 den Sprachsynthesizer 14 im Hinblick auf Klanglängen, Aufnahme/Auslassung von Phonemen, Akzenten, hohe/tiefe Tonhöhen, leise/laute Stimmen u. ä.
  • Die Maschinenwörter-Datenbank 15 und Klangquellen-Datenbank 16 sind mit gestrichelten Linien mit einem Bus verbunden, um zu zeigen, daß diese Datenbanken im Plattenblock der ID 1 gespeichert sein können.
  • Ferner hat der Spracherzeugungsblock 10 eine optische Plattenlaufwerkseinheit 11 mit einem Abnehmer (nicht gezeigt) und einer Abnahmeransteuerschaltung für die ID 1 sowie eine ID-Schnittstelle 17, die Informationen vom intelligenten Schaltungsblock 2 der ID 1 empfängt. Diese Komponenten brauchen nicht unbedingt zum Spracherzeugungsblock 10 zu gehören. Somit können sie zu einem anderen Funktionsblock gehören, und der Spracherzeugungsblock 10 ist in ein Computersystem u. ä. eingebaut, was später beschrieben wird. Obwohl ferner das Ziel der Sprachinformationen nicht gezeigt ist, ist ein Lautsprecher, Kopfhörer o. ä. als Schallerzeuger angeschlossen.
  • Die ID 1 weist den Plattenblock 3 und intelligenten Schaltungsblock 2 auf. Der intelligente Schaltungsblock 2 hat eine CPU 21 zur Berechnung und Steuerung, die das Auslesen von Daten aus dem Plattenblock 3 steuert, ein ROM 22 zum Speichern von festen Programmen und Parametern für die CPU 21, ein RAM 23 zum Zwischenspeichern und eine Systemschnittstelle 24 zum Informationsaustausch mit dem System. Hat die ID 1 eine unabhängige Stromquelle, gehört auch eine Photozelle 25 dazu. Außerdem kann die Schnittstelle kontaktierend oder kontaktlos sowie vom Busverbindungstyp oder Kommunikationsverbindungstyp sein. Als Kommunikationswege sind Funkkommunikation, optische Kommunikation u. ä. denkbar. Da aber eine externe Vorrichtung 10 dieser Anwendung nicht dazu bestimmt ist, durch umfangreiche Abwandlung einer vorhandenen Vorrichtung hergestellt zu werden, kann ein einfaches Verfahren zum Zufügen der ID 1 zur vorhandenen Vorrichtung gewählt werden.
  • Beispiel für eine autonome Art von Sprachsynthesevorrichtung Anhand von 3 bis 5 werden Beispiele für den Speicheraufbau und Informationsverarbeitungsablauf in einer unabhängigen Sprachsynthesevorrichtung beschrieben, z. B. einem Tonbandgerät und einem "Voice Book" (Textlesesystem), bei dem es sich um ein Hörbuch handelt.
  • 3 ist ein Beispiel für den Aufbau von Informationen, die im Plattenblock 3 gespeichert sind.
  • An Zielorten, auf die durch ein Verzeichnis 3a verwiesen wird, sind die im folgenden dargestellten Informationen gespeichert. Die Bezugszahl 3b bezeichnet die Maschinenwörter-Datenbank, die darstellungsgemäß mehrere unterschiedliche Maschinenwörter hat. Mit der Bezugszahl 3c sind Stimmensätze bezeichnet, und mehrere Sätze sind gespeichert. Die Bezugszahl 3d bezeichnet Dokumentenverbindungsparameter, die zur Steuerung des Dokumentenprozessors 12 durch die Sprachverbindungssteuerung 13 zu verwenden sind, und mehrere Arten von Parametern sind ebenfalls gespeichert. Mit der Bezugszahl 3e sind Sprachverbindungsparameter bezeichnet, die zur Steuerung des Sprachsynthesizers 14 durch die Sprachverbindungssteuerung 13 zu verwenden sind, und mehrere Arten von Sprachverbindungsparametern sind ebenso gespeichert. In einigen Fällen kann nur eine dieser Informationen 3b bis 3e ausreichen, solange die Dokumenteninformationen Ausgaben mit den gleichen Kennwerten sind (z. B. wenn eine Person liest). Der Unterschied dieser Parameter ist so getrennt, daß er dem Unterschied der nachfolgend näher dargestellten Dokumenteninformationen entspricht.
  • In 3 bezeichnet die Bezugszahl 3f Dokumenteninformationen. Dokumenteninformationen können Informationen mit der Länge eines gesamten Romans sein, der von einem (einer) Schauspielerin) gelesen wird, oder Informationen mit der Länge jeweiliger Dialoge in einem Theaterstück.
  • 4 zeigt den internen Aufbau der Dokumenteninformationen 3f.
  • Dokumenteninformationen 1 weisen ein Paar aus Sprechweiseninformationen und Dokumenteninformationen, die zu synthetisieren sind, oder mehrere Paare daraus auf. Denkbar als Sprechweiseninformationen sind mehrere Indizes, die die Kennwerte zum Synthetisieren von Sätzen der synthetisierten Dokumenteninformationen darstellen, z. B. einer Region (bezogen auf eine Sprache auf der Welt oder einen Landesdialekt), eines Geschlechts, Berufs, Körperbaus, Alters u. ä. Sind Kombinationen dieser Indizes in Entsprechung zu Schlüsselwörtern gespeichert, die auf berühmte Persönlichkeiten oder Inhalte von Dokumenten verweisen, kann eine spezifische Stimme einfach ausgewählt werden. Bei den Dokumenteninformationen handelt es sich um ein Dokument (Code), das tatsächlich zu synthetisieren ist.
  • 5 ist ein Ablaufplan, der darstellt, wie diese Sprachsynthesevorrichtung Sprache mit Hilfe der Informationen in 3 und 4 erzeugt. Die CPU 21 des Schaltungsblocks 2 in der ID 1 prüft im Schritt S51, ob die ID 1 in ein Laufwerk eingelegt ist. Ist sie eingelegt, fährt das Verfahren mit dem Schritt S52 fort. Gibt es mehrere Dokumente, weist die CPU 21 die Systemseite an, eine Dokumentenauswahl anzuzeigen, und eine Systemanzeigeeinheit (nicht gezeigt) zeigt diese an. Im Schritt S53 wird auf einen Auswahlbefehl von einem Benutzer gewartet, und bei dessen Enpfang geht das Verfahren vom Schritt S53 zum Schritt S54 über. Weiterhin können bei nur einem Dokument die Schritte S52 und S53 ausgelassen werden.
  • Im Schritt S54 weist die CPU 21 die optische Plattenlaufwerkseinheit 11 mit einer Adresse an, die ausgewählten Dokumenteninformationen auszulesen. Die optische Plattenlaufwerkseinheit 11 liest an der angewiesenen Adresse die ausgewählten Dokumenteninformationen aus und speichert die Informationen in einem Puffer im Dokumentenprozessor 12. Im Schritt S55 trennt die CPU 21 die Sprechweiseninformationen vom führenden Abschnitt der Dokumenteninformationen, die sich im Dokumentenprozessor 12 befinden oder direkt von der optischen Plattenlaufwerkseinheit 11 übertragen werden, und analysiert diese Informationen.
  • Als nächstes weist im Schritt S56 die CPU 21 mit Hilfe des Analysenergebnisses die optische Plattenlaufwerkseinheit 11 erneut an, zu verwendende Maschinenwörter, Stimmensätze, Dokumentenverbindungsparameter und Sprachverbindungsparameter auszulesen. Hinsichtlich der durch die optische Plattenlaufwerkseinheit 11 aus dem Plattenblock 3 ausgelesenen Informationen werden die Maschinenwörter und Stimmensätze im Sprachsynthesizer 14 festgelegt, und die Parameter werden in der Sprachverbindungssteuerung 13 festgelegt.
  • Im Schritt S57 weist die CPU 21 die Sprachverbindungssteuerung 13 an, die Sprachsynthese durchzuführen. Durch die Sprachverbindungssteuerung 13 erfolgt das Austauschen, Einsetzen, Löschen u. ä. von Wörtern durch Steuern des Dokumentenprozessors 12 gemäß den Dokumentenverbindungsparametern, sowie das Verbinden der Maschinenwörter und Stimmensätze ge mäß den Sprachverbindungsparametern mit Hilfe des Sprachsynthesizers 14.
  • Im Schritt S58 wird geprüft, ob alle erwünschten Dokumentenausgaben abgeschlossen sind, und bei Nichtabschluß kehrt das Verfahren zum Schritt S54 zurück und wiederholt die Schritte S54 bis S58.
  • Beispiel für eine in ein Computersystem eingebaute Sprachsynthesevorrichtung
  • Anhand von 4, die zuvor beschrieben wurde, 6 und 7 wird ein Beispiel für eine Sprachsynthesevorrichtung beschrieben, die in ein System eingebaut ist. In diesem Fall sind die Maschinenwörter-Datenbank 15 und Stimmensätze-Datenbank 16 in 2 systemseitig erstellt, und Dokumenteninformationen (Code) werden durch eine andere zum System gehörende Komponente in den Spracherzeugungsblock 10 eingegeben.
  • 6 zeigt die im Plattenblock 3 der ID 1 gespeicherten Inhalte. Bei diesem Beispiel sind nur Dokumentenverbindungsparameter und Sprachverbindungsparameter gespeichert. In diesem Beispiel ist es möglich, die Sprachsynthese feiner zu steuern, da diese Parameter erstellt werden können, indem sie in spezieller Entsprechung zu den wiederzugebenden Inhalten detailliert klassifiziert werden. Anhand von 7 wird ein Beispiel für einen Verfahrensablauf zur Sprachsynthese dieser Anwendung beschrieben. Bei diesem Beispiel arbeitet der Schaltungsblock 2 der ID 1 mit einer Systemsteuerung (nicht gezeigt) zusammen, die den Spracherzeugungsblock 10 steuert.
  • Zunächst liest im Schritt S81 eine systemseitige CPU (nicht gezeigt) Dokumenteninformationen von einer anderen Komponente aus. Im Schritt S82 wird geprüft, ob eine ID eingelegt ist, und ist sie nicht eingelegt, fährt das Verfahren mit dem Schritt S83 fort, damit das System Sprache nur durch den Spracherzeugungsblock 10 eines Systemblocks synthetisiert, ohne auf der ID 1 gespeicherte Parameter zu verwenden.
  • In diesem Stadium wird natürlich keine Feinsteuerung zum Synthetisieren von Sprache durchgeführt.
  • Ist die ID 1 in die optische Plattenlaufwerkseinheit 11 eingelegt, geht das Verfahren systemseitig vom Schritt S82 zum Schritt S84 über, damit das System die Sprechweiseninformationen gemäß 4 von den Dokumenteninformationen trennt und sie im Schritt S85 zur ID 1 sendet.
  • Wird ID-seitig im Schritt S71 bestätigt, daß die ID 1 in das Laufwerk eingelegt ist, so wird im Schritt S72 auf die Sprechweiseninformationen von der Systemseite gewartet. Bei Empfang der Sprechweiseninformationen geht das Verfahren zum Schritt S73 über, damit die ID 1 Kennungen von Maschinenwörtern, Stimmensätzen, Dokumentverbindungsparametern und Sprachverbindungsparametern erzeugt und sie im Schritt S74 zur Systemseite zurücksendet.
  • Empfängt systemseitig im Schritt S86 das System die Kennungen, liest das System im Schritt S87 Parameter aus dem Plattenblock 3 aus, um die Parameter im Schritt S88 in der Sprachverbindungssteuerung 13 festzulegen. Anschließend überträgt im Schritt S89 das System die Maschinenwörter und Stimmensätze, die mit Hilfe der Kennungen ausgewählt sind, aus den Datenbanken 15 und 16 zum Sprachsynthesizer 14. Im Schritt S90 werden Sprachinformationen gemäß der Steuerung der Sprachverbindungssteuerung 13 ähnlich wie im Fall des autonomen Typs der Sprachsynthesevorrichtung ausgegeben.
  • Im Schritt S91 wird der Abschluß des Dokuments geprüft, und bei Nichtabschluß kehrt das Verfahren zum Schritt S81 zurück, um die Verarbeitung von Dokumenteninformationen fortzusetzen. In den beiden o. g. Beispielen sind zwei Extremfälle beschrieben, nämlich das Beispiel, in dem Sprache hauptsächlich durch die ID synthetisiert wird, da die ID alle Informationen zur Dokumentensynthese enthält, und das Beispiel, in dem die Systemseite auch die Sprachsynthese ohne Gebrauch der ID unabhängig durchführen kann, da die ID nur die Parameter enthält. Dennoch sind natürlich verschiedene Arten von "Zwischen"-Systemen zwischen diesen beiden Systemen möglich, wobei sich das "Zwischen"-System durch Ändern von Kombinationen und Funktionszuordnungen erstellen läßt. Erstellen lassen sich z. B. ein System, in dem die ID die synthetisierten Dokumenteninformationen und Parameter enthält und die Systemseite die Sprechweiseninformationen modifizieren kann, und ein System, in dem die ID-Seite die Sprechweiseninformationen aus den Dokumenteninformationen in 7 extrahiert (S84).
  • Zusätzlich sind als Computersystem, in das diese Sprachsynthesevorrichtung eingebaut ist, insbesondere ein Personalcomputer und ein Fahrzeugnavigationssystem denkbar.
  • Zuvor wurde die Erfindung anhand bevorzugter Ausführungsformen beschrieben. Dennoch ist die Erfindung nicht auf die zuvor beschriebenen Ausführungsformen beschränkt, und verschiedene Änderungen, Zusätze und Abwandlungen können im Schutzumfang gemäß den beigefügten Ansprüchen vorgenommen werden.

Claims (3)

  1. System zum Synthetisieren von Sprache mit: einer Vorrichtung (10) mit einer Sprachsyntheseeinrichtung (14) zum Synthetisieren von Sprache auf der Grundlage von Dokumenteninformationen, die eine Sprechweise und ein zu synthetisierendes Dokument aufweisen, und die geeignet ist, erste Parameter zum Steuern der Sprachsyntheseeinrichtung (14) zu speichern; und einer Platte (1), die geeignet ist, in die Vorrichtung (10) einlegbar zu sein, wobei die Platte eine Elektronikschaltung (2) und einen Informationsspeicherblock (3) zum Speichern zweiter Parameter zum Steuern der Sprachsyntheseeinrichtung (14) aufweist, wobei die zweiten Parameter für jede von mehreren Sprechweisen bestimmt werden, wobei die Vorrichtung (10) auch eine Unterscheidungseinrichtung (11) zum. Beurteilen aufweist, ob die Platte eingelegt ist, a) bei nicht eingelegter Platte die Sprachsyntheseeinrichtung geeignet ist, durch die ersten Parameter gesteuert zu werden, die in der Vorrichtung (10) gespeichert sind, wenn Sprache auf der Grundlage der Dokumenteninformationen synthetisiert wird, und b) bei eingelegter Platte die Vorrichtung (10) geeignet ist, Informationen über die Sprechweise zur Elektronikschaltung der Platte zu senden, die Elektronikschaltung der Platte geeignet ist, die zweiten Parameter für die Sprechweise zur Vorrichtung zu senden, und die Sprachsyntheseeinrichtung geeignet ist, durch die empfangenen zweiten Parameter gesteuert zu werden, wenn Sprache auf der Grundlage der Dokumenteninformationen synthetisiert wird.
  2. Fahrzeugnavigationssystem mit dem System nach Anspruch 1.
  3. Sprachsyntheseverfahren, das durchgeführt wird mit Hilfe einer Vorrichtung (10) mit einer Sprachsyntheseeinrichtung (14) zum Synthetisieren von Sprache auf der Grundlage von Dokumenteninformationen, die eine Sprechweise und ein zu synthetisierendes Dokument aufweisen, und die geeignet ist, erste Parameter zum Steuern der Sprachsyntheseeinrichtung (14) zu speichern, und einer Platte (1), die geeignet ist, in die Vorrichtung (10) einlegbar zu sein, wobei die Platte eine Elektronikschaltung (2) und einen Informationsspeicherblock (3) zum Speichern zweiter Parameter zum Steuern der Sprachsyntheseeinrichtung (14) aufweist, wobei die zweiten Parameter für jede von mehreren Sprechweisen bestimmt werden, wobei das Verfahren die folgenden Schritte aufweist: a) bei nicht eingelegter Platte erfolgendes Steuern der Sprachsyntheseeinrichtung durch die ersten Parameter, die in der Vorrichtung (10) gespeichert sind, wenn Sprache auf der Grundlage der Dokumenteninformationen synthetisiert wird, und b) bei eingelegter Platte erfolgendes Ermöglichen, daß die Vorrichtung (10) Informationen über die Sprechweise zur Elektronikschaltung der Platte sendet, Ermöglichen, daß die Elektronikschaltung der Platte die zweiten Parameter für die Sprechweise zur Vorrichtung sendet, und Steuern der Sprachsyntheseeinrichtung durch die empfangenen zweiten Parameter, wenn Sprache auf der Grundlage der Dokumenteninformationen synthetisiert wird.
DE69837428T 1997-06-18 1998-06-18 Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer Expired - Lifetime DE69837428T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9161664A JPH117296A (ja) 1997-06-18 1997-06-18 電子回路を有する記憶媒体と該記憶媒体を有する音声合成装置
JP16166497 1997-06-18
PCT/JP1998/002699 WO1998058365A1 (fr) 1997-06-18 1998-06-18 Support de donnees avec circuits electroniques, et synthetiseur vocal pourvu de ce support de donnees

Publications (2)

Publication Number Publication Date
DE69837428D1 DE69837428D1 (de) 2007-05-10
DE69837428T2 true DE69837428T2 (de) 2007-07-12

Family

ID=15739495

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69837428T Expired - Lifetime DE69837428T2 (de) 1997-06-18 1998-06-18 Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer

Country Status (9)

Country Link
US (1) US6393400B1 (de)
EP (1) EP0936597B1 (de)
JP (1) JPH117296A (de)
KR (1) KR20000068072A (de)
CN (1) CN1174372C (de)
AU (1) AU8034298A (de)
DE (1) DE69837428T2 (de)
TW (1) TW374914B (de)
WO (1) WO1998058365A1 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5958012A (en) 1996-07-18 1999-09-28 Computer Associates International, Inc. Network management system using virtual reality techniques to display and simulate navigation to network components
US7680879B2 (en) 1996-07-18 2010-03-16 Computer Associates Think, Inc. Method and apparatus for maintaining data integrity across distributed computer systems
JP4292646B2 (ja) 1999-09-16 2009-07-08 株式会社デンソー ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
JP2001209400A (ja) * 2000-01-24 2001-08-03 Denso Corp 音声合成装置及び音声案内システム
US7418415B1 (en) * 2001-12-10 2008-08-26 Teredata Us, Inc. Object-oriented representation of a generic profitability rule for financial processing in a relational database management system
US7680709B1 (en) * 2000-06-29 2010-03-16 Teradata Us, Inc. Selection processing for financial processing in a relational database management system
GB0029022D0 (en) * 2000-11-29 2001-01-10 Hewlett Packard Co Locality-dependent presentation
JP2004532450A (ja) * 2001-03-02 2004-10-21 コンピュータ アソシエイツ シンク,インコーポレイテッド システム及びネットワーク管理におけるユーザ・インターフェース要素としてスピーチを生成し認識する方法及び装置
US6952674B2 (en) * 2002-01-07 2005-10-04 Intel Corporation Selecting an acoustic model in a speech recognition system
US7693719B2 (en) * 2004-10-29 2010-04-06 Microsoft Corporation Providing personalized voice font for text-to-speech applications
JP5440087B2 (ja) * 2009-10-13 2014-03-12 ヤマハ株式会社 エンジン音生成装置
JP5949607B2 (ja) * 2013-03-15 2016-07-13 ヤマハ株式会社 音声合成装置

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE871690R (fr) 1978-10-27 1979-02-15 Staar Sa Dispositif de memorisation de la position instantanee d'une bande magnetique contenue dans une cassette
JPS59175062A (ja) 1983-03-24 1984-10-03 Victor Co Of Japan Ltd 情報記録媒体再生装置
JPS61177585A (ja) 1985-02-04 1986-08-09 Toshiba Corp 携帯用電子装置密封体
ATE71752T1 (de) 1985-03-07 1992-02-15 Omron Tateisi Electronics Co Chipkartensystem.
JP2676030B2 (ja) 1985-06-14 1997-11-12 アドバンストエレクトロニクス 株式会社 ディスク
NL8503410A (nl) 1985-12-11 1987-07-01 Philips Nv Inrichting voor het overdragen van informatie tussen een elektronische geheugenkaart en een dataverwerkende eenheid.
US4839875A (en) 1986-05-19 1989-06-13 Anritsu Corporation Technique for automatic tracking of cassette rentals and managing of information related thereto
JPS637541A (ja) 1986-06-27 1988-01-13 Brother Ind Ltd 光記録媒体
DE3770115D1 (de) 1986-10-16 1991-06-20 Hitachi Maxell Kombination zweier verschiedener speicherelemente.
JPH0636305B2 (ja) 1987-03-06 1994-05-11 アドバンストエレクトロニクス株式会社 光情報記憶媒体及びそれを適用したシステム
JPS63253493A (ja) 1987-04-09 1988-10-20 Mitsubishi Electric Corp 情報記録システム
JPH01127392A (ja) * 1987-11-11 1989-05-19 Dainippon Printing Co Ltd 音声合成カード
JPH01162286A (ja) 1987-12-18 1989-06-26 Tokin Corp メモリー・カートリッジ
JPH025158A (ja) 1988-06-22 1990-01-10 Fujitsu Ltd 拡張icカード及びそのアクセス法
JPH01263892A (ja) 1988-04-15 1989-10-20 Toshiba Corp 携帯可能電子装置
DE3903454A1 (de) 1988-12-12 1990-06-13 Raymund H Eisele In edv-einrichtungen einsteckbares element
JPH02230584A (ja) 1989-03-02 1990-09-12 Seiko Epson Corp コンパクトディスク
FR2645988A1 (fr) 1989-04-14 1990-10-19 Altec Sa Dispositif pour branchement d'un disque dur amovible
US5484292A (en) * 1989-08-21 1996-01-16 Mctaggart; Stephen I. Apparatus for combining audio and visual indicia
US5423054A (en) 1989-12-29 1995-06-06 Pitney Bowes Inc. Processor and read/write head incorporated in disk for communicating data to host directly from processor read/write head to read/write head of host disk drive
US5036461A (en) 1990-05-16 1991-07-30 Elliott John C Two-way authentication system between user's smart card and issuer-specific plug-in application modules in multi-issued transaction device
US5276572A (en) 1990-09-19 1994-01-04 Hitachi, Ltd. Magnetic disk apparatus
JPH04304011A (ja) 1991-03-31 1992-10-27 Nec Corp アイソレータのインターフェース回路
JPH04356785A (ja) 1991-06-03 1992-12-10 Hitachi Ltd ディスク内蔵カード
JPH04355818A (ja) 1991-06-03 1992-12-09 Pfu Ltd データ入出力制御装置
US5559958A (en) * 1991-06-24 1996-09-24 Compaq Computer Corporation Graphical user interface for computer management system and an associated management information base
DE4121023C2 (de) 1991-06-26 1994-06-01 Smartdiskette Gmbh In eine EDV-Einrichtung einsteckbares Element
US5235586B1 (en) 1991-12-04 1997-03-04 Hewlett Packard Co Computer system utilizing compact intelligent disks
JP2942837B2 (ja) 1992-01-31 1999-08-30 株式会社セガ・エンタープライゼス セキュリティチェック方法及びゲーム装置並びにそれらに用いられる情報記憶媒体
US5289521A (en) * 1992-03-09 1994-02-22 Coleman Michael J Audio/telecommunications system to assist in speech and cognitive skills development for the verbally handicapped
JPH05258347A (ja) 1992-03-13 1993-10-08 Konica Corp 光ディスク
JP2868141B2 (ja) 1992-03-16 1999-03-10 株式会社日立製作所 ディスクアレイ装置
JPH05289854A (ja) 1992-04-08 1993-11-05 Olympus Optical Co Ltd 外部記憶装置のアクセス装置
JP3181989B2 (ja) 1992-07-20 2001-07-03 株式会社リコー 光ピックアップ装置
US5559927A (en) * 1992-08-19 1996-09-24 Clynes; Manfred Computer system producing emotionally-expressive speech messages
US5533125A (en) 1993-04-06 1996-07-02 International Business Machines Corporation Removable computer security device
JP3101668B2 (ja) * 1993-04-07 2000-10-23 和夫 三上 メモリ一体型音声合成モジュール
US5903867A (en) * 1993-11-30 1999-05-11 Sony Corporation Information access system and recording system
FR2714987B1 (fr) 1994-01-10 1996-02-02 Remery Patrick Système pour transactions comprenant des terminaux et des cartes à mémoire et carte à mémoire correspondante.
US5737549A (en) * 1994-01-31 1998-04-07 Ecole Polytechnique Federale De Lausanne Method and apparatus for a parallel data storage and processing server
EP0666550B1 (de) 1994-02-08 1997-05-02 Belle Gate Investment B.V. Datenauswechselsystem mit tragbaren Datenverarbeitungseinheiten
EP1336963B1 (de) 1994-03-19 2006-05-31 Sony Corporation Optische Platte, Verfahren und Gerät zur Aufzeichnung und Wiedergabe von Informationen
CN1130434A (zh) 1994-07-18 1996-09-04 Ntt数据通信株式会社 电子折子和使用电子折子的现金交易信息处理系统
US5640592A (en) 1994-09-30 1997-06-17 Mitsubishi Kasei America, Inc. System for transferring utility algorithm stored within a peripheral device to a host computer in a format compatible with the type of the host computer
JP3285110B2 (ja) 1994-10-21 2002-05-27 セイコーエプソン株式会社 ファームウェアの組み込み方法及びホスト装置とプリンタとからなるシステム
JPH08161790A (ja) 1994-11-30 1996-06-21 Hitachi Ltd 光ディスクおよびそれを用いる光ディスク装置
US5857079A (en) 1994-12-23 1999-01-05 Lucent Technologies Inc. Smart card for automatic financial records
AU5110596A (en) 1995-03-22 1996-10-08 Meiller Comcard Gmbh Protection device for data carriers and an interactive device which co-operates with the protection device to prevent unauthorised use
EP0735765B1 (de) 1995-03-31 2002-06-19 Sony Service Centre (Europe) N.V. Speichereinheit
JP3210549B2 (ja) 1995-05-17 2001-09-17 日本コロムビア株式会社 光情報記録媒体
US6115331A (en) 1995-05-31 2000-09-05 Fujitsu Limited Optical disk library apparatus of desk-top type
JPH0917154A (ja) 1995-06-27 1997-01-17 Nec Shizuoka Ltd 残量表示機能を有するディスク
JP3513988B2 (ja) * 1995-07-20 2004-03-31 ソニー株式会社 ナビゲーションシステム
US5956317A (en) 1995-07-28 1999-09-21 Toshiba-Emi Limited Composite optical disk with structure for preventing adhesive from leaking into the center hole
US5664228A (en) 1995-08-09 1997-09-02 Microsoft Corporation Portable information device and system and method for downloading executable instructions from a computer to the portable information device
US5663553A (en) 1995-09-27 1997-09-02 Intel Corporation Mass storage device adapter for smart cards
JP2669413B2 (ja) 1995-09-28 1997-10-27 日本電気株式会社 電子部品の実装構造
EP0795844A1 (de) 1996-03-11 1997-09-17 Koninklijke KPN N.V. Verfahren zum gesichertes Ändern von Daten einer Chipkarte
DE19616819A1 (de) 1996-04-26 1997-10-30 Giesecke & Devrient Gmbh CD mit eingebautem Chip
DE69711755T2 (de) 1996-05-02 2002-11-14 Texas Instruments Inc Verbesserungen in Bezug auf Sicherheitssysteme
KR100186412B1 (ko) 1996-05-07 1999-04-15 구자홍 메모리를 내장한 광 디스크
US5652838A (en) 1996-05-20 1997-07-29 Lovett; Donna M. Smart disc cd-rom
US5844218A (en) 1996-07-16 1998-12-01 Transaction Technology, Inc. Method and system for using an application programmable smart card for financial transactions in multiple countries
US5890014A (en) 1996-08-05 1999-03-30 Micronet Technology, Inc. System for transparently identifying and matching an input/output profile to optimal input/output device parameters
JP2830857B2 (ja) 1996-09-09 1998-12-02 三菱電機株式会社 データストレージシステム及びデータストレージ管理方法
US5999698A (en) * 1996-09-30 1999-12-07 Kabushiki Kaisha Toshiba Multiangle block reproduction system
US5951687A (en) 1997-01-31 1999-09-14 Seagate Technology, Inc. Storage disc with self diagnostics and configuration
US6005940A (en) 1997-05-16 1999-12-21 Software Security, Inc. System for securely storing and reading encrypted data on a data medium using a transponder
JP3895830B2 (ja) 1997-06-18 2007-03-22 インテリジェントディスク株式会社 電子回路を有する記憶媒体

Also Published As

Publication number Publication date
AU8034298A (en) 1999-01-04
DE69837428D1 (de) 2007-05-10
EP0936597A1 (de) 1999-08-18
CN1174372C (zh) 2004-11-03
US6393400B1 (en) 2002-05-21
JPH117296A (ja) 1999-01-12
KR20000068072A (ko) 2000-11-25
TW374914B (en) 1999-11-21
EP0936597A4 (de) 2001-01-17
WO1998058365A1 (fr) 1998-12-23
EP0936597B1 (de) 2007-03-28
CN1229500A (zh) 1999-09-22

Similar Documents

Publication Publication Date Title
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE60035001T2 (de) Sprachsynthese mit Prosodie-Mustern
DE60317130T2 (de) Vorrichtung und Verfahren zur Bereitstellung von Informationen mittels einer Sprachdialogschnittstelle
DE69908047T2 (de) Verfahren und System zur automatischen Bestimmung von phonetischen Transkriptionen in Verbindung mit buchstabierten Wörtern
DE60200857T2 (de) Erzeugung einer künstlichen Sprache
DE60020434T2 (de) Erzeugung und Synthese von Prosodie-Mustern
EP1336955B1 (de) Verfahren zur Erzeugung natürlicher Sprache in Computer-Dialogsystemen
DE60010827T2 (de) Hintergrundsystem für Audiodatenbeseitigung
DE60020773T2 (de) Graphische Benutzeroberfläche und Verfahren zur Änderung von Aussprachen in Sprachsynthese und -Erkennungssystemen
DE60201262T2 (de) Hierarchische sprachmodelle
DE60004420T2 (de) Erkennung von Bereichen überlappender Elemente für ein konkatenatives Sprachsynthesesystem
DE69629763T2 (de) Verfahren und Vorrichtung zur Ermittlung von Triphone Hidden Markov Modellen (HMM)
DE102017124264B4 (de) Computerimplementiertes Verfahren und Rechensystem zum Bestimmen phonetischer Beziehungen
DE69837428T2 (de) Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer
DE60207217T2 (de) Verfahren zum ermöglichen der sprachinteraktion mit einer internet-seite
DE10031008A1 (de) Verfahren zum Zusammensetzen von Sätzen zur Sprachausgabe
WO1998010413A1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
DE102006036338A1 (de) Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
DE60123153T2 (de) Sprachgesteuertes Browsersystem
DE60008893T2 (de) Sprachgesteuertes tragbares Endgerät
EP1105867B1 (de) Verfahren und vorrichtungen zur koartikulationsgerechten konkatenation von audiosegmenten
DE60300374T2 (de) Sprachaktiviertes Musikwiedergabesystem
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE212016000292U1 (de) System zur Text-zu-Sprache-Leistungsbewertung
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition