Internationale Patentklassifikation G10L 21/057

Sektion G — Physik

Musikinstrumente; Akustik

Link zur Definition für IPC-Symbol: G10L

Techniken zur Sprachanalyse oder Sprachsynthese; Spracherkennung; Techniken zur Sprachbearbeitung oder Stimmenbearbeitung; Codieren oder Decodieren von Sprache oder Audiosignalen [4]

Hierarchische Anzeige einschalten: G10L 13/00

G10L 13/00

Sprachsynthese; Umwandlung von Text in Sprache [7, 2006.01]

G10L 13/02

.	Verfahren zur Erzeugung synthetischer Sprache; Sprachsynthesiser [7, 2006.01, 2013.01]

G10L 13/027

. .	Synthesizer für die inhaltsgesteuerte Sprachsynthese ["concept-to-speech"]; Erzeugung natürlicher Redewendungen aus maschinenbasierten Inhalten (Erzeugen von Parametern zur Sprachsynthese aus einem Text G10L 13/08) [2013.01]

G10L 13/033

. .	Stimmenbearbeitung, z.B. Manipulieren der Stimme des Sprachgenerators (Sprachsynthesizers) [2013.01]

G10L 13/04

. .	Einzelheiten von Sprachsyntheseeinrichtungen, z.B. Sprachgeneratoraufbau oder Speicherverwaltung [7, 2006.01, 2013.01]

G10L 13/047

. . .

Sprachgeneratoraufbau (Architektur von Sprachsynthesizern) [2013.01]

G10L 13/06

.	In Sprachsynthesisern verwendete elementare Spracheinheiten; Verkettungsregeln [7, 2006.01, 2013.01]

G10L 13/07

. .	Verkettungsregeln [2013.01]

G10L 13/08

.	Textanalyse oder Erzeugen von Parametern zur Sprachsynthese aus einem Text, z.B. Graphem/Phonem-Umwandlung, Prosodieerzeugung oder Erkennen der Betonung oder Intonation [7, 2006.01, 2013.01]

G10L 13/10

. .	aus Text abgeleitete prosodische Regeln, Akzentuierung und Sprachmelodie [2013.01]

Hierarchische Anzeige einschalten: G10L 15/00

G10L 15/00

Spracherkennung (G10L 17/00 hat Vorrang) [7, 2006.01, 2013.01]

G10L 15/01

.	Bewertung oder Evaluierung von Spracherkennungssystemen [2013.01]

G10L 15/02

.	Merkmalsextraktion zur Spracherkennung; Auswahl der Erkennungselemente [7, 2006.01]

G10L 15/04

.	Segmentierung; Wortgrenzenerkennung [7, 2006.01, 2013.01]

G10L 15/05

. .	Wortgrenzenerkennung [2013.01]

Hierarchische Anzeige einschalten: G10L 15/06

G10L 15/06

.	Erzeugen von Bezugsschablonen; Trainieren von Spracherkennungseinrichtungen, z.B. Anpassung an charakteristische Merkmale der Stimme eines Sprechers (G10L 15/14 hat Vorrang) [7, 2006.01, 2013.01]

G10L 15/065

. .	Anpassung [2013.01]

G10L 15/07

. . .

an den Sprecher [2013.01]

G10L 15/08

.	Klassifizieren von oder Suchen nach Sprache [7, 2006.01]

G10L 15/10

. .	unter Verwendung von Abstandsmessungen oder Verzerrungsmessungen zwischen unbekannter Sprache und Bezugsschablonen [7, 2006.01]

G10L 15/12

. .	unter Verwendung dynamischer Programmiertechniken, z.B. Dynamic Time Warping [DTW] [7, 2006.01]

Hierarchische Anzeige einschalten: G10L 15/14

G10L 15/14

. .	unter Verwendung statistischer Modelle, z.B. Hidden Markov Models [HMM] (G10L 15/18 hat Vorrang) [7, 2006.01]

G10L 15/16

. .	unter Verwendung künstlicher neuronaler Netzwerke [7, 2006.01]

G10L 15/18

. .	unter Verwendung der natürlichen Sprache als Vorbild [7, 2006.01, 2013.01]

G10L 15/183

. . .

kontextabhängig, z.B. Sprachmodelle [2013.01]

G10L 15/187

. . . .

phonemischer Kontext, z.B. Betonungsregeln, phonotaktische Beschränkungen oder phonemische N-Gramme [2013.01]

G10L 15/19

. . . .

grammatikalischer Kontext, z.B. Disambiguierung von Erkennungshypothesen auf der Basis von Wortsequenzregeln [2013.01]

G10L 15/193

. . . . .

Formale Grammatik, z.B. endliche Automaten, kontextfreie Grammatik oder Wortnetze [2013.01]

G10L 15/197

. . . . .

Probabilistische Grammatik, z.B. Wort-n-Gramme [2013.01]

Hierarchische Anzeige einschalten: G10L 15/20

G10L 15/20

.	Spracherkennungsverfahren, besonders angepasst an die Belastung in widrigen Umgebungen, z.B. bei Lärm, unter Stress entstandene Sprache (G10L 21/02 hat Vorrang) [7, 2006.01]

G10L 15/22

.	während eines Spracherkennungsvorgangs angewendete Prozedur, z.B. Dialog zwischen Mensch und Maschine [7, 2006.01]

G10L 15/24

.	Spracherkennung unter Verwendung nichtakustischer Eigenschaften [7, 2006.01, 2013.01]

G10L 15/25

. .	unter Verwendung der Stellung der Lippen, der Lippenbewegung oder Gesichtsanalyse [2013.01]

Hierarchische Anzeige einschalten: G10L 15/26

G10L 15/26

.	Umwandlung von Sprache in Text (G10L 15/08 hat Vorrang) [7, 2006.01]

G10L 15/28

.	bauliche Einzelheiten von Spracherkennungssystemen [7, 2006.01, 2013.01]

G10L 15/30

. .	Verteilte Spracherkennung, z.B. in Client-Server-Systemen für Mobiltelefone oder Mobilfunknetze [2013.01]

G10L 15/32

. .	Mehrere Spracherkennungssysteme, die nacheinander oder parallel verwendet werden; dafür vorgesehene Bewertungssysteme, z.B. Wahlsysteme [2013.01]

G10L 15/34

. .	Anpassung eines einzelnen Spracherkennungssystems an die parallele Bearbeitung, z.B. durch mehrere Prozessoren oder Cloudcomputing [2013.01]

Hierarchische Anzeige einschalten: G10L 17/00

G10L 17/00

Techniken zur Sprechererkennung oder Sprecherverifikation [7, 2006.01, 2013.01]

G10L 17/02

.	Vorverarbeitungsschritte, z.B. Segmentauswahl; Musterdarstellung oder Mustermodellierung, z.B. basierend auf linearer Diskriminanzanalyse [linear discriminant analysis, LDA] oder anhand der Hauptkomponenten; Merkmalsauswahl oder Merkmalsextraktion [2013.01]

G10L 17/04

.	Training, Registrierung (Enrolment) oder Modellbildung [2013.01]

G10L 17/06

.	Entscheidungstechniken; Strategien zum Musterabgleich [2013.01]

G10L 17/08

. .	Verwendung eines Abweichungsmaßes oder eines bestimmten Abstands zwischen Testmuster und Referenzmuster [2013.01]

G10L 17/10

. .	Multimodale Systeme, d.h. basierend auf mehreren Erkennungssystemen oder Expertensystemen [2013.01]

G10L 17/12

. .	Wertenormalisierung ["score normalisation"] [2013.01]

G10L 17/14

. .	Vorausgehende Verwendung von phonemischer Klassifizierung oder Spracherkennung vor der Sprechererkennung oder Sprecherverifizierung [2013.01]

G10L 17/16

.	Hidden Markov Modelle [HMM] [2013.01]

G10L 17/18

.	Künstliche neuronale Netze; konnektionistische Ansätze [2013.01]

G10L 17/20

.	Mustertransformationen oder Maßnahmen, die auf die Erhöhung der Robustheit des Systems abzielen, z.B. gegen Kanalrauschen oder in unterschiedlichen Einsatzbereichen [2013.01]

G10L 17/22

.	Interaktive Verfahren; Mensch-Maschine-Schnittstellen [2013.01]

G10L 17/24

. .	mit Aufforderung für den Nutzer zur Eingabe eines Passworts oder einer vordefinierten Phrase [2013.01]

G10L 17/26

.	Erkennung besonderer stimmlicher Merkmale, z.B. zur Nutzung in Lügendetektoren; Erkennung von Tierstimmen [2013.01]

Hierarchische Anzeige einschalten: G10L 19/00

G10L 19/00

Sprach- oder Audioanalyse/-syntheseverfahren zur Redundanzverminderung, z.B. in Vocodern; Codieren oder Decodieren von Sprache oder Audiosignalen, unter Verwendung von Quelle-Filter-Modellen oder psychoakustischer Analyse (bei Musikinstrumenten G10H) [7, 2006.01, 2013.01]

G10L 19/002

.	Dynamische Bitzuteilung (für perzeptive Audiocodierer G10L 19/032) [2013.01]

G10L 19/005

.	Korrektur von Fehlern, die vom Transmissionskanal induziert werden, soweit sie auf den Codieralgorithmus bezogen sind [2013.01]

G10L 19/008

.	Codieren oder Decodieren von Multikanal-Audiosignalen unter Verwendung von Zwischenkanal ("Interchannel")-Korrelation zum Verringern von Redundanz, z.B. Joint Stereo, Intensity Coding oder Matrixing [2013.01]

G10L 19/012

.	Komfortrauschen oder Kodierung von Stille [2013.01]

G10L 19/018

.	Einbringen von Audio-Wasserzeichen, d.h. Einbetten von unhörbaren Daten in das Audio-Signal [2013.01]

G10L 19/02

.	unter der Verwendung von spektralen Analysemethoden, z.B. Umwandlungsvocoder oder Teilbandvocoder [7, 2006.01, 2013.01]

G10L 19/022

. .	Blockbildung, d.h. zeitliches Gruppieren von Proben; Wahl des Analysefensters; Überlappungsfaktorisierung [2013.01]

G10L 19/025

. . .

Feststellen von Transienten oder Attacken zur Umschaltung der Zeit / Frequenz-Auflösung [2013.01]

Hierarchische Anzeige einschalten: G10L 19/028

G10L 19/028

. .	Noise Substitution, z.B. Ersatz nicht-tonaler spektraler Komponenten durch eine verrauschte Quelle (Komfortrauschen für diskontinuierliche Sprachübertragung G10L 19/012) [2013.01]

G10L 19/03

. .	Spektrale Voraussagetechniken zur Vermeidung von (Pre-Echo); Temporal Noise Shaping [TNS], z.B. in MPEG2 oder MPEG4 [2013.01]

G10L 19/032

. .	Quantisierung oder Dequantisierung spektraler Komponenten [2013.01]

G10L 19/035

. . .

Skalare Quantisierung [2013.01]

G10L 19/038

. . .

Vektorquantisierung, z.B. TwinVQ Audio [2013.01]

G10L 19/04

.	unter der Verwendung von Voraussagetechniken [7, 2006.01, 2013.01]

G10L 19/06

. .	Ermittlung oder Codierung charakteristischer spektraler Merkmale, z.B. Kurzzeit-Voraussagekoeffizienten [7, 2006.01, 2013.01]

G10L 19/07

. . .

Line spectrum pair [LSP]-Vocoder [2013.01]

G10L 19/08

. .	Ermittlung oder Codierung der Anregungsfunktion; Ermittlung oder Codierung von Langzeit-Voraussageparametern [7, 2006.01, 2013.01]

G10L 19/083

. . .

wobei die Anregungsfunktion eine Anregungsverstärkung ist (G10L 25/90 hat Vorrang) [2013.01]

G10L 19/087

. . .

unter Verwendung gemischter Anregungsmodelle, z.B. MELP, MBE, Split Band LPC oder HVXC [2013.01]

G10L 19/09

. . .

Langzeitvoraussagetechniken, d.h. Entfernen periodischer Redundanzen, z.B.mittels adaptivem Codebuch oder Pitch-Voraussagetechniken [2013.01]

G10L 19/093

. . .

unter Verwendung sinusförmiger Anregungsmodelle [2013.01]

G10L 19/097

. . .

unter Verwendung einer Spektralzerlegung in Wellenform-Prototypen oder interpolativen Sprach-Codec-Systemen [PWI] [2013.01]

G10L 19/10

. . .

wobei die Anregungsfunktion eine Mehrfachpuls-Anregung ist [7, 2006.01, 2013.01]

G10L 19/107

. . . .

Sparse Pulse Excitation, z.B. unter Verwendung eines algebraischen Codebuchs [2013.01]

G10L 19/113

. . . .

Regular Pulse Excitation [2013.01]

G10L 19/12

. . .

wobei die Anregungsfunktion eine Code-Anregung ist, z.B. in einem codeangeregten Vocoder zur linearen Vorhersage [Code Excited Linear Prediction = CELP] [7, 2006.01, 2013.01]

G10L 19/125

. . . .

Pitch-Anregung, z.B. Pitch Synchronous Innovation CELP [PSI-CELP] [2013.01]

G10L 19/13

. . . .

Residual Excited Linear Prediction [RELP] [2013.01]

G10L 19/135

. . . .

Vector Sum Excited Linear Prediction [VSELP] [2013.01]

G10L 19/16

. .	Vocoder-Architektur [2013.01]

G10L 19/18

. . .

Multi-Mode-Vocoder [2013.01]

G10L 19/20

. . . .

unter Verwendung von klangklassenspezifischem Codieren, Hybrid-Encodern oder objektbasiertem Codieren [2013.01]

G10L 19/22

. . . .

Modenauswahl, basierend auf dem Audiosignal-Inhalt gegenüber äußereren Parametern [2013.01]

Hierarchische Anzeige einschalten: G10L 19/24

G10L 19/24

. . . .

Variable Rate Codecs, z.B. zur Erzeugung unterschiedlicher Qualitäten/Eigenschaften unter Verwendung einer skalierbaren Darstellung wie hierarchische Kodierung oder Schicht-Kodierung [2013.01]

G10L 19/26

. .	Vorfilterung oder Nachfilterung [2013.01]

Hierarchische Anzeige einschalten: G10L 21/00

G10L 21/00

Techniken zur Sprachverarbeitung oder Stimmsignalverarbeitung zur Erzeugung eines anderen hörbaren oder nicht hörbaren Signals, z.B. sichtbar oder fühlbar, um dessen Qualität oder Verständlichkeit zu ändern (G10L 19/00 hat Vorrang) [7, 2006.01, 2013.01]

G10L 21/003

.	Verändern der Stimmqualität, z.B. Tonhöhe oder Formant [2013.01]

G10L 21/007

. .	charakterisiert durch das verwendete Verfahren [2013.01]

G10L 21/01

. . .

Korrektur der Zeitachse [2013.01]

G10L 21/013

. . .

Anpassung an gezielte Tonhöhe [2013.01]

Hierarchische Anzeige einschalten: G10L 21/02

G10L 21/02

.	Sprachverbesserung, z.B. Rauschverminderung oder Echounterdrückung (Vermindern von Echoeffekten in Leitungsübertragungssystemen H04B 3/20; Echounterdrückung in Freisprechtelefonen H04M 9/08) [7, 2006.01, 2013.01]

G10L 21/0208

. .	Rauschfilterung [2013.01]

G10L 21/0216

. . .

charakterisiert durch die Methode zur Rauschabschätzung [2013.01]

G10L 21/0224

. . . .

Verarbeitung im Zeitbereich [2013.01]

G10L 21/0232

. . . .

Verarbeitung im Frequenzbereich [2013.01]

G10L 21/0264

. . .

charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01]

G10L 21/0272

. .	Separieren des Stimmsignals [2013.01]

G10L 21/028

. . .

unter Verwendung von Eigenschaften der Klangquellen [2013.01]

G10L 21/0308

. . .

charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01]

G10L 21/0316

. .	durch Änderung der Amplitude [2013.01]

G10L 21/0324

. . .

Einzelheiten der Verarbeitung [2013.01]

G10L 21/0332

. . . .

verbunden mit der Modifikation von Wellenformen [2013.01]

G10L 21/034

. . . .

Automatische Anpassung [2013.01]

Hierarchische Anzeige einschalten: G10L 21/0356

G10L 21/0356

. . .

zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01]

G10L 21/0364

. . .

zur Verbesserung der Verständlichkeit [2013.01]

Hierarchische Anzeige einschalten: G10L 21/038

G10L 21/038

. .	unter Verwendung von Bandspreiztechniken [2013.01]

G10L 21/0388

. . .

Einzelheiten der Verarbeitung [2013.01]

G10L 21/04

.	Zeitkomprimierung oder Zeitdekomprimierung [7, 2006.01, 2013.01]

G10L 21/043

. .	durch Änderung der Geschwindigkeit [2013.01]

G10L 21/045

. . .

mittels Ausdünnen oder Einschieben einer Wellenform [2013.01]

G10L 21/047

. . . .

charakterisiert durch dei Art der auszudünnenden oder einzuschiebenden Wellenform [2013.01]

G10L 21/049

. . . .

charakterisiert durch die Kopplung/Verbindung von Wellenformen [2013.01]

G10L 21/055

. .	zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01]

G10L 21/057

. .	zur Verbesserung der Verständlichkeit [2013.01]

Hierarchische Anzeige einschalten: G10L 21/06

G10L 21/06

.	Umwandlung von Sprache in eine nicht hörbare Darstellung, z.B. Sichtbarmachung von Sprache oder Sprachverarbeitung für Tasthilfen (G10L 15/26 hat Vorrang) [7, 2006.01, 2013.01]

G10L 21/10

. .	Umwandlung in sichtbare Information [2013.01]

G10L 21/12

. . .

durch Anzeigen von Information zum Zeitbereich [2013.01]

G10L 21/14

. . .

durch Anzeigen von Information zum Frequenzbereich [2013.01]

Hierarchische Anzeige einschalten: G10L 21/16

G10L 21/16

. .	Umwandeln in eine nicht-sichtbare Darstellung (Vorrichtungen oder Verfahren, um Ohrenkranken das direkte Hören durch andere Wahrnehmungsarten zu ersetzen A61F 11/04) [2013.01]

G10L 21/18

. .	Einzelheiten des Umwandlungsprozesses [2013.01]

Hierarchische Anzeige einschalten: G10L 25/00

G10L 25/00

Techniken zur Sprachanalyse oder Stimmanalyse, die nicht auf eine der Gruppen G10L 15/00-G10L 21/00 beschränkt sind (Stummschaltung von Verstärkern auf Halbleiterbasis, wenn einige Besonderheiten eines Signals von einem Sprachdetektor erfasst werden, z.B. Erfassen des Ausbleibens eines Signals H03G 3/34) [2013.01]

G10L 25/03

.	charakterisiert durch die Art der extrahierten Parameter [2013.01]

G10L 25/06

. .	wobei es sich bei den extrahierten Parametern um Korrelationskoeffizienten handelt [2013.01]

G10L 25/09

. .	wobei es sich bei den extrahierten Parametern um Nulldurchgangsraten handelt [2013.01]

G10L 25/12

. .	wobei es sich bei den extrahierten Parametern um Voraussagekoeffizienten handelt [2013.01]

G10L 25/15

. .	wobei es sich bei den extrahierten Parametern um Formanteninformation handelt [2013.01]

G10L 25/18

. .	wobei es sich bei den extrahierten Parametern um spektrale Information der jeweiligen Teilbänder handelt [2013.01]

G10L 25/21

. .	wobei es sich bei den extrahierten Parametern um Leistungsinformation handelt [2013.01]

G10L 25/24

. .	wobei es sich bei den extrahierten Parametern um das Cepstrum handelt [2013.01]

G10L 25/27

.	charakterisiert durch die Analysetechnik [2013.01]

G10L 25/30

. .	unter Verwendung neuronaler Netze [2013.01]

G10L 25/33

. .	unter Verwendung von Fuzzy Logik [2013.01]

G10L 25/36

. .	unter Verwendung von Chaostheorie [2013.01]

G10L 25/39

. .	unter Verwendung von genetischen Algorithmen [2013.01]

G10L 25/45

.	charakterisiert durch die Art des Analysefensters [2013.01]

G10L 25/48

.	besonders angepasst für eine bestimmte Verwendung [2013.01]

G10L 25/51

. .	zum Vergleich oder zur Differenzierung [2013.01]

G10L 25/54

. . .

zur Abfrage [2013.01]

G10L 25/57

. . .

zur Bearbeitung von Videosignalen [2013.01]

G10L 25/60

. . .

zur Messung der Qualität von Stimmsignalen [2013.01]

G10L 25/63

. . .

zum Abschätzen eines emotionalen Zustands [2013.01]

Hierarchische Anzeige einschalten: G10L 25/66

G10L 25/66

. . .

zum Extrahieren von Parametern in Verbindung mit einem Gesundheitszustand (Messen zu diagnostischen Zwecken A61B 5/00) [2013.01]

G10L 25/69

. .	zur Bewertung synthetischer oder decodierter Stimmsignale [2013.01]

G10L 25/72

. .	zum Übertragen der Analysergebnisse [2013.01]

G10L 25/75

.	zum Modellieren von Vokaltrakt-Parametern [2013.01]

Hierarchische Anzeige einschalten: G10L 25/78

G10L 25/78

.	Feststellen der Anwesenheit oder Abwesenheit von Stimmsignalen (sprachgesteuertes Umschalten der Übertragungsrichtung in Gegensprechanlagen mit Lautsprechern H04M 9/10) [2013.01]

G10L 25/81

. .	zur Differenzierung von Stimme gegenüber Musik [2013.01]

G10L 25/84

. .	zur Differenzierung von Stimme gegenüber Rauschen [2013.01]

G10L 25/87

. .	Feststellen diskreter Punkte innerhalb eines Stimmsignals [2013.01]

G10L 25/90

.	Bestimmung der Tonhöhe von Sprachsignalen [2013.01]

Hierarchische Anzeige einschalten: G10L 25/93

G10L 25/93

.	Differenzierung zwischen stimmhaften und stimmlosen Anteilen von Sprachsignalen (G10L 25/90 hat Vorrang) [2013.01]

Hierarchische Anzeige einschalten: G10L 99/00

G10L 99/00

Sachverhalte, soweit nicht in anderen Gruppen dieser Unterklasse vorgesehen [2013.01]