IPC-Stelle: G10L 25/45 [Version 2025.01 (aktuell)]

SymbolTypTitel
GSKSektion G — Physik
G10KLMusikinstrumenteAkustik
G10LUKLTechniken zur Sprachanalyse oder SprachsyntheseSpracherkennungTechniken zur Sprachbearbeitung oder StimmenbearbeitungCodieren oder Decodieren von Sprache oder Audiosignalen [4]
G10L 13/00HGRSprachsyntheseUmwandlung von Text in Sprache [7, 2006.01]
G10L 13/02UGR1
.Verfahren zur Erzeugung synthetischer SpracheSprachsynthesiser [7, 2006.01, 2013.01]
G10L 13/027UGR2
. .Synthesizer für die inhaltsgesteuerte Sprachsynthese ["concept-to-speech"]Erzeugung natürlicher Redewendungen aus maschinenbasierten Inhalten (Erzeugen von Parametern zur Sprachsynthese aus einem Text G10L 13/08) [2013.01]
G10L 13/033UGR2
. .Stimmenbearbeitung, z.B. Manipulieren der Stimme des Sprachgenerators (Sprachsynthesizers) [2013.01]
G10L 13/04UGR2
. .Einzelheiten von Sprachsyntheseeinrichtungen, z.B. Sprachgeneratoraufbau oder Speicherverwaltung [7, 2006.01, 2013.01]
G10L 13/047UGR3
. . .Sprachgeneratoraufbau (Architektur von Sprachsynthesizern) [2013.01]
G10L 13/06UGR1
.In Sprachsynthesisern verwendete elementare SpracheinheitenVerkettungsregeln [7, 2006.01, 2013.01]
G10L 13/07UGR2
. .Verkettungsregeln [2013.01]
G10L 13/08UGR1
.Textanalyse oder Erzeugen von Parametern zur Sprachsynthese aus einem Text, z.B. Graphem/Phonem-Umwandlung, Prosodieerzeugung oder Erkennen der Betonung oder Intonation [7, 2006.01, 2013.01]
G10L 13/10UGR2
. .aus Text abgeleitete prosodische Regeln, Akzentuierung und Sprachmelodie [2013.01]
G10L 15/00HGRSpracherkennung (G10L 17/00 hat Vorrang) [7, 2006.01, 2013.01]
G10L 15/01UGR1
.Bewertung oder Evaluierung von Spracherkennungssystemen [2013.01]
G10L 15/02UGR1
.Merkmalsextraktion zur SpracherkennungAuswahl der Erkennungselemente [7, 2006.01]
G10L 15/04UGR1
.SegmentierungWortgrenzenerkennung [7, 2006.01, 2013.01]
G10L 15/05UGR2
. .Wortgrenzenerkennung [2013.01]
G10L 15/06UGR1
.Erzeugen von BezugsschablonenTrainieren von Spracherkennungseinrichtungen, z.B. Anpassung an charakteristische Merkmale der Stimme eines Sprechers (G10L 15/14 hat Vorrang) [7, 2006.01, 2013.01]
G10L 15/065UGR2
. .Anpassung [2013.01]
G10L 15/07UGR3
. . .an den Sprecher [2013.01]
G10L 15/08UGR1
.Klassifizieren von oder Suchen nach Sprache [7, 2006.01]
G10L 15/10UGR2
. .unter Verwendung von Abstandsmessungen oder Verzerrungsmessungen zwischen unbekannter Sprache und Bezugsschablonen [7, 2006.01]
G10L 15/12UGR2
. .unter Verwendung dynamischer Programmiertechniken, z.B. Dynamic Time Warping [DTW] [7, 2006.01]
G10L 15/14UGR2
. .unter Verwendung statistischer Modelle, z.B. Hidden Markov Models [HMM] (G10L 15/18 hat Vorrang) [7, 2006.01]
G10L 15/16UGR2
. .unter Verwendung künstlicher neuronaler Netzwerke [7, 2006.01]
G10L 15/18UGR2
. .unter Verwendung der natürlichen Sprache als Vorbild [7, 2006.01, 2013.01]
G10L 15/183UGR3
. . .kontextabhängig, z.B. Sprachmodelle [2013.01]
G10L 15/187UGR4
. . . .phonemischer Kontext, z.B. Betonungsregeln, phonotaktische Beschränkungen oder phonemische N-Gramme [2013.01]
G10L 15/19UGR4
. . . .grammatikalischer Kontext, z.B. Disambiguierung von Erkennungshypothesen auf der Basis von Wortsequenzregeln [2013.01]
G10L 15/193UGR5
. . . . .Formale Grammatik, z.B. endliche Automaten, kontextfreie Grammatik oder Wortnetze [2013.01]
G10L 15/197UGR5
. . . . .Probabilistische Grammatik, z.B. Wort-n-Gramme [2013.01]
G10L 15/20UGR1
.Spracherkennungsverfahren, besonders angepasst an die Belastung in widrigen Umgebungen, z.B. bei Lärm, unter Stress entstandene Sprache (G10L 21/02 hat Vorrang) [7, 2006.01]
G10L 15/22UGR1
.während eines Spracherkennungsvorgangs angewendete Prozedur, z.B. Dialog zwischen Mensch und Maschine [7, 2006.01]
G10L 15/24UGR1
.Spracherkennung unter Verwendung nichtakustischer Eigenschaften [7, 2006.01, 2013.01]
G10L 15/25UGR2
. .unter Verwendung der Stellung der Lippen, der Lippenbewegung oder Gesichtsanalyse [2013.01]
G10L 15/26UGR1
.Umwandlung von Sprache in Text (G10L 15/08 hat Vorrang) [7, 2006.01]
G10L 15/28UGR1
.bauliche Einzelheiten von Spracherkennungssystemen [7, 2006.01, 2013.01]
G10L 15/30UGR2
. .Verteilte Spracherkennung, z.B. in Client-Server-Systemen für Mobiltelefone oder Mobilfunknetze [2013.01]
G10L 15/32UGR2
. .Mehrere Spracherkennungssysteme, die nacheinander oder parallel verwendet werdendafür vorgesehene Bewertungssysteme, z.B. Wahlsysteme [2013.01]
G10L 15/34UGR2
. .Anpassung eines einzelnen Spracherkennungssystems an die parallele Bearbeitung, z.B. durch mehrere Prozessoren oder Cloudcomputing [2013.01]
G10L 17/00HGRTechniken zur Sprechererkennung oder Sprecherverifikation [7, 2006.01, 2013.01]
G10L 17/02UGR1
.Vorverarbeitungsschritte, z.B. SegmentauswahlMusterdarstellung oder Mustermodellierung, z.B. basierend auf linearer Diskriminanzanalyse [linear discriminant analysis, LDA] oder anhand der HauptkomponentenMerkmalsauswahl oder Merkmalsextraktion [2013.01]
G10L 17/04UGR1
.Training, Registrierung (Enrolment) oder Modellbildung [2013.01]
G10L 17/06UGR1
.EntscheidungstechnikenStrategien zum Musterabgleich [2013.01]
G10L 17/08UGR2
. .Verwendung eines Abweichungsmaßes oder eines bestimmten Abstands zwischen Testmuster und Referenzmuster [2013.01]
G10L 17/10UGR2
. .Multimodale Systeme, d.h. basierend auf mehreren Erkennungssystemen oder Expertensystemen [2013.01]
G10L 17/12UGR2
. .Wertenormalisierung ["score normalisation"] [2013.01]
G10L 17/14UGR2
. .Vorausgehende Verwendung von phonemischer Klassifizierung oder Spracherkennung vor der Sprechererkennung oder Sprecherverifizierung [2013.01]
G10L 17/16UGR1
.Hidden Markov Modelle [HMM] [2013.01]
G10L 17/18UGR1
.Künstliche neuronale Netzekonnektionistische Ansätze [2013.01]
G10L 17/20UGR1
.Mustertransformationen oder Maßnahmen, die auf die Erhöhung der Robustheit des Systems abzielen, z.B. gegen Kanalrauschen oder in unterschiedlichen Einsatzbereichen [2013.01]
G10L 17/22UGR1
.Interaktive VerfahrenMensch-Maschine-Schnittstellen [2013.01]
G10L 17/24UGR2
. .mit Aufforderung für den Nutzer zur Eingabe eines Passworts oder einer vordefinierten Phrase [2013.01]
G10L 17/26UGR1
.Erkennung besonderer stimmlicher Merkmale, z.B. zur Nutzung in LügendetektorenErkennung von Tierstimmen [2013.01]
G10L 19/00HGRSprach- oder Audioanalyse/-syntheseverfahren zur Redundanzverminderung, z.B. in VocodernCodieren oder Decodieren von Sprache oder Audiosignalen, unter Verwendung von Quelle-Filter-Modellen oder psychoakustischer Analyse (bei Musikinstrumenten G10H) [7, 2006.01, 2013.01]
G10L 19/002UGR1
.Dynamische Bitzuteilung (für perzeptive Audiocodierer G10L 19/032) [2013.01]
G10L 19/005UGR1
.Korrektur von Fehlern, die vom Transmissionskanal induziert werden, soweit sie auf den Codieralgorithmus bezogen sind [2013.01]
G10L 19/008UGR1
.Codieren oder Decodieren von Multikanal-Audiosignalen unter Verwendung von Zwischenkanal ("Interchannel")-Korrelation zum Verringern von Redundanz, z.B. Joint Stereo, Intensity Coding oder Matrixing [2013.01]
G10L 19/012UGR1
.Komfortrauschen oder Kodierung von Stille [2013.01]
G10L 19/018UGR1
.Einbringen von Audio-Wasserzeichen, d.h. Einbetten von unhörbaren Daten in das Audio-Signal [2013.01]
G10L 19/02UGR1
.unter der Verwendung von spektralen Analysemethoden, z.B. Umwandlungsvocoder oder Teilbandvocoder [7, 2006.01, 2013.01]
G10L 19/022UGR2
. .Blockbildung, d.h. zeitliches Gruppieren von ProbenWahl des AnalysefenstersÜberlappungsfaktorisierung [2013.01]
G10L 19/025UGR3
. . .Feststellen von Transienten oder Attacken zur Umschaltung der Zeit / Frequenz-Auflösung [2013.01]
G10L 19/028UGR2
. .Noise Substitution, z.B. Ersatz nicht-tonaler spektraler Komponenten durch eine verrauschte Quelle (Komfortrauschen für diskontinuierliche Sprachübertragung G10L 19/012) [2013.01]
G10L 19/03UGR2
. .Spektrale Voraussagetechniken zur Vermeidung von (Pre-Echo)Temporal Noise Shaping [TNS], z.B. in MPEG2 oder MPEG4 [2013.01]
G10L 19/032UGR2
. .Quantisierung oder Dequantisierung spektraler Komponenten [2013.01]
G10L 19/035UGR3
. . .Skalare Quantisierung [2013.01]
G10L 19/038UGR3
. . .Vektorquantisierung, z.B. TwinVQ Audio [2013.01]
G10L 19/04UGR1
.unter der Verwendung von Voraussagetechniken [7, 2006.01, 2013.01]
G10L 19/06UGR2
. .Ermittlung oder Codierung charakteristischer spektraler Merkmale, z.B. Kurzzeit-Voraussagekoeffizienten [7, 2006.01, 2013.01]
G10L 19/07UGR3
. . .Line spectrum pair [LSP]-Vocoder [2013.01]
G10L 19/08UGR2
. .Ermittlung oder Codierung der AnregungsfunktionErmittlung oder Codierung von Langzeit-Voraussageparametern [7, 2006.01, 2013.01]
G10L 19/083UGR3
. . .wobei die Anregungsfunktion eine Anregungsverstärkung ist (G10L 25/90 hat Vorrang) [2013.01]
G10L 19/087UGR3
. . .unter Verwendung gemischter Anregungsmodelle, z.B. MELP, MBE, Split Band LPC oder HVXC [2013.01]
G10L 19/09UGR3
. . .Langzeitvoraussagetechniken, d.h. Entfernen periodischer Redundanzen, z.B.mittels adaptivem Codebuch oder Pitch-Voraussagetechniken [2013.01]
G10L 19/093UGR3
. . .unter Verwendung sinusförmiger Anregungsmodelle [2013.01]
G10L 19/097UGR3
. . .unter Verwendung einer Spektralzerlegung in Wellenform-Prototypen oder interpolativen Sprach-Codec-Systemen [PWI] [2013.01]
G10L 19/10UGR3
. . .wobei die Anregungsfunktion eine Mehrfachpuls-Anregung ist [7, 2006.01, 2013.01]
G10L 19/107UGR4
. . . .Sparse Pulse Excitation, z.B. unter Verwendung eines algebraischen Codebuchs [2013.01]
G10L 19/113UGR4
. . . .Regular Pulse Excitation [2013.01]
G10L 19/12UGR3
. . .wobei die Anregungsfunktion eine Code-Anregung ist, z.B. in einem codeangeregten Vocoder zur linearen Vorhersage [Code Excited Linear Prediction = CELP] [7, 2006.01, 2013.01]
G10L 19/125UGR4
. . . .Pitch-Anregung, z.B. Pitch Synchronous Innovation CELP [PSI-CELP] [2013.01]
G10L 19/13UGR4
. . . .Residual Excited Linear Prediction [RELP] [2013.01]
G10L 19/135UGR4
. . . .Vector Sum Excited Linear Prediction [VSELP] [2013.01]
G10L 19/16UGR2
. .Vocoder-Architektur [2013.01]
G10L 19/18UGR3
. . .Multi-Mode-Vocoder [2013.01]
G10L 19/20UGR4
. . . .unter Verwendung von klangklassenspezifischem Codieren, Hybrid-Encodern oder objektbasiertem Codieren [2013.01]
G10L 19/22UGR4
. . . .Modenauswahl, basierend auf dem Audiosignal-Inhalt gegenüber äußereren Parametern [2013.01]
G10L 19/24UGR4
. . . .Variable Rate Codecs, z.B. zur Erzeugung unterschiedlicher Qualitäten/Eigenschaften unter Verwendung einer skalierbaren Darstellung wie hierarchische Kodierung oder Schicht-Kodierung [2013.01]
G10L 19/26UGR2
. .Vorfilterung oder Nachfilterung [2013.01]
G10L 21/00HGRTechniken zur Sprachverarbeitung oder Stimmsignalverarbeitung zur Erzeugung eines anderen hörbaren oder nicht hörbaren Signals, z.B. sichtbar oder fühlbar, um dessen Qualität oder Verständlichkeit zu ändern (G10L 19/00 hat Vorrang) [7, 2006.01, 2013.01]
G10L 21/003UGR1
.Verändern der Stimmqualität, z.B. Tonhöhe oder Formant [2013.01]
G10L 21/007UGR2
. .charakterisiert durch das verwendete Verfahren [2013.01]
G10L 21/01UGR3
. . .Korrektur der Zeitachse [2013.01]
G10L 21/013UGR3
. . .Anpassung an gezielte Tonhöhe [2013.01]
G10L 21/02UGR1
.Sprachverbesserung, z.B. Rauschverminderung oder Echounterdrückung (Vermindern von Echoeffekten in Leitungsübertragungssystemen H04B 3/20; Echounterdrückung in Freisprechtelefonen H04M 9/08) [7, 2006.01, 2013.01]
G10L 21/0208UGR2
. .Rauschfilterung [2013.01]
G10L 21/0216UGR3
. . .charakterisiert durch die Methode zur Rauschabschätzung [2013.01]
G10L 21/0224UGR4
. . . .Verarbeitung im Zeitbereich [2013.01]
G10L 21/0232UGR4
. . . .Verarbeitung im Frequenzbereich [2013.01]
G10L 21/0264UGR3
. . .charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01]
G10L 21/0272UGR2
. .Separieren des Stimmsignals [2013.01]
G10L 21/028UGR3
. . .unter Verwendung von Eigenschaften der Klangquellen [2013.01]
G10L 21/0308UGR3
. . .charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01]
G10L 21/0316UGR2
. .durch Änderung der Amplitude [2013.01]
G10L 21/0324UGR3
. . .Einzelheiten der Verarbeitung [2013.01]
G10L 21/0332UGR4
. . . .verbunden mit der Modifikation von Wellenformen [2013.01]
G10L 21/034UGR4
. . . .Automatische Anpassung [2013.01]
G10L 21/0356UGR3
. . .zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01]
G10L 21/0364UGR3
. . .zur Verbesserung der Verständlichkeit [2013.01]
G10L 21/038UGR2
. .unter Verwendung von Bandspreiztechniken [2013.01]
G10L 21/0388UGR3
. . .Einzelheiten der Verarbeitung [2013.01]
G10L 21/04UGR1
.Zeitkomprimierung oder Zeitdekomprimierung [7, 2006.01, 2013.01]
G10L 21/043UGR2
. .durch Änderung der Geschwindigkeit [2013.01]
G10L 21/045UGR3
. . .mittels Ausdünnen oder Einschieben einer Wellenform [2013.01]
G10L 21/047UGR4
. . . .charakterisiert durch dei Art der auszudünnenden oder einzuschiebenden Wellenform [2013.01]
G10L 21/049UGR4
. . . .charakterisiert durch die Kopplung/Verbindung von Wellenformen [2013.01]
G10L 21/055UGR2
. .zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01]
G10L 21/057UGR2
. .zur Verbesserung der Verständlichkeit [2013.01]
G10L 21/06UGR1
.Umwandlung von Sprache in eine nicht hörbare Darstellung, z.B. Sichtbarmachung von Sprache oder Sprachverarbeitung für Tasthilfen (G10L 15/26 hat Vorrang) [7, 2006.01, 2013.01]
G10L 21/10UGR2
. .Umwandlung in sichtbare Information [2013.01]
G10L 21/12UGR3
. . .durch Anzeigen von Information zum Zeitbereich [2013.01]
G10L 21/14UGR3
. . .durch Anzeigen von Information zum Frequenzbereich [2013.01]
G10L 21/16UGR2
. .Umwandeln in eine nicht-sichtbare Darstellung (Vorrichtungen oder Verfahren, um Ohrenkranken das direkte Hören durch andere Wahrnehmungsarten zu ersetzen A61F 11/04) [2013.01]
G10L 21/18UGR2
. .Einzelheiten des Umwandlungsprozesses [2013.01]
G10L 25/00HGRTechniken zur Sprachanalyse oder Stimmanalyse, die nicht auf eine der Gruppen G10L 15/00-G10L 21/00 beschränkt sind (Stummschaltung von Verstärkern auf Halbleiterbasis, wenn einige Besonderheiten eines Signals von einem Sprachdetektor erfasst werden, z.B. Erfassen des Ausbleibens eines Signals H03G 3/34) [2013.01]
G10L 25/03UGR1
.charakterisiert durch die Art der extrahierten Parameter [2013.01]
G10L 25/06UGR2
. .wobei es sich bei den extrahierten Parametern um Korrelationskoeffizienten handelt [2013.01]
G10L 25/09UGR2
. .wobei es sich bei den extrahierten Parametern um Nulldurchgangsraten handelt [2013.01]
G10L 25/12UGR2
. .wobei es sich bei den extrahierten Parametern um Voraussagekoeffizienten handelt [2013.01]
G10L 25/15UGR2
. .wobei es sich bei den extrahierten Parametern um Formanteninformation handelt [2013.01]
G10L 25/18UGR2
. .wobei es sich bei den extrahierten Parametern um spektrale Information der jeweiligen Teilbänder handelt [2013.01]
G10L 25/21UGR2
. .wobei es sich bei den extrahierten Parametern um Leistungsinformation handelt [2013.01]
G10L 25/24UGR2
. .wobei es sich bei den extrahierten Parametern um das Cepstrum handelt [2013.01]
G10L 25/27UGR1
.charakterisiert durch die Analysetechnik [2013.01]
G10L 25/30UGR2
. .unter Verwendung neuronaler Netze [2013.01]
G10L 25/33UGR2
. .unter Verwendung von Fuzzy Logik [2013.01]
G10L 25/36UGR2
. .unter Verwendung von Chaostheorie [2013.01]
G10L 25/39UGR2
. .unter Verwendung von genetischen Algorithmen [2013.01]
G10L 25/45UGR1
.charakterisiert durch die Art des Analysefensters [2013.01]
G10L 25/48UGR1
.besonders angepasst für eine bestimmte Verwendung [2013.01]
G10L 25/51UGR2
. .zum Vergleich oder zur Differenzierung [2013.01]
G10L 25/54UGR3
. . .zur Abfrage [2013.01]
G10L 25/57UGR3
. . .zur Bearbeitung von Videosignalen [2013.01]
G10L 25/60UGR3
. . .zur Messung der Qualität von Stimmsignalen [2013.01]
G10L 25/63UGR3
. . .zum Abschätzen eines emotionalen Zustands [2013.01]
G10L 25/66UGR3
. . .zum Extrahieren von Parametern in Verbindung mit einem Gesundheitszustand (Messen zu diagnostischen Zwecken A61B 5/00) [2013.01]
G10L 25/69UGR2
. .zur Bewertung synthetischer oder decodierter Stimmsignale [2013.01]
G10L 25/72UGR2
. .zum Übertragen der Analysergebnisse [2013.01]
G10L 25/75UGR1
.zum Modellieren von Vokaltrakt-Parametern [2013.01]
G10L 25/78UGR1
.Feststellen der Anwesenheit oder Abwesenheit von Stimmsignalen (sprachgesteuertes Umschalten der Übertragungsrichtung in Gegensprechanlagen mit Lautsprechern H04M 9/10) [2013.01]
G10L 25/81UGR2
. .zur Differenzierung von Stimme gegenüber Musik [2013.01]
G10L 25/84UGR2
. .zur Differenzierung von Stimme gegenüber Rauschen [2013.01]
G10L 25/87UGR2
. .Feststellen diskreter Punkte innerhalb eines Stimmsignals [2013.01]
G10L 25/90UGR1
.Bestimmung der Tonhöhe von Sprachsignalen [2013.01]
G10L 25/93UGR1
.Differenzierung zwischen stimmhaften und stimmlosen Anteilen von Sprachsignalen (G10L 25/90 hat Vorrang) [2013.01]
G10L 99/00HGRSachverhalte, soweit nicht in anderen Gruppen dieser Unterklasse vorgesehen [2013.01]