| G | Sektion G — Physik |
| G10 | Musikinstrumente; Akustik |
| G10L | Techniken zur Sprachanalyse oder Sprachsynthese; Spracherkennung; Techniken zur Sprachbearbeitung oder Stimmenbearbeitung; Codieren oder Decodieren von Sprache oder Audiosignalen [4] |
| G10L 13/00 | Sprachsynthese; Umwandlung von Text in Sprache [7, 2006.01] |
| G10L 13/02 | . | Verfahren zur Erzeugung synthetischer Sprache; Sprachsynthesiser [7, 2006.01, 2013.01] |
|
| G10L 13/027 | . . | Synthesizer für die inhaltsgesteuerte Sprachsynthese ["concept-to-speech"]; Erzeugung natürlicher Redewendungen aus maschinenbasierten Inhalten (Erzeugen von Parametern zur Sprachsynthese aus einem Text G10L 13/08) [2013.01] |
|
| G10L 13/033 | . . | Stimmenbearbeitung, z.B. Manipulieren der Stimme des Sprachgenerators (Sprachsynthesizers) [2013.01] |
|
| G10L 13/04 | . . | Einzelheiten von Sprachsyntheseeinrichtungen, z.B. Sprachgeneratoraufbau oder Speicherverwaltung [7, 2006.01, 2013.01] |
|
| G10L 13/047 | . . . | Sprachgeneratoraufbau (Architektur von Sprachsynthesizern) [2013.01] |
|
| G10L 13/06 | . | In Sprachsynthesisern verwendete elementare Spracheinheiten; Verkettungsregeln [7, 2006.01, 2013.01] |
|
| G10L 13/07 | . . | Verkettungsregeln [2013.01] |
|
| G10L 13/08 | . | Textanalyse oder Erzeugen von Parametern zur Sprachsynthese aus einem Text, z.B. Graphem/Phonem-Umwandlung, Prosodieerzeugung oder Erkennen der Betonung oder Intonation [7, 2006.01, 2013.01] |
|
| G10L 13/10 | . . | aus Text abgeleitete prosodische Regeln, Akzentuierung und Sprachmelodie [2013.01] |
|
| G10L 15/00 | Spracherkennung (G10L 17/00 hat Vorrang) [7, 2006.01, 2013.01] |
| G10L 15/01 | . | Bewertung oder Evaluierung von Spracherkennungssystemen [2013.01] |
|
| G10L 15/02 | . | Merkmalsextraktion zur Spracherkennung; Auswahl der Erkennungselemente [7, 2006.01] |
|
| G10L 15/04 | . | Segmentierung; Wortgrenzenerkennung [7, 2006.01, 2013.01] |
|
| G10L 15/05 | . . | Wortgrenzenerkennung [2013.01] |
|
| G10L 15/06 | . | Erzeugen von Bezugsschablonen; Trainieren von Spracherkennungseinrichtungen, z.B. Anpassung an charakteristische Merkmale der Stimme eines Sprechers (G10L 15/14 hat Vorrang) [7, 2006.01, 2013.01] |
|
| G10L 15/065 | |
| G10L 15/07 | . . . | an den Sprecher [2013.01] |
|
| G10L 15/08 | . | Klassifizieren von oder Suchen nach Sprache [7, 2006.01] |
|
| G10L 15/10 | . . | unter Verwendung von Abstandsmessungen oder Verzerrungsmessungen zwischen unbekannter Sprache und Bezugsschablonen [7, 2006.01] |
|
| G10L 15/12 | . . | unter Verwendung dynamischer Programmiertechniken, z.B. Dynamic Time Warping [DTW] [7, 2006.01] |
|
| G10L 15/14 | . . | unter Verwendung statistischer Modelle, z.B. Hidden Markov Models [HMM] (G10L 15/18 hat Vorrang) [7, 2006.01] |
|
| G10L 15/16 | . . | unter Verwendung künstlicher neuronaler Netzwerke [7, 2006.01] |
|
| G10L 15/18 | . . | unter Verwendung der natürlichen Sprache als Vorbild [7, 2006.01, 2013.01] |
|
| G10L 15/183 | . . . | kontextabhängig, z.B. Sprachmodelle [2013.01] |
|
| G10L 15/187 | . . . . | phonemischer Kontext, z.B. Betonungsregeln, phonotaktische Beschränkungen oder phonemische N-Gramme [2013.01] |
|
| G10L 15/19 | . . . . | grammatikalischer Kontext, z.B. Disambiguierung von Erkennungshypothesen auf der Basis von Wortsequenzregeln [2013.01] |
|
| G10L 15/193 | . . . . . | Formale Grammatik, z.B. endliche Automaten, kontextfreie Grammatik oder Wortnetze [2013.01] |
|
| G10L 15/197 | . . . . . | Probabilistische Grammatik, z.B. Wort-n-Gramme [2013.01] |
|
| G10L 15/20 | . | Spracherkennungsverfahren, besonders angepasst an die Belastung in widrigen Umgebungen, z.B. bei Lärm, unter Stress entstandene Sprache (G10L 21/02 hat Vorrang) [7, 2006.01] |
|
| G10L 15/22 | . | während eines Spracherkennungsvorgangs angewendete Prozedur, z.B. Dialog zwischen Mensch und Maschine [7, 2006.01] |
|
| G10L 15/24 | . | Spracherkennung unter Verwendung nichtakustischer Eigenschaften [7, 2006.01, 2013.01] |
|
| G10L 15/25 | . . | unter Verwendung der Stellung der Lippen, der Lippenbewegung oder Gesichtsanalyse [2013.01] |
|
| G10L 15/26 | . | Umwandlung von Sprache in Text (G10L 15/08 hat Vorrang) [7, 2006.01] |
|
| G10L 15/28 | . | bauliche Einzelheiten von Spracherkennungssystemen [7, 2006.01, 2013.01] |
|
| G10L 15/30 | . . | Verteilte Spracherkennung, z.B. in Client-Server-Systemen für Mobiltelefone oder Mobilfunknetze [2013.01] |
|
| G10L 15/32 | . . | Mehrere Spracherkennungssysteme, die nacheinander oder parallel verwendet werden; dafür vorgesehene Bewertungssysteme, z.B. Wahlsysteme [2013.01] |
|
| G10L 15/34 | . . | Anpassung eines einzelnen Spracherkennungssystems an die parallele Bearbeitung, z.B. durch mehrere Prozessoren oder Cloudcomputing [2013.01] |
|
| G10L 17/00 | Techniken zur Sprechererkennung oder Sprecherverifikation [7, 2006.01, 2013.01] |
| G10L 17/02 | . | Vorverarbeitungsschritte, z.B. Segmentauswahl; Musterdarstellung oder Mustermodellierung, z.B. basierend auf linearer Diskriminanzanalyse [linear discriminant analysis, LDA] oder anhand der Hauptkomponenten; Merkmalsauswahl oder Merkmalsextraktion [2013.01] |
|
| G10L 17/04 | . | Training, Registrierung (Enrolment) oder Modellbildung [2013.01] |
|
| G10L 17/06 | . | Entscheidungstechniken; Strategien zum Musterabgleich [2013.01] |
|
| G10L 17/08 | . . | Verwendung eines Abweichungsmaßes oder eines bestimmten Abstands zwischen Testmuster und Referenzmuster [2013.01] |
|
| G10L 17/10 | . . | Multimodale Systeme, d.h. basierend auf mehreren Erkennungssystemen oder Expertensystemen [2013.01] |
|
| G10L 17/12 | . . | Wertenormalisierung ["score normalisation"] [2013.01] |
|
| G10L 17/14 | . . | Vorausgehende Verwendung von phonemischer Klassifizierung oder Spracherkennung vor der Sprechererkennung oder Sprecherverifizierung [2013.01] |
|
| G10L 17/16 | . | Hidden Markov Modelle [HMM] [2013.01] |
|
| G10L 17/18 | . | Künstliche neuronale Netze; konnektionistische Ansätze [2013.01] |
|
| G10L 17/20 | . | Mustertransformationen oder Maßnahmen, die auf die Erhöhung der Robustheit des Systems abzielen, z.B. gegen Kanalrauschen oder in unterschiedlichen Einsatzbereichen [2013.01] |
|
| G10L 17/22 | . | Interaktive Verfahren; Mensch-Maschine-Schnittstellen [2013.01] |
|
| G10L 17/24 | . . | mit Aufforderung für den Nutzer zur Eingabe eines Passworts oder einer vordefinierten Phrase [2013.01] |
|
| G10L 17/26 | . | Erkennung besonderer stimmlicher Merkmale, z.B. zur Nutzung in Lügendetektoren; Erkennung von Tierstimmen [2013.01] |
|
| G10L 19/00 | Sprach- oder Audioanalyse/-syntheseverfahren zur Redundanzverminderung, z.B. in Vocodern; Codieren oder Decodieren von Sprache oder Audiosignalen, unter Verwendung von Quelle-Filter-Modellen oder psychoakustischer Analyse (bei Musikinstrumenten G10H) [7, 2006.01, 2013.01] |
| G10L 19/002 | . | Dynamische Bitzuteilung (für perzeptive Audiocodierer G10L 19/032) [2013.01] |
|
| G10L 19/005 | . | Korrektur von Fehlern, die vom Transmissionskanal induziert werden, soweit sie auf den Codieralgorithmus bezogen sind [2013.01] |
|
| G10L 19/008 | . | Codieren oder Decodieren von Multikanal-Audiosignalen unter Verwendung von Zwischenkanal ("Interchannel")-Korrelation zum Verringern von Redundanz, z.B. Joint Stereo, Intensity Coding oder Matrixing [2013.01] |
|
| G10L 19/012 | . | Komfortrauschen oder Kodierung von Stille [2013.01] |
|
| G10L 19/018 | . | Einbringen von Audio-Wasserzeichen, d.h. Einbetten von unhörbaren Daten in das Audio-Signal [2013.01] |
|
| G10L 19/02 | . | unter der Verwendung von spektralen Analysemethoden, z.B. Umwandlungsvocoder oder Teilbandvocoder [7, 2006.01, 2013.01] |
|
| G10L 19/022 | . . | Blockbildung, d.h. zeitliches Gruppieren von Proben; Wahl des Analysefensters; Überlappungsfaktorisierung [2013.01] |
|
| G10L 19/025 | . . . | Feststellen von Transienten oder Attacken zur Umschaltung der Zeit / Frequenz-Auflösung [2013.01] |
|
| G10L 19/028 | . . | Noise Substitution, z.B. Ersatz nicht-tonaler spektraler Komponenten durch eine verrauschte Quelle (Komfortrauschen für diskontinuierliche Sprachübertragung G10L 19/012) [2013.01] |
|
| G10L 19/03 | . . | Spektrale Voraussagetechniken zur Vermeidung von (Pre-Echo); Temporal Noise Shaping [TNS], z.B. in MPEG2 oder MPEG4 [2013.01] |
|
| G10L 19/032 | . . | Quantisierung oder Dequantisierung spektraler Komponenten [2013.01] |
|
| G10L 19/035 | . . . | Skalare Quantisierung [2013.01] |
|
| G10L 19/038 | . . . | Vektorquantisierung, z.B. TwinVQ Audio [2013.01] |
|
| G10L 19/04 | . | unter der Verwendung von Voraussagetechniken [7, 2006.01, 2013.01] |
|
| G10L 19/06 | . . | Ermittlung oder Codierung charakteristischer spektraler Merkmale, z.B. Kurzzeit-Voraussagekoeffizienten [7, 2006.01, 2013.01] |
|
| G10L 19/07 | . . . | Line spectrum pair [LSP]-Vocoder [2013.01] |
|
| G10L 19/08 | . . | Ermittlung oder Codierung der Anregungsfunktion; Ermittlung oder Codierung von Langzeit-Voraussageparametern [7, 2006.01, 2013.01] |
|
| G10L 19/083 | . . . | wobei die Anregungsfunktion eine Anregungsverstärkung ist (G10L 25/90 hat Vorrang) [2013.01] |
|
| G10L 19/087 | . . . | unter Verwendung gemischter Anregungsmodelle, z.B. MELP, MBE, Split Band LPC oder HVXC [2013.01] |
|
| G10L 19/09 | . . . | Langzeitvoraussagetechniken, d.h. Entfernen periodischer Redundanzen, z.B.mittels adaptivem Codebuch oder Pitch-Voraussagetechniken [2013.01] |
|
| G10L 19/093 | . . . | unter Verwendung sinusförmiger Anregungsmodelle [2013.01] |
|
| G10L 19/097 | . . . | unter Verwendung einer Spektralzerlegung in Wellenform-Prototypen oder interpolativen Sprach-Codec-Systemen [PWI] [2013.01] |
|
| G10L 19/10 | . . . | wobei die Anregungsfunktion eine Mehrfachpuls-Anregung ist [7, 2006.01, 2013.01] |
|
| G10L 19/107 | . . . . | Sparse Pulse Excitation, z.B. unter Verwendung eines algebraischen Codebuchs [2013.01] |
|
| G10L 19/113 | . . . . | Regular Pulse Excitation [2013.01] |
|
| G10L 19/12 | . . . | wobei die Anregungsfunktion eine Code-Anregung ist, z.B. in einem codeangeregten Vocoder zur linearen Vorhersage [Code Excited Linear Prediction = CELP] [7, 2006.01, 2013.01] |
|
| G10L 19/125 | . . . . | Pitch-Anregung, z.B. Pitch Synchronous Innovation CELP [PSI-CELP] [2013.01] |
|
| G10L 19/13 | . . . . | Residual Excited Linear Prediction [RELP] [2013.01] |
|
| G10L 19/135 | . . . . | Vector Sum Excited Linear Prediction [VSELP] [2013.01] |
|
| G10L 19/16 | . . | Vocoder-Architektur [2013.01] |
|
| G10L 19/18 | . . . | Multi-Mode-Vocoder [2013.01] |
|
| G10L 19/20 | . . . . | unter Verwendung von klangklassenspezifischem Codieren, Hybrid-Encodern oder objektbasiertem Codieren [2013.01] |
|
| G10L 19/22 | . . . . | Modenauswahl, basierend auf dem Audiosignal-Inhalt gegenüber äußereren Parametern [2013.01] |
|
| G10L 19/24 | . . . . | Variable Rate Codecs, z.B. zur Erzeugung unterschiedlicher Qualitäten/Eigenschaften unter Verwendung einer skalierbaren Darstellung wie hierarchische Kodierung oder Schicht-Kodierung [2013.01] |
|
| G10L 19/26 | . . | Vorfilterung oder Nachfilterung [2013.01] |
|
| G10L 21/00 | Techniken zur Sprachverarbeitung oder Stimmsignalverarbeitung zur Erzeugung eines anderen hörbaren oder nicht hörbaren Signals, z.B. sichtbar oder fühlbar, um dessen Qualität oder Verständlichkeit zu ändern (G10L 19/00 hat Vorrang) [7, 2006.01, 2013.01] |
| G10L 21/003 | . | Verändern der Stimmqualität, z.B. Tonhöhe oder Formant [2013.01] |
|
| G10L 21/007 | . . | charakterisiert durch das verwendete Verfahren [2013.01] |
|
| G10L 21/01 | . . . | Korrektur der Zeitachse [2013.01] |
|
| G10L 21/013 | . . . | Anpassung an gezielte Tonhöhe [2013.01] |
|
| G10L 21/02 | . | Sprachverbesserung, z.B. Rauschverminderung oder Echounterdrückung (Vermindern von Echoeffekten in Leitungsübertragungssystemen H04B 3/20; Echounterdrückung in Freisprechtelefonen H04M 9/08) [7, 2006.01, 2013.01] |
|
| G10L 21/0208 | . . | Rauschfilterung [2013.01] |
|
| G10L 21/0216 | . . . | charakterisiert durch die Methode zur Rauschabschätzung [2013.01] |
|
| G10L 21/0224 | . . . . | Verarbeitung im Zeitbereich [2013.01] |
|
| G10L 21/0232 | . . . . | Verarbeitung im Frequenzbereich [2013.01] |
|
| G10L 21/0264 | . . . | charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01] |
|
| G10L 21/0272 | . . | Separieren des Stimmsignals [2013.01] |
|
| G10L 21/028 | . . . | unter Verwendung von Eigenschaften der Klangquellen [2013.01] |
|
| G10L 21/0308 | . . . | charakterisiert durch die Art der Parametermessung, z.B. Korrelationstechniken, Nulldurchgangstechniken oder Vorhersagetechniken [2013.01] |
|
| G10L 21/0316 | . . | durch Änderung der Amplitude [2013.01] |
|
| G10L 21/0324 | . . . | Einzelheiten der Verarbeitung [2013.01] |
|
| G10L 21/0332 | . . . . | verbunden mit der Modifikation von Wellenformen [2013.01] |
|
| G10L 21/034 | . . . . | Automatische Anpassung [2013.01] |
|
| G10L 21/0356 | . . . | zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01] |
|
| G10L 21/0364 | . . . | zur Verbesserung der Verständlichkeit [2013.01] |
|
| G10L 21/038 | . . | unter Verwendung von Bandspreiztechniken [2013.01] |
|
| G10L 21/0388 | . . . | Einzelheiten der Verarbeitung [2013.01] |
|
| G10L 21/04 | . | Zeitkomprimierung oder Zeitdekomprimierung [7, 2006.01, 2013.01] |
|
| G10L 21/043 | . . | durch Änderung der Geschwindigkeit [2013.01] |
|
| G10L 21/045 | . . . | mittels Ausdünnen oder Einschieben einer Wellenform [2013.01] |
|
| G10L 21/047 | . . . . | charakterisiert durch dei Art der auszudünnenden oder einzuschiebenden Wellenform [2013.01] |
|
| G10L 21/049 | . . . . | charakterisiert durch die Kopplung/Verbindung von Wellenformen [2013.01] |
|
| G10L 21/055 | . . | zum Synchronisieren mit anderen Signalen, z.B. Videosignalen [2013.01] |
|
| G10L 21/057 | . . | zur Verbesserung der Verständlichkeit [2013.01] |
|
| G10L 21/06 | . | Umwandlung von Sprache in eine nicht hörbare Darstellung, z.B. Sichtbarmachung von Sprache oder Sprachverarbeitung für Tasthilfen (G10L 15/26 hat Vorrang) [7, 2006.01, 2013.01] |
|
| G10L 21/10 | . . | Umwandlung in sichtbare Information [2013.01] |
|
| G10L 21/12 | . . . | durch Anzeigen von Information zum Zeitbereich [2013.01] |
|
| G10L 21/14 | . . . | durch Anzeigen von Information zum Frequenzbereich [2013.01] |
|
| G10L 21/16 | . . | Umwandeln in eine nicht-sichtbare Darstellung (Vorrichtungen oder Verfahren, um Ohrenkranken das direkte Hören durch andere Wahrnehmungsarten zu ersetzen A61F 11/04) [2013.01] |
|
| G10L 21/18 | . . | Einzelheiten des Umwandlungsprozesses [2013.01] |
|
| G10L 25/00 | Techniken zur Sprachanalyse oder Stimmanalyse, die nicht auf eine der Gruppen G10L 15/00-G10L 21/00 beschränkt sind (Stummschaltung von Verstärkern auf Halbleiterbasis, wenn einige Besonderheiten eines Signals von einem Sprachdetektor erfasst werden, z.B. Erfassen des Ausbleibens eines Signals H03G 3/34) [2013.01] |
| G10L 25/03 | . | charakterisiert durch die Art der extrahierten Parameter [2013.01] |
|
| G10L 25/06 | . . | wobei es sich bei den extrahierten Parametern um Korrelationskoeffizienten handelt [2013.01] |
|
| G10L 25/09 | . . | wobei es sich bei den extrahierten Parametern um Nulldurchgangsraten handelt [2013.01] |
|
| G10L 25/12 | . . | wobei es sich bei den extrahierten Parametern um Voraussagekoeffizienten handelt [2013.01] |
|
| G10L 25/15 | . . | wobei es sich bei den extrahierten Parametern um Formanteninformation handelt [2013.01] |
|
| G10L 25/18 | . . | wobei es sich bei den extrahierten Parametern um spektrale Information der jeweiligen Teilbänder handelt [2013.01] |
|
| G10L 25/21 | . . | wobei es sich bei den extrahierten Parametern um Leistungsinformation handelt [2013.01] |
|
| G10L 25/24 | . . | wobei es sich bei den extrahierten Parametern um das Cepstrum handelt [2013.01] |
|
| G10L 25/27 | . | charakterisiert durch die Analysetechnik [2013.01] |
|
| G10L 25/30 | . . | unter Verwendung neuronaler Netze [2013.01] |
|
| G10L 25/33 | . . | unter Verwendung von Fuzzy Logik [2013.01] |
|
| G10L 25/36 | . . | unter Verwendung von Chaostheorie [2013.01] |
|
| G10L 25/39 | . . | unter Verwendung von genetischen Algorithmen [2013.01] |
|
| G10L 25/45 | . | charakterisiert durch die Art des Analysefensters [2013.01] |
|
| G10L 25/48 | . | besonders angepasst für eine bestimmte Verwendung [2013.01] |
|
| G10L 25/51 | . . | zum Vergleich oder zur Differenzierung [2013.01] |
|
| G10L 25/54 | . . . | zur Abfrage [2013.01] |
|
| G10L 25/57 | . . . | zur Bearbeitung von Videosignalen [2013.01] |
|
| G10L 25/60 | . . . | zur Messung der Qualität von Stimmsignalen [2013.01] |
|
| G10L 25/63 | . . . | zum Abschätzen eines emotionalen Zustands [2013.01] |
|
| G10L 25/66 | . . . | zum Extrahieren von Parametern in Verbindung mit einem Gesundheitszustand (Messen zu diagnostischen Zwecken A61B 5/00) [2013.01] |
|
| G10L 25/69 | . . | zur Bewertung synthetischer oder decodierter Stimmsignale [2013.01] |
|
| G10L 25/72 | . . | zum Übertragen der Analysergebnisse [2013.01] |
|
| G10L 25/75 | . | zum Modellieren von Vokaltrakt-Parametern [2013.01] |
|
| G10L 25/78 | . | Feststellen der Anwesenheit oder Abwesenheit von Stimmsignalen (sprachgesteuertes Umschalten der Übertragungsrichtung in Gegensprechanlagen mit Lautsprechern H04M 9/10) [2013.01] |
|
| G10L 25/81 | . . | zur Differenzierung von Stimme gegenüber Musik [2013.01] |
|
| G10L 25/84 | . . | zur Differenzierung von Stimme gegenüber Rauschen [2013.01] |
|
| G10L 25/87 | . . | Feststellen diskreter Punkte innerhalb eines Stimmsignals [2013.01] |
|
| G10L 25/90 | . | Bestimmung der Tonhöhe von Sprachsignalen [2013.01] |
|
| G10L 25/93 | . | Differenzierung zwischen stimmhaften und stimmlosen Anteilen von Sprachsignalen (G10L 25/90 hat Vorrang) [2013.01] |
|
| G10L 99/00 | Sachverhalte, soweit nicht in anderen Gruppen dieser Unterklasse vorgesehen [2013.01] |