Verarbeitung von Sprach- oder Stimmsignalen allgemein.
Erzeugung künstlicher Sprachsignale; Umwandlung von Text in Sprache.
Spracherkennung.
Liedtexterkennung aus einer gesungenen Stimme (d.h. Spracherkennung aus einer gesungenen Stimme).
Sprechererkennung, Sprecherauthentifikation oder Sprecherbestätigung.
Sängererkennung bei/aus Gesang (d.h. Sprechererkennung bei/aus einer gesungenen Stimme).
Analyse von Sprache oder Tonsignalen zur Bandbreitenkompression oder -erweiterung, Bitraten- oder Redundanzverminderung.
Codieren/Decodieren von Tonsignalen zur Kompression oder Erweiterung mittels Analyse/Synthese, Quelle-Filter-Modellen oder psychoakustischer Analyse.
Veränderung von Sprachsignalen, Sprachverbesserung, Quellentrennung.
Verarbeitung des Sprach- oder Stimmsignals zur Erzeugung eines anderen hörbaren oder nicht hörbaren Signals, z.B. sichtbar oder fühlbar, um dessen Qualität oder Verständlichkeit zu ändern.
Rauschverminderung oder Echounterdrückung bei einem Tonsignal.
Techniken zur Sprach- oder Stimmanalyse, besonders ausgebildet für die Analyse oder Veränderung von Tonsignalen, die nicht notwendigerweise Sprache oder Stimme enthalten.
Die Klassifizierung sollte sich im Allgemeinen auf passende Gruppen beziehen, z.B. G06F, H03M für mathematische Modelle zur Tonanalyse allgemein.
Die Klassifizierung sollte sich im Allgemeinen auf passende Gruppen beziehen, z.B. G10K, G10H, H04R, H04S, wenn Tonproduktionen oder allgemein die Tonanalyse oder -verarbeitung von Interesse sind.
Telegrafieverkehr wird von H04L umfasst.
Fernsprechverkehr wird von H04M umfasst.
Vorrichtungen für die Speicherung von Sprachsignalen | G11B |
Statische Speicher | G11C |
Codierung von komprimierten Sprachsignalen für die Übertragung oder Speicherung | H03M 7/30 |
Kehlkopf- oder Luftröhrenprothesen in den Körper implantierbar | A61F 2/20 |
Eingabe-/Ausgabevorrichtungen für Bordrechner | G01C 21/36 |
Messen von Schallwellen allgemein | G01H |
Peilgeräte zum Bestimmen der Richtung, aus der Infraschall-, Schall- oder Ultraschallwellen ohne eine Richtungskennung empfangen werden | G01S 3/80 |
Systeme, die die Reflexion oder Wiederausstrahlung von akustischen Wellen verwenden | G01S 15/00 |
Eingabe mittels akustischer Signale / Ausgabe mittels akustischer Signale für Computer | G06F 3/16 |
Kompilierung oder Interpretation von höheren Programmiersprachen | G06F 8/41, G06F 9/455 |
Wiederauffinden von Informationen; Struktur der Datenbasis dafür | G06F 16/00 |
Komplexe mathematische Funktionen | G06F 17/10 |
Digitale Datenverarbeitungsverfahren oder -anlagen, besonders angepasst für die Verarbeitung von natürlichen Sprachdaten | G06F 40/00 |
Allgemeine Mustererkennung | G06F 18/00 |
Bilddatenverarbeitung | G06T |
Anordnungen zum Erkennen oder Verstehen von Bildern [Image Recognition, Image Understanding] oder Videos [Video Recognition, Video Understanding] | G06V 10/00 |
Zeichenerkennung; Erkennung digitaler Tinte; dokumentenorientierte bildbasierte Mustererkennung | G06V 30/00 |
Erkennung von biometrischen Mustern, sowie Mustern mit Bezug zu Menschen oder Tieren in Bild- oder Videodaten | G06V 40/00 |
Individuelle Registriervorrichtungen an Ein- und Ausgängen | G07C 9/00 |
Anordnungen zum Herstellen einer Beziehung zwischen den Signalen an ihrem Eingang und Ausgang, z.B. Differenzieren, Verzögern | G08C 13/00 |
Unterrichten im Sprechen | G09B 19/04 |
Unterrichten oder Verständigen mit Blinden, Tauben oder [Taub-]Stummen | G09B 21/00 |
Tonerzeugungsvorrichtungen, außer Musikinstrumente oder Lautsprecher | G10K |
Verfahren oder Einrichtungen zum Schutz gegen oder zum Dämpfen von Lärm oder Geräusch oder sonstigen akustischen Wellen | G10K 11/16 |
Signalverarbeitung für die Aufzeichnung | G11B 20/00 |
Fehlererkennung oder -korrektur in der digitalen Aufzeichnung oder Wiedergabe; Prüfen im Zusammenhang mit digitaler Aufzeichnung oder Wiedergabe | G11B 20/18 |
Änderung von Aufzeichnungen; Markieren; Adressieren; zeitliche Steuerung [z.B. Zeitdehnung, Zeitraffung] oder Synchronisierung; Überwachen | G11B 27/00 |
Elektronische Schaltungen zur Tonerzeugung | H03B |
Verstärker | H03F |
Verstärker, die ein Verstärkerelement verwenden, das aus zwei mechanisch oder akustisch gekoppelten Wandlern besteht, z.B. Telefon-Mikrofonverstärker | H03F 13/00 |
Verstärkungsregelung in Verstärkern oder Frequenzwandlern | H03G 3/00 |
Übertragung | H04B |
Mit dem Empfänger vereinigte Einrichtungen zum Begrenzen oder Unterdrücken von Störungen oder von Rauschen | H04B 1/10 |
Einzelheiten von Übertragungssystemen, die nicht durch das zur Übertragung verwendete Medium gekennzeichnet sind, zur Bandbreitenverringerung von Signalen | H04B 1/66 |
Übertragungssysteme, die Ultraschall-, Schall- oder Infraschallwellen verwenden | H04B 11/00 |
Übertragungssysteme, die nicht durch das zur Übertragung verwendete Medium gekennzeichnet sind, gekennzeichnet durch die Verwendung von Pulsmodulation | H04B 14/02 |
Rundfunk-Verbreitungssysteme | H04H |
Zeitmultiplexsysteme, bei denen ein Übertragungskanal, der einem ersten Benutzer zugeteilt ist, diesem weggenommen und einem zweiten Benutzer zugeteilt werden kann, wenn der erste Benutzer den Kanal nicht verwendet | H04J 3/17 |
Geheimer Nachrichtenverkehr | H04K 1/00 |
Übertragung digitaler Information, z.B. Telegrafieverkehr | H04L |
Fernsprechverkehr | H04M |
Anordnungen bei Mikrofonen, Hörern oder vollständigen Fernsprechapparaten zum Verhindern des Mithörens, zum Dämpfen örtlicher Geräusche oder zum Verhindern einer unerwünschten Übertragung; spezielle Mundstücke oder Hörer dafür | H04M 1/19 |
Anordnungen zum Verhindern akustischer Rückkopplung beim Fernsprechverkehr | H04M 1/20 |
Vorrichtungen, um einen Teilnehmer anzurufen, wobei gleichzeitig mehrere Signale gespeichert werden können | H04M 1/27 |
Einrichtungen von Teilnehmerstationen oder Nebensprechanlagen, z.B. zur Benutzung durch den Teilnehmer, mit Sprech- oder Hörverstärkern | H04M 1/60 |
Anordnungen zur selbsttätigen Entgegennahme von Anrufen | H04M 1/64 |
Interaktive Informationsdienste, z.B. Fernsprechauskunftsdienste | H04M 3/493 |
Gleichzeitige Sprech- und Telegrafie- oder andere Datenübertragung über die gleichen Leitungen | H04M 11/06 |
Systeme zur Übertragung eines Pulscodes modulierten Videosignals mit einem oder mehreren anderen PCM-Signalen, z.B. einem Audiosignal, einem Sync-Signal | H04N 7/52 |
Schaltsysteme | H04Q |
Lautsprecher, Mikrofone, Schallplatten-Tonabnehmer oder ähnliche akustische, elektromechanische Wandler; Hörhilfen für Schwerhörige; Großlautsprecheranlagen | H04R |
Stereophonische Anordnungen | H04R 5/00 |
Großlautsprecheranlagen | H04R 27/00 |
Stereophone Systeme, z.B. Raumklang-Erfassung, Matrizierung von Audiosignalen im dekodierten Zustand | H04S |
AAC | Advanced Audio Coding |
ACELP | Algebraic Code Excited Linear Prediction |
ADPCM | Adaptive Differential Pulse Code Modulation |
AMR AMR-NB | Adaptive Multi-Rate |
AMR-WB | Adaptive Multi-Rate Wideband |
ANN | künstliches neuronales Netz |
AR | Autoregressiv |
ASR | automatische Spracherkennung |
BLP | Lineare Rückwärts-Prädiktion [Backward Linear Prediction] |
BP | Rückpropagierung |
BSAC | Bit Sliced Arithmetic Coding (Audiokodierung von MPEG-4 Teil 3) |
CELP | Code-Excited Linear Prediction |
DCT | Diskrete Kosinustransformation |
DFT | Diskrete Fourier-Transformation |
DPCM | Differentielle Puls-Code-Modulation |
DRM | Digitale Rechteverwaltung |
DTX | Diskontinuierliches Senden |
EVRC EVRC-B | Enhanced Variable Rate CODEC |
FFT | schnelle Fourier-Transformation |
FIR | Impulsantwort mit endlicher Dauer |
FLP | Lineare Vorwärts-Prädiktion |
GMM | Gaußsches Mischverteilungsmodell |
HMM | Verstecktes Markov-Modell [Hidden Markov Model] |
HVXC | Harmonic Vector Excitation Coding |
IDCT | Inverse diskrete Kosinustransformation |
IVR | Interactive Voice Response |
LMS | Least Mean Square |
LPC | Linear Predictive Coding |
LSF | Line Spectral Frequencies |
LSP | Line Spectral Pairs |
LTP | Long Term Prediction |
MBE | Multi-Band Excitation |
MDCT | Modifizierte diskrete Kosinustransformation |
MELP | Mixed-Excitation Linear Prediction |
MLP | Mehrlagiges Perzeptron |
MP3 | MPEG-1 Audio Layer III oder MPEG-2 Audio Layer III |
MPEG | Motion Picture Experts Group |
MPEG 1 Audio | Standard ISO/IEC 11172-3 |
MPEG 2 Audio | Standard ISO/IEC 13818-3 |
MPEG 4 Audio | Standard ISO/IEC 14496-3 |
MPEG 21 | Standard ISO/IEC 21000 |
MSE | Mittlerer quadratischer Fehler |
NB – WB | Schmalband – Breitband |
PARCOR | Partielle Korrelation |
PWI | Prototyp-Wellenform-Interpolation |
RELP | Residual Excited Linear Prediction |
SBR | Spektralbandreplikation |
TDNN | Neuronales Netz mit Zeitverzögerung |
TTS | Wandlung von Text in Sprache |
USAC | Unified Speech and Audio Coding |
VoIP | Internet-Protokoll-Telefonie [Voice over IP] |
VLSR | Very large speech recognition |
VQ | Vektorquantisierung |
VSELP | Vector Sum Excited Linear Prediction |
V/UV | stimmhaft/stimmlos |
VXML oder VoiceXML | Voice Extensible Markup Language (ein XML-Standardformat des W3C) |