G10L

Definition

Diese Klassifikationsstelle umfasst:

Verarbeitung von Sprach- oder Stimmsignalen allgemein.

Erzeugung künstlicher Sprachsignale; Umwandlung von Text in Sprache.

Spracherkennung.

Liedtexterkennung aus einer gesungenen Stimme (d.h. Spracherkennung aus einer gesungenen Stimme).

Sprechererkennung, Sprecherauthentifikation oder Sprecherbestätigung.

Sängererkennung bei/aus Gesang (d.h. Sprechererkennung bei/aus einer gesungenen Stimme).

Analyse von Sprache oder Tonsignalen zur Bandbreitenkompression oder -erweiterung, Bitraten- oder Redundanzverminderung.

Codieren/Decodieren von Tonsignalen zur Kompression oder Erweiterung mittels Analyse/Synthese, Quelle-Filter-Modellen oder psychoakustischer Analyse.

Veränderung von Sprachsignalen, Sprachverbesserung, Quellentrennung.

Verarbeitung des Sprach- oder Stimmsignals zur Erzeugung eines anderen hörbaren oder nicht hörbaren Signals, z.B. sichtbar oder fühlbar, um dessen Qualität oder Verständlichkeit zu ändern.

Rauschverminderung oder Echounterdrückung bei einem Tonsignal.

Techniken zur Sprach- oder Stimmanalyse, besonders ausgebildet für die Analyse oder Veränderung von Tonsignalen, die nicht notwendigerweise Sprache oder Stimme enthalten.

Beziehungen zu anderen Klassifikationsstellen

Die Klassifizierung sollte sich im Allgemeinen auf passende Gruppen beziehen, z.B. G06F, H03M für mathematische Modelle zur Tonanalyse allgemein.

Die Klassifizierung sollte sich im Allgemeinen auf passende Gruppen beziehen, z.B. G10K, G10H, H04R, H04S, wenn Tonproduktionen oder allgemein die Tonanalyse oder -verarbeitung von Interesse sind.

Telegrafieverkehr wird von H04L umfasst.

Fernsprechverkehr wird von H04M umfasst.

Querverweise

Einschränkende Querverweise

Diese Klassifikationsstelle umfasst nicht:
Vorrichtungen für die Speicherung von Sprachsignalen
G11B
Statische Speicher
G11C
Codierung von komprimierten Sprachsignalen für die Übertragung oder Speicherung
H03M 7/30

Informative Querverweise

Kehlkopf- oder Luftröhrenprothesen in den Körper implantierbar
A61F 2/20
Eingabe-/Ausgabevorrichtungen für Bordrechner
G01C 21/36
Messen von Schallwellen allgemein
G01H
Peilgeräte zum Bestimmen der Richtung, aus der Infraschall-, Schall- oder Ultraschallwellen ohne eine Richtungskennung empfangen werden
G01S 3/80
Systeme, die die Reflexion oder Wiederausstrahlung von akustischen Wellen verwenden
G01S 15/00
Eingabe mittels akustischer Signale / Ausgabe mittels akustischer Signale für Computer
G06F 3/16
Kompilierung oder Interpretation von höheren Programmiersprachen
G06F 8/41, G06F 9/455
Wiederauffinden von Informationen; Struktur der Datenbasis dafür
G06F 16/00
Komplexe mathematische Funktionen
G06F 17/10
Digitale Datenverarbeitungsverfahren oder -anlagen, besonders angepasst für die Verarbeitung von natürlichen Sprachdaten
G06F 40/00
Allgemeine Mustererkennung
G06F 18/00
Bilddatenverarbeitung
G06T
Anordnungen zum Erkennen oder Verstehen von Bildern [Image Recognition, Image Understanding] oder Videos [Video Recognition, Video Understanding]
G06V 10/00
Zeichenerkennung; Erkennung digitaler Tinte; dokumentenorientierte bildbasierte Mustererkennung
G06V 30/00
Erkennung von biometrischen Mustern, sowie Mustern mit Bezug zu Menschen oder Tieren in Bild- oder Videodaten
G06V 40/00
Individuelle Registriervorrichtungen an Ein- und Ausgängen
G07C 9/00
Anordnungen zum Herstellen einer Beziehung zwischen den Signalen an ihrem Eingang und Ausgang, z.B. Differenzieren, Verzögern
G08C 13/00
Unterrichten im Sprechen
G09B 19/04
Unterrichten oder Verständigen mit Blinden, Tauben oder [Taub-]Stummen
G09B 21/00
Tonerzeugungsvorrichtungen, außer Musikinstrumente oder Lautsprecher
G10K
Verfahren oder Einrichtungen zum Schutz gegen oder zum Dämpfen von Lärm oder Geräusch oder sonstigen akustischen Wellen
G10K 11/16
Signalverarbeitung für die Aufzeichnung
G11B 20/00
Fehlererkennung oder -korrektur in der digitalen Aufzeichnung oder Wiedergabe; Prüfen im Zusammenhang mit digitaler Aufzeichnung oder Wiedergabe
G11B 20/18
Änderung von Aufzeichnungen; Markieren; Adressieren; zeitliche Steuerung [z.B. Zeitdehnung, Zeitraffung] oder Synchronisierung; Überwachen
G11B 27/00
Elektronische Schaltungen zur Tonerzeugung
H03B
Verstärker
H03F
Verstärker, die ein Verstärkerelement verwenden, das aus zwei mechanisch oder akustisch gekoppelten Wandlern besteht, z.B. Telefon-Mikrofonverstärker
H03F 13/00
Verstärkungsregelung in Verstärkern oder Frequenzwandlern
H03G 3/00
Übertragung
H04B
Mit dem Empfänger vereinigte Einrichtungen zum Begrenzen oder Unterdrücken von Störungen oder von Rauschen
H04B 1/10
Einzelheiten von Übertragungssystemen, die nicht durch das zur Übertragung verwendete Medium gekennzeichnet sind, zur Bandbreitenverringerung von Signalen
H04B 1/66
Übertragungssysteme, die Ultraschall-, Schall- oder Infraschallwellen verwenden
H04B 11/00
Übertragungssysteme, die nicht durch das zur Übertragung verwendete Medium gekennzeichnet sind, gekennzeichnet durch die Verwendung von Pulsmodulation
H04B 14/02
Rundfunk-Verbreitungssysteme
H04H
Zeitmultiplexsysteme, bei denen ein Übertragungskanal, der einem ersten Benutzer zugeteilt ist, diesem weggenommen und einem zweiten Benutzer zugeteilt werden kann, wenn der erste Benutzer den Kanal nicht verwendet
H04J 3/17
Geheimer Nachrichtenverkehr
H04K 1/00
Übertragung digitaler Information, z.B. Telegrafieverkehr
H04L
Fernsprechverkehr
H04M
Anordnungen bei Mikrofonen, Hörern oder vollständigen Fernsprechapparaten zum Verhindern des Mithörens, zum Dämpfen örtlicher Geräusche oder zum Verhindern einer unerwünschten Übertragung; spezielle Mundstücke oder Hörer dafür
H04M 1/19
Anordnungen zum Verhindern akustischer Rückkopplung beim Fernsprechverkehr
H04M 1/20
Vorrichtungen, um einen Teilnehmer anzurufen, wobei gleichzeitig mehrere Signale gespeichert werden können
H04M 1/27
Einrichtungen von Teilnehmerstationen oder Nebensprechanlagen, z.B. zur Benutzung durch den Teilnehmer, mit Sprech- oder Hörverstärkern
H04M 1/60
Anordnungen zur selbsttätigen Entgegennahme von Anrufen
H04M 1/64
Interaktive Informationsdienste, z.B. Fernsprechauskunftsdienste
H04M 3/493
Gleichzeitige Sprech- und Telegrafie- oder andere Datenübertragung über die gleichen Leitungen
H04M 11/06
Systeme zur Übertragung eines Pulscodes modulierten Videosignals mit einem oder mehreren anderen PCM-Signalen, z.B. einem Audiosignal, einem Sync-Signal
H04N 7/52
Schaltsysteme
H04Q
Lautsprecher, Mikrofone, Schallplatten-Tonabnehmer oder ähnliche akustische, elektromechanische Wandler; Hörhilfen für Schwerhörige; Großlautsprecheranlagen
H04R
Stereophonische Anordnungen
H04R 5/00
Großlautsprecheranlagen
H04R 27/00
Stereophone Systeme, z.B. Raumklang-Erfassung, Matrizierung von Audiosignalen im dekodierten Zustand
H04S

Glossar

Sprache

Bestimmte vokale Klänge, die Wörter bilden, um Gedanken und Ideen zum Ausdruck zu bringen.

Stimme

durch Stimmbänder oder künstliche Versionen von Stimmbändern erzeugte Töne/Geräusche.

Tonsignal

Für den Menschen hörbarer Ton, einschließlich Sprache, Stimme, Musik, Stille oder Hintergrundgeräusch, oder eine beliebige Kombination davon.

Synonyme und Stichwörter

Abkürzungen

AAC

Advanced Audio Coding

ACELP

Algebraic Code Excited Linear Prediction

ADPCM

Adaptive Differential Pulse Code Modulation

AMR
AMR-NB

Adaptive Multi-Rate

AMR-WB

Adaptive Multi-Rate Wideband

ANN

künstliches neuronales Netz

AR

Autoregressiv

ASR

automatische Spracherkennung

BLP

Lineare Rückwärts-Prädiktion [Backward Linear Prediction]

BP

Rückpropagierung

BSAC

Bit Sliced Arithmetic Coding (Audiokodierung von MPEG-4 Teil 3)

CELP

Code-Excited Linear Prediction

DCT

Diskrete Kosinustransformation

DFT

Diskrete Fourier-Transformation

DPCM

Differentielle Puls-Code-Modulation

DRM

Digitale Rechteverwaltung

DTX

Diskontinuierliches Senden

EVRC
EVRC-B

Enhanced Variable Rate CODEC

FFT

schnelle Fourier-Transformation

FIR

Impulsantwort mit endlicher Dauer

FLP

Lineare Vorwärts-Prädiktion

GMM

Gaußsches Mischverteilungsmodell

HMM

Verstecktes Markov-Modell [Hidden Markov Model]

HVXC

Harmonic Vector Excitation Coding

IDCT

Inverse diskrete Kosinustransformation

IVR

Interactive Voice Response

LMS

Least Mean Square

LPC

Linear Predictive Coding

LSF

Line Spectral Frequencies

LSP

Line Spectral Pairs

LTP

Long Term Prediction

MBE

Multi-Band Excitation

MDCT

Modifizierte diskrete Kosinustransformation

MELP

Mixed-Excitation Linear Prediction

MLP

Mehrlagiges Perzeptron

MP3

MPEG-1 Audio Layer III oder MPEG-2 Audio Layer III

MPEG

Motion Picture Experts Group

MPEG 1 Audio

Standard ISO/IEC 11172-3

MPEG 2 Audio

Standard ISO/IEC 13818-3

MPEG 4 Audio

Standard ISO/IEC 14496-3

MPEG 21

Standard ISO/IEC 21000

MSE

Mittlerer quadratischer Fehler

NB – WB

Schmalband – Breitband

PARCOR

Partielle Korrelation

PWI

Prototyp-Wellenform-Interpolation

RELP

Residual Excited Linear Prediction

SBR

Spektralbandreplikation

TDNN

Neuronales Netz mit Zeitverzögerung

TTS

Wandlung von Text in Sprache

USAC

Unified Speech and Audio Coding

VoIP

Internet-Protokoll-Telefonie [Voice over IP]

VLSR

Very large speech recognition

VQ

Vektorquantisierung

VSELP

Vector Sum Excited Linear Prediction

V/UV

stimmhaft/stimmlos

VXML oder VoiceXML

Voice Extensible Markup Language (ein XML-Standardformat des W3C)