G10L 21/00

Definition

Diese Klassifikationsstelle umfasst:

Anwendungen zur Sprach- oder Stimmmodifikation, einschließlich Anwendungen für Sprach- oder Stimmanalysetechniken, die besonders ausgebildet sind zum Analysieren oder Modifizieren von Audiosignalen, die nicht notwendigerweise Sprache oder Stimme enthalten, jedoch keine Musiksignale sind ( G10H).

Bandbreitenerweiterung eines Audiosignals;

Verbesserung der Verständlichkeit eines codierten Sprachsignals;

Entfernen von Störgeräuschen aus einem Audiosignal;

Entfernen von Echo aus einem Audiosignal;

Separieren von Audioquellen;

Tonhöhen- oder Geschwindigkeitsmodifikation bei einem Audiosignal;

Stimmverformung;

Visualisierung von Audiosignalen (z.B. Sonogramme).

Synchronisierung von Lippen- oder Gesichtsbewegung mit Sprache (z.B. Ausrichtung von Phonem und Mundbilder).

Synchronisierung von Gesichtsanimation mit einer im Stimm- oder Sprachsignal enthaltenen Emotion.

Querverweise

Einschränkende Querverweise

Diese Klassifikationsstelle umfasst nicht:
Sprach- oder Audioanalyse/-syntheseverfahren zur Redundanzverminderung, z.B. in Vocodern; Codieren oder Decodieren von Sprache oder Audiosignalen, unter Verwendung von Quelle-Filter-Modellen oder psychoakustischer Analyse
G10L 19/00

Informative Querverweise

3D Animation
G06T 13/20
Signalverarbeitung, die nicht auf ein bestimmtes Aufzeichnungs- oder Wiedergabeverfahren abgestellt ist, zur Verringerung des Rauschens
G11B 20/24
Verstärkungsregelung in Verstärkern, bei der die Regelung vom umgebenden Lärmpegel oder Schallpegel abhängig ist
H03G 3/32
Vermindern der Echoeffekte oder des Pfeifens in Leitungsübertragungssystemen
H04B 3/20
Übertragungssysteme, die nicht durch das zur Übertragung verwendete Medium gekennzeichnet sind, unter Verwendung von Pulscodemodulation, z.B. für die Reduzierung des Rauschens oder der Bandbreite
H04B 14/04
Echounterdrückung in Freisprechtelefonen
H04M 9/08

Glossar

Mundbild

Die visuelle Darstellung von Mund, Lippen, Zunge und Zähnen, die einem Phonem entspricht.

Synonyme und Stichwörter

Abkürzungen

BSS

Blinde Quellentrennung

LDA

Lineare Diskriminanzanalyse

PCA

Hauptkomponentenanalyse


G10L 21/00

Definition Statement

This place covers:

Speech or voice modification applications, but receives also applications for speech or voice analysis techniques specially adapted to analyse or modify audio signals, where the audio signals do not necessarily include speech or voice but which are not music signals ( G10H).

Bandwidth extension of an audio signal.

Improvement of the intelligibility of a coded speech signal.

Removal of noise from an audio signal.

Removal of echo from an audio signal.

Separation of audio sources.

Pitch, speed modification of an audio signal.

Voice morphing.

Visualisation of audio signals (e.g. sonagrams).

Lips or face movement synchronisation with speech (e.g phonemes - visemes alignment).

Face animation synchronisation with the emotion contained in the voice or speech signal.

References

Limiting references

This place does not cover:
Speech or audio signal analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
G10L 19/00

Informative references

3D Animation
G06T 13/20
Signal processing not specific to the method of recording or reproducing, for reducing noise
G11B 20/24
Gain control in amplifiers where the control is dependent upon ambient noise level or sound level
H03G 3/32
Reducing echo effects or singing in line transmission systems
H04B 3/20
Transmission systems not characterised by the medium used for transmission using pulse code modulation, e.g. for reducing noise or bandwidth
H04B 14/04
Echo suppression in hand-free telephones
H04M 9/08

Glossary

viseme
visemes

a visual representation of the mouth, lips, tongue and teeth corresponding to a phoneme.

Synonyms and Keywords

Abbreviations

BSS

Blind source separation

LDA

Linear discriminant analysis

PCA

Principal component analysis