G06V 10/20
Definition
Diese Klassifikationsstelle umfasst:Jede Art der Verarbeitung von erfassten Bild- oder Videodaten vor den Schritten der Merkmalsextraktion und Merkmalserkennung; Vorrichtungen, die für die Durchführung dieser Verarbeitung konfiguriert sind.
Verarbeitung zur Vorbereitung eines Bildes für die Merkmalsextraktion.
Verarbeitung zur Verbesserung der Bildqualität mit dem Ziel, Strukturen im Bild hervorzuheben, die der automatischen Erkennung von Objekten oder Objektkategorien dienen.
Verarbeitung, um Elemente des Bildes abzuschwächen oder zu verwerfen, die für den Mustererkennungsvorgang wahrscheinlich nicht von Nutzen sind.
Bei der Verarbeitung wird das Bild in ein Standardformat konvertiert, das sich für die Routinen zur Merkmalsextraktion und Mustererkennung eignet.
Anmerkungen – andere Klassifikationsstellen
Spezifische Aspekte der Vorverarbeitung werden von den Untergruppen der Gruppe G06V 10/20 abgedeckt; sie betreffen insbesondere Aspekte wie:
- Verfahren oder Vorrichtungen zur Identifizierung von Bildbereichen, die dem Mustererkennungsverfahren unterzogen werden sollen oder wahrscheinlich Bildinformationen enthalten, die für eine Objekterkennungsaufgabe relevant sind – Gruppe G06V 10/22;
- Korrektur falsch ausgerichteter Bilder (z.B. Änderung der Ausrichtung von einem falschen Hochformat in ein Querformat), Kompensation der Posenänderung des Objekts durch Anwenden affiner Transformationen (Parallelverschiebung, Skalierung, zentrische Streckung, Ähnlichkeit, Spiegelung, Drehung, Scherung sowie deren Zusammensetzungen in beliebiger Kombination und Reihenfolge) oder Korrektur durch die Bildaufnahme verursachter geometrischer Verzerrungen – Gruppe G06V 10/24;
- Bestimmung eines minimal umgebenden Rechtecks [Bounding Box], das das Muster von Interesse enthält, Verarbeitung innerhalb eines Bereichs von Interesse [Region of Interest – ROI] oder eines Volumens von Interesse [Volume of Interest – VOI], um das Muster für die Erkennung hervorzuheben – Gruppe G06V 10/25;
- Vorrichtungen oder Verfahren zum Trennen eines in Frage kommenden Objekts von anderen, uninteressanten Bildbereichen oder dem Hintergrund; Bildsegmentierung, soweit sie für die Unterstützung eines nachfolgenden Erkennungsschritts angepasst ist – Gruppe G06V 10/26;
- Anpassung der Bittiefe, z.B. Umwandlung in Schwarz-Weiß-Bilder, und Festlegung von Schwellenwerten dafür, z.B. durch Analyse des Grauwert-Histogramms des Bildes; Umwandlung der Bilddaten in einen vorgegebenen Zahlenbereich, z.B. durch Skalierung der Pixelwerte – Gruppe G06V 10/28;
- Methoden zur Verbesserung des Signal-Rausch-Verhältnisses [SRV, SNR] oder zur Entrauschung des Bildes zum Zwecke der Verbesserung der Erkennung – Gruppe G06V 10/30;
- Anpassung der Größe oder der Auflösung des Bildes an ein Standardformat, z.B. durch Skalierung; Anpassung der Größe des erkannten Objekts an ein bestimmtes Format – Gruppe G06V 10/32;
- Glättung oder Ausdünnung [Thinning], um eine alternative, weniger komplexe Darstellung des Musters zu erhalten; Anwendung morphologischer Operatoren (z.B. morphologische Dilatation, Erosion, Öffnung oder Schließung) zum Auffüllen von Lücken oder Zusammenführen von Elementen mit dem Ziel, die für die Erkennung relevanten Strukturen hervorzuheben; Skelettierung zur Charakterisierung der Form eines Musters – Gruppe G06V 10/34;
- Verstärkung des Kontrasts durch Faltung des Bildes mit einer Filtermaske oder durch Anwendung eines nichtlinearen Operators auf lokale Bildbereiche – Gruppe G06V 10/36.
Beispiele

Ausrichtung des Bildes eines Gesichts durch affine Transformationen, um ein poseninvariantes [pose-invariant] Bild zu erhalten.
Beziehungen zu anderen Klassifikationsstellen
Verschiedene Arten von Bildvorverarbeitung im Allgemeinen werden wie folgt durch Gruppen abgedeckt:
- G06T 3/00 wenn geometrische Bildtransformationen (z.B. Bilddrehung) angewendet werden;
- G06T 5/00 wenn eine Verbesserung oder Wiederherstellung (z.B. Entrauschung) des Bildes durchgeführt wird.
Querverweise
Nichteinschränkende Querverweise in anwendungsorientierte Klassifikationsstellen
Erkennen von Szenen; szenenspezifische Elemente
| G06V 20/00 |
Zeichenerkennung; Erkennung digitaler Tinte; dokumentenorientierte bildbasierte Mustererkennung
| G06V 30/00 |
Erkennen oder Verstehen von biometrischen Mustern, sowie Mustern mit Bezug zu Menschen oder Tieren in Bild- oder Videodaten
| G06V 40/00 |
Informative Querverweise
Filteroperationen zum Entdecken von Kanten, Ecken oder anderen Bildmerkmalen, die zum Kennzeichnen von Objekten verwendet werden
| G06V 10/44 |
Verbesserung oder Wiederherstellung von Bildern
| G06T 5/00 |
Bildsegmentierung
| G06T 7/10 |
Morphologische Operatoren für die Bildsegmentierung
| G06T 7/155 |
Glossar
DCT
| diskrete Kosinustransformation [Discrete Cosine Transform].
|
FFT
| schnelle Fourier-Transformation [Fast Fourier Transform].
|
FOV
| Sichtfeld [Field of View], der Bereich der Umgebung, den ein Bildsensor wahrnimmt.
|
ROI
| Bereich von Interesse [Region of Interest], ein Bildabschnitt, der wahrscheinlich relevante Informationen enthält.
|
Skelettierung
| der Vorgang einer Schrumpfung einer Form auf eine zusammenhängende Folge von Linien, die gleich weit von den Grenzen der Form entfernt sind.
|
SNR
| Signal-Rausch-Verhältnis [Signal-to-Noise Ratio].
|
VOI
| Volumen von Interesse [Volume of Interest], ein Quader, der dreidimensionale Datenpunkte umschließt, die wahrscheinlich relevante Informationen darstellen.
|