G06V 10/40

Definition

Diese Klassifikationsstelle umfasst:

Verfahren und Einrichtungen zur Extraktion von visuellen Merkmalen, die anschließend in einen Objekterkennungsalgorithmus eingegeben werden.

Anmerkungen – technischer Hintergrund

Diese Anmerkungen liefern weitere Informationen über die technischen Sachverhalte, die in diese Stelle klassifiziert werden:

Früher spielte die Wahl geeigneter Algorithmen zur Merkmalsextraktion eine entscheidende Rolle bei der Entwicklung von Algorithmen zur Mustererkennung. Sie hatte einen starken Einfluss auf die Gesamtleistung. Mit dem Aufkommen von Deep Learning, und besonders bei neuronalen Faltungsnetzwerken, hat sich die Notwendigkeit, dedizierte Merkmalsextraktionsalgorithmen manuell zu entwerfen, zu einem gewissen Grad verringert, da die inneren Schichten der neuronalen Netze darauf trainiert werden, automatisch geeignete Merkmale aus den Trainingsdaten zu finden.

Anmerkungen – andere Klassifikationsstellen

Die Untergruppen der Gruppe G06V 10/40 betreffen schwerpunktmäßig bestimmte Arten von Merkmalsextraktionsverfahren. Dazu gehören:

Anmerkung: Globale Merkmalsextraktionsverfahren beinhalten oft Bereichstransformationen, wie z.B. die Transformation in den Frequenzbereich. Die globalen Deskriptoren enthalten numerische Daten wie Vektoren oder Matrizen, können aber auch das Bild oder das Objekt in abstrakter Form als eine Folge von Symbolen aus einem vorgegebenen Alphabet darstellen, die mit Hilfe einer Grammatik integriert werden (Gruppe G06V 10/424).

Beispiele

Bildreferenz:G06V0010400000_0


Bildreferenz:G06V0010400000_1



Quantifizierung lokaler Bildeigenschaften, insbesondere des lokalen Gradienten, mittels einer lokalen Abtastung.

Bildreferenz:G06V0010400000_2



Verschiedene Arten von Merkmalen, die zur Objekterkennung verwendet werden, z.B. Konturen, Liniensegmente, durchgehende Linien.

Querverweise

Nichteinschränkende Querverweise in anwendungsorientierte Klassifikationsstellen

Erkennen von Szenen und szenenspezifischen Elementen
G06V 20/00
Zeichenerkennung; Erkennung digitaler Tinte; dokumentenorientierte bildbasierte Mustererkennung
G06V 30/00
Erkennen oder Verstehen von biometrischen Mustern, sowie Mustern mit Bezug zu Menschen oder Tieren in Bild- oder Videodaten
G06V 40/00
Erkennen von Fingerabdrücken oder Handabdrücken
G06V 40/12
Erkennen von Gefäßmustern
G06V 40/14
Erkennen von menschlichen Gesichtern, z.B. von Gesichtsteilen, Gesichtsskizzen oder Gesichtsausdrücken, in Bild- oder Videodaten
G06V 40/16
Erkennen von Merkmalen der Augen in Bild- oder Videodaten, z.B. der Iris
G06V 40/18

Informative Querverweise

Spektrometrie, Farbmessung
G01J 3/46
Bildanalyse mit merkmalsbasierten Methoden, insbesondere zur Bestimmung von Transformations-Parametern zum Ausrichten von Bildern zueinander
G06T 7/33
Bildanalyse zum Ermitteln der Tiefe oder der Form
G06T 7/50
Codierung der Bildumrisse, z.B. durch Erkennung der Kanten
G06T 9/20

Glossar

BoW

Bag of Words, ein ursprünglich für die Verarbeitung natürlicher Sprache entwickeltes Modell; auf Bilder angewandt, stellt es ein Bild durch ein Histogramm "visueller Wörter" dar, wobei jedes "visuelle Wort" einen bestimmten Teil des Merkmalsraums repräsentiert.

Kante

eine Bildregion, in der das Bild einen starken Luminanzgradienten aufweist.

GLCM

Grauwertematrix [Grey-Level Co-occurrence Matrix].

HOG

Histogramm orientierter Gradienten, ein von N. Dalal und B. Triggs beschriebener Merkmalsdeskriptor.

SIFT

skaleninvariante Merkmalstransformation [Scale-Invariant Feature Transform], ein Algorithmus zur Merkmalserkennung.

SURF

Speeded Up Robust Features, ein Merkmalsdeskriptor.