G06V 10/26

Definition

Diese Klassifikationsstelle umfasst:

Verfahren und Einrichtungen zur Segmentierung von Mustern in Bildern oder Video-Einzelbildern, z.B. Segmentierungsalgorithmen. Anmerkung: Segmentierungsalgorithmen unterteilen Bilder oder Video-Einzelbilder in verschiedene Regionen, so dass die Grenzen zwischen benachbarten Regionen mit Änderungen bestimmter Bildeigenschaften koinzidieren.

Segmentierungsalgorithmen, die direkt auf dem Bild arbeiten, indem sie die Pixelwerte und ihre Nachbarschaftsbeziehungen berücksichtigen, z.B. Algorithmen, die auf mathematischer Morphologie basieren, wie Region Growing, Wasserscheidentransformation [Watershed Transformation] und Level-Set-Methoden.

Segmentierungsalgorithmen, die eine Hierarchie von Segmentierungen erzeugen, indem sie mit einer groben Segmentierung beginnen, die nur wenige Segmente umfasst, und diese grobe Segmentierung sukzessive verfeinern, indem sie die groben Bildsegmente (möglicherweise rekursiv) in feinere Segmente aufteilen (Grob-zu-Fein-Ansätze).

Graphenschnitt-Algorithmen wie normalisierte Schnitte [Normalised Cuts] oder Min-Cut, die graphbasierte Clustering-Algorithmen für die Bildsegmentierung verwenden.

Region-Growing-Algorithmen, die mit wenigen Startpunkten beginnen und diese iterativ zu größeren Regionen erweitern, bis ein Optimalitätskriterium erfüllt ist.

Die Verwendung von Klassifikatoren zur Trennung von Vordergrund und Hintergrund. Anmerkung: Klassifikatoren berechnen eine Bewertungsfunktion, die eine Wahrscheinlichkeit (oder Vertrauen) ausdrückt, dass ein bestimmter Bildbereich ein Vordergrundobjekt oder aber ein Teil des Hintergrunds ist. Das Bild wird dann auf der Grundlage dieser Bewertungswerte segmentiert.

Deep-Learning-Modelle, insbesondere verschiedene Encoder-Decoder-Architekturen auf der Grundlage von neuronalen Faltungsnetzwerken [Convolutional Neural Networks, CNN], angewendet auf die semantische Bildsegmentierung (wobei nicht nur eine Aufteilung des Bildes in Regionen, sondern auch eine konsistente Zuweisung von Labels für Bildobjektkategorien, z.B. “Himmel”, “Bäume”, “Straße” erforderlich ist).

Erkennung von Verdeckungen. Anmerkung: Manchmal verdeckt ein Objekt (z.B. ein Baumstamm) teilweise ein anderes Objekt (z.B. einen Hund hinter dem Baum), was dazu führen kann, dass das andere Objekt in mehrere nicht zusammenhängende Segmente aufgeteilt wird; Algorithmen zur Erkennung von Verdeckungen gehen mit solchen Situationen um, um semantisch verbundene Segmente zu einem einzigen Segment zusammenzufügen.

Andere Algorithmen (z.B. einige Aktive-Kontur-Modelle), die von einer anfänglichen Bildregion ausgehen, die groß genug ist, um ein Bildobjekt mit Sicherheit zu umschließen, und diese Region iterativ schrumpfen, bis ihre Begrenzung eng an der Kontur des Objekts anliegt.

Anmerkungen – technischer Hintergrund

Diese Anmerkungen liefern weitere Informationen über die technischen Sachverhalte, die in diese Stelle klassifiziert werden:

Segmentierungsalgorithmen unterteilen Bilder oder Video-Einzelbilder in verschiedene Regionen, sodass die Grenzen zwischen benachbarten Regionen mit Änderungen bestimmter Bildeigenschaften koinzidieren.

Segmentierungsalgorithmen können Regionen erkennen, die eine homogene Textur oder charakteristische Farben aufweisen, einzelne Objekte umschließen usw.

Einige Segmentierungsalgorithmen sind im Grunde genommen Clustering-Algorithmen. Sie lassen die räumliche Anordnung der Pixel im Bild außer Acht und berechnen Cluster in einem Merkmalsraum (z.B. indem sie den k-Means-Algorithmus auf alle Farbwerte in einem Bild anwenden). Dann gruppieren sie räumlich verbundene Pixel, die zu demselben Cluster gehören, zu einer Region (einem “Segment”).

Beispiele

Bildreferenz:G06V0010260000_0

Farbsegmentierung einer Hautregion eines Gesichts unter Verwendung von Clustering in einem Farbraum.

Bildreferenz:G06V0010260000_1

Beispiel einer beim autonomen Fahren häufig vorkommenden Szene und ihrer semantischen Segmentierungskarte [Segmentation Map] mit Regionen wie “Straße”, “Himmel”, “Bäume”, usw.

Beziehungen zu anderen Klassifikationsstellen

Variationsverfahren für die Objekterkennung wie Aktive-Kontur-Modelle [Active Contour Models, ACM oder “Snakes”), Active Shape Models [ASM] oder Active Appearance Models [AAM] werden in die Gruppe G06V 10/74 klassifiziert.

Querverweise

Informative Querverweise

Clustering-Algorithmen zum Erkennen oder Verstehen von Bildern oder Videos	G06V 10/762
Bildsegmentierung allgemein	G06T 7/10
Bildanalyse mit regionenbasierter Segmentierung	G06T 7/11
Kantenbasierte Segmentierung allgemein	G06T 7/12
Bildsegmentierung auf Grundlage der Bewegung allgemein	G06T 7/215

Glossar

BSD	Berkeley-Segmentierungsdatensatz, eine Sammlung von manuell segmentierten Bildern.
K-Means	ein Clustering-Algorithmus.
NCUTS	normalisierte Schnitte [Normalised Cuts], ein graphbasierter Segmentierungsalgorithmus.
PASCAL VOC	eine Sammlung von Bilddatensätzen zur Bewertung der Leistung von Computer-Vision-Algorithmen; sie enthält einen speziellen Datensatz zur Bewertung von Segmentierungsalgorithmen.