G06V 20/40

Definition

Diese Klassifikationsstelle umfasst:

Zusammenfassung / Abstrahierung von Videos, z.B. Extraktion von Schlüsselbildern [key-frame extraction], Extraktion von Videomerkmalen oder Fingerprints, Extraktion von repräsentativen Aufnahmen, Erkennung wichtiger Einzelbilder durch Analyse der Zuschauerreaktionen oder durch Überwachung von Teilbereichen des Videos, wie z.B. des TV-Logos.

Semantisches Clustering auf hoher Ebene, Klassifizierung und Verstehen von Videoszenen, z.B. Erfassung, Labeling oder Markov-Modellierung. Beispiele für Videoinhalte, die einer solchen Analyse unterliegen, sind Sportübertragungen oder TV-Nachrichten.

Semantisches Clustering auf niedriger Ebene oder Bestimmung von Abschnitten in Videos, z.B. Szenen und Aufnahmen; Klassifizierung von Aufnahmen, z.B. als Großaufnahme, Halbnahaufnahme [medium shot] oder Totale.

Extraktion von Merkmalen, z.B. Ähnlichkeitsmaße auf der Basis von Histogrammen oder von Mannigfaltigkeiten, unter Verwendung von Video-Fingerprints, usw. Beispiele für Merkmale auf niedriger Ebene sind farb- oder texturbasierte Merkmale, Punkte mit lokaler Bedeutung [local interest points] (Schlüsselstellen [Key-Points]), Filterantworten, Kantenmerkmale, lokale Deskriptoren ( SIFT, SURF usw.) oder Kombinationen davon (siehe auch die Gruppe G06V 10/40). Beispiele für Merkmale auf hoher Ebene sind Merkmale, die sich auf die Kamerabewegung beziehen (Verfolgung visueller Merkmale), das Vorhandensein von Haut, die Anzahl der vorhandenen Gesichter, die Größe der Gesichter oder anderer sichtbarer menschlicher Merkmale, sowie Text oder andere Objekte, die in jedem Bild identifizierbar sind.

Abgleich von Videosequenzen, z.B. durch Bild- oder Zeitanalyse.

Segmentierung von Videosequenzen, z.B. durch Parsen oder Schneiden der Sequenz.

Kategorisierung von Videos, z.B. Klassifizierung von Videoinhalten in Sport/Musik/Nachrichten oder Erkennung von Werbespots in Medieninhalten zum Zweck ihrer Ersetzung.

Analyse von Sportveranstaltungen, z.B. Taktikanalyse in Sportvideos zur Unterstützung von Trainern und Spielern; Registrierung des letzten Wurfs bei einem Baseballspiel; Registrierung der wichtigen Teile wie Schüsse, Punkte usw.; Videoüberwachung der Anzeigetafel.

Erzeugung kompakter Darstellungen der Videosequenz als Ergebnis der Mustererkennung oder des Bildverständnisses, z.B. Erstellung von Miniaturansichten oder repräsentativen Symbolen.

Aufspüren und Erkennen von schädlichen/sexuellen/gewalttätigen Inhalten.

Entdeckung von Beziehungen zwischen Objekten oder Personen in Videos.

Erfassung einer Schlüssel-/Ankerperson in einem Video; Charakterisierung der Hauptpersonen.

Verknüpfung eines Videos mit semantischen Informationen (z.B. Schlüsselwörtern) zur Beschreibung des Inhalts (z.B. mit Markov-Netzwerken [Markov Random Fields]).

Erzeugung von semantischen Labels anhand eines Graphen, der den Videoinhalt beschreibt, wobei die Knoten Objekte oder Aktivitäten und die Kanten die Beziehungen zwischen ihnen darstellen.

Beispiele

Bildreferenz:G06V0020400000_0

Clustering der repräsentativen Einzelbilder, die ein bestimmtes Gesicht enthalten, und Erstellung von Miniaturbildern einer Videosequenz mit Gesichtern.

Bildreferenz:G06V0020400000_1

Erkennung von Fußballspielern in einem Fußballspiel und Anzeige der typischen Schüsse, bei denen ein bestimmter Spieler aktiv war.

Querverweise

Einschränkende Querverweise

Diese Klassifikationsstelle umfasst nicht:

Extraktion von Overlay-Text	G06V 20/62
Wiederauffinden von Videodaten	G06F 16/70
Verarbeitung von Video-Einzel-Datenströmen in Videoservern	H04N 21/234
Verarbeitung von Video-Einzel-Datenströmen in Video-Client-Anordnungen	H04N 21/44

Informative Querverweise

Anordnungen zum Verstehen von Bildern oder Videos allgemein	G06V 10/00
Globale Merkmalsextraktion durch Analyse des gesamten Musters, z.B. globale Form, globale Deskriptoren für den Rand oder unter Verwendung von Transformationen im Frequenzbereich oder von Autokorrelation	G06V 10/42
Lokale Merkmalsextraktion durch Analyse von Teilen des Musters, z.B. durch Erkennung von Kanten, Konturen, Schleifen, Ecken, Strichen oder Schnittpunkten; Konnektivitätsanalyse, z.B. von Zusammenhangskomponenten, Verbindung von Kanten oder Analyse von benachbarten Schnitten [neighbouring slice analysis]	G06V 10/44
Mustererkennung oder maschinelles Lernen in Bildern oder Videos mittels Clustering	G06V 10/762
Erkennen von Szenen unter Videoüberwachung oder Kontrolle von Aktivitäten, z.B. zur Erkennung verdächtiger Objekte	G06V 20/52
Labeling von Szeneninhalten, z.B. Ableiten syntaktischer oder semantischer Repräsentationen	G06V 20/70
Erkennen von menschlichen oder tierischen Körpern	G06V 40/10
Erkennen von menschlichen Gesichtern, z.B. von Gesichtsteilen, Gesichtsskizzen oder Gesichtsausdrücken	G06V 40/16
Erkennen von Bewegungen oder Verhalten, z.B. Gestenerkennung	G06V 40/20
Bewegungsanalyse in Bildern	G06T 7/20
Bildanalyse mittels bewegungsbasierter Segmentierung	G06T 7/215
Änderung von Aufzeichnungen; Markieren; Adressieren; zeitliche Steuerung [z.B. Zeitdehnung, Zeitraffung] oder Synchronisierung; Überwachen; Messen des Banddurchlaufs	G11B 27/00
Schaltungen für das Fernsehbildsignal im Videofrequenzbereich	H04N 5/14

Glossar

Video-Fingerprinting	Klasse von Verfahren zur Dimensionsreduzierung, um charakteristische Komponenten eines Videos zu identifizieren, zu extrahieren und zusammenzufassen, so dass dieses Video eindeutig identifiziert werden kann.
Videozusammenfassung [Video Summarisation]	Erstellung einer kurzen Zusammenfassung des Inhalts eines längeren Videos durch Auswahl und Darstellung der informativsten oder interessantesten Videoausschnitte.