Zusammenfassung / Abstrahierung von Videos, z.B. Extraktion von Schlüsselbildern [key-frame extraction], Extraktion von Videomerkmalen oder Fingerprints, Extraktion von repräsentativen Aufnahmen, Erkennung wichtiger Einzelbilder durch Analyse der Zuschauerreaktionen oder durch Überwachung von Teilbereichen des Videos, wie z.B. des TV-Logos.
Semantisches Clustering auf hoher Ebene, Klassifizierung und Verstehen von Videoszenen, z.B. Erfassung, Labeling oder Markov-Modellierung. Beispiele für Videoinhalte, die einer solchen Analyse unterliegen, sind Sportübertragungen oder TV-Nachrichten.
Semantisches Clustering auf niedriger Ebene oder Bestimmung von Abschnitten in Videos, z.B. Szenen und Aufnahmen; Klassifizierung von Aufnahmen, z.B. als Großaufnahme, Halbnahaufnahme [medium shot] oder Totale.
Extraktion von Merkmalen, z.B. Ähnlichkeitsmaße auf der Basis von Histogrammen oder von Mannigfaltigkeiten, unter Verwendung von Video-Fingerprints, usw. Beispiele für Merkmale auf niedriger Ebene sind farb- oder texturbasierte Merkmale, Punkte mit lokaler Bedeutung [local interest points] (Schlüsselstellen [Key-Points]), Filterantworten, Kantenmerkmale, lokale Deskriptoren ( SIFT, SURF usw.) oder Kombinationen davon (siehe auch die Gruppe G06V 10/40). Beispiele für Merkmale auf hoher Ebene sind Merkmale, die sich auf die Kamerabewegung beziehen (Verfolgung visueller Merkmale), das Vorhandensein von Haut, die Anzahl der vorhandenen Gesichter, die Größe der Gesichter oder anderer sichtbarer menschlicher Merkmale, sowie Text oder andere Objekte, die in jedem Bild identifizierbar sind.
Abgleich von Videosequenzen, z.B. durch Bild- oder Zeitanalyse.
Segmentierung von Videosequenzen, z.B. durch Parsen oder Schneiden der Sequenz.
Kategorisierung von Videos, z.B. Klassifizierung von Videoinhalten in Sport/Musik/Nachrichten oder Erkennung von Werbespots in Medieninhalten zum Zweck ihrer Ersetzung.
Analyse von Sportveranstaltungen, z.B. Taktikanalyse in Sportvideos zur Unterstützung von Trainern und Spielern; Registrierung des letzten Wurfs bei einem Baseballspiel; Registrierung der wichtigen Teile wie Schüsse, Punkte usw.; Videoüberwachung der Anzeigetafel.
Erzeugung kompakter Darstellungen der Videosequenz als Ergebnis der Mustererkennung oder des Bildverständnisses, z.B. Erstellung von Miniaturansichten oder repräsentativen Symbolen.
Aufspüren und Erkennen von schädlichen/sexuellen/gewalttätigen Inhalten.
Entdeckung von Beziehungen zwischen Objekten oder Personen in Videos.
Erfassung einer Schlüssel-/Ankerperson in einem Video; Charakterisierung der Hauptpersonen.
Verknüpfung eines Videos mit semantischen Informationen (z.B. Schlüsselwörtern) zur Beschreibung des Inhalts (z.B. mit Markov-Netzwerken [Markov Random Fields]).
Erzeugung von semantischen Labels anhand eines Graphen, der den Videoinhalt beschreibt, wobei die Knoten Objekte oder Aktivitäten und die Kanten die Beziehungen zwischen ihnen darstellen.
Beispiele
Clustering der repräsentativen Einzelbilder, die ein bestimmtes Gesicht enthalten, und Erstellung von Miniaturbildern einer Videosequenz mit Gesichtern.
Erkennung von Fußballspielern in einem Fußballspiel und Anzeige der typischen Schüsse, bei denen ein bestimmter Spieler aktiv war.
Extraktion von Overlay-Text | G06V 20/62 |
Wiederauffinden von Videodaten | G06F 16/70 |
Verarbeitung von Video-Einzel-Datenströmen in Videoservern | H04N 21/234 |
Verarbeitung von Video-Einzel-Datenströmen in Video-Client-Anordnungen | H04N 21/44 |
Anordnungen zum Verstehen von Bildern oder Videos allgemein | G06V 10/00 |
Globale Merkmalsextraktion durch Analyse des gesamten Musters, z.B. globale Form, globale Deskriptoren für den Rand oder unter Verwendung von Transformationen im Frequenzbereich oder von Autokorrelation | G06V 10/42 |
Lokale Merkmalsextraktion durch Analyse von Teilen des Musters, z.B. durch Erkennung von Kanten, Konturen, Schleifen, Ecken, Strichen oder Schnittpunkten; Konnektivitätsanalyse, z.B. von Zusammenhangskomponenten, Verbindung von Kanten oder Analyse von benachbarten Schnitten [neighbouring slice analysis] | G06V 10/44 |
Mustererkennung oder maschinelles Lernen in Bildern oder Videos mittels Clustering | G06V 10/762 |
Erkennen von Szenen unter Videoüberwachung oder Kontrolle von Aktivitäten, z.B. zur Erkennung verdächtiger Objekte | G06V 20/52 |
Labeling von Szeneninhalten, z.B. Ableiten syntaktischer oder semantischer Repräsentationen | G06V 20/70 |
Erkennen von menschlichen oder tierischen Körpern | G06V 40/10 |
Erkennen von menschlichen Gesichtern, z.B. von Gesichtsteilen, Gesichtsskizzen oder Gesichtsausdrücken | G06V 40/16 |
Erkennen von Bewegungen oder Verhalten, z.B. Gestenerkennung | G06V 40/20 |
Bewegungsanalyse in Bildern | G06T 7/20 |
Bildanalyse mittels bewegungsbasierter Segmentierung | G06T 7/215 |
Änderung von Aufzeichnungen; Markieren; Adressieren; zeitliche Steuerung [z.B. Zeitdehnung, Zeitraffung] oder Synchronisierung; Überwachen; Messen des Banddurchlaufs | G11B 27/00 |
Schaltungen für das Fernsehbildsignal im Videofrequenzbereich | H04N 5/14 |