Kombination von Informationen aus mehreren Quellen, um eine einheitliche Darstellung zum Erkennen oder Verstehen von Bildern oder Videos zu erhalten.
Anmerkungen – technischer Hintergrund
Diese Anmerkungen liefern weitere Informationen über die technischen Sachverhalte, die in diese Stelle klassifiziert werden:
Ein einfacher Fusionsprozess kombiniert Rohdaten von mehreren Sensoren oder mehreren Sensormodalitäten (z.B. Fusion von räumlichen und zeitlichen Daten). Neben der Fusion der Sensorrohdaten ist es auch möglich, die Sensordaten zunächst zu verarbeiten, um Merkmale zu extrahieren und die extrahierten Merkmale dann zu einem gemeinsamen Merkmalsvektor zu kombinieren. Alternativ ist es möglich, Klassifizierungsergebnisse zu fusionieren, z.B. indem die Merkmale aus verschiedenen Sensormodalitäten in separate Klassifikatoren eingegeben werden, die jeweiligen Klassifizierungsergebnisse von jedem Klassifikator erhalten und die einzelnen Ergebnisse zu einem endgültigen Klassifizierungsergebnis kombiniert werden.
Beispiele sind die probabilistische Fusion, die statistische Fusion, die Fuzzy-Fusion, die Fusion auf der Grundlage der Evidenztheorie [Theory of Belief Functions, Dempster-Shafer], die Fusion durch Abstimmung.
Die Fusion kann auch in verschiedenen Phasen eines Erkennungssystems zu unterschiedlichen Zwecken eingesetzt werden, z.B. zur Dimensionalitätsreduktion, zur Robustheit der Berechnung, zur Verbesserung der Präzision und Sicherheit der Klassifizierungsentscheidungen usw.
Beispiele
Fusion auf Sensorebene, gefolgt von Klassifizierung.
Fusion auf Merkmalsebene durch Kombination von Darstellungen der Farbe, Form und Textur.
Multimodale Sprechererkennung oder Sprecherverifikation | G10L 17/10 |
Mustererkennung oder maschinelles Lernen, mittels Clustering | G06V 10/762 |
Mustererkennung oder maschinelles Lernen, mittels Klassifizierung | G06V 10/764 |
Mustererkennung oder maschinelles Lernen, mittels Regression | G06V 10/766 |