G06F 18/24

Definition

Diese Klassifikationsstelle umfasst:

Klassifizierung im Allgemeinen, d.h. Identifizierung der Kategorie oder der Gruppe von Kategorien (Klassen), zu der neue Daten oder eine aus ihnen abgeleitete andere Darstellung gehören, auf der Grundlage eines Trainingssatzes von Daten, der Beobachtungen (oder Instanzen) enthält, deren Zugehörigkeit zu einer Kategorie bekannt ist. Häufig werden die einzelnen Beobachtungen in eine Reihe quantifizierbarer Eigenschaften zerlegt, die als erklärende Variablen oder Merkmale bezeichnet werden. Diese Eigenschaften können Kategorien, Ordnungszahlen, ganzzahlige Werte, reelle Werte usw. sein. Andere Klassifikatoren führen eine Klassenzuordnung durch, indem sie aktuelle Beobachtungen mit früheren Beobachtungen anhand einer Ähnlichkeits- oder Abstandsfunktion vergleichen.

Ein Klassifikator kann parametrisch oder nicht-parametrisch sein, je nachdem, welches Modell für die Beobachtungen verwendet wird.

Zu den Klassifizierungsalgorithmen gehören solche, die:

Betrachtet man die Entscheidungsfläche des Klassifikators, so kann es sich um einen linearen oder nichtlinearen Klassifikator handeln. Lineare Klassifikatoren modellieren die Grenzen zwischen verschiedenen Klassen im Merkmalsraum als Hyperebenen. Nichtlineare Klassifikatoren verwenden stattdessen z.B. quadratische, polynomiale oder hyperbolische Funktionen.

Querverweise

Nichteinschränkende Querverweise in anwendungsorientierte Klassifikationsstellen

Wiederauffinden von Informationen bezüglich Einzelbilddaten; Clusteranalyse; Klassifizierung
G06F 16/55
Wiederauffinden von Informationen bezüglich Videodaten; Clusteranalyse; Klassifizierung
G06F 16/75
Erkennen oder Verstehen von Bildern oder Videos mittels Klassifizierung
G06V 10/764

Glossar

CART

Classification and Regression Tree

C4.5

Klassifizierungsalgorithmus unter Verwendung eines Entscheidungsbaums [Decision Tree]

FAR

Falschakzeptanzrate [False Acceptance Rate]

FRR

Falschrückweisungsrate [False Rejection Rate]

Gini-Impurity

Ein Maß dafür, wie oft ein zufällig ausgewähltes Element aus der Menge falsch gelabelt würde, wenn es gemäß der Verteilung der Labels in der Teilmenge zufällig gelabelt würde; wird normalerweise auf der Ebene der Knoten von baumbasierten Klassifikatoren verwendet.

ID3

Iterative Dichotomiser 3, ein Vorläufer von C4.5

ROC

Receiver Operating Characteristics