G06F 18/24

Definition

Diese Klassifikationsstelle umfasst:

Klassifizierung im Allgemeinen, d.h. Identifizierung der Kategorie oder der Gruppe von Kategorien (Klassen), zu der neue Daten oder eine aus ihnen abgeleitete andere Darstellung gehören, auf der Grundlage eines Trainingssatzes von Daten, der Beobachtungen (oder Instanzen) enthält, deren Zugehörigkeit zu einer Kategorie bekannt ist. Häufig werden die einzelnen Beobachtungen in eine Reihe quantifizierbarer Eigenschaften zerlegt, die als erklärende Variablen oder Merkmale bezeichnet werden. Diese Eigenschaften können Kategorien, Ordnungszahlen, ganzzahlige Werte, reelle Werte usw. sein. Andere Klassifikatoren führen eine Klassenzuordnung durch, indem sie aktuelle Beobachtungen mit früheren Beobachtungen anhand einer Ähnlichkeits- oder Abstandsfunktion vergleichen.

Ein Klassifikator kann parametrisch oder nicht-parametrisch sein, je nachdem, welches Modell für die Beobachtungen verwendet wird.

Zu den Klassifizierungsalgorithmen gehören solche, die:

Betrachtet man die Entscheidungsfläche des Klassifikators, so kann es sich um einen linearen oder nichtlinearen Klassifikator handeln. Lineare Klassifikatoren modellieren die Grenzen zwischen verschiedenen Klassen im Merkmalsraum als Hyperebenen. Nichtlineare Klassifikatoren verwenden stattdessen z.B. quadratische, polynomiale oder hyperbolische Funktionen.

Querverweise

Nichteinschränkende Querverweise in anwendungsorientierte Klassifikationsstellen

Wiederauffinden von Informationen bezüglich Einzelbilddaten; Clusteranalyse; Klassifizierung
G06F 16/55
Wiederauffinden von Informationen bezüglich Videodaten; Clusteranalyse; Klassifizierung
G06F 16/75
Erkennen oder Verstehen von Bildern oder Videos mittels Klassifizierung
G06V 10/764

Glossar

CART

Classification and Regression Tree

C4.5

Klassifizierungsalgorithmus unter Verwendung eines Entscheidungsbaums [Decision Tree]

FAR

Falschakzeptanzrate [False Acceptance Rate]

FRR

Falschrückweisungsrate [False Rejection Rate]

Gini-Impurity

Ein Maß dafür, wie oft ein zufällig ausgewähltes Element aus der Menge falsch gelabelt würde, wenn es gemäß der Verteilung der Labels in der Teilmenge zufällig gelabelt würde; wird normalerweise auf der Ebene der Knoten von baumbasierten Klassifikatoren verwendet.

ID3

Iterative Dichotomiser 3, ein Vorläufer von C4.5

ROC

Receiver Operating Characteristics

G06F 18/24

Definition Statement

This place covers:

Classification in general, namely identifying to which category or which set of categories (classes) a new data or some other representation originating from it belongs, on the basis of a training set of data containing observations (or instances) whose category membership is known. Often, the individual observations are analysed into a set of quantifiable properties, known as explanatory variables or features. These properties may be categorical, ordinal, integer-valued, real-valued, etc. Other classifiers perform a class assignment by comparing current observations to previous observations by means of a similarity or distance function.

A classifier can be parametric or non-parametric depending on the type of model adopted for the observations.

Classification algorithms include those:

When the decision surface of the classifier is considered, this can be a linear classifier or non-linear classifier. Linear classifiers model the boundaries between different classes in the feature space as hyperplanes. Non-linear classifiers use e.g. quadratic, polynomial, or hyperbolic functions instead.

References

Application-oriented references

Information retrieval of still images; Clustering; Classification
G06F 16/55
Information retrieval of video data; Clustering; Classification
G06F 16/75
Image or video recognition or understanding using classification
G06V 10/764

Glossary

CART

Classification and Regression Tree

C4.5

Classification algorithm using a decision tree

FAR

False Acceptance Rate

FRR

False Rejection Rate

Gini impurity

A measure of how often a randomly chosen element from the set would be incorrectly labeled if it was randomly labeled according to the distribution of labels in the subset; usually used at the level of the nodes of tree-based classifiers.

ID3

Iterative Dichotomiser 3, a precursor of C4.5

ROC

Receiver Operating Characteristics