G06F 16/00

Definition

Diese Klassifikationsstelle umfasst:

Systeme und Verfahren zum Wiederauffinden von digitalen Informationen, die in Datenbanken, Datenrepositorien oder Dateisystemen lokal oder remote gespeichert sind.

Einzelheiten der Organisation und Aufbereitung von Informationen für die Verwendung beim Wiederauffinden digitaler Informationen, z.B. Erzeugung von Informationen zur Indexierung oder Formulierung von Abfragen.

Einzelheiten der zum Wiederauffinden der Informationen verwendeten Datenstrukturen, wie Baumstrukturen, Listen oder Hashing.

Einzelheiten der Abfrageverarbeitung und der Darstellung von Abfrageergebnissen, z.B. in Textform oder in grafischer Form auf grafischen Benutzeroberflächen (GUIs).

Einzelheiten des Durchsuchens von digitaler Information.

Einzelheiten der Datenbankarchitekturen, Datenrepositorien oder Dateisystemen, z.B. physische, logische, virtuelle, zentrale oder verteilte Architekturen.

Einzelheiten der Verwaltung der in Datenbanken, Datenrepositorien oder Dateisystemen gespeicherten Daten, z.B. Tuning, Replizierung, Archivierung, Synchronisierung, Nebenläufigkeitskontrolle und Schnittstellen hierfür wie grafische Benutzeroberflächen (GUIs).

Einzelheiten der Optimierung der Speicherung und des Wiederauffindens digitaler Informationen, z.B. Deduplizierung gespeicherter Daten, anwendungsspezifisches Zwischenspeichern und Vorababruf bei Dateisystemen, (verteilten) Datenbanken oder Webbrowsern.

Systeme und Verfahren zum Wiederauffinden von Daten aus strukturierten Datenbanken und zu deren Verwaltung. Beispiele strukturierter Datenbanken sind relationale, objektorientierte, multidimensionale, räumliche, zeitliche und geografische Datenbanken.

Systeme und Verfahren zum Wiederauffinden von semistrukturierten Daten, z.B. Daten im XML-Format oder durch Kommata getrennte Werte.

Systeme und Verfahren zum Wiederauffinden von Text-, Audio-, Bild-, Video- oder Multimedia-Daten aus Datenbanken oder zur Verwaltung von Dokumentenbibliotheken.

Systeme und Verfahren zum Wiederauffinden von Informationen im World Wide Web und zum Durchsuchen des World Wide Webs.

Beziehungen zu anderen Klassifikationsstellen

Inhaltsbasiertes Wiederauffinden von Informationen in Datenbanken, die Mediendaten, z.B. Audio-, Bild- oder Videodaten, speichern. Beinhaltet den Vergleich einer Suchanfrage mit einer entsprechenden Repräsentation der Daten. Die Erzeugung der Suchanfrage und die Repräsentation der Daten kann die Analyse dieser Daten und die anschließende Ermittlung von Low- und High-Level-Merkmalen beinhalten. G06F 16/00 umfasst die Aspekte des eigentlichen Vergleichsprozesses, z.B. eines Ähnlichkeitsabgleichs. Die Analyse und Merkmalsextraktion wird durch G06F 18/00, G06T 7/00, G10H oder G10L abgedeckt, je nach Art der Daten.

Verteilte Repositorien bedingen die Verwendung von Netzwerken zur Datenübertragung. Spezielle Protokolle für den Informationsaustausch, auch auf Anwendungsebene, sind im Allgemeinen unter H04L zu finden.

Einzelheiten der physischen Datenspeicherung befinden sich grundsätzlich in G06F 3/06, G11B oder G06F 12/00.

Die reine Nutzung von Datenbanken in bestimmten Anwendungsbereichen (z.B. Systeme zur Verarbeitung von Verwaltungs- oder Finanzdaten) wird von dem jeweiligen Anwendungsbereich abgedeckt, z.B. G06Q.

Querverweise

Nichteinschränkende Querverweise in anwendungsorientierte Klassifikationsstellen

Konfigurationsmanagement, insbesondere Quellcode-Datenbanken
G06F 8/71
Suche in Quellcode-Datenbanken
G06F 8/71
Fehlerbehebung (Wiederherstellung), Sicherung (Backup), Spiegelung
G06F 11/14
Zugriffskontrolle oder Zugriffssicherheit bei Systemen und Repositorien zum Wiederauffinden von Informationen; Anonymisieren von Abfragen und Datenbankinhalten
G06F 21/00
CAD-Datenbankanwendungen
G06F 30/00
Geschäftliche, finanztechnische und verwaltungstechnische Anwendungen
G06Q 10/00-G06Q 90/00
Bildanalyse
G06T 7/00
Szenen; szenenspezifische Elemente
G06V 20/00
Zeichenerkennung; Erkennung digitaler Tinte; dokumentenorientierte bildbasierte Mustererkennung
G06V 30/00
Erkennung von biometrischen Mustern, sowie Mustern mit Bezug zu Menschen oder Tieren in Bild- oder Videodaten
G06V 40/00
Musikinstrumente; Musikanalyse
G10H
Sprachanalyse
G10L
Biologische Anwendungen
G16B
Chemische Anwendungen
G16C
Medizinische Anwendungen
G16H
Code-Umsetzung und -Kompression
H03M 7/00
Netzwerkprotokolle, Adressierung und Routing
H04L 69/00
Telefonverzeichnisse in Fernsprechsystemen
H04M
Zwischenspeicherung digitaler Bildinformation
H04N 1/21
Fernsehzeitschriften, elektronische Programmführer, Videoverteilung, interaktives Fernsehen, VOD (Video on Demand)
H04N 21/00

Informative Querverweise

Mustererkennung
G06F 18/00, G06V 10/00
Datenverarbeitungssysteme oder -verfahren, besonders angepasst an verwaltungstechnische, geschäftliche, finanzielle oder betriebswirtschaftliche Zwecke, sowie an geschäftsbezogene Überwachungszwecke
G06Q

Spezielle Klassifizierungsregeln

1. Für Dokumente, die sich damit befassen, wie eine bestimmte Art von Daten abgerufen wird oder wie die Datenbank oder das Repositorium für diese bestimmte Art von Daten strukturiert ist, sollte die Klassifizierung im Allgemeinen in der angegebenen Untergruppe für den jeweiligen Datentyp erfolgen und zwar wie folgt:

2. Wenn jedoch mehr als ein bestimmter Datentyp detaillierter beschrieben wird, sollte eine Klassifizierung in jeder der entsprechenden Untergruppen in Betracht gezogen werden.

3. Wenn überhaupt kein bestimmter Datentyp angegeben ist oder ausdrücklich darauf hingewiesen wird, dass der offenbarte Vorgang zum Wiederauffinden beliebiger Datentypen verwendet werden kann, z.B. einer Liste alternativer Datentypen, und im Fall "generischer" Datentypen sind Untergruppen unter G06F 16/90 zu verwenden.

4. Beim Abruf von annotierten Daten/Metadaten kann der für den Abruf verwendete Datentyp sich in manchen Fällen von dem Datentyp unterscheiden, der schließlich abgerufen werden soll, beispielsweise, wenn Textdokumente über zugehörige Bilder wiederaufgefunden werden.

In diesem Fall sollte die Klassifizierung nach dem Ausmaß der zu jedem Aspekt offenbarten Details erfolgen:

Bei Fällen, die beide Aspekte in hohem Maße betreffen, kann eine doppelte Klassifizierung gerechtfertigt sein.

Hinweis: Viele Probleme mit generischen Datentypen gemäß Regel 3 ergeben sich bei Dokumenten, die Abfragesysteme/-verfahren unter Verwendung von Metadaten beschreiben, wobei der Datentyp der letztendlich abgerufenen Daten beliebig ist oder eigentlich keine Rolle spielt. Mit dem oben genannten Vorgehen können diese Dokumente einfach nach dem Datentyp, der für den Abruf verwendet wird, klassifiziert werden und in der Metadaten-Untergruppe nach der Untergruppe für den allgemeinen Datentyp. Eine ähnliche Vorgehensweise kann angewendet werden, wenn man zum Durchsuchen eines Datentyps einen anderen Datentyp verwendet.

Zum Beispiel: das Durchsuchen eines Satzes von Audiodateien anhand der Titel oder der die Audiodateien darstellenden Bilder, soll in "Durchsuchen von Audiodaten" klassifiziert werden. Falls einige interessante Aspekte auch eine Klassifizierung unter dem Durchsuchen anhand von Text bzw. Bildern rechtfertigen, sollte eine doppelte Klassifizierung erfolgen. Auch hier ist die Klassifizierung unter "Durchsuchen von allgemeinen Daten" in Betracht zu ziehen.

G06F 16/00

Definition Statement

This place covers:

Systems and methods for retrieving digital information stored in databases, data repositories or file systems, locally or remotely.

Details of the organisation and preparation of information for use during the retrieving of digital information, e.g. generation of indexing information or query formulation.

Details of data structures used for information retrieval, such as trees, lists or hashing.

Details of query processing and the presentation of query results, e.g. in textual or graphical form on GUIs.

Details of browsing digital information.

Details of architectures of databases, data repositories or file systems, e.g. physical, logical, virtual, central or distributed architectures.

Details of managing data stored in databases, data repositories or file systems, e.g. tuning, replication, archiving, synchronisation, concurrency control and interfaces therefor such as GUIs.

Details of optimising the storage and retrieval of digital information, e.g. de-duplication of stored data, application-specific caching and pre-fetching in file systems, (distributed) databases or web browsers.

Systems and methods for retrieving data from structured databases and for their management. Examples of such structures databases are relational, object-oriented, multidimensional, spatial, temporal and geographical databases.

Systems and methods for retrieving semi-structured data, e.g. XML formatted data or comma separated values.

Systems and methods for retrieving text, audio, image, video or multimedia data from databases or for managing document libraries

Systems and methods for information retrieval from and browsing in the World Wide Web.

Relationships with other classification places

Content-based information retrieval in databases storing media data, e.g. audio, image or video data, involves the comparison of a search query with a corresponding representation of the data. The generation of the search query and the representation of the data can involve the analysis of the data and the subsequent low- and high-level feature extraction. G06F 16/00 covers aspects of the actual process of comparison, e.g. similarity matching. The analysis and feature extraction is covered by G06F 18/00, G06T 7/00, G10H or G10L depending on the type of data.

Distributed repositories involve the use of networks for data transmission. Specific protocols for information interchange, including on the application layer are generally to be found under H04L

Physical data storage details are generally found in G06F 3/06, G11B or G06F 12/00.

The mere use of databases in specific application fields (e.g. administrative or financial processing systems) is covered by the respective application field, e.g. G06Q.

References

Application-oriented references

Configuration management, in particular source code databases
G06F 8/71
Searching in source code databases
G06F 8/71
Error recovery, backup, mirroring
G06F 11/14
Access control or security in information retrieval systems and repositories; Anonymising queries and database content
G06F 21/00
CAD database applications
G06F 30/00
Business, financial and administrative related applications
G06Q 10/00-G06Q 90/00
Image analysis
G06T 7/00
Scenes; Scene-specific elements
G06V 20/00
Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
G06V 30/00
Recognition of biometric, human-related or animal-related patterns in image or video data
G06V 40/00
Musical instruments; music analysis
G10H
Speech analysis
G10L
Biological applications
G16B
Chemical applications
G16C
Medical applications
G16H
Code conversion and compression
H03M 7/00
Network protocols, addressing and routing
H04L 69/00
Telephone directories in telephonic communication systems
H04M
Digital picture intermediate information storage
H04N 1/21
TV guides, electronic programming guides, video distribution, interactive television, VOD (video on demand)
H04N 21/00

Informative references

Pattern recognition
G06F 18/00, G06V 10/00
Data processing systems or methods specially adapted for administrative, commercial, financial managerial or supervisory purposes
G06Q

Special rules of classification

1. For documents dealing with how a given type of data is retrieved or how the database or repository for this particular type of data is organised, classification should generally take place in the indicated subgroup for the data type as follows:

2. If however more than one particular data type is described in some detail, classification under each of the corresponding subgroup should be considered.

3. If no specific data type is indicated at all, or an explicit hint is given that the disclosed mechanism can be used for retrieval of arbitrary data types, e.g. a list of alternative data types, and for "generic" data type use subgroups under G06F 16/90.

4. In the case of annotated data/metadata-based retrieval, the type of data used for the retrieval is sometimes different than the data type to be finally retrieved. E.g. associated images are used to retrieve text documents.

In this case, the classification should be decided according to the level of disclosed details concerning each aspect:

In the cases where both aspects are well covered, double classification can be warranted.

Note: Many problems with generic data types as under rule 3 arise for documents describing querying systems/methods using metadata wherein the data type of the data finally retrieved is arbitrary or doesn't really matter. Using the above approach, these documents can simply be classified under the data type used for the retrieval and in the metadata subgroup under the generic data type subgroup. A similar approach can be applied in case of browsing a data type using a different data type.

For example: browsing a set of audio files by browsing through the titles of the files or through images representing the audio files is to be classified under ''browsing of audio data''. In case some interesting aspects merit also a classification under text, respectively image browsing, this should be covered by double classification. Again, classification under ''browsing of generic data'' has to be considered.