57 |
Zusammenfassung |
AB |
[DE] Verfahren zum Abspeichern von Suchmerkmalen einer Bildsequenz, die Toninformation umfasst, und Zugriff auf eine Bildfolge, die eine echte Teilmenge der Bildsequenz ist. Um in einer Bildsequenz, die Toninformation umfasst, gezielt suchen zu können, werden Suchmerkmale aus der Toninformation mittels eines Spracherkenners ermittelt. Auch die Eingabe eines zu suchenden Begriffs kann über gesprochene Sprache erfolgen. Suchmerkmale sind alternativ einzelne Worte einer vorgegeben Sprache oder Phoneme/Phonemkombinationen. Mit diesem Verfahren können Bildsequenzen anhand ihrer Toninformation automatisch indiziert werden. [EN] The invention relates to a method for storing search parameters of an image sequence and accessing an image that is a true subset of the image sequence. Said image sequence contains audio information. In order to be able to selectively search within an image sequence containing audio information, search characteristics are determined from the audio information by means of voice recognition. A concept which is to be searched can be inputted by means of spoken language. Search characteristics are either single words of a predetermined language or phonemes/phoneme combinations. The inventive method thus enables image sequences to be automatically indexed with their audio information. [FR] L'invention concerne un procédé pour la mémorisation des paramètres de recherche d'une séquence d'images, laquelle comprend des informations audio, et l'accès à une suite d'images qui est un sous-ensemble réel de la séquence d'images. Afin de pouvoir effectuer des recherches appropriées dans une séquence d'images comprenant des informations audio, des paramètres de recherche issus des informations audio sont déterminés au moyen d'un élément de reconnaissance vocale. Même l'introduction d'un concept devant faire l'objet de recherches peut s'effectuer par message parlé. Les paramètres de recherche sont soit des mots individuels d'un message prédéfini, soit des phonèmes/des combinaisons de phonèmes. Ce procédé permet d'indexer automatiquement des séquences d'image à l'aide de leurs informations audio. |
56 |
Entgegengehaltene Nichtpatentliteratur/Zitate, in Recherche ermittelt |
CTNP |
"CORRELATING AUDIO AND MOVING-IMAGE TRACKS", IBM TECHNICAL DISCLOSURE BULLETIN,ISSN 0018-8689, vol. 33, no. 10A, 1 March 1991 (1991-03-01), USA, pages 295/296, XP000110048 7; HAUPTMANN A G: "SPEECH RECOGNITION IN THE INFORMEDIA DIGITAL VIDEO LIBRARY: USES AND LIMINATIONS", PROCEEDINGS OF THE 7TH. INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE, HERNDON, VA., NOV. 5 - 8, 1995, no. CONF. 7, 5 November 1995 (1995-11-05), INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, pages 288 - 294, XP000598376 7; SHANDLE J: "DIGITAL AUDIO DELIVERS NON-STOP INNOVATIONS SPEECH AND MUSIC KEEP PUSHING THE FRONTIERS OF COMPUTING ACROSS TECHNOLOGIES INCLUDING COMPRESSION, SYNTHESIS, AND SPEECH RECOGNITION", ELECTRONIC DESIGN, vol. 41, no. 22, 1 November 1993 (1993-11-01), CLEVELAND, OH, US, pages 53/54, 56 - 58, 60, 64 - 66, XP000408631 7; WACTLAR H D ET AL: "AUTOMATED VIDEO INDEXING OF VERY LARGE VIDEO LIBRARIES", SMPTE JOURNAL, vol. 106, no. 8, August 1997 (1997-08-01), pages 524 - 528, XP000698604 7; XUEDONG HUANG ET AL: "THE SPHINX-II SPEECH RECOGNITION SYSTEM: AN OVERVIEW", COMPUTER SPEECH AND LANGUAGE, vol. 7, no. 2, 1 April 1993 (1993-04-01), LONDON, GB, pages 137 - 148, XP000382200 7
|