Forschung – Bild- und Video-Inhaltsanalyse

Im Bereich der Bild- und Video-Inhaltsanalyse ist der Themenschwerpunkt am IENT die Verfügbarmachung von Inhalten aus Multimedia-Material. Die grundsätzliche Idee ist, dass die Menge an verfügbaren Bild- und Videodaten derart groß ist, dass es zum Problem wird, Inhalte wiederzufinden. Aufgrund der Vielfalt und Unterschiedlichkeit der z.B. im Internet verfügbaren Videodaten sind allerdings sehr generelle Verfahren nötig, um interaktive Suche zu unterstützen oder gar eine vollautomatische Suche zu ermöglichen.

Inhaltsbasierte Bildersuche

Ein in den letzten Jahren immer größer werdendes Problem ist die effiziente Suche von Inhalten in stetig wachsenden Multimediadatenbanken, insbesondere auch digitalen Bilddatenbanken.

Ein Ansatz dieses Problem zu lösen liegt in der inhaltsbasierten Bildersuche (engl. Content Based Image Retrieval (CBIR)), bei der eine Beschreibung der Bilder anhand von Merkmalen, die sich direkt aus dem Bildinhalt ergeben, erfolgt. Im Gegensatz zu schlagwortbasierten Verfahren, in denen die Beschreibung des Bildinhaltes durch annotierten Text erfolgt, bieten inhaltsbasierte Verfahren den Vorteil auch bei vollständigem Fehlen von Metainformationen eine Einordnung des Bildinhaltes zu ermöglichen. Ein klassisches Einsatzgebiet eines CBIR-Systems ist die Ähnlichkeitssuche, bei der zu einem gegebenen Bild eine Menge von ähnlichen Bildern in einer Datenbank gefunden werden soll (query by example).

Kompakte Darstellung von lokalen Merkmalsdeskriptoren

Lokale Merkmalsdeskriptoren sind für die Suche in Bilddatenbanken oder für die Bildklassifikation von großer Bedeutung. Der Hauptnachteil ist jedoch, dass ein Bild durch sehr viele hochdimensionale Merkmalsdeskriptoren dargestellt wird. Sollen nun sehr große Datenbanken durchsucht werden oder eine mobile Anwendung lokale Merkmalsdeskriptoren nutzen, kommen schnell Speicher- und Rechenzeitprobleme auf.

Um dieses Problem zu lösen, werden verschiedene Verfahren genutzt, die viele lokale Merkmalsdeskriptoren zusammenfassen und kompakt in einem globalen Deskriptor pro Bild darstellen. Die Schwierigkeit hierbei liegt darin, möglichst viel der in den Deskriptoren enthaltenen Information auch in den kompakten Darstellungen nutzen zu können. Verfahren, die dies ermöglichen sind z.B Bag of Keypoints, Image Signatures und Fisher Vektoren.

Offene Bachelor- und Masterarbeiten

Es ergeben sich immer wieder interessante Themen im Bereich Bild- und Video-Inhaltsanalyse, die im Rahmen von Projekten, Bachelor- und Masterarbeiten bearbeitet werden können. Bei Interesse an diesem Arbeitsgebiet einfach mal bei uns im Büro vorbei schauen und nachfragen. Konkretere Vorschläge finden sich ggf. auch als Aushang im Institut oder auf unserer Homepage unter Bachelorarbeiten bzw. Masterarbeiten.

Kontakt

Für weitere Informationen besuchen Sie bitte die Seiten von Iris Heisterklaus M.Sc. und Abin Jose M.Sc.