1. Juni 2023 | Anmelden
 
 

Annotation & Retrieval

Video­analyse (VID)

Mit Hil­fe der Video­analyse kön­nen wichtige Infor­ma­tio­nen darüber gefun­den wer­den, was in ein­er Szene gezeigt wird. Hier wer­den grundle­gende Bild­in­for­ma­tio­nen extrahiert, sowie eine Seg­men­tierung in Schnitte vorgenom­men. Darauf auf­bauend soll ein möglichst all­ge­meines Ver­fahren entwick­elt wer­den, Objek­te im Videostrom zu ermit­teln. Ziel ist die Iden­ti­fika­tion einzel­ner Objek­te, deren Benen­nung im Anschluss als such­bar­er Index zur Ver­fü­gung ste­ht. Wegen der Vielzahl möglich­er Objek­te kann hier nur exem­plar­isch vorge­gan­gen wer­den. Auf dieser Basis auf­bauend, soll ein Weg gezeigt wer­den, weit­ere Objek­te zu iden­ti­fizieren. Aus­gangspunkt ist dabei die Per­son­e­nent­deck­ung, die wis­senschaftlich schon sehr gut durch­drun­gen ist.

Die existieren­den Ansätze müssen speziell für das ver­wen­dete Mate­r­i­al zugeschnit­ten wer­den. Anschließend wird über­prüft, inwieweit diese Ver­fahren ver­all­ge­mein­ert und auch für andere Objek­te als Gesichter ver­wen­det wer­den kön­nen.

Sprach­analyse (SPR)

Im Gegen­satz zum rein bildlichen Retrieval kann der Ein­bezug der Sprach­analyse nicht nur ermit­teln, was gezeigt wird, son­dern worum es the­ma­tisch geht. Kommt in ein­er Nachricht­ensendung beispiel­sweise ein Bild des säch­sis­chen Land­tags vor, so ist dies durch die Video­analyse dur­chaus ermit­tel­bar, die Sprach­analyse set­zt das Bild in den the­ma­tis­chen Kon­text. Geht es um eine Geset­zesini­tia­tive, die Land­tagswahl, einen Auss­chuss oder einen Skan­dal?

Die ver­schiede­nen Facetten sprach­lich­er Infor­ma­tion wer­den zur Analyse herange­zo­gen. Dies sind die Erken­nun­gen von Schrift, Sprech­ern sowie Gesproch­en­em. Aus der Gesamtheit dieser Infor­ma­tion lassen sich ver­schiedene für das Retrieval wichtige Ele­mente her­ausar­beit­en.

Meta­da­ta Han­dling (MDH)

Die Analyse der Sprach- und Video­dat­en dient im Retrieval­prozess der Beschrei­bung medi­aler Inhalte. Die eigentliche Suche erfol­gt nicht mehr in den Orig­i­nal­dat­en son­dern in den bei der Analyse erstell­ten Meta­dat­en. Auf­gabe des Bere­ichs Meta­dat­en Han­dling ist es, die Meta­dat­en in ein­er sin­nvollen Weise bere­itzustellen. Es wird ein API-Frame­work definiert, das den kom­plet­ten Umgang mit den Meta­dat­en in Grundzü­gen regelt. Fern­er wird ein Schema erstellt, welch­es den Auf­bau der Meta­dat­en beschreibt.

Für die Ver­wal­tung der Meta­dat­en wer­den XML-basierte Tech­nolo­gien wie MPEG‑7 und XQuery herange­zo­gen. Ziel ist die Behand­lung grund­sät­zlich­er Prob­leme bei der Mod­el­lierung medi­aler Retrieval­maschi­nen.

 
 
Projektgeber
Projektnehmer
Technische Universität Chemnitz sachsMedia ist eine Initiative der Professur Medieninformatik der TU Chemnitz
Kontakt
Dipl.-Inf. Jens Kürsten
Technische Universität Chemnitz
Fakultät für Informatik
Professur Medieninformatik
Straße der Nationen 62
09111 Chemnitz