Künstliche Intelligenz aus Kärnten macht Videos smart

30.05.2022

Wie in Textdokumenten sind auch in Videos meist nur bestimmte Passagen relevant. Eine Software aus Kärnten macht Inhalte in Videos durchsuchbar.

Dieser Artikel ist älter als ein Jahr!

Videos sind allgemein beliebt. Sie fassen oft komplexe Inhalte auf einfache Art und Weise zusammen und bieten auch unterhaltsame Zusatzinformationen. Studien zeigen, dass der Konsum von Online-Videos in den vergangenen Jahren stark gestiegen ist. Besonders jüngere Generationen erwarten, Informationen auch in Videoform bereitgestellt zu bekommen. Laut einer deutschen Untersuchung aus dem Jahr 2018 produzieren und konsumieren besonders Millennials – also die Generation, die im Zeitraum der frühen 1980er-Jahre bis zu den späten 1990ern geboren wurde – mehr Web-Videos als je zuvor.

Im Zuge dieser Entwicklung setzen auch immer mehr Unternehmen und Organisationen auf videobasierte Informationen. Mit Inhalten, Schulungen, Anleitungen oder Webinaren in Bewegtbildern können sie nicht nur die Bindung zu bestehenden Interessent*innen stärken, sondern auch neue Zielgruppen erreichen.

Videos durchsuchen

Mit der zunehmenden Masse an erzeugten Videos verlieren Unternehmen aber auch schnell den Überblick über die darin enthaltenen Inhalte, weiß Christian Tautschnig, CEO des Kärntner Unternehmens Streamdiver. „In einem Textdokument interessieren mich nur gewisse Bereiche. Das gleiche Bedürfnis besteht auch beim Video“, sagt er gegenüber der futurezone. Anders als bei digitalen Textdokumenten sind relevante Passagen in Videos aber nicht durchsuchbar.

Das will Streamdiver ändern. Für einen roten Faden in diesem Informationsdschungel sorgt das System Smart Digital Video. Betriebe, Organisationen und die öffentliche Hand sollen damit das maximale Potenzial ihrer digitalen Videos ausschöpfen und ihre Videoinhalte besser durchsuchbar und vermittelbar machen können.

Christian Tautschnig — CEO von Streamdiver

© Streamdiver GmbH

KI erkennt Dialekte

Im Zentrum des unlängst mit dem Kärntner Forschungspreis prämierten Systems steht die automatische Transkription von Gesprächsinhalten aus digital aufgezeichneten Videos. Die Lösung basiert auf einer hauseigenen künstlichen Intelligenz (KI), welche unterschiedliche Dialekte erkennt, auswertet und für Wortprotokolle oder Untertitel ins Hochdeutsche umwandelt. „Wir haben jetzt schon sehr gute Erfahrungswerte mit kärntnerisch, steirisch und tirolerisch“, erzählt Tautschnig. Herausfordernd sei hingegen derzeit noch vorarlbergerisch – hier brauche es noch mehr Daten.

Durch maschinelles Lernen könne sich die künstliche Intelligenz auch rasch an die sprachlichen Besonderheiten einer bestimmten Gemeinde oder Region anpassen. Dadurch könne eine dialektbehaftete Sprache laut Tautschnig mit einer höheren Genauigkeit wiedergegeben werden als bei anderen Transkriptionsmöglichkeiten, die es aktuell am Markt gibt.

Videos Wort für Wort durchsuchen

Mit der KI-gestützten Transkription erhalten Anwender*innen aus ihrem Video aber nicht nur ganze Wortprotokolle – um die jeweiligen Informationen zielgerichtet aufzufinden, können sie jedes Video auch Wort für Wort durchsuchen – so wie ein digitales Textdokument auch. „Bei der Lösung geht es darum, ein Video vollinhaltlich zu erschließen und mehrere Informationen daraus zu ziehen. Denn in einem Video stecken auch Informationen in bildlicher Form, die mit Textstellen in Zusammenhang stehen“, so Tautschnig.

So kann die KI etwa auch Sprecher*innen, Objekte und Aktivitäten, die für die Wissensvermittlung relevant sind, in einem Video identifizieren und automatisch den ausgewerteten Textabschnitten zuweisen. Für einen besseren Überblick kann die gesprochene Sprache auch auf Themenschwerpunkte analysiert werden und diese Inhalte in anderen Videos auffindbar gemacht werden.

Generell soll der Informationsaustausch und Wissenstransfer vereinfacht und den Anwender*innen Zeit bei der Bereitstellung der Inhalte erspart werden. „Ziel ist es, Unternehmen und Organisationen zu befähigen, die richtige Information zur richtigen Zeit an die richtige Zielgruppe zu bringen“, erzählt der Streamdiver-CEO. Das System kann beispielsweise bei Gemeinderatssitzungen zur Anwendung kommen und Bürger*innen relevante Sitzungsinhalte in Videos zur Verfügung stellen.

Stetige Weiterentwicklung

Das System wurde mit Unterstützung des Kärntner Wirtschaftsförderungs Fonds, der Österreichischen Forschungsförderungsgesellschaft (FFG) und der TU Graz entwickelt. Laut Tautschnig wurde eineinhalb Jahre daran geforscht. „Wir entwickeln das System aber permanent weiter“, sagt er. So sollen immer mehr Funktionen einen Mehrwert bieten und die Arbeit mit Videomaterial einfacher gestalten.

Vor ihrer Markteinführung wurde die Lösung in drei Kärntner Gemeinden getestet. Zu den Nutzern zählen inzwischen etwa die Österreichische Post, das Land Kärnten, mehrere Gemeinden, aber auch kleinere Unternehmen.

Diese Serie erscheint in redaktioneller Unabhängigkeit mit finanzieller Unterstützung der Forschungsförderungsgesellschaft (FFG).

Künstliche Intelligenz erkennt Störgeräusche im industriellen Umfeld

Ob Maschinen und Anlagen im industriellen Umfeld erwartungsgemäß funktionieren, ist oft nicht direkt sichtbar. Dort, wo optische Testmethoden versagen, kann allerdings die Analyse akustischer Signale dienen. Denn unterschiedliche Geräusche lassen auf die Funktionalität der Maschinen und Komponenten schließen und geben einen Hinweis darauf, ob der Produktionsprozess reibungslos verläuft. Die frühzeitige Erkennung von Störgeräuschen kann somit maßgeblich zur Qualitätskontrolle beitragen.

Sind abweichende Geräusche hörbar, müssen in der Regel Ingenieur*innen den jeweiligen Fehler ausfindig machen. Wird dieser nicht oder zu spät erkannt, kann es zu teuren Ausfällen in der Produktion kommen. Die Reparatur kostet zusätzlich Zeit und Geld.

KI sammelt akustische Daten

Damit Produktions- und Fertigungsprozesse möglichst störungsfrei ablaufen, hat Porsche Digital ein auf einer künstlichen Intelligenz basiertes Geräuschprüfungssystem namens Sounce entwickelt. Das System besteht aus Sensoren, welche am jeweiligen Prüfstand verbaut sind. Die künstliche Intelligenz sammelt dabei akustische Daten aus unterschiedlichen Quellen und wertet diese aus.

Auf Basis dieser gesammelten Daten wird ein Deep-Learning-Algorithmus trainiert. Bei einem Fehler erkennt die künstliche Intelligenz abweichende Störgeräusche somit automatisch und in Echtzeit. Ihre Resultate werden in einer Webanwendung zusammengeführt, analysiert und visualisiert. So sind sämtliche Fehler einer Anlage auf einem Blick sichtbar und können umgehend behoben werden. Unter anderem in der Automobilindustrie soll das System für einen reibungslosen Produktionsprozess sorgen.

Mehr zum Thema

Focused woman wearing headphones using laptop, writing notes

Start-ups

Kommentare

Wir würden hier gerne einen Outbrain Feed zeigen. Leider haben Sie uns hierfür keine Zustimmung gegeben. Wenn Sie diesen anzeigen wollen, stimmen sie bitte Outbrain UK Ltd zu.