Direkt zum Inhalt
Symbolfoto: Das AIT ist Österreichs größte außeruniversitäre Forschungseinrichtung

Multi-Modal Artificial Intelligence

Multimodale künstliche Intelligenz

Die Definition von Intelligenz ist vielfältig, und das gilt auch für die Definition von künstlicher Intelligenz. Die meisten Mainstream-Lösungen für künstliche Intelligenz (KI) vereinfachen jedoch eine Aufgabe zu einem Problem des maschinellen Lernens unter Verwendung einer einzelnen sensorischen Modalität wie Bilder oder Videos. Dadurch werden relevante Informationen wie die Audioebene von Videos oder der Text von Dokumentenbildern vernachlässigt. Hier am AIT konzentrieren wir uns auf die komplexe Aufgabe, Informationen aus mehreren Modalitäten zu nutzen und zu kombinieren, um kognitive KI-Systeme auf höherer Ebene zu entwickeln. Diese Systeme lernen aus der Korrelation von z.B. Audio- und visuellen Ereignissen und liefern fortgeschrittene Modelle, z.B. für sicherheitsrelevante Anwendungen. Durch die Nutzung multimodaler Korrelationen reduziert multimodale KI den Bedarf an manuellen Kommentaren weiter. Wir setzen multimodale KI-Lösungen in vielen unserer Anwendungen ein, z. B. in der vorausschauenden Wartung oder der öffentlichen Sicherheit.