KOM-Konferenztagebuch II: Lernende Mensch-Maschinen

Künstliche Intelligenz, Machine Learning, Deep Learning: Davon hört man viel und weiß selten, was genau gemeint ist und wie diese Technologien funktionieren. Wir bringen zusammen mit Denny Stohr Ordnung ins inhaltliche und begriffliche Chaos. Denny ist Wissenschaftlicher Mitarbeiter am Sonderforschungsbereich MAKI. Er hat die ACM Multimedia in Kalifornien besucht – eine der wichtigsten Konferenzen zum Thema Multimedia. Dort stellte er seine gemeinsame Forschungsarbeit mit Alexander Frömmgen vor.

Denny, was genau versteht man unter Machine Learning?

„Bei Debatten um das Thema fehlt es oft an begrifflicher Schärfe. Eine griffige Aussage darüber, was Machine Learning von der normalen Programmierung unterscheidet, stammt aus dem Jahr 1959. Bereits damals gab es erste Konzepte und Ideen dazu, wie Computer selbstständig lernen können. Arthur L. Samuel – er war in Stanford Pionier im übergreifenden Bereich der künstlichen Intelligenz – beschreibt es so: Machine Learning gives computers the ability to learn without being explicitly programmed.“

Das ist nachvollziehbar, aber trotzdem noch sehr abstrakt. Wie funktioniert Machine Learning konkret, wenn man es auf einen Anwendungsfall bezieht?

„Der große Unterschied zur klassischen Programmierung ist, dass der Computer die Anwendung quasi selbst erzeugt. Er erzeugt sie unter Zuhilfenahme eines Trainingsprogramms, das mit Daten gefüttert wird. Gerade für komplexe Anwendungen, in denen die Algorithmen sehr viele Bedingungen erfüllen müssen, ist das gut. Anschauliche Beispiele finden sich im Bereich der Bilderkennung. Dort ist es nicht möglich, alle Einzelfälle von Hand in den Code zu schreiben. Allein beim einfachen Beispiel der Erkennung einer Katze auf einem Foto ist das sehr schwierig. Schließlich unterscheiden sie sich in etlichen Merkmalen. Die einzigen Gemeinsamkeiten sind vier Beine und ein Schwanz, das ist alles. Hier wird die Bandbreite der Daten von zigtausenden von Fotos genutzt, um Maschinen eben nicht auf konkrete Merkmale zu programmieren, sondern möglichst allgemeine, abstrakte Klassifikationsschemata abzuleiten.“

Und wie funktioniert das Trainingsprogramm selbst?

„Wenn wir uns als Beispiel eine sehr beliebte Methode anschauen, das Deep Learning, dann sind die elementaren Operationen relativ einfach, das ist im Kern Statistik. Das Modell ist der Struktur des menschlichen Gehirns nachempfunden. Zunächst einmal haben wir sehr viele Neuronen die beliebig in mehreren Layern angeordnet werden können. Eine Schicht aus mehreren Neuronen ist ein Layer. In diesen Layern können Neuronen abhängig von bestimmten Schwellenwerten aktiviert werden. Diese Neuronen aktivieren wiederum andere mit eigenen Schwellenwerten. Je mehr Layer desto „tiefer“ ist das Netz. Am Ende sollte dieses Netz ebenso trainiert sein, dass es eine zu lernende Entscheidung zur Folge hat – nicht nur für die gelernten Beispiele, sondern auch für neue unbekannte Eingaben. Genau so, wie wir Menschen das auch können. Diese Art Machine Learning, basierend auf virtuellen neuronalen Netzen, gibt es als Modell schon seit den 1950er Jahren. Aber erst in den letzten zehn Jahren hat sich der Ansatz wirklich durchgesetzt. Ohne entsprechend viele Daten kann das Netz nicht ausreichend abstrahieren. Heute sind solche Daten, z.B. durch die Nutzung von Smartphones und umfangreiche zentrale Speicherung von Inhalten, gegeben: Sensordaten, Bilder, Videos etc. Diese Daten werden zum Training künstlicher neuronaler Netze genutzt. Die Entwicklungskurve, die wir heute im Bereich der künstlichen Intelligenz erleben, ist enorm.“

Was die Nutzerinnen und Nutzer meist nicht wissen: Die Technik ist bereits in sehr vielen alltäglichen Anwendungen zu finden.

„Ja, das wurde mir bei der ACM auch nochmal stark vor Augen geführt. Dort gab es sechs Keynotes und alle waren zum Thema Machine Learning. Google bewirbt die Technologie in fast allen seiner Produkte. Auch nVidia profitiert von Machine Learning, denn ihre Grafikchips eignen sich nicht nur zum Spielen, sondern auch sehr gut für das effiziente Trainieren von Deep-Learning-Anwendungen. Aktuell forschen sie daran, diese Hardware noch kompakter und effizienter zu machen, sodass sie irgendwann im Bereich des Internet of Things genutzt werden kann.“

Da ist viel Resonanzraum für Zukunftsmusik. Was könnte noch kommen in diesem Bereich?

„Das gibt es bereits bei Mobilgeräten: Spracherkennung, das basiert auch alles auf Machine Learning und funktioniert schon sehr gut. Wenn man diese Technologie kostengünstig und omnipräsent bereitstellen kann, sind die Zukunftsszenarien beliebig vielfältig…“

Was war dein eigener Forschungsbeitrag auf der ACM Multimedia in Bezug auf Machine Learning?

„Der wichtigste Schritt beim Machine Learning ist, dass man die richtigen Daten zum Lernen bekommt und vorbereitet. Wir haben gesehen, dass es im Umfeld von adaptivem Videostreaming so viele Algorithmen, Player und Netzwerkeingeschaften gibt, dass nicht immer nur ein Algorithmus der Beste ist. Durch die Vielzahl an Algorithmen und Kontexten, waren präzise vergleiche schwierig. Wir haben danach gefragt, welche Mechanismen in welchem Kontext jeweils am geeignetsten sind. Unser selbstentwickeltes Tool MACI ist in der Lage, diesen ganzen Möglichkeitsraum systematisch zu generieren und zu erfassen.“

Wie funktioniert euer Tool MACI?

„Eine integrierte Analyseplattform erlaubt es uns, durch statistische Analysen relevante Zusammenhänge zu erkennen. Für den Fall des DASH Videostreamings können wir damit sehen, welche Algorithmen genutzt werden sollten, um eine verbesserte „Quality of Experience“ – also subjektiv wahrgenommene Qualität – beim Videostreaming im jeweiligen Kontext zu ermöglichen. Da sehen wir großes Potential für Machine Learning, diese Ergebnisse weiter auszubauen und konkrete, erkennbare Vorteile für Nutzer zu erreichen. Viele Konferenzteilnehmer hatten Interesse, das Tool zu nutzen und das für ihre eigenen Arbeiten zu testen. MACI haben wir inzwischen als OpenSource Projekt auf GitHub veröffentlicht, da wir erkannt haben, dass das systematische analysieren von Systemen, wie bei unserem Videostreaming Arbeit, ein wiederkehrender Prozess in der Forschung ist. Trotzdem gab es hier einfach noch kein Tool das genau diese Anforderungen gut unterstützt hat. Wir denken, dass MACI auch in vielen anderen Bereichen sehr nützlich ist.“

Naiv gefragt: Ist Machine Learning ein Allheilmittel? Die Schattenseiten kann man sich durchaus gut vorstellen.

„Ich sehe es überwiegend positiv, eben durch die vielen möglichen Anwendungsfelder. Man merkt das bereits als Nutzer: Ich kann mittlerweile sehr präzise nach Inhalten, zum Beispiel Katzen, in Bildern und Videos suchen. Das ist aus meiner Sicht ein sehr nützliches Feature. Unklar ist dabei aber, wieso bestimmte Inhalte gefunden oder nicht gefunden wurden: Das Modell ist trainiert, um möglichst gute Ergebnisse zu liefern, aber man weiß nicht, warum es bestimmte Annahmen trifft. Bei Katzenbildern ist es egal, wenn vielleicht besonders niedliche Bilder überrepräsentiert werden. Aber wenn solche Systeme durch einen gezielt herbeigeführten oder erlernten „Bias“ vielleicht bestimme politische Kandidaten im Ranking der Suchmaschine bevorzugen, ist das tatsächlich ein brisantes Thema. Ich denke ein Problem ist, dass die Entwicklung im Moment so schnell geht, dass kaum jemand hinterher kommt – eben ein exponentielles Wachstum. Ich selbst bin von der rasanten Geschwindigkeit auch überwältigt und verweise gern auf den Roman QualityLand von Marc-Uwe Kling. Im Buch wird das in Form einer Dystopie auf die Spitze getrieben.“

Danke für das Gespräch! Ich würde sagen, wir schließen dann mit einem Auszug aus QualityLand.

“Ich hab immer befürchtet, dass die Maschinen eines Tages die Macht ergreifen«, sagt er zu seiner Frau. »Aber dass sie es tun, indem sie sich wählen lassen – damit hab ich nicht gerechnet.«

Denise nickt.

»Ich meine, was kommt als Nächstes? Wahlrecht für Maschinen?«

Denise nickt.

»Bald werden wir uns von Maschinen sagen lassen müssen, was wir zu tun haben!«, ruft Martyn.

Die Stimme des Smart Home meldet sich: »Martyn, dein Blutdruck steigt. Du hast einen anstrengenden Arbeitstag vor dir. Du solltest dich schlafen legen.«

Martyn gibt die einzige Antwort, von der er weiß, dass das System sie akzeptiert: »OK.”

(Auszug aus: Marc-Uwe Kling, QualityLand (dunkle Edition), Ullstein Verlag, 2017)