Was Sie über Maschinelles Lernen wissen sollten

Wie erkennen wir auf einem Foto eine Katze? Dieses scheinbar einfache Problem ist schwierig als Algorithmus zu fassen (© phonlamaiphoto | fotolia.de | icons8.com)

In den vergangenen Monaten hat unser Gastautor Dr. Gero Presser mit einer Vielzahl von Entscheidern über Künstliche Intelligenz im Allgemeinen und Maschinelles Lernen im Besonderen diskutiert. Mehrere dieser Führungskräfte waren von ihren Investoren gefragt worden, wie ihre Strategie in Hinblick auf Maschinelles Lernen aussehe und wo es bereits eingesetzt würde. Wie kommt es, dass dieses vormals technische Thema plötzlich die Führungsetagen von Unternehmen erreicht hat?

Autor: Dr. Gero Presser

Computer sollen Aufgaben für Menschen lösen. Der traditionelle Ansatz ist, das gewünschte Vorgehen zu „programmieren“, also dem Computer einen passenden Algorithmus zur Problemlösung beizubringen. Der Algorithmus ist eine kleinteilige Beschreibung des Vorgehens, ähnlich einem Kochrezept. Es gibt viele Aufgaben, die durch einen Algorithmus ausgezeichnet beschrieben werden können. Wir alle haben zum Beispiel in der Grundschule Algorithmen für das Addieren von Zahlen gelernt. In der fehlerfreien und schnellen Ausführung solcher Algorithmen sind Computer den Menschen deutlich überlegen.

 

Machine Learning

 

Dieses Vorgehen stößt allerdings an Grenzen. Wie erkennen wir auf einem Foto eine Katze? Dieses scheinbar einfache Problem ist schwierig als Algorithmus zu fassen. Halten Sie einen Moment inne und versuchen Sie es. Selbst triviale Schritte wie „hat vier Beine“ oder „hat zwei Augen“ haben ihre Tücken, da häufig Teile verdeckt sind oder das Foto nur einen gewissen Ausschnitt darstellt. Ein Bein oder ein Augae zu erkennen ist zudem für sich genommen genauso schwierig, wie eine ganze Katze zu erkennen.

Genau hier liegt die Stärke des Maschinellen Lernens. Wir entwickeln keinen Algorithmus für die Problemlösung, sondern überlassen es dem Computer, diesen Algorithmus selbständig anhand von Beispielen zu erlernen. Wir sagen dem Computer nicht mer genau, was er zu tun hat, sondern trainieren ihn. Bei unserem Katzenbeispiel könnte dies bedeuten, dass wir das System mit vielen Fotos trainieren und jeweils dazu vermerken, ob dies eine Katze abbildet. Hierdurch reift der Algorithmus, bis er schließlich auf bislang unbekannten Bildern Katzen erkennt.

Machine Learning

Tatsächlich lernen Computer hierbei üblicherweise keine klassischen Programme, sondern Parameter innerhalb eines Modells, zum Beispiel Kantengewichte innerhalb eines Netzwerkes. Dieses Prinzip ist durchaus vergleichbar mit dem Lernprozess in unserem Gehirn (soweit wir diesen verstehen), bei dem Verbindungen zwischen Nervenzellen angepasst werden. Analog zum Gehirn und im Gegensatz zu einem klassischen Programm lässt sich dieses Netzwerk mit seinen Kantengewichten allerdings kaum von Menschen interpretieren.

 

Neuronales Netzwerk

In diesem Kontext hat sich eine spezielle Klasse von Lernverfahren für künstliche Neuronale Netze als besonders erfolgreich erwiesen, das sogenannte Deep Learning. Deep Learning ist eine Form des Maschinellen Lernens, welches wiederum eine Teildisziplin der Künstlichen Intelligenz ist, einem wichtigen Forschungszweig der Informatik. Bereits 2012 hat sich ein Netzwerk aus 16.000 Computern bei Google anhand von 10 Millionen Bildern aus Youtube-Videos darauf trainiert, Katzen (und andere Objektklassen) erfolgreich in Bildern zu erkennen. Als Verfahren wurde hierzu Deep Learning eingesetzt.

 

Deep Learning

 

Viele praxisrelevante Probleme fallen eher in die Kategorie „Katze erkennen“ als „Zahlen addieren“. Sie lassen sich also nur unzureichend durch einen Algorithmus lösen, den Menschen aufschreiben können. Häufig geht es darum, in Daten ein Muster zu erkennen, zum Beispiel Objekte in Bildern, Text in Sprache oder ein potenzieller Betrugsversuch in Transaktionsdaten.

Ein einfaches und häufiges Praxisbeispiel ist die vorausschauende Wartung (Predictive Maintenance). Stellen Sie sich vor, dass viele Sensoren Datenströme liefern und gelegentlich eine Maschine ausfällt. Die Herausforderung besteht dann darin, das Muster in den Datenströmen zu erlernen, das letztlich den Ausfall ankündigt. Künftig wird dieses Muster frühzeitig erkannt; der Ausfall der Maschine kann verhindert werden.

Das Prinzip des Maschinellen Lernens ist nicht neu. Dennoch erlebt es gerade jetzt einen Siegessturm. Hierzu tragen drei wesentliche Faktoren bei: Einerseits sind die großen Datenmengen verfügbar, die für die Anwendungen und das Trainieren erforderlich sind. Andererseits haben wir eine enorme Rechenleistung, insbesondere durch die Cloud. Und drittens haben diverse Open-Source-Projekte dazu geführt, dass die Algorithmen quasi jedermann zur Verfügung stehen.

Machine Learning

Maschinelles Lernen ersetzt nicht die klassische Programmierung, sondern ergänzt sie: Sie liefert Werkzeuge, um eine wichtige Klasse von Problemen zusätzlich zu adressieren, die bislang nur schwer oder gar nicht zu beherrschen waren. Insgesamt ergeben sich hierdurch neue Möglichkeiten, und auch bestehende Systeme werden zunehmend um Funktionen auf Basis des Maschinellen Lernens ergänzt.

Ein typisches Beispiel sind wiederkehrende Tätigkeiten, die Mustern folgen. Denke Sie an ein Computerprogramm mit hunderten Funktionalitäten, die über viele Menüs kompliziert zur Verfügung gestellt werden, von denen Sie im Alltag aber nur wenige wirklich aktiv verwenden. Hier kann ein Computer durch Beobachtung lernen, was Sie üblicherweise als nächstes tun und Ihnen dies prominent anbieten. So macht die Maschine Sie letztlich produktiver. Oder denken Sie an die Zuordnung und Transformation von Daten (zum Beispiel im Rahmen von sogenannten ETL-Jobs zur Befüllung eines Data Warehouses): Indem der Computer wiederkehrende Daten und Objekte „lernt“, können viele Schritte automatisiert und beschleunigt werden.

Vielfältige Anwendungen

Weitere Beispiele findet man in fast jedem Bereich: Lerninhalte können adäquate auf den individuell Lernenden zugeschnitten werden (speziell innerhalb von „Massive Open Online Courses“, den MOOCs). Krankheiten können frühzeitigt erkannt werden, ebenso die geeignete Zielgruppe für das Online-Marketing, Kundenabwanderungen oder Probleme mit der Datenqualität. Last but not least ermöglicht Maschinelles Lernen, Profile auf einer Partnerbörse zu matchen.

(Exkurs: Als technische Infrastruktur im Umfeld von Big Data hat sich das Machine-Learning-Framework Spark – in Kombination mit Hadoop –  mit seinen ausgereiften Werkzeugen etabliert. Diesen Ansatz verfolgt auch der IT-Dienstleister Talend, abstrahiert aber eine Ebene weiter durch die Modellierung von Jobs (sowohl für das Trainieren als auch den späteren Einsatz in Produktion). Die Modellierung reduziert die Komplexität und führt gleichzeitig zu einer gewissen Unabhängigkeit von den zugrunde liegenden Technologien, die sich immer noch schnell verändern und für die Experten nur sehr schwierig zu finden sind.)

Die Details der Algorithmen aus dem Bereich des Maschinellen Lernens müssen nur wenige Spezialisten im Detail begreifen. Hingegen ist es fürs Management grundsätzlich vorteilhaft, das Konzept zu verstehen, wie Maschinen aus Beispielen Muster lernen und auf neue Daten anwenden können. Letztlich vergrößert sich damit die Klasse der Probleme, die wir maschinell adressieren und automatisieren können. Es geht um Entscheidungen, die automatisiert werden können.

Fazit: Ich würde mich freuen, wenn Sie folgendes „Bild“ aus diesem Beitrag mitnehmen: Computer können mittlerweile nicht nur klaren Vorschriften folgen (denken Sie an die Addition von Zahlen) sondern auch aus Beispielen lernen (denken Sie an die Erkennung von Katzen und das Training anhand von Beispielbildern). Je nach Herausforderung ist die eine Vorgehensweise besser geeignet als die die andere. Beide können beliebig kombiniert werden und führen insgesamt zu mehr und neuen Möglichkeiten in der Automatisierung.

Hinweis: Dieser Artikel ist in geringfügig anderer Fassung ursprünglich im Blog des Softwareherstellers Talend erschienen..

Autor

Dr. Gero Presser ist Mitgründer und geschäftsführender Gesellschafter der QuinScape GmbH mit Sitz in Dortmund. Das 2001 gegründete Unternehmen beschäftigt über 100 Mitarbeiter und ist spezialisiert auf die Themen Apps und Portale sowie Integration und Analytics.

Kontakt:

Xing
LinkedIn