Machine Learning für Anfänger

Machine Learning für Anfänger

 Machine Learning, Deep Learning, AI… das ist zurzeit in aller Munde. Aber worum geht es bei Machine Learning überhaupt und wofür kann es gut sein? Wir haben einen freiberuflich arbeitenden AI und Machine Learning Experten gefragt uns das komplizierte Thema etwas näher zu bringen. Jonathan Prom Scharff arbeitet gerade an seinem eigenen Projekt mit dem Ziel den nationalen Energieverbrauch mithilfe der neuesten Erkenntnisse aus dem Machine Learning zu verringern. Als Machine Learning Berater ist Jonathan auch für Projekte in anderen Wirtschaftssektoren verfügbar.

 

1. Wie nutzen Betriebe heutzutage Machine Learning und wie schnell entwickelt sich die Technik momentan?

Das ist die häufigste Frage, um die sich Konferenzteilnehmer aus der Wirtschaft in diesem Feld kümmern. Typischerweise folgt dann ein Bild, das sagt AI ist ähnlich revolutionär wie die Einführung des elektrischen Stroms und Zitate aus einem McKinsey-Bericht die behaupten das ein Großteil der Aufgaben im Betrieb in der Zukunft automatisiert werden. Der Sprecher wird dann die Zuhörer mit ernstem Blick fixieren und ausrufen „Wenn Sie jetzt nicht handeln dann werden Sie von der Entwicklung überrollt werden“. Während es sich dabei um eine gute Verkaufstaktik handelt, fast nichts motiviert Leute so wie Angst, ist meine persönliche Erfahrung in der täglichen Arbeit mit AI etwas anders. Ja Google, Facebook und ähnliche nutzen Machine Learning in großem Maß und ja viele Arbeitsaufgaben werden automatisiert werden aber es ist meine Erfahrung das die meisten Großunternehmen Machine Learning nur sehr begrenzt anwenden. Wenn tatsächlich Machine Learning angewendet wird dann in einer sehr einfachen Form, die beinahe nicht funktionsfähig genannt werden kann oder auf eine sehr komplexe Art und weise die nicht wirklich gut funktioniert.

Entweder hat ein Praktikant schnell etwas zusammengeschustert oder die Firma hat eine Gruppe von Akademikern angeheuert, die Ihre High-Tech Lösungen aus der Wissenschaft neu im Betrieb aufgebaut haben. Beide Szenarien führen selten zum Erfolg. Warum das erste Szenario nicht funktioniert ist klar und beim zweiten Szenario ist das Problem, dass Theorie und Praxis oft im Konflikt miteinander liegen.

Es geht darum die richtigen Daten zu bekommen (Garbage in – Garbage out gilt auch hier, da kann das System noch so gut sein) und diese daten dann mit den bereits bestehenden und gut erprobten Werkzeugen für Machine Learning zu kombinieren.

Fasen wir zusammen, Machine Leanring wird wohle einen großen Einfluss auf die Arbeitsablaeufe in Ihrem Betrieb haben aber von einigen Ausnahmen mal abgesehn gehen die Veränderungen in der Arbeitsweise noch recht langsam von statten. Die Industrie revolutionaer zu veraendern ist recht schwer, selbst wenn die Startups genau wuessten was sie tun muessten um Machine Learning erfolgreich anzuwenden fehlt ihnen oft der Zugang zu qualitativ hochwertigen Daten.

2. Wenn dem so ist wo leistet den Machine Learning heute schon einen Beitrag zur Wertschöpfung?

Die Antwort auf diese Frage wird wohl sehr stark davon abhängen wen Sie fragen. Ich persönlich denke das Machine Learning beginnt einen wichtigen Beitrag zu leisten, wenn es darum geht recht “einfache“ Arbeitsschritte zu automatisieren. Der Schlüssel bei der Bewertung ob ein Arbeitsvorgang von Machine Learning profitieren kann, ist ob der Vorgang in bestimmte gut definierte Schritte aufgeteilt werden kann.

Nehmen wir einmal an Sie wollen die Entscheidung ob ein Kunde eine bestimmte Versicherung bekommt automatisieren. Das könnte man in ein klar definiertes Set an Parametern aufteilen deren Werte entscheiden ob eine Versicherung vergeben wird oder nicht. Mit so einem Set an Paramatern kann ein Machine Learning Prozess mit großer Wahrscheinlichkeit erfolgreich implementiert werden.

Wenn Sie nun aber andererseits die Aufgabe haben: Formen Sie aus diesen Datenpunkten einen Versicherungsvertrag, dann ist es beinah unmöglich diesen Job mit Machine Learning zu automatisieren. Es ist aber meine Erfahrung das solche kompliziert erscheinenden Aufgaben oft in kleinere weniger komplizierte gut zu definierende Unteraufgaben aufteilen, wenn man bereit ist ein paar Kompromisse einzugehen. Zum Beispiel können wir sagen, anstatt das unsere Machine Learning Prozess den ganzen Vertrag schreiben soll, lassen wir ihn doch einfach zwischen 7 Standardverträgen entscheiden. Der nächste Schritt wäre dann die richtigen Zahlenwerte für einige Felder in diesen Verträgen zu berechnen.

Auf diese Art haben wir das komplexe Problem in gut zu managende unteraufgaben aufgeteilt und haben jetzt einen großen Teil der Arbeit automatisiert. Die Hauptaufgabe ist hier zu sehen ob der Prozess in eine klar zu beantwortende Kernfrage übersetzt werden kann, wie: Welcher dieser sieben Verträgen ist der passende? Was sollte der Preis für die Versicherung unter diesen Umständen sein. Außerdem ist es meiner Meinung nach wichtig nicht eine zu großen Teil des Arbeitsablaufs zu automatisieren. Meist ist die Situation so das recht einfach 70-80% der Arbeit automatisiert werden können ohne den menschliche Faktor vollkommen herauszunehmen. Mehr ist meist nicht sinnvoll denn die Automatisierung der letzten 20-30% ist oft übermäßig teuer und kann dazu noch fehleranfällig sein.

3. Erklären sie uns das Machine Learning doch mal an einem konkreten Beispiel.

Ok, stellen Sie sich einmal vor Sie sind Richter und möchten Ihre Arbeit automatisieren. Das geht recht einfach denn wen kümmern schon die Kriminellen. Das Problem bei der Automatisierung der Bestrafungen ist aber das es hier für jede Regel eine Ausnahme gibt. Falls ich also ein Programm schrieb will das Straftäter automatisch verurteilt muss ich unglaublich viel coden um alle Eventualitäten in Betracht zu ziehen. Und jede kleine Änderung der Gesetze würde das Programm wieder nutzlos machen.

Was aber nun, wenn wir den Computer unseren Code schreiben lassen anstatt das selber zu machen. Könnten wir nicht einfach alle Gerichtsentscheidungen mit den Akten der Straftäter in unseren PC eingeben und dann den Rechner die Regeln herausfinden lassen? Ja das ist möglich und das ist es was wir gemeinhin Machine Learning nennen. Wir können uns das Machine Learning als eine Reihe von Algorithmen vorstellend, die lernen observierte Verhaltensweisen kopieren. Im Falle eines automatischen Richters würden wir also alle Fälle und die Urteilssprüche zusammenstellen. Diese Fälle aus der Vergangenheit wären dann die observierte Verhaltensweise und der Machine Learning Prozess würde versuchen ein ausgefeiltes Regelsystem zu entwerfen das die Entscheidungen des Richters aus den früheren Fällen kopiert.

Was würde nun passieren, wenn wir das in echten Leben ausprobieren? Es wurde sogar schon in den Vereinigten Staaten getestet. Das erste Problem, das aufkam, wenn man den AI-Richter benutzte war ein leichter Rassismus in den Verurteilungen. Das war das Ergebnis der historisch härteren Bestrafung schwarzer Straftäter aus den Daten. Der AI-Richter folgte diesem Trend. Wir sehen also das eine Machine Learning Algorithmus ebenfalls von menschlichen Vorurteilen beeinflusst werden kann. Wie können wir jetzt diesen Effekt aus den Ergebnissen des Machine Learning Prozesses entfernen. Hier wird Machine Learning von einer Wissenschaft mehr zu einer Kunst. Wir müssen unsere daten etwas manipulieren um das richtige Ergebnis zu erhalten. Entweder nehmen wir die Datenpunkte heraus die zu den falschen Ergebnissen führen oder wir befähigen den Algorithmus zu erkennen wann ein Urteil rassistisch ist. Die beste Lösung wäre für diesen Fall die Hautfarbe aus den Datensatz zu entfernen, Man fragt sich warum Sie überhaupt von Relevanz in einem Datensatz zu Gerichtsurteilen ist.

4. Welchen Algorithmus empfehlen Sie zur Erstellung unseres AI-Richters?

Wir haben nun also unseren Datensatz mit all den Urteilen und Strafen, die wir miteinbeziehen wollen in unserem Datensatz. Sie sind nun bereit Ihren AI-Richter in Betrieb zu nehmen. Viele würden zuerst daran denken neuronale Netzwerke zu verwenden einen Unterbereich des Machine Learning der seit kurzem auch als Deep Learning bekannt ist. Meiner Meinung nach kann ein unerfahrener Nutzer aber einen guten Erfolg mit einer recht mondän klingenden Methode namens Gradient boosting decision trees.

Abseits von Machine Learning Wettbewerben kennt kaum einer die Boosting-Technik aber mit Ihrem schlanken Aufbau und geringen Ressourcenbedarf hat diese Technik großen Erfolg in Wettbewerben erzielt.

5. Wird Deep Learning also vollkommen überschätzt?

Gute frage, Sie denken sicher: “Warum redet jeder über Deep Learning? Die können doch nicht all3 inkompetent sein?“ Die einfache Antwort auf diese Frage hat mit etwas zu tun, was unstrukturierte Daten genannt wird. Wenn Sie einen Datensatz aus historischen Fällen bauen, dann wird dieser eine gewisse Struktur haben. Das bedeute Sie werden eine Tabelle mit Kategorien wie Vorstrafen, Rasse, schwere der Schuld und so weiter zusammenstellen. Fuer jeden Fall notieren Sie dann die entsprechende Werte in der Tabelle.

Schließlich haben Sie eine Tabelle, in der jede Reihe für einen Fall steht. Diese Daten werden dann in den Machine Learning Algorithmus gefüttert, der dann lernt die Daten aus der Geschichte mit den erteilten Strafen zu verbinden. Nun haben wir das Problem, dass es manchmal schwer ist due Daten in Tabellenform zu bringen besonders wenn es sich um Bilder oder Texte handelt. Während Menschen recht einfach Gegenstände in eine Bild erkennen, fällt das dem Machine Learning Algorithmus recht schwer. Zumindest bevor dem Aufkommen von Deep Learning, welches die Fähigkeiten von Machine Learning Bilder und Texte zu interpretieren vollständig verändert hat. Deep Learning funktioniert natürlich auch bei strukturierten Daten aber für diese Art Daten existieren viel einfachere Methoden, die vergleichbare Ergebnisse liefern.

5. Was empfehlen Sie als Startpunkt für jemanden der sich für Machine Learning interessiert?

Ob Sie es glauben oder nicht, der Einstieg ins Machine Learning ist recht einfach. Es gibt ein paar wundervolle Einsteigerkurse, mit denen Sie professionelle Ergebnisse erhalten, völlig kostenlos bei course.fast.ai. Diese Kurse konzentrieren sich meist auf Deep Learning aber bald wird es auch Kurse geben, die sich auf traditionellere Methoden beziehen. Ein andere guter Startpunkt ist kaggle.com, hier teilen Machine Learning Experten Ihre Lösungsansätze aus Machine Learning Wettbewerben.

Kann AI Ihrem Unternehmen weiterhelfen? Holen Sie sich die Hilfe eines externen Experten.

Sollten Sei auf der Suche nach einem AI Experten oder AI Projekt Manager, einem Machine Learning Experteneinen Experten für Testautomatisierung oder anderen Berater aus diesem Feld sein, dann kontaktieren Sie uns. In Kürze werden Sie ein sorgfältig ausgewähltes Angebot erhalten mit einem Experten, der auf Ihr Projekt passt.

 

Hinterlasse eine Antwort