Wie Machine Learning, nur besser: Reinforcement Learning

reinforcement learning

Viele Unternehmen haben bereits umgestellt und setzen auf Empfehlungssysteme, um Kunden sämtliche Produkte entsprechend der individuellen Vorlieben zu präsentieren. Häufig ist die Lösung dafür KI odas sog. maschinelle Lernen/Machine Learning (ML), das – basierend auf Daten aus früheren Erfahrungen – anzeigt, wofür sich Nutzer entscheiden könnten. Allerdings hilft ML nicht für schnell wechselnde Verbraucherpräferenzen, da die Vorhersagen einfach nicht geeignet sind. Und genau hier kommt das sog. Reinforcement Learning, also das bestärkende Lernen ins Spiel.

Bislang wurde Reinforcement Learning hauptsächlich in Forschungslaboren eingesetzt, mittlerweile hat es seinen Weg auch in Produkte und Dienste wie Azure Cognitive Services gefunden. Die Dienste können von einem Developerteam in Apps und Webseiten sowie in autonome Systeme integriert werden, um z.B. Signale aus Umwelt, menschlicher Sprache und Stimmungen, Bilder oder unstrukturierte Informationen zu erfassen.

Maschinelles Lernen neu gedacht

Reinforcement Learning basiert auf einem völlig anderen Ansatz als Supervised Learning, dem überwachten Lernen, einer Technik, die beim maschinellen Lernen noch wesentlich stärker zum Einsatz kommt. Dank des Supervised Learnings können Systeme so trainiert werden, Vorhersagen anhand von Trainingsbeispielen zu treffen, mit denen sie gefüttert werden.

Unterschied: Supervised vs. Reinforcement Learning

Sie gehen dem Prinzip des Supervised Learnings nach, wenn Sie eine Sprache lernen wollen und dafür auf Texte, Grammatik und Vokabular zurückgreifen.

Reinforcement Learning würde stattdessen bedeuten, in das Land zu reisen und die Sprache vor Ort zu lernen. Dies hat den Vorteil, dass Sie fragende Blicke erhalten, sobald Sie eine Aussage nicht klar formulieren oder Ihnen ein Fehler passiert: Bestellen Sie jedoch z.B. in Frankreich fehlerfrei und zeitgemäß ein Gebäck, erhalten sie als Belohnung auch ein Croissant.

Ein KI-Bot, der sich durch Reinforcement Learning Wissen aneignet, lernt von der Interaktion mit seinem Umfeld. Dieses kann sich sowohl in der realen Welt als auch in einer simulierten Umgebung befinden, wo verschiedene Optionen unbedenklich erforscht werden können. Der KI-Bot handelt und wartet ab, ob die auf einem Belohnungssystem basierte Aktion zu einem positiven oder negativen Ergebnis führt. Sobald das Feedback vorhanden ist, erfährt der Bot, ob die Entscheidung richtig oder falsch war, und aktualisiert sein Verhalten entsprechend. Im Wesentlichen entspricht Reinforcement Learning dem Lernverhalten von Menschen im Laufe ihrer Entwicklung, aber auch von vielen Tieren in der Natur.

Reinforcement Learning im Einsatz:

Mit Reinforcement Learning zum personalisierten Angebot

Einer der ersten Cognitive Services, der Reinforcement Learning nutzt, ist das Personalisierungsmodul von Microsoft Azure. Im Gegensatz zu reinen Empfehlungsmodulen, die nur wenige Optionen aus einem großen Katalog bereitstellen, präsentiert dieser Dienst das beste Ergebnis immer dann, wenn Benutzer mit der Anwendung interagieren.

Reinforcement Learning in Microsoft Teams

Auch die Kommunikations- und Kollaborationslösung Microsoft Teams setzt auf Reinforcement Learning, um in Echtzeit den optimalen Datenfluss in Videokonferenzen zu ermitteln. Damit gleicht Teams Übertragungsverzögerungen im Millisekunden-Bereich aus und bietet so bessere Verbindungs- und Videoqualität.


Sie wollen wissen, wie Machine Learning funktioniert und welche Untergruppen es gibt? Dann lohnt sich ein Blick in den Blogeintrag „Hauptsache Lernen“