Quelle: Fraunhofer IPA/Grafik: Andrine Theiss
Selbstlernende Roboter – die matrixfähige Montagezelle
Personalisierte und auf die Kundenwünsche zugeschnittene Produkte wie Kleidung, Handyhüllen oder Autos gehören heute längst zum Standard. Dieser Wunsch nach Individualität erfordert lernfähige Roboter in der Produktion, die sich ihre wechselnden Aufgaben selbst beibringen. Arik Lämmle erklärt, wie das funktioniert.
Stellen Sie sich vor, wir wollen ein neues Produkt industriell fertigen. Dabei geht es im Grunde nicht einmal unbedingt darum, welches Produkt wir eigentlich herstellen wollen. Der Einfachheit denken wir an ein simples Produkt, bestehend aus zwei Platten, die wir aufeinanderlegen und miteinander verschrauben wollen. Das klingt doch erst einmal ziemlich einfach, oder? Auch unsere Mitarbeiterinen und Mitarbeiter in der Produktion sehen das so und machen sich frisch ans Werk. Allerdings ist gerade dieser, sich immer wiederholende Prozess nach einiger Zeit für den Menschen zu einfach und kognitiv wenig anspruchsvoll. Die Lösung: ein Roboter, der diesen Prozess und die repetitiven Aufgaben übernimmt und mit wenig manuellem Aufwand eingerichtet werden kann.
Doch die personalisierten und auf die Kundinnen und Kunden zugeschnittenen Produkte stellen für unseren Roboter eine Herausforderung dar: Im Gegensatz zu unserem erfahrenen Mitarbeiter weiß unser metallener Kollege nicht, wie er damit umgehen soll, dass die Produkte ständig wechseln und sich verändern. Wie bringen wir also unserem Roboter bei, gerade mit dieser Vielfalt an unterschiedlichen Produkten umzugehen, zumal wir aktuell ja nur zwei Platten miteinander verschrauben wollen? Wie soll das schlussendlich für komplexere Produkte funktionieren?
Roboter lernen wie Kinder
Eine Möglichkeit wäre, dass der Mitarbeiter dem Roboter wieder und wieder zeigt, wie er das Produkt herstellen soll, selbst, wenn wir alle Bedürfnisse unserer Kunden im Hinblick auf unsere Produktvarianten berücksichtigen wollen. Klingt doch erstmal vernünftig: Der Roboter wird durch den Menschen trainiert und profitiert von dessen Erfahrung. Damit wären allerdings sowohl unser Roboter als auch der Mensch gleichzeitig gebunden.
Viel schöner wäre doch also die Vorstellung, dass sich der Roboter selbst beibringt unser Produkt zu fertigen – ein bisschen wie ein kleines Kind, das lernt Klötzchen unterschiedlicher Formen in das dazu passende Loch zu stecken. Die passende Technologie dazu nennt sich Deep Reinforcement Learning und ist ein Teilgebiet der Künstlichen Intelligenz (KI). Wie das kleine Kind führt unser Roboter Aktionen aus und beobachtet das Ergebnis. Anfangs wird unser Roboter vermutlich noch versuchen, den kreisförmigen Klotz in das viereckige Loch zu stecken. Damit unser Roboter also wirklich lernt, müssen wir ihm eine Rückmeldung geben, ob seine Aktionen auch wirklich zum Ziel führen. Das geschieht über eine sogenannte Belohnung. Führt unser Roboter die richtige Aktion aus, erhält er eine Belohnung, andernfalls eine Bestrafung, beispielsweise, wenn er den Klotz beschädigt.
Üben in einer virtuellen Umgebung
Doch wie soll das dann in der Realität und vor allem in einer industriellen Fertigung funktionieren, wenn der Roboter unser Produkt beschädigen kann? Glücklicherweise gibt es auch dafür eine Lösung: die Simulation. Nun übt unser Roboter in einer sicheren, digitalen Umgebung, wie er unser Produkt herstellen kann und beschädigt nicht mehr als ein paar Bits und Bytes. Damit wird unserem Roboter sogar ermöglicht mehr zu lernen, als nur unser einfaches Produkt herzustellen, denn in der Simulation können wir ohne viel Aufwand nahezu jedes beliebige Objekt einfügen.
Wichtig ist dabei, dass unser kognitiver Roboter, während er lernt, nur die Aktionen ausführt, die er später auch in der Realität zur Verfügung hat. Das wird durch die Verwendung von etablierten Roboteraktionen, sogenannten »Skills«, sichergestellt, die unabhängig vom Typ unseres Roboters eingesetzt werden können. Solche Roboter-Skills werden bereits heute für eine Vielzahl an Prozessen, von einfachen Verschraubungen bis hin zu komplexen Montageoperationen, eingesetzt.
Roboter können mit Produktvarianten umgehen
Insgesamt liefert uns unser Roboter damit eine Möglichkeit, auf Kundenwünsche zu reagieren und individualisierte Produkte zu montieren. Durch das Wissen über seine eigenen Aktionen interagiert der Roboter mit seiner Umgebung. Jede Aktion wird dabei im Hinblick auf den Gesamtfortschritt durch die Belohnung oder Bestrafung bewertet. Wir geben unserem Roboter damit die Fähigkeit zur sequenziellen Entscheidungsfindung und zum situativen Handeln mit einem längerfristigen Ziel. Zudem lernt unser Roboter sicher mit Produktvarianten und sogar Abweichungen in den Produkten oder im Prozess umzugehen, indem diese während des Trainings berücksichtigt werden.
Forschungsprojekt »Rob-aKademI«
Im Forschungsprojekt »Rob-aKademI« entwickeln Wissenschaftlerinnen und Wissenschaftler Technologien, mit denen sich die Programmierung von Robotern für Montageaufgaben einfacher und autonomer gestalten lässt. Ein Digitaler Zwilling der Produktionsumgebung und ein spezielles Programmiergerüst ermöglicht es, dass Roboter Fähigkeiten für das flexible Montieren lernen.
Zeigen wir unserem Roboter also während des Trainings nicht nur ein Produkt, sondern auch dessen Varianten wird der Roboter lernen damit umzugehen und auch die Produktvariante herstellen zu können. Schlussendlich durchläuft unser Roboter einen ähnlichen Prozess wie der Mensch, wenn er die Montageanleitung liest und sich anschließend am zu fertigenden Produkt versucht. Durch sich wiederholende Versuche und Irrtümer lernen sowohl Menschen als auch Roboter kontinuierlich dazu, bis sie irgendwann die richtige Montagetechnik gefunden haben. Und da unser Roboter nur in der digitalen Welt trainiert, ist er vollkommen sicher – sowohl für sich als auch für seine Umwelt.
Serie zur Matrixproduktion
Eine Serie von Beiträgen beschäftigt sich auf interaktiv online mit der Matrixproduktion, einem flexiblen Produktionssystem, das Resilienz und Wandlungsfähigkeit eines Unternehmens erhöht. Erschienen ist in dieser Serie bereits:
- Kein Fehler in der Matrix von Daniel Ranke
- Zuverlässige Durchlaufzeitprognose in der Matrix von Lisa Charlotte Günther
- Automatisierte Prozesskontrolle in der Matrix von Hang Beom Kim und Timo Leitritz
Nächste Woche zeigt Michael Trierweiler, wie sich Matrix-Produktionssysteme Schritt für Schritt rekonfigurieren lassen.
Dieser Artikel ist im Rahmen von »SE.MA.KI« (Selbstlernende Steuerung einer technologieübergreifenden Matrixproduktion durch simulationsgestützte KI) entstanden. Das Forschungs- und Entwicklungsprojekt SE.MA.KI. wird vom Bundesministerium für Bildung und Forschung (BMBF) gefördert. Förderkennzeichen: L1FHG42421. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt beim Autor.
Ihr Ansprechpartner
Arik Lämmle
Mitarbeiter der Gruppe Roboterprogrammierung und -regelung
Telefon: +49 711 970-1639