Zwei Review-Publikationen des TMDT zum Thema „Deep Reinforcement Learning in der Produktion“ veröffentlicht.
Die Studie „Reinforcement Learning in Manufacturing Control: Baselines, Challenges and Ways Forward“ von Samsonov et al. untersucht den Einsatz von Deep Reinforcement Learning (DRL) zur Optimierung von Fertigungsprozessen. Die Autoren unterstreichen die Notwendigkeit, dass DRL-Lösungen in der in der Lage sein müssen, unterschiedliche Problemgrößen ohne erneutes Training zu bewältigen. Zudem stellen sie einen neue Belohnungsfunktion für das Agententraining namens multi-instance ranked reward (m-R2) vor, der ein effektiveres Training von DRL-Agenten ermöglicht.
Die Survey Publikation „On Reliability of Reinforcement Learning based Production Scheduling Systems: A Comparative Survey“ Waubert de Puiseau et al. untersucht Publikationen, in welchen die Anwendung von Deep Reinforcement Learning (DRL) auf reale Produktionsplanungsprobleme adressiert wird. Die Autoren stellen fest, dass spezifische Anforderungen der realen Anwendungsfelder oft nicht berücksichtigt werden. Sie definieren dazu zuverlässige Bewertungskriterien für die Produktionsplanung und identifizieren vielversprechende Forschungsrichtungen für die zukünftige Arbeit. Der Beitrag der Studie besteht darin, eine Brücke zwischen dem numerischen Optimierungsbereich und dem DRL-Bereich zu schlagen und eine solide Grundlage für die Entwicklung zuverlässiger DRL-basierter Produktionsplanungsverfahren zu schaffen.