Advancing Training and Inference Methods for Deep Reinforcement Learning-Based Job Shop Scheduling
Die Dissertation behandelt den Einsatz selbstlernender Agenten für Produktionsplanungsaufgaben. Insbesondere wurden innovative Verfahren zum effektiveren Training und zur effizienteren Nutzung trainierte Agenten entwickelt, um kürzere Produktionspläne in kürzerer Zeit finden zu können als bisher. In Verbindung mit einem Fokus auf Zuverlässigkeitskriterien wurde damit ein Beitrag geliefert, um agentenbasierte Produktionsplanung in die Anwendung zu bringen.
Wir haben Alexander zu seiner Dissertation befragt:
In welchem Kontext ist deine Dissertation entstanden? Welche Projekte oder anderen Faktoren haben deine Dissertation besonders beeinflusst?
Das Thema KI-basierter Produktionsplanung war zu Beginn meiner Promotion, 2019, ganz neu. Deep Reinforcement Learning (DRL) hatte sich als vielversprechender Ansatz in strategischen Computerspielen, zuletzt aber auch in Schach und Go, gerade erst sensationell und medienwirksam etabliert. Der Transfer der Methodik auf industrielle Probleme hatte aber noch nicht wirklich Fahrt aufgenommen. In einem gemeinsamen Forschungsprojekt mit AIRBUS sollte sich das ändern.
Die Faszination dafür, dass ein Computer bzw. ein künstliches neuronales Netz eine eigene Strategie entwickeln kann, ist bis heute nicht abgeklungen. Gerade aber die Kombination mit einem Anwendungsfall wie der Produktionsplanung, die über die Zeit immer wieder von industriellen Partnern als omnipräsent und höchst relevant bestätigt wurde, hat mich immer wieder motiviert weiter zu forschen.
Welchen Beitrag leistet deine Arbeit zum Forschungsfeld?
DRL für die Produktionsplanung ist ein interdisziplinäres Forschungsfeld. Meine Arbeit leistet Beiträge, die von unterschiedlichen Perspektiven inspiriert sind. So habe ich Möglichkeiten untersucht, über Jahrzehnte erarbeitetes Domänenwissen aus dem Bereich Operations Research gezielt in die Methodik zu integrieren. Auf der anderen Seite habe ich Trends in der KI-Forschung verfolgt und Errungenschaften wie Curriculum Learning und Transformer-Architekturen gewinnbringend auf diesen Anwendungsfall übertragen.
Ich hoffe, dass ich damit nicht nur einzelne Methoden beigetragen habe, sondern vielleicht auch zeigen konnte, dass sich solche Perspektivenwechsel lohnen. Aus diesem Grund habe ich in meinem letzten Kapitel unterschiedliche Perspektiven auf Zuverlässigkeit gebündelt und eine einheitliche Nomenklatur sowie einheitliche Bewertungsmetriken entwickelt – als Basis für zukünftige interdisziplinäre Arbeiten, die die Methodik bis in die Anwendung bringen werden.

Wie geht es nun für dich und das Thema weiter?
Das Thema wird am TMDT weitergeführt. Denn wie es so ist, hat meine Dissertation neue Fragen aufgeworfen, die beantwortet werden müssen. Darüber freue ich mich sehr! Diese Entwicklungen möchte ich weiter aktiv mit verfolgen und gestalten. Für mich persönlich geht es jedoch erst einmal in die Industrie, wo ich mich bei der SCHOTT AG in Mainz mit Produktions-IT auseinandersetzen werde. Vielleicht ja zur Vorbereitung auf agentenbasierte Produktionsplanung.