Navigationsweiche Anfang

Navigationsweiche Ende

Lehrstuhl für Technologien und Management der Digitalen Transformation


Herr Univ.-Prof. Dr.-Ing. Tobias Meisen

Industrial Natural Language Processing and Information Extraction

Heutzutage erzeugen Unternehmen riesige Mengen an heterogenen strukturierten, semi-strukturieren und unstrukturierten Daten. Während die strukturierten und semi-strukturierten Daten durch ihre gegebene Struktur sehr gut analysiert und verarbeitet werden können, stellen die unstrukturierten Daten Unternehmen immer wieder für neue Herausforderungen. Dabei machen ausgerechnet diese unstrukturierten Daten ungefähr 80% aller unternehmensweiten Daten aus. Zu diesen Daten zählen unter anderem:

  • Textdokumente
  • Bilder
  • Videos
  • E-Mails
  • Kundengespräche (Audioaufnahmen, Chats, etc.)
  • PDFs

Mit unserem Forschungsschwerpunkt „Industrial Natural Language Processing & Information Extraction“ verfolgen wir das Ziel, diese Daten zum einen auffindbar und nutzbar zu machen und zum anderen diese anschließend zu analysieren. Neben der gezielten Anwendung unterschiedlichster Algorithmen und Methoden des maschinellen Lernens und der künstlichen Intelligenz zur gezielten Extraktion und Analyse der vorhanden Daten, liegen unsere Schwerpunkte in der Entwicklung und Weiterentwicklung aktueller Verfahren in den beiden folgenden Bereichen.

Im Kontext der Information Extraction beschränken wir unsere Forschung insbesondere auf die Entwicklung von Verfahren zur gezielten Analyse von Text und Bild Dokumenten. Dies ermöglicht es uns z.B. für PDF Dokumente Tabellen, Diagramme und weitere Elemente zu erkennen und gezielt zu extrahieren.

Im Kontext des Industrial Language Processings beschäftigen wir uns Schwerpunktmäßig zum einen mit dem Aufbau und Design effektiver Microservice basierter NLP Architekturen zur effizienten Analyse von großen Datenmengen und zum anderen mit der Anonymisierung & Pseudonymisierung persönlicher Informationen innerhalb von Textdokumenten, um diese anschließend in der Cloud analysieren zu können. 

 

Ansprechpartner

André Pomp, M.Sc.

Interesse an dieser Forschung?

Möchten Sie eine Abschlussarbeit in diesem Forschungsschwerpunkt schreiben? Dann schauen Sie hier nach offenen Themen oder melden Sie sich initiativ bei pomp{at}uni-wuppertal.de

Möchten Sie gerne tiefer in dieses Feld eintauchen? Dann treten Sie unserem Team als wissenschaftlicher Mitarbeiter(in) bei! Weitere Infos hier

Ausgewählte relevante Publikationen

Referenzen
Matthias Hansen; André Pomp; Kemal Erki; Tobias Meisen
Data-Driven Recognition and Extraction of PDF Document Elements
Technologies, 7(3):65
2019
ISSN: 2227-7080
Elma Kerz; Andreas Burgdorf; Daniel Wiechmann; Stefan Meeger; Yu Qiao; Christian Kohlschein; Tobias Meisen
Understanding Vocabulary Growth Through An Adaptive Language Learning System
Proceedings of the 8th Workshop on NLP for Computer Assisted Language Learning , Seite 65--78.
Herausgeber: LiU Electronic Press, Turku, Finland
2019
Robert Jungnickel; André Pomp; Andreas Kirmse; Xiang LI; Vladimir Samsonov; Tobias Meisen
Evaluation and Comparison of Cross-lingual Text Processing Pipelines
2019 IEEE Symposium Series on Computational Intelligence (SSCI) , Seite 417--425.
2019
Total:
3
Export als:
BibTeX, XML