Utilizing Embeddings to Learn Universal Customer Representation in E-Commerce
Die Dissertation von Miguel Alves Gomes untersucht, wie mithilfe von Embeddings generelle Kundenrepräsentationen im E-Commerce erstellt werden können.Im Onlinehandel entscheidet gute Personalisierung über Erfolg oder Misserfolg. Gleichzeitig gewinnen Datenschutz und Datensparsamkeit immer mehr an Bedeutung. Der von Miguel Alves Gomes entwickelte Ansatz nutzt Embeddings, die aus dem beobachteten Kundenverhalten erlernt werden. Diese latenten Repräsentationen können anschließend vielseitig für unterschiedliche Personalisierungsaufgaben eingesetzt werden, etwa zur Vorhersage von Kauf- oder Klickintentionen.Um die hohe Dynamik des E-Commerce abzubilden, wurden die Embeddings um lifelong learning-Mechanismen erweitert. Durch inkrementelles und kontinuierliches Lernen passen sich die Modelle fortlaufend an neue Trends und verändertes Nutzerverhalten an, ohne dabei bisher Gelerntes sofort zu verlieren.
Wir haben Miguel zu seiner Dissertation befragt:
In welchem Kontext ist deine Dissertation entstanden? Welche Projekte oder anderen Faktoren haben deine Dissertation besonders beeinflusst?
Als ich am TMDT angefangen habe, konnte ich in verschiedene Projekte hineinschnuppern und eines davon war das Industrieprojekt mit Breinify. Die Arbeit daran war herausfordernd, aber auch sehr inspirierend. Besonders faszinierend fand ich, wie komplex menschliches Verhalten im Vergleich zu anderen Datenarten ist.
Während Bilder oder Sprache oft klaren Gesetzmäßigkeiten folgen, ist menschliches Verhalten hochindividuell und dennoch lassen sich Muster erkennen, die sich mathematisch in einem latenten Vektorraum darstellen lassen. Diese Erkenntnis hat mich motiviert, mich in meiner Dissertation genau dieser Herausforderung zu widmen: wie sich Verhalten mit maschinellen Lernverfahren generalisieren lässt, ohne seine Individualität zu verlieren.
Welchen Beitrag leistet deine Arbeit zum Forschungsfeld?
Personalisierung im E-Commerce ist kein neues Thema. Große Unternehmen wie Amazon oder Alibaba prägen dieses Feld seit Jahren. Sie verfügen über gewaltige Datenmengen, um riesige Modelle zu trainieren und kontinuierlich zu optimieren.
Doch was passiert, wenn diese Daten nicht in ausreichender Menge vorhanden sind, etwa bei kleineren Onlineshops, bei denen sich Nutzer nicht registrieren müssen und Interaktionen entsprechend spärlich ausfallen? In solchen Szenarien werden meist traditionelle Expertensysteme eingesetzt, weil datenhungrige KI-Modelle hier schlicht nicht anwendbar sind. Diese Systeme haben jedoch zwei zentrale Nachteile:
- Sie erzeugen starre, anwendungsspezifische Kundenrepräsentationen, die bspw. bei jeder Änderung des Anwendungsfalls manuell angepasst werden müssen.
- Sie sind nicht echtzeitfähig, was ihre Nutzung auf Kampagnen oder Batch-Analysen beschränkt.
Hier setzt mein Ansatz an: Durch self-supervised learning können Embeddings auch bei geringen Datenmengen direkt aus den vorhandenen Interaktionsdaten gelernt werden, ohne Labels und ohne explizite Nutzerinformationen. Das ermöglicht eine flexible, skalierbare und datenschutzfreundliche Personalisierung, die selbst bei unbekannten Nutzern in Echtzeit eingesetzt werden kann.
Wie geht es nun für dich und das Thema weiter?
Die Vorhersage von Verhalten fasziniert mich weiterhin sehr. Ich möchte das Thema über den E-Commerce hinausdenken, denn Verhalten spielt in vielen Bereichen eine Rolle:
Im Bildungsbereich etwa kann es helfen, Lernprozesse besser zu verstehen und individuell zu unterstützen. In der Medizin könnte es genutzt werden, um Krankheitsverläufe oder Therapieerfolge vorherzusagen. Selbst im Tierschutz kann das Verständnis von Verhaltensmustern neue Perspektiven eröffnen.
Ich sehe Verhalten daher als eine universelle Datenkategorie und möchte weiter erforschen, wie wir diese mithilfe von KI besser verstehen, modellieren und verantwortungsvoll nutzen können.
Ich freue mich, dass ich auch am TMDT bleiben werde, um genau diese Verhaltensthematik weiter voranzutreiben und neue Anwendungsmöglichkeiten datengetriebener Verhaltensmodelle zu erschließen.