Kaufland.de: mit Data Science bereit für Morgen

Zukunftsvisionen für das Produktdaten Management

Dieser Beitrag ist auch verfügbar auf: Deutsch

In den vorherigen Artikeln unserer Serie zum Produktdaten Management haben Sie bereits Wissenswertes über Pflichtattribute und die vielfältigen Vorteile sauberer Produktdaten erfahren. Doch was erwartet unsere Händler in Bezug auf Produktdaten in der Zukunft? Die Antwort finden Sie in unserem heutigen Beitrag.

Neue Technologien für exakte Produktdaten

Seit Ende letzten Jahres ist er live: Der Attribute Extractor, den wir bereits in einem früheren Artikel ankündigten. Insgesamt zehn Attribute eines Produktes kann das System automatisch aus bereitgestellten Produkttexten oder -bildern erkennen, darunter zum Beispiel Farbe, Größe oder Hersteller. Der Extractor liefert dabei zwei Daten: Zum einen den jeweiligen Wert für ein Attribut, zum anderen die Wahrscheinlichkeit, mit der der Attribute Extractor sich seiner Einschätzung sicher ist. Der Service eröffnet neue Möglichkeiten für weitere Entwicklungen: So könnte das System in der Zukunft auch Produktbilder analysieren und den Händlern Informationen über ihre Produktdatenqualität liefern – auf Artikelebene, spezifisch und detailliert.

Attribute Extractor
Der Attribut Extractor gibt nicht nur das Attribut („value“), sondern auch die Wahrscheinlichkeit, mit der er sich seiner Einschätzung sicher ist („score“), an.

Davor stehen aber noch zwei andere Projekte, an denen die Teams aus Produktdaten Management und IT derzeit arbeiten:

  • Der Category Decider:
    Er erkennt, in welche Kategorie ein Produkt gehört und arbeitet bereits heute mit einer hohen Trefferquote. Dieser Wert soll nun noch weiter optimiert werden, damit der Category Decider als wirkungsvolle Validierung fungieren und die Händler bei der Einteilung der Produkte unterstützen kann. Erkennt der Decider in Zukunft eklatante Unstimmigkeiten, soll automatisch das Produktdaten Team benachrichtigt werden und ein Mitarbeiter bearbeitet den Fall. So unterstützt das Programm die optimale Produktdatenqualität auf KAufland.de.
Björn Kaps, Leiter Produktdaten Management von real.de

Data Science wird in den nächsten zwei bis drei Jahren alle Prozesse im Produktdaten Management grundlegend verändern. Hier entwickeln wir neue Technologien auf Basis von Data Science inhouse. 

(Björn Kaps, Leiter Produktdaten Management)

  • Produktempfehlungen:
    Ein weiteres Projekt dreht sich rund um das Thema Produktempfehlungen. Hier arbeiten die Teams daran, einen sogenannten Recommender zu erstellen, der dem Kunden ähnliche oder zu dem aktuell betrachteten Artikel passende Produkte anzeigt. So wird nicht nur der Kunde unterstützt und inspiriert, sondern es werden auch die Angebote unserer Händler stärker in den Vordergrund gerückt.

Stichwort Data Science im Produktdaten Management

Der Schlüssel für derartige Technologien lautet Data Science. Bei uns erarbeitet ein vierköpfiges Team von Data Science Experten mit dem Produktdaten Management Lösungswege und Ideen, um Prozesse zu optimieren, zu automatisieren und so die Abläufe sowohl für unsere Händler als auch für das Produktdaten Team einfacher und wirkungsvoller zu gestalten. Was abstrakt klingt, lässt sich in vier Schritte einteilen:

  1. Zuerst definieren die Teams die Aufgabe, die angegangen werden soll. Dabei werden wichtige Fragen geklärt, wie: Wo liegen die Probleme? Was ist das Ziel?
  2. Dann stellt das Data Science Team die verfügbaren Daten zusammen, die rund um die Problemstellung vorhanden sind. Sie bilden die Hauptkomponente, mit der eine künstliche Intelligenz arbeitet, lernt und auf deren Basis sie später ihre Entscheidungen trifft. Im Fall des Category Deciders sind das zum Beispiel Informationen über Produkte und Kategorien. Um Lernmaterial für den Decider zur Verfügung zu stellen, wurden manuell rund 35.000 Artikel auf Kaufland.de von Mitarbeitern kategorisiert.
  3. Je nachdem, was für Daten vorliegen, entscheidet sich das Team für eine andere Art des Ansatzes, um dem erstellten System seine spätere Aufgabe „beizubringen“, sprich es zu trainieren. Für den Category Decider wählten die Data Scientists das sogenannte überwachte Lernen*. Da die Produkte, die dem Decider zur Verfügung gestellt wurden, bereits einer Kategorie zugeteilt sind, kann das Programm aus dieser Zugehörigkeit lernen.
  1. Nachdem der künstlich intelligente Service in der Evaluierungsphase den Feinschliff erhalten hat, wird er im letzten Schritt an den Shop angebunden, damit er zum Einsatz kommen kann.

Künstliche Intelligenz kann den manuellen Aufwand für das Produktdaten Management extrem reduzieren und gibt dem Team Zeit für andere relevante Aufgaben.

(Ruth Janning, Head of Data Science)

Bereit für die Zukunft

Auf diese Weise wird das Produktdaten Management auf Kaufland.de fit für die Zukunft. Denn: Die Themen Personalisierung und Produktdatenpflege produzieren äußerst komplexe und informationsintensive Aufgaben, die manuell kaum mehr zu stemmen sind. Künstliche Intelligenz dagegen kann in kurzer Zeit auf eine große Menge an Daten zurückgreifen und intensive Prozesse bearbeiten, sodass Kunde und Händler gleichermaßen davon profitieren.

*Überwachtes Lernen (supervised learning) ist ein Ansatz, bei dem ein Teil der Daten bereits gelabelt, also im Falle des Category Deciders z.B. bereits einer Kategorie zugeordnet sind. Die gelabelten Daten werden dabei verwendet, um ein entsprechendes Model (wie z.B. den Category Decider) zu trainieren sodass es später auch für ungelabelte Daten Entscheidungen treffen kann. Dieser Ansatz gehört zum Gebiet des maschinellen Lernens.
Schreibe einen Kommentar