Überspringen

Der Ticketshop ist eröffnet!

Hol Dir jetzt Deine Eintrittskarte für die EUROBIKE 2024 und werde Teil des größten Fahrrad- und Ecomobility-Events des Jahres!

Künstliche Intelligenz

Disruption im Wochenrhythmus

21.06.2023

Die Diskussionen um Risiken und Nebenwirkungen von ChatGPT reißen nicht ab. Jens Dorn, der selbst Transformer-Modelle entwickelt hat und heute die Business Intelligence beim Versandhändler Otto mitsteuert, sieht wenig Grund für Hysterie. Ein nüchterner Umgang mit den Fähigkeiten der Maschinen – im Positiven wie im Negativen – genügt. Allerdings werden sich viele Arbeitsprozesse verändern und nur wer da mitgehen kann, kann von den fantastischen Möglichkeiten der KI profitieren.

eurobike-frankfurt-2023-jens-dorn-otto

Was hat der OTTO-KI-Mann Jens Dorn mit der Radbranche zu tun?

Zur Radbranche habe ich Kontakt, seit ich 14 bin, weil ich da schon im Velo-Laden in Bergisch Gladbach geholfen habe Räder zu reparieren. Mit siebzehn habe ich meinen ersten Rahmen selbst gebaut. Sehr viel später habe ich dann Klever-Mobility mit meiner Internetagentur bei dem europäischen Markteintritt begleitet. Das ging vom Aufbau des ersten Auftritts im Internet, über den Shop bis hin zum Online-Marketing. In der Zeit habe ich Klever Mobility auch zur Eurobike begleitet.

Was machen Sie bei OTTO genau?

Ich arbeite dort in der Business Intelligence. Also mit Daten, Analysen und auch mit künstlicher Intelligenz. Ich hatte eigentlich immer mehrere Themen. Das erste war: Ich habe 2018 eigentlich schon mit den Technologien angefangen zu arbeiten, die jetzt zu ChatGPT führen. Wir haben solche Art von Transformern in Vorstufen schon vor zwei Jahren gebaut. Gleichzeitig habe ich die datengetriebene Logistik, also Business Intelligence für Logistik, bei Otto aufgebaut und maßgeblich auch die übergreifende Logistiksteuerung mitentwickelt.

Im Auftrag von ganz oben habe ich dann acht Monate mit einem hervorragenden Team Suchtechnologie entwickelt, die weit gesprungen ist und die seitdem nach und nach in die OTTO Suche integriert wurde.

Seit anderthalb Jahren bin ich maßgeblich an der Entwicklung der Systeme für unsere Sortimentsverantwortlichen beteiligt. Es geht darum, über das gesamte sehr heterogene Sortiment Wirtschaftlichkeit, Kundenrelevanz und Kapazitäten möglichst optimal zu steuern. Da kann man mit Daten und künstlicher Intelligenz schon ziemlich viel beitragen.

Was ist für Sie gerade im Business-Kontext die spannendste Frage?

Da gibt es mehrere. Eine ist: Wie kombiniere ich die Fähigkeiten großer Large Language Model mit eigenen Modellen, in denen ich meinen USP, meine Kundeninteraktion, meine Intellectual Properties in meiner Verantwortung weiterentwickeln und schützen kann.

Wie überraschend kam der öffentliche Hype um ChatGPT?

Es war klar, dass irgendwann so ein Kipppunkt kommen musste. Das hängt einfach mit dem Reifegrad von Innovationen zusammen. Dass das jetzt genau bei Chat-GPT passiert, das war bei OpenAI ein bisschen zu erwarten, bei dem, was sie schon gemacht haben und bei der Performance und bei den Leuten, die die haben. Es hätte aber genauso gut auch sein können, dass Google schneller ist oder tatsächlich irgendjemand aus China.

Das heißt, es ist folgerichtig, eher früher als später rauszugehen, weil die Lernkurve steiler wird, wenn ich es auf die Menschen loslasse?

Ja. Lernen bedeutet eigentlich immer, zu verstehen, was jemand anders schon verstanden hatte. Erkenntnis hingegen bedeutet, selber zu verstehen. Und das, worauf es ankommt, ist, dass du in einer höheren Geschwindigkeit selber verstehen kannst. Und dafür brauchst du dieses frühe Rausgehen und dich dem Feedback zu stellen.

eurobike-frankfurt-2023-jens-dorn-1

Aber es ist doch nichts schlimmer, als wenn die Maschine etwas falsch macht.

Und die spannende Frage lautet: Wie baust du die Interaktion? Wenn du sagst: Guck mal, da ist ein Fehler, du machst den einfach weg, dann bekommt das System kein Signal, ob das gut war. Wenn du das aber zeigst, kann ich mir das als validiert speichern. Wenn ich das eine Weile mache, lerne ich dabei viel schneller, als wenn ich immer der Meinung bin, ich werde schon recht haben.

Das klingt sehr abstrakt. Wie übersetzt sich das in aktive Systeme?

Statt den Webshop komplett durchzuplanen, könnte man ihn als lernendes System verstehen. Das ist ein komplett anderer Ansatz. Im Endeffekt sind die Nutzerinteraktionen starke Lernsignale. Aber du hast auch Experten in deinem Haus, die senden auch Signale. Wie baust du jetzt diese beiden Systeme zusammen?

Es ist ein Zusammenspiel zwischen KI und Mensch.

Genau. Eine KI wie ChatGPT ist eine Instanz, die dir Antworten liefert, aber das, wovon sie lernt, ist von deiner Reaktion.

Das zweite, was passiert, was dahinterliegend total spannend ist, ist, dass wir, wenn du auf Hardware guckst, bis jetzt immer versucht haben, Hardware zu generalisieren. Also wir benutzen eine CPU, die kann allen unterschiedlichen Kram berechnen. Aber jetzt werden analoge Computer wieder total spannend, weil wir die Generalisierung in die Modelle verlagern. Analoge Computer können definierte Berechnung mit deutlich weniger Energie und Zeitaufwand erledigen. Es gibt erste Chips die nur drei Watt benötigen und so viel leisten wie Hochleistungsgrafikkarten.

Das heißt, du kannst diese Modelle auf jedem Client, an jeder Ecke benutzen. Auf jedem Handy, auf jeder Uhr. Und wenn sowas jetzt aber fürs Training auch noch da wäre, dann brauchst du noch einen Bruchteil der Energie. Da wird eine ganze Menge passieren.

"Wenn ich das anfange, in einem Modell zu trainieren, könnte ich dir genau sagen, was gerade im Markt relevant ist."

Die Systeme werden noch viel leistungsfähiger?

Auf jeden Fall. GPT basiert auf einer Technologie namens Transformer. Es gibt jetzt erste Ansätze, die um Längen leistungsfähiger werden könnten als Transformer. Die Wahrscheinlichkeit, dass die Technologie von GPT auch nur die nächsten anderthalb Jahre zentral sein wird, würde ich als gering einschätzen.

Was heißt Transformer? Können Sie das in Kindersprache erklären?

Transformer ist einfach eine bestimmte Art und Weise, wie man Modelle trainiert. Das ist ein Modelltraining, das Aufmerksamkeit belohnt. Das ist ein System, das praktisch das neuronale Netz auf eine bestimmte Art und Weise belohnt. So lernt das Netz welche Dinge wahrscheinlich zueinander gehören.

Müssen wir jetzt alle Prompting lernen?

Nein. Was jetzt gerade die ganze Zeit für Technologie rauskommt, das ist das Disruption im Wochenrhythmus. Jetzt heißt es überall Prompt Engineering, müsste man lernen. Pustekuchen. AgentGPT übernimmt, rudimentär bereits ganze Aufgabenpakete, wie zum Beispiel das Planen einer Reise. Das disruptiert Prompt Engineering. Du brauchst das Prompt Engineering nicht mehr. Du musst nur noch sagen, was du willst. Die Prompts werden erstellt und passé, Geschichte.

Es ist eine Frage des besseren Interface.

Ja genau. Einfach nur Texte in eine Box eingeben, ist eigentlich mit die schlechteste UX, die man sich vorstellen kann, um mit solchen Systemen zu interagieren. Die Frage ist, wie muss das UX sein, dass das deine Intuition treibt?

Und die Kernfrage dahinter ist:  Welche Fähigkeiten brauchen wir, um mit permanenter Disruption umgehen zu können?

Und welche Fähigkeiten sind das?

Das Muster ist auf jeden Fall: Von der Planung stärker zu einer Optimierung zu kommen.

eurobike-frankfurt-2023-jens-dorn-fahrrad

Was bedeutet das für die Fahrradbranche?

Ich glaube, die Essenz ist, dass diese Technologie, die da entsteht, nicht etwas ist, was nur auf sie herniederkommt, sondern etwas, was auch kleinere Mittelständler anfangen können, für sich selber zu nutzen. Es nicht so schwer.

Nennen Sie mal ein Beispiel.

Stellen Sie sich vor, es gäbe eine neue Art von Fahrrad. Irgendwie so eine Melange aus Gravel-Bike und Mountain-Bike. Mit einem E-Bike, mit einem Motor, um gut bergauf zu fahren. Da habe ich ChatGPT ein bisschen Kontext gegeben und habe dann gesagt, generieren wir mal einfach erst mal einen Produktnamen dafür. Und dann habe ich angefangen, mir Produktbeschreibungen bis in die technischen Spezifikationen ausgeben zu lassen. Und das im Stil von Gazelle. Wenn ich irgendeine wilde Idee habe, habe ich innerhalb von 20 Minuten zehn verschiedene Varianten, wie sowas beschrieben werden könnte. Und kann mir dann auch Bilder ausgeben lassen. So habe ich an einem Vormittag 50 Varianten, die potenziell interessant wären. Diese Varianten kann ich dann - anstatt jetzt groß weiterzuentwickeln - erstmal Kunden zeigen, um daraus zu lernen.

Der Ingenieur verlässt seinen Elfenbeinturm und muss Kommunikator werden.

Die Expertise geht praktisch eine Metaebene weiter hoch. Du arbeitest nicht mehr im System, sondern du arbeitest am System, das die Entwicklung macht.

Und was bedeutet das für einen Händler wie OTTO?

Es ist ja relativ einfach heutzutage, den Wettbewerb zu beobachten. Ich könnte ja auf die Idee kommen, für den deutschen E-Commerce ein System zu bauen, was die Semantik des deutschen E-Commerce beherrscht. Wenn ich das anfange, in einem Modell zu trainieren, könnte ich dir genau sagen, was gerade im Markt wie relevant ist. Und dann stelle ich dazu die Frage: Wie muss eigentlich eine Logistik funktionieren, die dazu anschlussfähig ist? Das ist auch so einer Art von Transformer-Technologie: Verstehen was wichtig ist, kombiniert damit, was aus unserer Sicht wirtschaftlich sinnvoll funktioniert.

Das, was du aber nicht aus Daten sehen kannst, ist die Veränderung. Der spannende Teil ist, dass du dir den Markt am ehesten beherrschen kannst, wenn du derjenige bist, der die Veränderung rein gibt. Das heißt, das, was du hinkriegen musst, ist, dass du alles, was standardmäßig so wie letztes Jahr läuft, du dich möglichst nicht drum kümmern musst, damit du die Veränderung treiben kannst, die den Markt bestimmt.

"[...] umso mehr ich standardmäßig machen kann, umso interessanter wird die Differenzierung."

Der Mensch entledigt sich von Basisaufgaben, um kreativer zu werden?

Genau. Das Interessante ist ja, umso mehr ich standardmäßig machen kann, umso interessanter wird die Differenzierung. Brauchen wir dafür noch die ganzen Leute, wenn man das alles automatisch normal machen kann? Ja, weil die Differenzierung viel wichtiger wird.

Was würden Sie heute machen, wenn Sie ein Unternehmer wären?

Auf Hugging Face werden gerade über 118.000 solcher und ähnlicher Modelle als Open Source gelistet und es werden täglich mehr. Die kann ich mir einfach runterladen und bei mir hosten und benutzen. Das adaptiere ich auf meine Domäne oder ich gehe ins Finetuning. Das heißt, ich kann diese Modelle weiter trainieren. Und dann fange ich an, denen Sachen beizubringen, die zu meiner Branche, zu meiner Firma, zu meinem Kontext gehören.

Wie muss man sich das Trainieren vorstellen?

Im ersten Schritt gebe ich Daten rein. Die müssen eine bestimmte Form haben, aber das würde an dieser Stelle zu weit führen.

Das zweite, was ich mache ist, dass ich dann hingehe und das trainiere. Das bedeutet, dass ich jetzt Experten habe, die mit dem entsprechenden System arbeiten und sagen, das, was hier generiert wurde, ist richtig, das, was hier generiert wurde, ist falsch.

Idealerweise erzeugt man ein Modell, das man möglichst generalistisch einsetzen kann. Dass du ein Modell hast, mit dem man eine Suche genauso befeuern kann wie den Customer Service.

Würden Sie ein System wie ChatGPT als Chatbot in eine Website integrieren?

Natürlich möchte ich mein Modell so trainieren, dass es möglichst keinen Quatsch erzählt. Das ist ja auch das, woran OpenAI unter anderem arbeitet. Aber gleichzeitig gibt es eine Adaptionskurve bei den Nutzern. Eine Integration in die Website erlaubt auf jeden Fall eine viel schneller Lernkurve, damit das System besser wird. Es basiert eben nicht mehr auf starren Regeln, wie frühere Chatbots.

Ist nicht die Abwesenheit eines Regelsystems auch ein Problem bei der Kontrolle?

Sagen wir es so, der spannende Teil ist ja immer wieder der Vergleich mit dem Menschen. Du kannst natürlich sagen: ChatGPT halluziniert manchmal. Das muss man in den Griff bekommen. Aber die komparative Aussage ist: seltener als Menschen an manchen Stellen.

Jens Dorn

eurobike-frankfurt-2023-jens-dorn-portraitfoto

Seit 2018 arbeitet Jens Dorn bei OTTO an und mit Technologien, auf denen Angebote wie ChatGPT basieren. In Kollaboration mit huggingface.com hat er mit OTTO zur Demokratisierung dieser Modelle beigetragen und so den Weg geöffnet, dass auch Mittelständler diese Modelle für sich trainieren und nutzen können.

Er hat die Business Intelligence für Logistik bei OTTO aufgebaut und 2020 maßgeblich die Entwicklung der übergreifenden Logistiksteuerung geprägt. 2021 konnte er bei OTTO das Potenzial von Data-Science getriebener Suchtechnologie aufzeigen. In den letzten zwei Jahren entwickelt Jens Dorn auf Basis neuer Technologie wirksame Ansätze zur Steuerung von Angebot und Nachfrage für das Assortment. Dabei liegt sein Fokus auf der Integration neuer technologischer Fähigkeiten von Unternehmens zu einem neuen operativen Betriebssystem. #OwnYourAI

Als Jugendlicher hat Jens Dorn im Radladen um die Ecke geholfen Fahrräder zu reparieren und später eigene Fahrradrahmen gebaut. Mit zwanzig Jahren gründete er eine Ideenagentur und begann parallel ein Studium der Betriebswirtschaft. 2006 wurde die Agentur auf das Thema Digitalisierung neu ausgerichtet. In diesem Rahmen hat er Klever Mobility, einen E-Bike Anbieter, bei ihrem Markteinstieg in den europäischen Markt mehrere Jahre unterstützt und dabei die Fahrradbranche kennengelernt.