Warum KI bessere Datenstrukturen braucht - mit Stefan N., Outdooractive

Shownotes

Warum empfiehlt eine Plattform genau diese Tour – und nicht eine andere? In dieser Folge spricht Jonas Rashedi mit Stefan Neubig von Outdooractive über Recommender-Systeme, Knowledge Graphen und die technischen Grundlagen moderner Empfehlungstechnologien.

Stefan gibt Einblicke in den Aufbau eines Graphen mit rund 92 Millionen Knoten und 140 Millionen Beziehungen. Dabei geht es um Nutzer, Touren, Regionen und Interaktionen – und darum, wie Machine-Learning-Modelle daraus personalisierte Empfehlungen ableiten.

Besonders spannend: Warum Erklärbarkeit immer wichtiger wird, welche überraschenden Erkenntnisse Outdooractive bei Experimenten zur Besucherlenkung gewonnen hat und weshalb Knowledge Graphen im Zusammenspiel mit KI-Agenten eine wichtige Rolle spielen könnten.

MY DATA IS BETTER THAN YOURS ist ein Projekt von BETTER THAN YOURS, der Marke für richtig gute Podcasts.

🔗 Zum Linkedin Profil von Stefan: https://www.linkedin.com/in/stefan-neubig/ 🔗 Zum LinkedIn Profil von Jonas: https://www.linkedin.com/in/jonasrashedi/ 🔗 Rund um Jonas: https://linktr.ee/jonas.rashedi

Du möchtest gezielt Werbung im Podcast MY DATA IS BETTER THAN YOURS schalten? Zum Kontaktformular: https://2frg6t.share-eu1.hsforms.com/2ugV0DR-wTX-mVZrX6BWtxg

Du möchtest deine Werbung in diesem und vielen anderen Podcasts schalten? Kein Problem!
Für deinen Zugang zu zielgerichteter Podcast-Werbung, klicke hier.

Audiomarktplatz.de - Geschichten, die bleiben - überall und jederzeit!

Transkript anzeigen

00:00:00: In der heutigen Folge spreche ich mit dem lieben Stefan von Autoactive zum Thema Recommendersystem beziehungsweise Knowledge Grafen.

00:00:07: Ein total spannender Punkt, weil am Ende sehen wir das gerade wirklich tagtäglich in unserem normalen Leben.

00:00:13: Man ist auf einer Webseite, kriegt irgendwie ein Produkt empfohlen oder isst eine App und kriegt irgendwas empfohlens was dazu passen könnte.

00:00:19: Und das mal zu überlegen wie kann man das eigentlich technisch im Hintergrund aufbauen?

00:00:22: Was braucht man alles dafür?

00:00:23: Wie kostet eigentlich so viel oder was kostet der Betrieb?

00:00:27: Das sind alle Themen die wir in der heutige Folge besprechen

00:00:33: Neue Folgen jeden Freitag.

00:00:35: In dieser digitalen Welt gibt es einen speziellen Faktor, der über Erfolg und Misserfolg entscheidet

00:00:40: – Daten!

00:00:42: Doch nur die wenigsten wissen sie für sich zu nutzen.

00:00:46: Wer seine Kunden verstehen will um ihnen das bieten zu können was sie brauchen kommt um ein professionelles Datenmanagement nicht herum.

00:00:53: Jonas Rascheli interviewt andere Experten aus den Data Bereichen und zeigt Schritt für Schritt wie genau das funktioniert.

00:01:05: Mein heutiger Gast der Liebe Stefan ist jemand, der eine vielleicht doch seltene Kombination mit sich bringt.

00:01:12: Industrierealität Forschung in Personalunion.

00:01:17: Stefan Neubig ist Head of Data Engineering und AI bei Outdoor Active, eines der größten europäischen Outdoor Tourismus-Plattformen.

00:01:28: Ich habe mir mal hier die Zahl mit aufgeschrieben, neunhundert Zehn Tausend Touren und über dreißig Millionen Akteure in einem Ökosystem.

00:01:37: Gleichzeitig arbeitet er gerade an seinem Doktortitel, noch nicht abgeschlossen aber dabei in der TU München zum Thema Empfehlungssysteme und wie man die vor allem auch erklärbar machen kann.

00:01:50: Und das worüber wir heute reden ist genau nämlich dieser Schnittpunkt dazwischen.

00:01:55: Stefan Baut unter anderem bei Outdoor Active eben ein Zentralen Knowledge-Graf

00:02:01: auf oder

00:02:02: arbeitet daran und das ist eines der spannendsten Punkte über die wir uns heute auch unterhalten wollen.

00:02:07: Und schauen wie es eben da weitergeht.

00:02:11: Herr Stephan!

00:02:12: Hi Jonas!

00:02:13: So, lange Intro.

00:02:15: aber habe ich denn irgendwas in der Intro vergessen was sozusagen noch erzählt werden sollte?

00:02:21: Nein, noch gar keinen Fall.

00:02:22: Die war gut genug.

00:02:23: Das war völlig neu.

00:02:26: Stefan, kannst du uns vielleicht doch nochmal kurz so Anwendungsfälle von Outdoor Active vorstellen?

00:02:32: Was es ist.

00:02:34: Was sich vielleicht viele die nicht zu diesen neunhunderttausend Touren gehören also die da irgendwie mal ein bisschen reingucken was man dazu machen kann.

00:02:44: Out of the Active hat im Endeffekt zwei Seiten und die eine Seite ist bekannter, das ist die BtoC-Seite.

00:02:49: Da haben wir in der App ein Wanderportal verschiedene Webseiten wo du in Touren, Points Of Interest und so weiter suchen kannst, kombinieren kannst oder auch planen kannst.

00:02:57: Und dann haben wir noch einen relativ prosen BtoB Teil.

00:02:59: tatsächlich d.h.

00:03:00: Destinations für unsere Partner sind Kunden stellen ihre eigenen Inhalte bei uns rein bekommen Reichheit weite und können mit uns zusammenarbeiten wenn zum Themen wie Besucherlenkung geht.

00:03:11: Also ich will meine Destinationen vielleicht nicht in die Overcrowd und ich habe bestimmte Orte, die Overcrawled sind.

00:03:16: Ich möchte Besuche umverteilen also die

00:03:19: Dienstleistungen.".

00:03:20: Und ich würde sagen Autoective hat da so ein bisschen eine Alleinstellungsmerkmal weil wir auf der einen Seite der BtoC Firmen sehen.

00:03:28: Komut Ultra ist das kennt man auch für andere Zeit auch ne ganze Menge BtoB-Unternehmen haben, die auch anbieten im Tourismus sind.

00:03:35: aber Autoeactive ist hier an der Schnittstelle was wir als Einmalige Marktposition für uns eigentlich sehen.

00:03:42: Und was macht man da so im Data und AI Bereich, in dem Engineering-Bereich?

00:03:47: Was passiert da so?

00:03:48: Lange Zeit hat man bei Autoaktiv vor allem an der Karte gearbeitet – die Karte der Große Stolz!

00:03:53: Ich kam dann vor fünf, sechs Jahren zum Autoaktif und gerade als ich kam wollte man Data deutlich stärker ausbauen.

00:04:01: also da ging es nur vor allem darum dass die Destination immer mehr Interesse daran haben Wie viele Leute besuchen mich tatsächlich, wie viele Leute klicken auf mein Content und was für Leute vor allem Besuchen mich.

00:04:11: Also auch diese Personanalyse waren ein großes Thema.

00:04:14: Wir haben

00:04:15: hier so Insights zu verstehen.

00:04:16: Total

00:04:17: Insights!

00:04:17: Wie ist das erste Projekt in dem ich habe?

00:04:20: Hab' ich

00:04:21: gut erraten.

00:04:22: Großartig!

00:04:25: Aber dieses Henne-Eye-Prinzip ist natürlich auch... dann will man Insights haben, hat vielleicht aber noch nicht die Datengrundlage geschaffen.

00:04:32: Was hast du denn davor gefunden?

00:04:34: Das richtig.

00:04:34: Ich hatte Ein relativ großes Glück, dass schon sehr viel erfasst wurde.

00:04:38: Das wurde aber nicht persistiert!

00:04:40: Wir hatten da relativ viele Events wie Clicks, das wurde aber gar nicht weiter verarbeitet sondern das wurde ausschließlich verwendet um so eine kurze Session History zu haben.

00:04:50: Wir haben dann angefangen das zu persistieren und das zu speichern und dann hatten wir auch in relativ kurzer Zeit im halben Jahr schon sehr belastbare Daten.

00:04:58: nach einem Jahr hat sie natürlich das ganze Jahr mit jeder Seasonalität eingestellt.

00:05:02: Ja, sonst war es relativ gut.

00:05:04: Wir hatten relativ viele aufgezeichnete Tracks die natürlich helfen, eine Heatmap zu bauen und wir haben vor ein paar Jahren Viewranger akquiriert.

00:05:13: das ist auch so eine Wander-App, die in UK relativ bekannt war.

00:05:17: Die haben akquirieren, da haben wir relativ viele Tracks gekriegt Und du kannst deine eigenen Accounts wie Garmin usw.

00:05:22: mit Outdeckte zwischendurch verbinden.

00:05:24: Das heißt wenn Du das tust dann haben wir diese Tracks natürlich auch und können damit weiterarbeiten.

00:05:30: Ich weiß am Wochenende in Schmalenberg Falke sitzt er ja mit dem Hauptsitz und hat auch wunderbare Falke-Wandersocken.

00:05:38: Und ich bin Wandern gegangen, den Case hatte ich auch.

00:05:44: Also ich habe online gegoogelt beziehungsweise am Ende habe ich eher ich gesagt Klot bedient und hab gesagt was ist eine coole Wanderstrecke?

00:05:51: Die war dann gar nicht so gut.

00:05:52: also die war im Sinne von man startet wo aber wie man die Strecke dann ablauft im Wall.

00:05:58: das war nicht so cool und ich glaube der hätte ich mir auch eher noch mal eine Art App gewünscht, die mich mehr durchführt.

00:06:05: Nicht dass ich mit dem Handy durch den Wald laufen wollte aber an gewissen Positionen biegt man dann ja ab.

00:06:11: Wisst ihr sagt ihr wieviel User ihr so in der App habt?

00:06:16: Puh!

00:06:16: Gut.

00:06:16: also wir haben es ist sechzehn Millionen registrierte Nutzer.

00:06:19: jetzt muss ich überlegen wie viele davon nutzen die App regelmäßig?

00:06:21: Ich habe da keine verlässlichen Zahlen.

00:06:23: tatsächlich gerade Ja ist

00:06:24: gut Aber das ist ne Hausnummer.

00:06:26: Sechzehnt Millionen registrierte Nutzer wenn man überlegt das irgendwie ca.

00:06:29: Achtzig Millionen in Deutschland leben.

00:06:32: Aber ihr seid auch international unterwegs?

00:06:34: Wir sind international unterwegs, wobei wir eher in Europa unterwegs sind.

00:06:38: also wir sind auch in der USA, wir sind aber auch in Asien da relativ klein.

00:06:44: Also Europa ist so eigentlich unser Markt und da ist speziell das deutschsprachige Raum besonders stark, aber auch UK sehr stark durch die Akquirierung genau und Frankreich tatsächlich auch relativ gut.

00:06:58: Jetzt habe ich vorhin schon das Buzzword Getropped Knowledge Grafen.

00:07:04: Das ist ein Thema mit dem ihr euch schon mal anfänglich beschäftigt habt, dann überlegt habt wie kann man damit weitermachen?

00:07:09: Kannst du uns erstmal so ein bisschen Schritt für Schritt erklären... Wie kam man zu den Gedanken?

00:07:15: Zu was waren die ersten Schritte und warum macht man das überhaupt?

00:07:22: Ja, hat eine gewisse Historie wahrscheinlich.

00:07:25: Bevor ich mal auch zu Active gelandet bin bin, war ich bevor des Inforschungsinstituts.

00:07:30: Dort habe ich mich schon relativ tief mit Knowledge-Grafen beschäftigt und kam so in das Thema rein.

00:07:35: also ich hab' das Thema schon zu Outback ein bisschen mitgebracht und habe dann halt einfach selbst überlegt jetzt baue ich diesen Datenbereich auf.

00:07:42: wie kann nicht dass jetzt mit Knowledge Grafen mit dem was sich gut kann unterstützen?

00:07:45: Kannst

00:07:46: du kurz erklären was Knowledge Graph ist?

00:07:48: Ja es wird halt gern sogar vor allem deshalb weil Knowledge Graph gar keine einheitliche Definition hatten.

00:07:55: Ich glaube, im Jahr zwölf hat Google mal das World Knowledge Graph benutzt.

00:07:58: Davor hat man immer von Linked Open Data gesprochen.

00:08:01: Das war so diese Semantik-Webzeit die sich nie wirklich eingestellt hat am Ende des Tages.

00:08:06: Werden Knowledge Graphen ist ja unterschiedlich definiert.

00:08:09: Eine Definition wäre die Du hast einfach ein Graph von Real World Entities also irgendwelche echt Weltoobjekte in einem großen Graph die irgendwie verbunden sind und dann hast du einen Knowledge Graph.

00:08:21: Akademisch ist die Definition vielleicht nicht ganz so beliebt Und bei mir offen gesagt auch nicht, weil ich finde das wirklich zentrale.

00:08:28: Bei einem Knowledge Graph ist die Semantik und die Sematik ist meistens gegeben durch eine Ontologie.

00:08:32: also für mich Knowledge Graph finde ich das sage meine ich immer ein Grafen der Daten verbindet aber eine Semantika vor meiner Ontologie quasi ein Grafschema wenn man es vereinfacht sagen will dabei hat dass das ist für mich ein Knowledge Graph.

00:08:47: Ja kannst du einfaches Beispiel machen?

00:08:50: Ich glaube, so die bekannten Knowledge grafen sowas wie dbp dir zum Beispiel oder freebase damals das was Google dann akquiriert hat.

00:08:59: Was ist denn ein konkretes Beispiel bei Autoactive?

00:09:01: Wir haben halt einen Grafen.

00:09:02: jeder Knoten ist entweder eine Tour oder es ist ein Point of Interest Es kann Nutzer sein und die Kanten sind alle mögliche Relationen zwischen diesen Objekten oder auch Interaktionen wenn ich zwischen einem Nutzer und Natur rede.

00:09:15: Nutzer hat auf eine Tour gelegt, Nutzer geht eine Tour usw.. Also diese Information habe ich drin und die Anthologie sagt, welche Knoten und welche Kanten das potenziell geben darf.

00:09:26: Und wie die Zusammenhänger.

00:09:27: also gibt's Ausschlüsse?

00:09:29: Darf einen knoten wenn er die eine kannte hat vielleicht die andere nicht besitzen und so weiter.

00:09:32: So jetzt

00:09:33: hab' ich dich glaube ich unterbrochen mit dem.

00:09:37: Du hast neulich Grafen mit zur Autoaktiv gebracht und hast dir überlegt Wie kann man es da einsetzen.

00:09:43: Genau am Ende war einer der ersten Dinge die wir gemacht haben ein Recomender System zu bauen Und dann haben wir angefangen, uns mal ein bisschen mit Recommendern zu beschäftigen.

00:09:51: Hat doch zu meiner Forschung gut gepasst und am Ende sind mir relativ schnell draufgekommen was wir brauchen ist eigentlich kein klassischer Recommender sondern einen Multistakeholder Recommender.

00:10:01: also ich muss die Perspektiven von mehreren Seiten erfüllen.

00:10:04: Ich habe vorher schon gesagt Wir haben Bestenationen das sind unsere Plattformpartner.

00:10:07: wir haben Kunden als Nutzer die unsere App nutzen und beide haben bestimmte Bedürfnisse.

00:10:14: Nutzer wollen ja einfach den besten Outdoor-Trag haben, Destinationen haben bestimmten Lenkungsbedürfnissen.

00:10:19: Sie wollen nicht dass Leute durch gesperrte Wege gehen passiert tatsächlich sehr viel häufiger als man denkt.

00:10:25: sie wollen nicht das eine Destination extrem overcrowded oder andere undercrowded ist.

00:10:29: Das ist relativ komplex.

00:10:31: Und deswegen haben wir uns überlegt Wir brauchen recommender der das irgendwie vermittelt.

00:10:36: und was wir uns als nächstes überlegt haben is Eigentlich darf dieser Recomender nicht nur vermitteln.

00:10:41: Eigentlich musste das auch erklären, weil wir wollen ja dass die Nutzer das auch verstehen.

00:10:45: Also wir wollen nicht nur den Nutzer sagen übrigens geh mal zu diesem Ort hier weiß ich nicht Schloss von Schwangau und wir bieten ihm das Schloss Neuschwanstein gar nicht an.

00:10:55: Da wird sich jeder fragen wieso bieten die mir das Schlost Neuschvanstein nicht an?

00:10:58: Das ist naheliegend!

00:10:58: Weil jeder kennt das und die Plattform ist komisch weil das ist das Naheliegens der was ich dir anbieten kann.

00:11:05: wenn wir aber dazuschreiben Geht auch zu hohen Schwanker, weil Schloss Neuschwanstein ist wirklich voll zu der Zeit.

00:11:10: Das macht dir keinen Spaß und das ist eh alles überlastet schon hier ne?

00:11:14: Du kannst es so in einer anderen Zeit machen vielleicht im Herbst wenn du jetzt eh in Deutschland wohnst nicht soweit weg bist zum Beispiel dann wär das eine zeitliche Lenkung.

00:11:23: Und da sind wir in der Suche gekommen.

00:11:24: Wir müssen auch erklären Wenn man das Ganze jetzt technologisch betrachtet Wie kann ich diese drei Dinge zusammenbringen?

00:11:32: Da sind Knowledge Grafen Ein Ansatz zur Zeit vor ein paar Jahren extrem populär war, genau dafür noch bevor wir LLMs hatten.

00:11:41: Wenn man das mal ein bisschen tiefer legt und ein bisschen auseinander dividiert... Ich habe mir so Zahlen aufgeschrieben, da hattest du ja auch gerade eben gesagt, ihr habt ca.

00:11:48: dreißig Millionen Akteure im Ökosystem.

00:11:52: Ihr habt die über neunhunderttausend Touren.

00:11:54: Ihr hat auch zwanzig Sprachen, so viel zum Thema Internationalität.

00:12:00: Das sind Zahlen, die man jetzt vielleicht auch lesen kann.

00:12:03: aber auf der anderen Seite interessiert mich natürlich diese Wie baut man das?

00:12:08: Also wie viel Entitäten liegen da, wie viele Beziehungen muss ich mir eigentlich untereinander vorstellen.

00:12:16: Wieviel Abfragen laufen dadurch, wieviele Terabyte an Daten liegen da.

00:12:20: Das sind so die Punkte, die natürlich total spannend sind.

00:12:24: Das kann ich dir tatsächlich relativ genau sagen.

00:12:26: wir haben ungefähr zwei neunzig Millionen Knoten zum Knowledge Grafen von verschiedenen Typen.

00:12:32: Das können Touren sein es können Points of Interest sein auch Regionen seien unsere ungefähr einhundertvierzig Millionen Kanten, die diese verbinden.

00:12:40: Explizite Kanten muss ich sagen.

00:12:43: Das heißt was modelliert dieser Knowledge-Kraft?

00:12:45: Das ist jetzt nur der für unseren Rock-Commander, oder?

00:12:47: Nur der Recommender- Knowledge-Graf, der modellierte welche Objekte gibt es in unserem Ökosystem?

00:12:52: also gibt's irgendwelche Touren, welche Points of Interests gibts?

00:12:56: wie sind sie vielleicht mit den Touren verbunden?

00:12:58: Der eine Point Of Interest liegt auf Natur und so weiter.

00:13:00: Also einfach alles modellieren.

00:13:01: dann gibt es die Regionen, eine Tour kann durch verschiedene Regionen geben Und dann habe ich den Nutzer auf der anderen Seite und der interagiert mit diesen Objekten.

00:13:11: Er hat drauf gelegt, er hat es auf dem Merkzettel.

00:13:13: Das sind alles verschiedene Kanten.

00:13:14: das heißt ich hab immer eine Kante zwischen einem Nutzerobjekt und der Tour und die ist halt beschriftet wenn man so möchte mit einem Attribut.

00:13:23: also es kann entweder ein Besuch sein oder was auch immer.

00:13:27: Was jetzt der Recommender macht wenn er trainiert wird?

00:13:30: Der lernt vorher zu sagen welche Kanten wahrscheinlich auch existieren.

00:13:35: Und das kann man sich jetzt so vorstellen, ich habe es in diesem Grafen.

00:13:37: Ich hab eine Tour und ein Nutzer.

00:13:40: die sind nicht verbunden.

00:13:42: Ich habe aber einen Algorithmus so trainiert dass er die Wahrscheinlichkeit berechnen kann, dass es eine Kante zwischen beiden gibt zum Beispiel eine Click-Relation.

00:13:49: also wie wahrscheinlich ist es dass der Nutzer dort draufklickt?

00:13:51: oder wie wahrscheinlich isst es da der Nutze die Tour herunter lädt oder auch wirklich dann physisch dorthin geht?

00:13:56: Diese Wahrscheinlichkeiten kann ich berechnend dafür trainieren.

00:13:58: werden Grafnull Network auf dem Knowledge Grafen Potenziell die Wahrscheinlichkeit für jede Kante zwischen allen Knoten berechnen, die dann eben heißen hat Interesse an.

00:14:11: Und das ist das was ich dann eben rausgehe und es interessant der in diesem Knowledgecraft passierten Recommender ist.

00:14:17: jetzt klassischerweise gibt's bei Recommendersystem zwei Familien so ganz ursprünglich.

00:14:23: Das sagt man Content basiert.

00:14:24: Ich empfehle Contents die ähnlich sind wie Contents, die du in der Vergangenheit gemacht

00:14:28: hast

00:14:29: und kollaboratives Filter.

00:14:31: also ich empfehles Content, die Nutzer, die so ähnlich sind wie du halt auch angeklickt haben.

00:14:38: Und wenn wir jetzt das ganze verbinden, dann haben wir einen Fibriden-Recommender und ein Knowledge-Craft.

00:14:43: Der beide

00:14:44: Vorteile verbindet?

00:14:45: Ganz richtig!

00:14:46: Der verbindet die Beide allerdings so ein bisschen blackboxartig.

00:14:48: also so richtig verstehst du es nicht aber alle Faktoren spielen mit rein.

00:14:52: Das heißt wir haben den kollaborativen Anteil dran und wir haben dem Content Ähnlichkeitsanteil dran.

00:14:58: So trainieren wird dann das Modell dass diese Kanten herleitet.

00:15:02: Und das Spannende ist, wenn ich jetzt einen Grafen habe und dann hab' ich eine Kante hergeleitet zwischen Tour A und Nutzer B. Dann sind Tour A-Nutzer B ja noch nicht direkt verbunden weil diese Kante berechne ich.

00:15:14: aber sie haben ne andere Verbindung die eben über die Grafstruktur gegeben is'.

00:15:19: Zum Beispiel hat der Nutzer irgendeine Region besucht und diese Region wird von einem anderen Nutzer gesucht und der wiederum hat andere Ähnlichkeiten und der findet diese Turgut in welcher Form auch immer.

00:15:30: Und diese Verbindungen kann ich jetzt nutzen, um eine Erklärung zu erzeugen.

00:15:35: Wie der Recommender auf die Idee gekommen ist, diese Tour vorzuschlagen.

00:15:39: Ja.

00:15:39: Trainiert man diesen Recommender öfters?

00:15:42: Wenn ja wie oft?

00:15:44: Das richtig!

00:15:44: Wir trainieren so ungefähr einmal pro Woche neu weil du hast neue Nutzer, du hast neue Touren als ändern sich Sachen.

00:15:51: also einmal pro Wochen trainieren wir neu.

00:15:53: Ja, und ich ahne welche Frage das nächstes kommt.

00:15:56: Welche kommt als nächstes?

00:15:58: Ganz sicher, du willst wissen was wir dafür zahlen.

00:16:01: Danke genau.

00:16:03: Der ist immer betriebswirtschaftlich gedacht.

00:16:08: Du hast jetzt noch nicht gesagt wie groß dieses System ist oder will ja so ein bisschen hin also.

00:16:13: Recomender is eins der wichtigsten und spannendsten Punkte die man im e-Commerce kennt, die man in anderen Modellen kennt.

00:16:18: Wie baut man es auf?

00:16:19: Ein bisschen was ich in der Folge versuche hier herauszufinden ist die, wie kann man diese Verbindung herstellen?

00:16:25: Ich versuche es jetzt gerade mal mit einem E-Commerce zu verbinden der Fashion Sachen verkauft.

00:16:31: Da gibt's ja auch unterschiedliche Nutzern, unterschiedliche Produkte, unterschiedlich Herkünfte vielleicht wo die Nutzer herkommen, Wetter.

00:16:38: mit dem was verbinden kann und auf Basis unterschiedlichen Faktoren kannst du halt eben diese unterschiedlichen Beziehungen auch herstellen, die du dann rausfindest dass wenn jemand vielleicht die schwarze Laufshirt gekauft hat, dann auch eher das gelbe Polo kauft.

00:16:53: So, jetzt habe ich einen langen Monolog gehalten.

00:16:54: Jetzt will ich die zahlen müssen.

00:16:56: Okay du hast es nicht vergessen.

00:16:58: Ja Die Zahlen sind unglaublich niedrig.

00:17:02: tatsächlich Wir haben aktuell Ausgaben von.

00:17:06: Ich glaube also wir nutzen zwei Server.

00:17:08: Ich hole aus dass dich warten benutzen zwei server.

00:17:11: der eine wird fürs modell training verwendet Das machen wir einmal die Woche und der andere server wird verwendete für die inference.

00:17:17: die Machen wir jede nacht Was bei der Inferenz passiert ist, für jedes der Objekte von denen ich geredet habe.

00:17:22: Jede Tour, jeder Nutzer, alles was in dem Grafen ist wird ein Embedding erzeugt.

00:17:27: Diese Embeddings aus Elektoren werden nun einfach in einer Datenbank gespeichert.

00:17:31: Die speichern wir aktuell in eine Clickhouse-Datenbank.

00:17:33: die ist relativ perfamant und die haben wir sowieso schon.

00:17:37: Da kann ich dir jetzt nicht sagen welchen Anteil dieser Vektorspeicher ausmacht aber das sind vielleicht ein paar hundert Megawatt also dass es relativ wenig.

00:17:45: Das kann man glaube ich ziemlich vernachlässigen.

00:17:47: Und zur Laufzeit, wenn ich in der konkrete Empfehlung durchführe, frage ich auch immer nur die Datenbank.

00:17:52: Das heißt, da fallen keine anderen Inferenzkosten an.

00:17:56: und ... Die Server auf den ich das Modell trainiere, der kostet ... ... zweihundertfünfzig Euro pro Monat... ...und der Inferent-Server kostet fünfzig Euro per Monat.

00:18:04: Und es ist nicht mal so, dass sie die ganze Zeit ausgelastet ist, sondern der Maschinearning-Serber wird einmal pro Woche benutzt und der Inference-Servers einmal pro Nacht.

00:18:12: Da läuft uns so die halbe Nacht und dann ist er wieder gut.

00:18:15: Ja!

00:18:17: Wenn ich jetzt tief ober und du mich über Neu über neunzig Sekunden irgendwie so den elevator pitch machen müsstest zu Warum macht es Sinn?

00:18:26: Ein knowledge grafen zu haben?

00:18:27: was kostet das?

00:18:28: also sozusagen Aufwand gegen ertrag.

00:18:30: Was wäre dein pitch?

00:18:32: Mein pitch schwer Lieber Jonas.

00:18:36: Es ist tatsächlich, so dass wir neue fähigkeiten dazu bekommen.

00:18:39: Ich würde gar nicht so sehr finanziell argumentieren weil was sind die kosten von dem knowledge graven.

00:18:43: Die kosten sind vor allem das schema des modell.

00:18:47: Das ist gar nicht so einfach zu entwickeln, das kann man zugeben.

00:18:49: Dann kann man sicherlich ein halbes Jahr planen und es natürlich ein iterativer Prozess muss verfeinert werden.

00:18:55: Infrastrukturkosten allerdings fallen normalerweise keine an zumindest wenn man ihn so baut wie wir ihn bauen nämlich virtuell.

00:19:01: Das heißt wirklich nur so eine Stück Software über der bereits vorhandenen Datenbanklandschaft das vermittelt Und im Endeffekt fallen so keine Mehrkosten an den Vergleich zu dem, was ich eh schon habe.

00:19:13: Die sparen mir auch sehr viele Data Engineering Prozesse natürlich weil die Daten müssen nicht kopiert werden.

00:19:19: Ich würde das damit argumentieren dass wir neue Fähigkeiten erhalten aber ich würde sagen finanziell hast du gar keinen großen Nachteil.

00:19:26: Wenn Du jetzt den Mehrwert von dem Recomender nehmen kannst kannst Du irgendwie Zahlen nennen, wenn du so ein bisschen in dich reingehst und überlegst was war der krasseste AHA-Effekt wo dein Gefühl war?

00:19:39: Der

00:19:45: Rekommender funktioniert nicht.

00:19:47: Und das waren Ergebnisse von einer sehr interessanten Studie tatsächlich die wir zusammen mit der Hochschule Campen gemacht haben.

00:19:55: Was wir gemacht haben, da haben wir einen Experiment zur Besucherlenkung durchgeführt Und dazu haben wir uns ein Experiment überlegt, wo wir Nutzern, Warnmeldungen für Touren anzeigen.

00:20:06: Hier wirds voll.

00:20:08: Geht er vielleicht nicht hin?

00:20:09: Wir haben verschiedene Gruppen gehabt.

00:20:10: Der eine bekommt nur die Warnung hier wird's voll der andere bekommt Alternativen vorgeschlagen.

00:20:15: also hier wird es voll und hier sind Alternatifen und noch ne andere Gruppe kriegt dann auch noch Erklärungen dazu.

00:20:21: Also hier wird´s voll.

00:20:23: Das ist übrigens alternativ und zu jeder Alternative steht noch so'n kleiner Satz dabei Warum wird es da eigentlich voll?

00:20:29: Oder warum ist diese Alternative gut für dich geeignet, also passt auch zu der Tour, passt zu dir persönlich und so weiter.

00:20:36: Und was wir dann festgestellt haben ist das Ergebnis war die Leute sind erst recht zu der tour gegangen, für die wir Warnmeldungen ausgespielt haben.

00:20:46: Ergebnis knappheit.

00:20:49: Wir haben nur noch zweimal diesen artikel Scheinbar macht das die Tour attraktiver und unser Fazit war dann, wenn du nicht möchtest, dass Leute wohin gehen.

00:20:57: Dann sagen sie sollen da auf keinen Fall hingehen.

00:21:00: Ich meine, wenn Du willst, dass sie dahin gehen?

00:21:02: Genau!

00:21:03: Wir haben aber noch weiter gemacht.

00:21:05: zur Ehrenrettung muss ich das sagen und zwar war das ja erstmal nur ein Hinweis.

00:21:09: also hier wird's voll.

00:21:12: Wenn du das Ganze noch ein bisschen anders Frames und so Nudging-Elemente einsetzt, zum Beispiel hier wird es voll.

00:21:18: Du wirst Nachteile haben, z.B.

00:21:20: keinen Parkplatz finden.

00:21:21: Du wärst im Stau stehen.

00:21:22: also wenn du auf dieses emotionale bisschen spielst dann hat der Recommender plötzlich relativ gut funktioniert und das war für uns auch ein sehr interessantes Feining bei der ganzen Geschichte tatsächlich.

00:21:34: Den Ansatz den er verfolgt ist ja relativ mutig.

00:21:38: Ich habe mit wenig Firmen darüber gesprochen, wie sie diese Recommender bauen.

00:21:44: Ganz oft wird ja vor allem im E-Commerce immer Recommender mit dazugekauft.

00:21:50: Ich hatte auch mal eine Folge mit jemandem von Otto aufgenommen zum Thema Recommender.

00:21:56: Da war so ein bisschen die Aussage dass der Recomender ja auch auf Basis von unterschiedlichen Modellen gebaut werden kann.

00:22:07: Bei Otto war es glaube ich so, dass das ein Maschinenlearning-Recomender war, der gut funktioniert.

00:22:14: Warum braucht ihr eigentlich wenn man die Logik nochmal aufbricht und technisch zerlegt?

00:22:19: So eine semantische Schicht im Vergleich dazu, dass es andere nur mit einem Maschinlearning-Modell machen?

00:22:26: Das ist der gute Frage!

00:22:28: Unser Maschinearningmodell, unser Netzwerk steht da erst... setzt ihr erst mal auf dem Knowledge Grafen auf.

00:22:34: Tatsächlich nutzt dieser Recommender auch nur den Grafen und gar nicht die Semantik, er könnte die Sematik vermutlich nutzen.

00:22:42: das kann man doch irgendwie wieder rein schußt.

00:22:43: dann aber das machen wir gar nicht, der nutzt tatsächlich den Graven.

00:22:47: Die Semantig drüber hilft uns dann tatsächlich um Erklärungen zu generieren Und dafür ist sie tatsächlich unglaublich nützlich.

00:22:54: Ja um die zusätzlichen Informationen, die du jetzt gerade beschrieben hast dieses Nudging Thema und Co.

00:23:00: mitzu darzustellen

00:23:02: Ja einmal das, aber auf der anderen Seite navigierst du ja bei der Erklärung auch den Grafen.

00:23:06: Wenn Du die Erklärungen warum existiert eine Kante zwischen A und B haben möchtest versuchst Du andere Pfade zu finden zwischen A & B die bereits existieren über verschiedene Knoten.

00:23:16: Und da ist es relativ gut wenn man weiß dass es übrigens ein point of interest und für points-of-interest gilt folgendes Points of Interest, das sind irgendwelche interessanten Punkte und so weiter.

00:23:27: Wenn du einfach diese Zusatzinformation hast was ist eigentlich ein Point-of-Interest?

00:23:31: Was ist eigentlich eine Region oder was ist eine touristische Region im Vergleich zu einer politischen Region?

00:23:36: Wenn du diese Informationen hast, dann fällt es einfach deutlich leicht in eine gute Erklärung zu generieren.

00:23:41: Und gerade jetzt wo wir LLMs haben die extrem gut im Text trendern sind funktionierst natürlich gleich doppelt so gut.

00:23:48: wenn wir dann diese Information aus dem Graf ans LLM mitgeben dann kriegste gleich mal ne ganz andere Erklärungen als wenn du jetzt einfach nur die beiden Touren antraust und der zusammen fand dass sie erst warum könnten die zusammenpasst?

00:23:58: oder warum passt er einen Nutzer zur Tour?

00:24:02: Lass uns mal beide ein bisschen gedankenexperimentiert durchspielen.

00:24:05: Total gerne!

00:24:06: Und ihr habt das glaube ich so ein bisschen in den Anfang des Jahrzehnts.

00:24:13: Wenn ihr euch nicht entschieden hättet deiner Passion nachzugehen, Knowledge Grafen zu bauen sondern stattdessen eher dasselbe auf einem klassischen modernen Data Stack zu legen.

00:24:24: Also irgendwie ohne jetzt irgendwie Namen im schlechten Kontext zu sagen aber irgendwie Snowflake, DBT und dann noch Luca obendrauf Und vielleicht noch mal so als Prise, ein bisschen large language model dazu.

00:24:39: So ein bisschen gehässig zu sein.

00:24:40: was wäre passiert?

00:24:42: Es sind ja alles ganz großartige Produkte.

00:24:46: Ja, naja was was wer passiert?

00:24:49: es hätte wahrscheinlich auch relativ gut funktioniert.

00:24:53: ich muss Ich muss mal sagen was war eigentlich so eine große Motivation?

00:24:56: war eine knowledge kraft zu verwenden?

00:24:59: und ich glaube die größte motivation oder was denn die motivation nochmal deutlich verstärkt dass gerade weil wir jetzt über Large Language Models und Agenten usw.

00:25:07: sprechen?

00:25:08: Und das Problem ist, ich habe vor zwei Jahren dieses große Ziel gehabt eigentlich, wie wir bauen einen riesigen Knowledge Grafen auf der Zentrum für alles wird eine Motivation davon war, treib damit deine komplette agentische Architektur an!

00:25:26: Weil was du machst wenn du ein Agenten hast Du hast natürlich etliche MCPs als Tools wo er dann auf Daten zugreifen kann Auf Datenbanken oder was auch immer.

00:25:34: Und wir haben gemerkt, wir können einfach mal unsere API nutzen.

00:25:38: Ein MCP-Rapper drum rumbauen und dann hast du halt diese API die du eh schon verwendest, musst nichts neu bauen und die nutzen halt unser Agent.

00:25:46: Das macht irgendwie Sinn?

00:25:47: Habt ihr Agenten im Einsatz?

00:25:48: Wir haben Agenten in einem Einsatz.

00:25:50: Da müssen wir uns zusprechen.

00:25:50: kommen

00:25:52: Können wir gerne machen.

00:25:53: aber was wir dann gefunden haben ist Du bist halt auch relativ stark limitiert.

00:25:58: Also du möchtest jetzt zum Beispiel Das ist ein Nutzer, der fragt jetzt an.

00:26:02: Ja ich hätte gerne eine Tour und bitte die Tours und bitte am Schloss der Schwanzchen vorbeigehen.

00:26:06: Jetzt hat unsere API natürlich die Möglichkeit dass du nach Touren suchst das du nach Points of Interest suchst.

00:26:13: Du kannst sogar die Informationen über die API oberzeit einen Point-of-Interest verknüpft ist.

00:26:18: aber die API hat halt einfach kein Filter dafür.

00:26:20: Und das ist ein relativ einfaches Beispiel.

00:26:23: Wenn ich dir jetzt ein anderes Beispiel gebe, ich will eine Wandertour mit diesen und ihnen Eigenschaften aber bitte in einer Region wo es Wetter am nächsten Wochenende mindestens fünfzehn Grad hat und die Sonne soll auch noch scheiden dann hast du hier einfach Beziehungen, die du so nicht auflösen kannst.

00:26:39: Der Agent würde wahrscheinlich wenn er relativ clever ist dann irgendwie strukturiert vorgehen ich suche erstmal alle Touren raus oder ich such erst mal Regionen raus und definiere ich mal das Wetter zu den Regionen dazu... Und dann wenn das Wett da passt, dann zurecht mir jetzt noch die Region aus.

00:26:52: Er macht ja die Tour aus.

00:26:54: Das heißt er macht hier einige Einzelschritte und kann es aber nicht auf einen Auffasch machen!

00:27:00: Die Vision bei diesem Knowledgecraft ist dass du das stark reduzierst.

00:27:04: zum Beispiel Du hast eine Knowledge Grafen, der verbindet Turen und Point of Interest.

00:27:10: Das heißt du könntest dann einfach mit einem Graph Matching Algorithmus oder halt einfach mit einer anfragisch-abfragischen Sprache.

00:27:16: das kann Sparkle sein, es könnte auch Psypha sein wenn man jetzt Neoforge hat.

00:27:20: Könntest du dann sehr viel flexiblere Fragen stellen als die die du an der API richten kannst?

00:27:26: Mit dem Alter oder mit dem neuen Stack?

00:27:28: Mit

00:27:28: den neuen Stack!

00:27:28: Ja

00:27:30: okay...das heißt du hast eigentlich gerade nochmal die Vorteile vom neuen Stack, vom Knowledge Grafen erklärt den du brauchst um perspektivisch auch Richtung Agenten Systeme abzubiegen.

00:27:41: Weil das nicht möglich wäre mit dem Stack... Mit dem klassischen sozusagen Data Stack.

00:27:48: Das wär damit auf jeden Fall so nicht möglich gewesen.

00:27:51: Wusstet ihr da schon damals so und habt euch deswegen dafür entschieden?

00:27:53: Das war unsere Vermutung quasi unserer Arbeitshypothese.

00:27:58: Stefan nochmal so ein bisschen die Frage.

00:27:59: Auf der einen Seite bist du ja Und meine Wahrnehmung ist bei einem Lehrstuhl, der zu einen der renommiertesten im Bereich Wirtschaftsinformatik zählt.

00:28:11: Auf der anderen Seite arbeitest du jetzt in einer Tourismus-Plattform im Allgäu.

00:28:17: Wo widersprechen sich denn akademische Anspruch und dann am Ende die Plattform Realität?

00:28:24: Ich glaube mein akademischer Anspruch war wie du dir vorstellen kannst diesen Knowledge Grafen komplett zu bauen und dann alles auf diesen Knowledge Grafen aufzusetzen.

00:28:36: Das passt überhaupt nicht zur Realität von Autoactive, wo man ja auch mal Produkte liefern muss.

00:28:41: D.h.,

00:28:42: das war dann der Punkt, wo wir gesagt haben okay, wir machen jetzt aus der Not eine Tugend!

00:28:46: Wir schauen erst einmal was erreichen wir mit den MCPs?

00:28:49: Und das Learning war, man erreicht unglaublich viel weil Agenten immer besser werden und in der Lage sind Tools sehr intelligent zu kombinieren.

00:28:57: Ich glaube immer noch, dass der Knowledge-Graf langfristig vielleicht sogar mittelfristig deutlich mehr Wert verspricht.

00:29:03: Aber es war ein wirklich sehr großes Learning wie schnell du heute Dinge bauen kannst und das war natürlich so ein bisschen gegen das Forschungsinteresse aber das war okay.

00:29:15: Das

00:29:16: heißt so eine Achtzigzwanziglösung hinzusetzen?

00:29:19: Ja also ich glaub das kann man sagen

00:29:21: pragmatisch unterwegs zu sein, ohne jetzt negativ.

00:29:25: Da muss ich natürlich fairerweise sagen dass wenn man jetzt am Wirtschaftsinformatik löscht und unterwegs ist und viele andere Doktoranden von Professor Kretschmer haben sehr viel Kontakt auch zu Unternehmen in der Wirtschaft meistens größere Unternehmen da lernt man durchaus Pragmatismus sein.

00:29:43: Der Ehrenrettung halber schon sagen also Pragmatismus habe ich am Lehrstuhl tatsächlich auch gelernt

00:29:49: Stefan wenn deine These stimmt dass der Knowledge-Grafen so ein bisschen mit hybride Architektur das Mittel, der Wahl für plattformnah KI ist und viele wollen ja Richtung Plattform eigentlich gehen.

00:30:06: Warum machen es dann nicht mehr so viele Unternehmen?

00:30:11: Oder warum auch es nicht mehr unternehmen?

00:30:14: Es ist eine spannende Frage, wobei ich gar nicht weiß ob's nicht doch stimmt, dass viele Unternehmen diese Richtung.

00:30:22: Also ich glaube jetzt auch gerade SAP hat vor kurzem gesagt, der Knowledge Graph hat als Modell gewonnen und die wollen sich dem stärker widmen.

00:30:31: Und wenn man jetzt mal so Richtung Text-to-SQL Ansätze schaut dann sieht man auch das da der Trend geht ein bisschen semantischer zu denken.

00:30:39: also wenn ich jetzt mit natürlicher Sprache übersetzen möchte auf SQL Queries Dann verwenden da einige State of the Art Ansätze mindestens irgendeine Art von Semantic.

00:30:50: Manche nennen aber auch explizit Konzeptgrafen oder Ontologien.

00:30:55: Also das findet schon so ein bisschen den Weg ins Produkt, ich glaube auf der anderen Seite gibt es auch diesen riesigen Knowledgecraft-Hype und deswegen gibt's da einfach eine sehr heterogene Landschaft.

00:31:06: Aber insgesamt glaube ich, dass Thema ist durchaus eins des Wächstes.

00:31:11: Stell dir vor wir haben eine Hörerin die jetzt gerade zuhört oder einen Hörer, wie ich in dem mittelständischen Unternehmen unterschiedliche Daten über Kunden, über Produkte.

00:31:25: Über Bewegungen oder Käufe je nachdem wie man es sozusagen nimmt und die liest jetzt deine Paper die du veröffentlicht hörst vielleicht hoffentlich auch diese Folge Und schreibt dich am Montag so ein bisschen an.

00:31:38: Hey Stefan Ich fand jetzt die Folge so spannend und ich glaube das macht total Sinn sich mit dem Knowledge Grafen zu beschäftigen.

00:31:44: Was wären so die ersten drei Dinge die die Person tun sollte?

00:31:51: Aller Erste wäre, überlegte mal einen Use-Case wo der Knowledge-Kraft wirklich Sinn macht.

00:31:58: Weil genau das haben wir bei uns ja gesehen angefangen mit Wir brauchen diesen einen großen Knowledge-Graf und haben dann aber gemerkt naja wir fangen hier mal mit dem einen Wo wir sofort den Use Case haben an nämlich den Recommender und der nächste Knowledge-Craft wo wir gerade bauen Das ist dann der Knowledge Graf der den Agenten unterstützt.

00:32:16: dass die dann zusammenhängen irgendwann das ist klar.

00:32:19: Aber ich glaube, du musst auf jeden Fall Use-Case getrieben starten und die Ontologie kann auch sehr einfach sein.

00:32:24: Ich würde sie aber nicht weglassen.

00:32:26: Welche Personen bräuchte die Dame oder der Herr um das umzusetzen?

00:32:31: Ich glaube, Du brauchst einerseits gute Data Engineers, die einfach sicherstellen, dass die Prozesse stimmen vor allem dann wenn Du eine native zusätzliche Kraftdatenbank brauchst also nutzen möchtest, wenn Du ja vor Jay bei einer Virtualisierung brauchst einfach sehr gut Software Engineering, die Du möglicherweise ohnehin schon hast.

00:32:49: Ich glaube, dass die Einstiegshürde vor allem das ist sich diesem Thema mal zu nähern.

00:32:53: Dieses Ontologiethema ist ein Thema, das war lange Zeit, da haben wir ein sehr starkes Nischenthema und man sieht so'n bisschen wie es jetzt rauskommt.

00:33:00: aber in der Allgemeinbildung des typischen Informatikers kann ich auch von meiner eigenen Ausbildung sprechen.

00:33:07: Da waren Ontologien nicht im Standard-Lehrplan.

00:33:10: Ja, ich glaube schon... Wie kommt man zur Idee umzusetzen?

00:33:19: Und auch ich, habe mir natürlich vorher Gedanken gemacht zur Folge Knowledge Graphen ist schon ein Thema was für viele wenn man sich da nicht so einliest in bürmisches Dorf ist.

00:33:30: Da muss man natürlich verstehen wie man das aufbauen kann und was man es braucht.

00:33:34: am Ende sprechen viel mehr Nutzer oder erleben vielmehr Nutzer des Ergebnisses Recommenders.

00:33:42: Das riecht dich also.

00:33:43: ich erinnere mich auch wo ich mit dem Thema angefangen hab als Master Student.

00:33:48: mein damaliger Betreuer gesagt hat Stefan, mach mal.

00:33:52: Hier ist ein Onzologiebuch.

00:33:53: das war einfach eine Sammlung von vielen Papers die einigermaßen Advanced waren jetzt für meine damalige Wahrnehmung und es war unglaublich schwierig diesen Zugang zu finden.

00:34:02: ich glaube dass hat sich inzwischen verbessert.

00:34:03: Es gibt schon einige gute Textbücher zum Thema aber es ist immer noch finde ich sehr abstraktes Feld Und ich habe die große Hoffnung, dass wenn sich jetzt wirklich große Firmen dem auch widmen.

00:34:17: Dass das einfach viel mehr Mainstream wird weil es wäre auf jeden Fall ein Gewinn.

00:34:21: Wenn man Stefan sich so ein bisschen privat anguckt

00:34:24: was

00:34:25: wo und wie beschädigt.

00:34:25: also ich glaube die Doktorarbeit beschäftigt dich wahrscheinlich privat immer noch sehr.

00:34:29: Das heißt das Thema Recommender ist immer ein bisschen Punkt.

00:34:31: aber Was machst du privat mit Daten?

00:34:34: Du bist glaube ich auch einen Outdoor Mensch sonst würdest du glaube ich bei der Firma arbeiten.

00:34:40: Was sind so deine Themen, die dich privat mit dem Thema Daten umtreiben?

00:34:44: Ja, Daten im Rahmen der Doktorarbeits sind natürlich auch ein Thema.

00:34:48: Aber nein ganz privat!

00:34:51: Ich würde tatsächlich sagen es ist relativ schwierig weil die Zeit fehlt.

00:34:55: ich habe immer extrem gute Ideen also Ideen wie...ich bin totaler Kaffee-Liebhaber und meine Siebträger Maschinen.

00:35:02: Oh

00:35:02: jetzt know we are talking.

00:35:04: Jetzt wissen wir's interessant.

00:35:06: Ich hab mir schon überlegt diese Dinge müssen ja durchheizen bis das gut wird Und die könnte ich mal anschließen, so ein Stromzähler.

00:35:13: Ich hab den sogar schon angeschlossen.

00:35:15: Ich müsste es nur mal auswerten.

00:35:17: Ich kann relativ leicht rauslesen wann wird die Maschine verwendet?

00:35:20: Wann verbraucht sie wie viel und ist ja total interessant mal so einen Pattern zu analysieren dass ich jetzt selber an mir selbst nicht erkenne Wie oft kann ich dir eigentlich vielleicht doch mal ausschalten?

00:35:30: momentan läuft ihr halt einfach von früh bis wenn ich von früh um sechs Uhr läuft der durch bis abends dann

00:35:35: muss

00:35:37: Ja dann wird sich ausgeschalten, aber vielleicht kann man das optimieren.

00:35:40: Aber da fehlt ja die Zeit, ne?

00:35:43: Sonst hätte ich schon Lust drauf euch.

00:35:44: Ich glaube es ist wirklich die Umsetzungszeit, Ideen.

00:35:52: Wenn du nochmal die Folge oder dein Data Game selber mit einem Filmtitel bezeichnen würdest was wäre das?

00:36:01: Die Karte hinter der Karte.

00:36:03: Out of the Active hat die Karte großer Stolze.

00:36:06: so Geografische Karte und der Knowledge Graph hinter dieser Karte werden.

00:36:10: so diese Informationslandschaft, die hilft dass man über diese Karte auch geografisch besser navigieren kann.

00:36:15: Und alle Informationen dahinter besser versteht.

00:36:19: Cool!

00:36:20: Stefan wenn ich die Folge ein bisschen mit dem Fazit zusammenfassen kann was sich aus der Folge nochmal gelernt habe ist Recomendersysteme.

00:36:26: gibt es zwei unterschiedliche Arten und Weisen.

00:36:28: welches gibt ihr Content?

00:36:30: auf der anderen Seite user based also Verhalten und sozusagen Darstellungscase.

00:36:37: Auf der anderen Seite gibt es einen Grund, warum man sich mit dem Thema Knowledge Grafen beschäftigen sollte.

00:36:42: Weil wenn man weiter in die Zukunft geht und das Thema der Ontologie und Semantik sich einmal vielleicht teilweise mit anschaut kann es die Grundlage sein für Agenten.

00:36:55: Die Verbindung der unterschiedlichen Entitäten, die es eigentlich im Unternehmen gibt sind dadurch viel relevanter und kann man dadurch viel besser darstellen.

00:37:04: Der infrastrukturelle Aufwand ist gar nicht so groß.

00:37:07: Was man braucht, ist eigentlich wie bei jedem sauberen Datenprojekt eine saubere Datenhygiene den Use Case in ersten Use Case um damit zu starten und natürlich die Bereitwilligkeit danach immer wieder das Ding zu testen weil es wirklich analog wie klassisch früher Data Science Cases immer iterativ passiert.

00:37:27: Hast du irgendwas vergessen?

00:37:28: Das hast du perfekt zusammengefasst Jonas!

00:37:31: Stefan, dann kann ich mich nur für die Folge belanken.

00:37:34: War ganz spannend!

00:37:35: Vielen vielen Dank.

00:37:37: Ich glaube das ist ein Thema was mich jetzt noch mal bisschen näher gebracht hat.

00:37:39: Ein Thema was ich mir einfach nochmal durchlesen will auch in der Zukunft.

00:37:42: Vielleicht kann ich irgendwann mal deine Doktorarbeit lesen?

00:37:44: Ja, auf jeden Fall.

00:37:46: Und da kann man so ein bisschen mal schauen wo die Reise eigentlich hingeht.

00:37:50: Danke dir!

00:37:51: Super, vielen Dank Jonas.

Shownotes

Transkript anzeigen

Neuer Kommentar