Wir selbst sind manchmal echt erstaunt, wie sehr sich die Ausgangssituationen doch ähneln, wenn Kunden mit ihren Problemen und Wünschen an uns herantreten – dabei sind die Branchen, in denen sie tätig sind oder auch die Historie, die sie mitbringen, doch zumeist sehr unterschiedlich. Ob Start-up oder Hidden Champion, offensichtlich stehen viele Unternehmen vor sehr ähnlichen Herausforderungen, wenn es um das Thema “Datenprojekt” geht.

📝 Die Story, die uns erzählt wird, klingt häufig so…

“Wir haben unsere Auswertungen bisher komplett in Excel erledigt, dafür ist Lukas aus dem Controlling verantwortlich – der schickt das allen Kollegen 1x die Woche zu. Wenn Lukas aktuelle Daten aus dem ERP-System haben will, muss er bei Sophie aus der IT-Abteilung nachfragen, die ihm die Daten als CSV-Datei exportiert. Das dauert alles ziemlich lange und leider haben wir auch schon fiese Fehler in den Excels gefunden. Geht das auch einfacher (oder automatischer)?”

“Unsere neue E-Commerce-Marke läuft richtig gut an, wir kommen mit der Auslieferung der Bestellungen kaum hinterher. Mittlerweile haben wir auch einen ordentlichen Marketingapparat aufgebaut – allerdings haben wir keinen richtigen Überblick, welche Kanäle gut oder schlecht laufen und ob wir vielleicht unsere Budgets shiften sollten. Es sind soo viele Datenquellen – Google Ads, Facebook Ads, Affiliate, Retargeting und Influencer. Wie kriegen wir das alles zusammen?“

“Unser Chef hat auf seinem Unternehmertreff kürzlich gehört, dass Daten das neue Öl sind (Anm. d. Red.: Bitte, bitte sagt sowas nicht. 🙏). Es nervt ihn, dass er seine Umsatz-Auswertungen immer noch als PDF mit vielen einzelnen Zeilen aus dem ERP-System bekommt. Wir haben uns intern beraten und festgestellt, dass wir tatsächlich ein paar spannende Ideen haben, wie uns Daten in unserer Entscheidungsfindung unterstützen könnten. Marie aus der IT und Jasper aus dem E-Commerce sollen sich jetzt der Sache annehmen. Allerdings wissen sie nicht, wo sie anfangen sollen – es gibt einfach zu viele Buzzwords, die sie nicht verstehen. Was brauchen wir wirklich?”

💙 Marie und Jasper – I feel you.

Was sucht man eigentlich, wenn man weg von Excel hin zu einer “modernen Datenlösung” kommen will – aus welchen der oben genannten Gründe auch immer? (PS: Bitte sagt es uns, das würde unserem SEO wirklich sehr helfen 👀).

Wäre ich selbst in der Situation, als Greenhorn im Data-Business mit solch einem Projekt betraut zu werden, dann würde ich vermutlich zunächst nach einer Lösung für meinen ganz spezifischen Anwendungsfall googlen – “Excel automatisieren”, “Marketingperformance analysieren”, “Datenprojekt wie beginnen”, “Was haben Daten und Öl gemeinsam”.

Und tatsächlich findet man in den Weiten des Internets immer irgendeinen Anbieter, der genau das Problem löst. Schöne neue Welt. Googlst du etwa nach “Marketingdaten analysieren”, wirst du über kurz oder lang sicherlich Adverity, Funnel oder Fivetran über den Weg laufen. Also alles top, lass uns damit loslegen. Oder?

Gerade diesen Einsteigern fällt es – mangels Expertise – natürlich schwer, hier den Überblick zu behalten. Was brauche ich eigentlich? Wie oft haben wir gesehen, dass ein Tool wie Funnel bezahlt wird, in der Hoffnung, dass es die Marketingperformance komplett transparent machen – und am Ende liegen die Daten doch wieder als Excel in einem E-Mail-Postfach. Oder es wird ein BI-Tool wie Tableau oder Power BI eingeführt und direkt mit der Produktivdatenbank des CRM-Systems verbunden. Autsch.

Der Ausdruck ‘Tool’ beschreibt es ja schon ganz gut: Es ist eben EIN Werkzeug. Für die meisten Bauprojekte brauche ich jedoch nicht nur den Hammer, sondern auch Schraubenzieher, Säge und Zollstock – einen ganzen Werkzeugkasten. Welche Tools benötige ich also für eine richtige “moderne Datenlösung”? Wie sieht so etwas in der Praxis aus?

📬 Die frohe Botschaft zuerst: Es ist eigentlich ganz simpel.

Ist man ernsthaft gewillt, die ersten Schritte in Richtung ‘Data & Analytics’ zu gehen, empfehle ich dringend schon direkt zu Beginn, das Projekt auf ein solides Fundament zu stellen. Niemand baut ein Hochhaus ohne einen tragfähigen Untergrund. Und so werden mühselige, nervtötende Nacharbeiten vermieden – versprochen, die werden auch dich ereilen, wenn du das nicht beherzigst. Lerne aus meinen Fehlern.

Ein solches Grundgerüst besteht in der Regel in eigentlich jedem Datenprojekt aus vier Prozessschritten:

🔌 Extraktion

Selbstverständlich müssen die Daten zunächst aus ihrer Quelle abgeschöpft werden, kurzum: Möchte ich die Performance meiner Google Ads analysieren, benötige ich zunächst einmal Zugriff auf die Rohdaten. Glücklicherweise stellen heutzutage alle ernstzunehmenden Angebote im Internet sog. “APIs” bereit, über welche man die Daten aus dem eigenen Account abgreifen kann. Noch einfacher ist es, wenn man selbst Herr/Frau über seine Anwendungen ist: Das ERP- oder CRM-System, vielleicht auch der eigene Shop. Hier gibt es in der Regel intern immer einen Kollegen, der weiß, wie man an diese Daten rankommt, sprich aus der Datenbank exportiert.

Empfehlenswerte Tools zur Extraktion für dein Datenprojekt sind etwa 🥇 Fivetran, Airbyte, Funnel oder Stitch.

⚙️ Transformation

Diese Systeme – ob API oder Datenbank – spucken die Daten meist in einem Format aus (➡️ further reading: normalisiert oder als JSON-Array), welches der Endanwender nur schwer interpretieren kann. In der Regel wird nicht eine große Tabelle exportiert (das wäre ja auch zu leicht), sondern viele einzelne, die man zunächst mühsam zusammenbasteln muss. Außerdem sind dies ja erstmal nur Rohdaten, der spezifische “Sinn” oder Business-Kontext fehlt noch.

Mein Lieblingsbeispiel: Umsatz. Komme ich in ein Unternehmen und frage dort fünf Leute, wie hier Umsatz definiert ist, erhalte ich meist sechs Antworten – dabei sind die Rohdaten für den Umsatz im System immer gleich gespeichert. “Mit oder ohne Retouren?”, “Zum Bestell- oder Rechnungsdatum?” sind Fragen, die mir dann begegnen. Und das ist völlig normal: Entscheidend ist, WER die Daten interpretiert. Und für alle Anwender muss es eine zufriedenstellende Lösung geben.

Das ist der Kern eines jeden Datenprojekts. Schaffe ich es, die Rohdaten so zu transformieren (wir sagen auch modellieren), dass daraus ein Datenmodell entsteht, das der Endanwender versteht?

Ein empfehlenswertes Tool zur Transformation für dein Datenprojekt ist etwa 🥇 data build tool, kurz dbt.

💾 Laden

Sind die Daten aus dem Quellsystem extrahiert und um Business-Kontext angereichert (transformiert), müssen sie irgendwo gespeichert (oder “geladen”) werden … sonst wären die vorherigen Schritte ja umsonst. Hierfür gibt es wiederum spezielle Systeme, sog. “analytische” Datenbanken – im Volksmund auch gerne “Data Warehouse” genannt, obwohl das fachlich nicht ganz richtig ist. Sei’s drum.

Diese Systeme sind maximal darauf optimiert, sehr schnell sehr große Datenmengen lesen zu können. Dies unterscheidet sie von sog. “transaktionalen” Datenbanken, auf denen etwa dein ERP-, CRM- oder Shopsystem fußt. Diese sind wiederum optimiert, sehr schnell sehr kleine Datenmengen schreiben zu können, etwa eine einzelne Bestellung im Shop.

Ruft uns ein Kunde verzweifelt an, dass seine Reports zu lange dauern, fragen wir zunächst, wo die Daten gespeichert sind – und in 9/10 Fällen laufen die Analysen hier direkt auf den transaktionalen Produktivsystemen, also etwa der Shop-Software selbst. Habt ihr schon mal von ‘worst practice’ gehört? ❌

Empfehlenswertes Tool zur Speicherung für dein Datenprojekt sind unter anderem 🥇 Snowflake, BigQuery, Databricks, Firebolt uvm.

📊 Visualisierung

Last but not least: die abgefahrenen Charts und Grafiken, die jeder CEO sehen will. Man würde meinen, dass die Visualisierung von Daten in einem Projekt die meiste Zeit beanspruchen würde, aber weit gefehlt: Unserer Erfahrung nach ist das vielleicht 10% bis maximal 20% der Leistung, wenn auch sicherlich der sichtbarste Teil. Die Transformation der Daten zu einem aussagekräftigen Datenmodell ist bedeutend aufwendiger.

Es ist aus meiner Sicht erfreulich, dass moderne Tools in diesem Bereich heutzutage wirklich sehr intuitiv und anwenderfreundlich geworden sind. Es ist mittlerweile möglich, mit Drag & Drop in Sekundenschnelle eigene Charts zusammenzusetzen – sofern das zugrundeliegende Datenmodell gut erarbeitet ist. Dies macht es einem ganz neuen Nutzerkreis möglich, schneller Entscheidungen mithilfe von Daten zu treffen. Wenn du also irgendwann mal etwas von dem Buzzword “data driven” gehört hast – here you are. 🇺🇸

Von uns als gut befundene BI-Tools für dein Datenprojekt sind z.B. 🥇 Power BI, Tableau und Looker.

✅ That’s it – dein Datenprojekt

Das sind die Prozesse einer “modernen Datenlösung”. Diese Schritte – gerne auch E(xtraktion)T(ransformation)L(aden)-Prozess genannt – werden in jedem Datenprojekt durchlaufen, plus Visualisierung in bunten Charts. PS: Es gibt auch ELT-Prozesse, aber das ist ein Thema für einen anderen Blog-Artikel.

Klar, der ein oder andere fortgeschrittene Anwender wird nun sagen: “Mühlenbrock, da gibt es aber noch so viel mehr”. Das mag wohl stimmen, allerdings ist das der Beginn, an dem sich der Neu- oder Quereinsteiger orientieren sollte.

🔑 Fazit

Was nehmen wir mit? Aller Anfang ist schwer. Es gibt zuhauf Plattformen und Angebote, die mit allzu buntem Marketingsprech versuchen, den Kunden von ihrem “Tool” zu überzeugen. Sicher, Fivetran z.B. ist ein wirklich super Angebot für dich, da es ein spezifisches Problem löst. Allerdings solltest du nun wissen, dass nicht nur ein Werkzeug, sondern ein ganzer Werkzeugkasten notwendig ist, um eine solides Fundament (plus Hochhaus) zu bauen.

Klingt das abschreckend für dich? Viele Tools = viele Euros zu bezahlen? Nein, sicher nicht – die Angst kann ich dir nehmen. Eine moderne Datenplattform lässt sich oft schon ab 200 EUR monatlich realisieren, Cloud sei Dank. Vorbei die Zeiten, in denen horrende Anfangsinvestitionen für ein Datenprojekt getätigt werden mussten, ohne zu wissen, ob sich das irgendwann auch wirklich rentiert.

Es gibt seit wenigen Jahren – frisch aus dem Silicon Valley zu uns rübergeschwappt – ein ganz neues Paradigma, wie solch eine kostengünstige, extrem leistungsfähige und mit dem Erfolg mitwachsende Datenplattform aufgebaut werden kann, der Modern Data Stack.

Was das ist und wie dein du und dein Unternehmen davon profitieren können, erfährst du hier.