MacNorris Logo
Herausforderung

Dubletten: Der Endgegner deiner IT-Systeme.

Jedes Unternehmen hat sie. Die meisten wissen es. Niemand geht es an. Dubletten sind nicht das Problem, sie sind das Symptom.


Die RealitÀt

Dubletten entstehen nicht aus Faulheit. Sie entstehen aus Pragmatismus.

Irgendwann hat jemand entschieden: einen neuen Datensatz anlegen geht schneller als Logik zu implementieren. Dreißig Sekunden statt einem Sprint. Das Problem war gelöst, zumindest fĂŒr heute.

Gleichzeitig lĂ€uft die Schnittstelle zwischen Shopsystem und ERP still weiter. Jeden Tag. Ohne Duplikat-Check. Weil der Check beim Aufsetzen nicht eingeplant war, weil niemand das Budget dafĂŒr hatte, und weil es ja "funktioniert".

Und so entsteht Kunde "MĂŒller GmbH" dreimal. Dann zehnmal. Dann weiß niemand mehr welcher der richtige ist.

1 von 3DatensÀtzen in einer durchschnittlichen Unternehmensdatenbank ist ein Duplikat oder veraltet
30 Sek.dauert es einen neuen Datensatz anzulegen. Das ist der Grund warum es passiert.
0 €Budget war fĂŒr den Duplikat-Check eingeplant. Das ist der Grund warum es bleibt.
Erkennst du das?

Vier Wege wie Dubletten in eure Systeme kommen.

Diese Situationen kennen wir aus fast jedem Unternehmen das zu uns kommt.

Die Schnittstelle ohne Logik

Shop-System und ERP tauschen Daten aus, aber niemand hat beim Aufsetzen einen Duplikat-Check implementiert. Jede Bestellung eines bestehenden Kunden legt einen neuen Datensatz an. Jeden Tag. Automatisch.

Das Ergebnis: Tausende Duplikate entstehen ohne menschliches Zutun, und niemand bemerkt es.

Der Dummy-Kunde

Debitorennummer 12345. Oder "Laufkunde". Unter einem einzigen Sammeldatensatz liegen Tausende Transaktionen, weil es schneller war als eine saubere Kundenzuordnung. FĂŒr die Buchhaltung damals okay. FĂŒr jede Integration heute: Horror.

Das Ergebnis: Keine saubere Kundenzuordnung, kein funktionierendes Reporting, keine Personalisierung.

Die Datenmigration die niemand geprĂŒft hat

Systemwechsel vor fĂŒnf Jahren. Die alten Daten wurden importiert, ohne Bereinigung, ohne Deduplizierung, weil die Zeit drĂ€ngte. Was damals "wir bereinigen das spĂ€ter" hieß, ist heute Fundament.

Das Ergebnis: Jeder neue Import schichtet sich ĂŒber das alte Chaos. Das "SpĂ€ter" kommt nie.

Mehrere Systeme, keine gemeinsame Wahrheit

CRM, ERP, Shopsystem, Buchhaltung, jedes System pflegt seine eigene Kundenliste. Dieselbe Firma heißt im CRM "MĂŒller GmbH", im ERP "MĂŒller" und im Shop "muellerGmbH".

Das Ergebnis: Keine Schnittstelle findet den Match. Jede Integration scheitert an denselben Edge Cases.

Der typische Fehler

Einmal bereinigen. Dann passiert es wieder.

Viele Unternehmen reagieren irgendwann. Sie beauftragen ein Bereinigungsprojekt, investieren Wochen, entfernen Duplikate. Und sechs Monate spÀter ist der nÀchste Berg entstanden.

Weil die Ursache nie behoben wurde.

Die Schnittstelle ohne Duplikat-Check lĂ€uft weiter. Der Prozess "schnell neuen Datensatz anlegen" ist weiter der Standardweg. Niemand hat Verantwortung fĂŒr DatenqualitĂ€t ĂŒbernommen. Es gibt kein Monitoring das neue Duplikate meldet.

Eine einmalige Bereinigung ist wie Unkraut jÀten ohne die Wurzel zu entfernen. Sieht kurz ordentlich aus. Dann wÀchst es nach.

Der MacNorris Ansatz

Dubletten bereinigen ist Schritt zwei. Schritt eins ist verstehen warum sie entstehen.

Wir fangen nicht mit der Bereinigung an. Wir fangen damit an zu verstehen wo Dubletten in eurem System entstehen und warum.

Welche Schnittstellen laufen ohne Duplikat-Check? Welche manuellen Prozesse produzieren systematisch neue EintrĂ€ge? Gibt es Dummy-DatensĂ€tze die eigentlich Symptome eines Prozessproblems sind? Wer ist verantwortlich fĂŒr DatenqualitĂ€t, und wenn niemand: warum nicht?

Erst wenn wir die Ursachen kennen, bereinigen wir. Und gleichzeitig schließen wir die KanĂ€le durch die tĂ€glich neue Duplikate entstehen. Nicht als jahrelanges Data-Governance-Projekt, sondern als konkreter Eingriff der sofort Wirkung zeigt.

Das Ziel ist nicht eine einmalig saubere Datenbank. Das Ziel ist eine Datenbank die sauber bleibt.

Aus der Praxis

18.000 Dubletten. Vier Wochen. Und nie wieder.

Ein E-Commerce-Unternehmen will KI im Kundenservice einfĂŒhren. Erster Blick in die Kundendatenbank: 43.000 DatensĂ€tze, davon 18.000 Dubletten. Entstanden ĂŒber vier Jahre durch eine Shopsystem-ERP-Schnittstelle ohne Duplikat-Check. Dazu ein Dummy-Kundenkonto unter dem 11.000 Transaktionen hĂ€ngen.

Das KI-Projekt wird zum Datenprojekt. Aber diesmal richtig.

  • Ursachenanalyse in Woche 1: drei Duplikat-Quellen identifiziert
  • Schnittstelle mit Duplikat-Logik nachgerĂŒstet
  • Bereinigung: 18.000 Duplikate in vier Wochen
  • Monitoring eingerichtet: neue Duplikate werden tĂ€glich gemeldet
  • Dummy-Konto aufgelöst, Transaktionen korrekt zugeordnet
  • KI-Automatisierung live nach sechs Wochen
“Wir haben die Daten jahrelang mitgeschleppt. Jetzt fragen wir uns warum wir nicht frĂŒher angefangen haben.”
Head of Operations, E-Commerce Unternehmen
HĂ€ufige Fragen

Was ihr uns zum Thema Dubletten meistens fragt.

Tools fĂŒr automatische Deduplizierung gibt es. Aber ohne vorherige Analyse fĂŒhren sie genauso oft falsche DatensĂ€tze zusammen wie richtige. Automatisierung ohne Logik verstĂ€rkt das Problem, sie löst es nicht.

Nicht zwingend. Oft reicht es die Schnittstellen zu korrigieren die Duplikate produzieren. Das ERP selbst bleibt unberĂŒhrt.

Erste sichtbare Ergebnisse in zwei bis vier Wochen. Wichtiger als die Geschwindigkeit ist dass gleichzeitig die Ursachen behoben werden, damit es nicht nach fĂŒnf Monaten wieder von vorne beginnt.

In den meisten Unternehmen niemand. Das ist die Wurzel des Problems. Wir helfen nicht nur bei der Bereinigung, sondern beim Aufbau klarer Verantwortlichkeiten und einfacher Prozesse die DatenqualitÀt dauerhaft sichern.

EURE DATEN WACHSEN. EURE DATENQUALITÄT NICHT.

Beschreibt uns kurz wie es bei euch aussieht, wir sagen euch in einem GesprÀch wo die Duplikat-Quellen liegen.

Dubletten im CRM und ERP: Ursachen und dauerhafte Lösung | MacNorris