Dublettenprüfung


Dublettenprüfung

Die aus der verteilten Bearbeitung von Ausgangsdatenbanken resultierende Mehrfacheingabe von Adressen führt dazu, dass in den Zusatzfeldern für ein und denselben Kunden doppelte bzw. unterschiedliche Informationen geführt werden. Die Zielsetzung einer Marketingdatenbank, "den Kunden mit allen dazugehörigen Informationen" zu kennen, wird damit verfehlt. Mittels verschiedener automatischer und heuristischer Verfahren wie bspw. wissensbasierte Tabellen, Fuzzy Logik, phonetische Vergleiche, Bi- und Tri-String-Vergleiche sowie Akronymen-Behandlung lassen sich Datensätze identifizieren und zusammenführen, die dasselbe Objekt in der realen Welt repräsentieren.

Typische Dublettentypen sind bei Businessdaten Firmen-, Umfirmierungs-, Ansprechpartner- und Umzugsdubletten innerhalb der Region. Bei Privatdaten sind dies Haushalts-, Personen-, Heirats- und Umzugsdubletten.

Die Zusammenführung von Dubletten ermöglicht eine Konsolidierung des Datenbestandes sowie die ganzheitliche Sicht auf einen Kunden. Ziele dabei sind:

  • die Ermittlung des Umsatzes bzw. der Aktivität pro Kunde / Haushalt
  • die Provisionierung von Akquisitionstätigkeiten, z.B. nur für Neukunden
  • Die Anreicherung von externen Informationen, kein Einkauf redundanter Informationen
  • Konsolidierung unterschiedlicher Quellsysteme
  • Negative Prüfung von Sperrlisten