Die Adressbereinigung folgt weitestgehend maschinell unterstützten Standardverfahren:
- Postalische Bereinigung
- Umzugsprüfung
- Fehlerhafte Feldzuordnung
- Fehlerhafte, unvollständige Feldinhalte
- Rechtschreibeprüfung
- Identifikation von Tippfehlern
Hier gilt insbesondere: Qualität statt Quantität!
Das Zusammenführen der Dubletten und der dazugehörigen Informationen in der Kundendatenbank erfordert in einem zweiten Schritt individuelle Vorgehensweise und Programmierung:
- Die Leitadresse einer Dublettengruppe muss nach abgestimmten Regeln definiert werden. Dies kann z.B. die Adresse mit dem höchsten Umsatz oder die Adresse mit der letzten Aktivität sein.
- Die zu dieser Adresse gehörigen Informationen müssen zusammengeführt werden. Die Summe der Umsätze aus allen Dubletten könnte solch eine Zusammenführung sein.
- Die restlichen Dubletten müssen gelöscht werden.
Nachdem die Adressen um Dubletten bereinigt wurden, müssen nun die fehlerhaft belegten Informationsfelder korrigiert werden. Aus Erfahrungen kennen wir die Beispiele der uneinheitlichen und unvollständigen Kommunikationsdaten, ebenso zählen missbräuchlich genutzte Datenfelder und falsche Anreden hierzu. Dieser Block von Kommunikationsdaten kann durch maschinelle Standards unterstützt werden. Manuelle Nacharbeit wird jedoch auf jeden Fall notwendig sein. Die Bereinigung von Geschäftsdaten ist das schwierigste Feld der Datenbereinigung. Sie bedarf einer sorgfältigen Analyse der zugrunde liegenden Geschäftsvorgänge, der Datenquellen und der Datenverarbeitung. Daraus resultierend müssen die Bereinigungsvorgänge im Detail definiert und abgestimmt werden.