Opt-out-Listen mit den DataQualityTools verarbeiten

Sperrlisten wie beispielsweise Robinsonlisten sind ein wichtiger Bestandteil des Dialogmarketings. Diese zu pflegen ist nicht weiter schwer. Und mit Hilfe der DataQualityTools können Sperrlisten auch ohne Probleme verarbeitet werden.

Robinsonlisten, näheres dazu können Sie in dem Artikel 'Robinsonlisten / Sperrlisten' nachlesen, sind ein gutes Hilfsmittel um dem Wunsch einzelner Adressaten keine Werbung zu erhalten nachzukommen und dabei sogar noch Geld zu sparen. Darüber hinaus können mit eigenen Sperrlisten aber auch Konkurrenten, die eigenen Mitarbeiter oder bei Neukundenwerbung die eigenen Kunden als Empfänger von bestimmten Direktmarketing-Kampagnen ausgeschlossen werden.

Um Sperrlisten verarbeiten zu können benötigt man ein Programm das in der Lage ist eine unscharfe Suche nach Duplikaten zwischen zwei Tabellen durchzuführen, wie zum Beispiel die auf www.DataQualityApps.de erhältlichen DataQualityTools. Mit Hilfe der Suche nach Duplikaten zwischen zwei Tabellen können darüber hinaus auch Adresslisten synchronisiert werden, beispielsweise um Adressen die bereits mit einer früheren Direktmarketing-Kampagne beworben worden sind nicht noch einmal zu bewerben oder um Informationen, wie beispielsweise die Telefon- oder Kundennummer, anhand des Abgleichsergebnisses aus der einen Adressliste in eine andere zu übertragen. Die Einsatzmöglichkeiten der Suche nach Duplikaten zwischen zwei Tabellen sind vielfältig. Und mit den DataQualityTools ist die Suche nach Duplikaten zwischen zwei Tabellen auch schnell erledigt.

Gehen Sie dazu folgendermaßen vor:

  1. Wenn Sie das nicht schon getan haben, dann laden Sie sich die DataQualityTools von www.DataQualityApps.de herunter. Installieren Sie das Programm und fordern Sie eine Testfreischaltung an. Damit können Sie dann eine Woche lang ohne jede Einschränkung mit dem Programm arbeiten.
  2. Die Funktion die wir benötigen findet sich im Menü in dem Block 'Abgleich zwischen zwei Tabellen'. Wählen wir dort den 'Abgleich über die postalische Adresse'.
  3. Nach dem Aufruf dieser Funktion erscheint zunächst die Projektverwaltung. Legen Sie hier ein neues Projekt mit einem beliebigen Projektnamen an und klicken Sie dann auf die Schaltfläche 'Weiter'.
  4. Im nächsten Schritt öffnen wir zunächst mit Hilfe der Schaltfläche 'Datei öffnen' die Datei mit den zu verarbeitenden Daten. Bei Datenbankservern (MS SQL Server, MySQL, Oracle, IBM DB2 oder PostgreSQL) ist stattdessen zunächst aus der Auswahlliste bei 'Format / Zugriff auf' der entsprechende Datenbankserver auszuwählen. Anschließend ist der Name des Datenbankservers einzugeben. Nach einem Klick auf die Schaltfläche 'mit dem Server verbinden' sind die Zugangsdaten einzugeben. Die Auswahl der gewünschten Datenbank und der Tabelle daraus erfolgt schließlich aus den entsprechenden Auswahllisten.
  5. Anschließend ist dem Programm anzugeben in welcher Spalte der Tabelle es welche Information findet, also beispielsweise in welcher Spalte die Straße steht oder der Name des Orts. Dazu ist aus den Auswahllisten mit den Spaltennamen aus der Tabelle jeweils dasjenige Datenfeld auszuwählen das am besten zu der Bezeichnung links daneben passt. Eine Vorbelegung dieser Feldzuordnung führt das Programm anhand der Spaltennamen automatisch durch. Nachdem wir über die postalische Adresse nach Duplikaten suchen wollen müssen auch für alle Bestandteile der postalischen Adresse diejenigen Spalten aus der zu verarbeitenden Tabelle angegeben werden in denen diese Information gespeichert ist. Das Ergebnis der Feldzuordnung kann mit Hilfe der 'Kontrolle der Feldzuordnung', die sich auf der rechten Hälfte des Bildschirms befindet, kontrolliert werden.
  6. Die Tabelle die wir dem Programm gerade eben angegeben haben ist die Tabelle in der nach Duplikaten gesucht werden soll. Werden die gefundenen Duplikate später in der Ursprungstabelle gelöscht, dann erfolgt der Löschvorgang in eben dieser Tabelle. Daneben müssen wir dem Programm noch eine zweite Tabelle, die Sperrliste angeben. Aus dieser werden grundsätzlich keine Datensätze gelöscht. Sie ist schreibgeschützt. Um die zweite Tabelle angeben zu können klicken Sie auf die Schaltfläche 'Weiter'. Der Dialog zu dem wir gelangen sieht genauso aus wie der vorherige Dialog und ist auch genauso zu bedienen. Geben Sie hier die Tabelle mit der Sperrliste an und nehmen Sie die Feldzuordnung ganz analog zu der ersten Tabelle vor.
  7. Mit der Schaltfläche 'Weiter' gelangen wir zu dem Dialog in dem die eigentliche Funktion konfiguriert wird. Hier ist allem voran der Schwellwert für die maximal zulässige Abweichung zwischen zwei Adressen anzugeben. Desweiteren können einzelne Bestandteile der postalischen Adresse von dem Abgleich ausgeschlossen werden. Dabei muss natürlich für jeden Bestandteil der postalischen Adresse der mit verglichen werden soll in der in den beiden vorangegangenen Schritten vorgenommenen Feldzuordnung auch eine Spalte aus den beiden Tabellen angegeben werden. Hinweis: Die beiden Tabellen zwischen denen die Suche nach Duplikaten durchgeführt werden soll können ganz unterschiedlich aufgebaut sein. Beispielsweise könnte in der einen Tabelle die Hausnummer mit in der gleichen Spalte stehen wie die Straße und in der anderen Tabelle könnte diese Information in zwei getrennten Spalten stehen. Wichtig ist dabei nur, dass in der Feldzuordnung für diese beiden Tabellen auch alle drei Spalten angegeben werden.
  8. Ein Klick auf die Schaltfläche 'Weiter' startet dann die Suche nach Duplikaten. Es dauert nicht lange und es wird eine Zusammenfassung des Ergebnisses angezeigt. Hat das Programm zwischen den zu verarbeitenden Tabellen Duplikate gefunden, dann führt ein Klick auf die Schaltfläche 'OK' zu dem Dialog mit den Funktionen mit denen das Ergebnis weiter verarbeitet werden kann. Ansonsten sollte der Schwellwert für den Übereinstimmungsgrad niedriger gewählt und der Abgleich noch einmal gestartet werden.
  9. In dem Dialog mit den Funktionen mit denen das Ergebnis weiter verarbeitet werden kann findet sich ganz oben eine Schaltfläche mit der Beschriftung 'manuelle Nachbearbeitung'. Hier wird das Ergebnis des Abgleichs in Form einer Tabelle dargestellt. Diejenigen Datensätze die gelöscht werden sollen sind dort mit einem roten Kreuz gekennzeichnet, welches sich bei Bedarf löschen lässt.
  10. Schließlich muss das Ergebnis dann noch weiter verarbeitet werden. Beispielsweise könnten wir die zum Löschen markierten Datensätze direkt aus der Ursprungsdatei heraus löschen. Dazu ist lediglich ein Klick auf die Schaltfläche 'in der Ursprungsdatei löschen' nötig.

Die Suche nach Duplikaten zwischen zwei Tabellen kann auch mit dem ebenfalls auf www.DataQualityApps.de erhältlichen DeduplicationWizard durchgeführt werden. Dieser kann nur Excel-Dateien verarbeiten und enthält nur die wichtigsten Funktionen aus den DataQualityTools.

Hinweis: Für die DataQualityTools gibt es ein Lehrvideo das am Beispiel der Suche nach Duplikaten innerhalb von einer Tabelle in die Bedienung des Programms einführt.

Wie man den DeduplicationWizard für die Suche nach Duplikaten innerhalb von einer Adressliste einsetzt können Sie in dem Artikel 'Suche nach Duplikaten mit dem DeduplicationWizard' nachlesen. Und in dem Artikel 'Zeitgesteuerte Suche nach Duplikaten mit dem BatchDeduplicator' können Sie nachlesen wie man die Suche nach Duplikaten automatisiert.

Autor: Thomas Hainke