Datenintegration

Streben nach dem Idealzustand von Daten

Datenintegration ist mitunter der profitabelste Bereich in der Datenwirtschaft, da erst richtig verknüpfte Informationen neue Einsichten, einen Wettbewerbsvorteil oder schlicht Mehrwert schaffen.

Bei der Daten- oder Informatinsintegration begegnet es einem allerdings sehr schnell, daß die zur Verfügung stehende Datenqualität nicht ausreicht um das gewünschte Ergebnis zu erreichen, daher ist häufig eine Überprüfung der Datenqualität und Verbesserung notwendig.

Datenqualitätsmanagement (Data Quality Management) ist ein Managementprozess zur kontinuierlichen Sicherung und Überwachung der Qualität geschäftlicher Daten aus dem operativen Prozess und dient als Grundlage für das Berichtswesen und Automatisierung von Geschäftsprozessen.

Datenqualitätsmanagmentprozess

  • Entdecken (Data Profiling)
  • Datenqualität definieren
  • Datenqualität messen
  • Regelverletzungen analysieren
  • Nachhaltig verbessern
  • Kontinuierlich überwachen

Grundlage von Entscheidungen sind neben der eigenen Expertise die Daten, die einem zur Verfügung stehen. Hier gilt der Grundsatz, daß das Ergebnis direkt mit dem quantifizierten Datenqualitätsniveau korreliert und mit Datenqualitätsschwächen leidet.

Was ich nicht messen kann, kann ich nicht steuern.

Datenqualitätskriterien / Dimensionen
  • Vollständigkeit
  • Eindeutigkeit
  • Korrektheit
Häufigste Gründe für schlechtes Datenmanagement
  • Manuelle Dateneingabe
  • Datenmigrations- und -konvertierungsprojekte
  • Einträge von mehreren Benutzern
  • Abweichende Standards

Informationsintegration

  • Daten sammeln (API, Webscrapping)
  • Daten aufbereiten (DQM)
  • Datenströme zusammenführen (DQM)
  • Datendubletten identifizieren (DQM)
  • Daten organisieren (DQM)
  • Daten Mehrwert schaffen