Data Profiling ist der systematische Prozess der Untersuchung, Analyse, Beschreibung und Bewertung von Datenquellen, Datensätzen, Tabellen, Spalten und Werten, um deren Qualität, Konsistenz, Genauigkeit, Vollständigkeit, Redundanz, Beziehungen, Verteilung und Muster zu verstehen und zu verbessern. Data Profiling ist ein wichtiger Schritt und Werkzeug im Datenmanagement, Datenintegration, Datenqualität und Data Governance, da es die Datenverständlichkeit, Datenbereinigung, Datenabgleich, Datenvalidierung und Datenkatalogisierung unterstützt. Data Profiling-Techniken umfassen Deskriptive Statistik, Datenvalidierungsregeln, Data Lineage und Anomalieerkennung.