Ein Data Lake ist ein zentrales Repository, das große Mengen von strukturierten und unstrukturierten Daten speichert und für die Analyse bereithält. Im Gegensatz zu Data Warehouses, die Daten in einem strukturierten, vordefinierten Schema speichern, behalten Data Lakes die Rohdaten in ihrem ursprünglichen Format, wodurch sie flexibler und skalierbarer sind. Data Lakes werden häufig in Kombination mit Big Data- und Advanced Analytics-Anwendungen eingesetzt, um schnelle und explorative Datenanalysen durchzuführen.