Data Lake

Data Lakes, zu Deutsch Datenseen, sind sehr große Datenspeichersysteme aus strukturierten oder unstrukturierten Rohdaten unterschiedlicher Quellen. Vor der unstrukturierten Speicherung bedürften die Daten für Data Lakes keine Umformatierung und können sowohl text- als auch zahlenbasiert, Bilder, Videos und in jeglichen anderen Datenspeicherformaten abgespeichert sein. Diese Data Lakes dienen der Analyse von Big Data. Erst im letzten Schritt vor der Analyse findet die Strukturierung und Umformatierung der Daten statt. Also erst genau dann, wenn man sie benötigt. Bei häufig ändernden Anforderungen ist ein Data Lake dadurch flexibler als ein Data Warehouse. Insgesamt ergeben sich zudem viel mehr Möglichkeiten der zukunftsorientierten Analyse.