Die Digitalisierung ist eine sehr wichtigen Transformation geworden, den jede Organisation in ihren Roadmap hat. Datalake ist ein sehr wichtiges Zahnrad in diesem Prozess. Diese Ökosysteme müssen
in der Lage sein, sich selbst zu bedienen; die Benutzer müssen in die Lage versetzt werden, flexibel auf Veränderungen reagieren zu können; die Datensicherheit gewährleisten; den Zugriff auf alle im
Unternehmen verfügbaren Daten ermöglichen und datengestutzte Entscheidungen ermöglichen.
Datalake Ecosystems
Datalake ecosystems consists of 7 key zones
Data import – landing place for all information which is external to the organisation
Datalake – landing place for all information which is internal to the organisation – most cases this is a replication of the operational systems
Data Lab – environment for the users where they create reports, build models for descriptive/predictive analytics or machine learning
BI Portal – environment where all the reporting enterprise wide is available
Model Store – container-based environment where models are executed
Data processing – a zone with compute power which helps transform data from data lake to either Data Lab, Model Store, BI Portal
Data Export – landing place for all information that is provided to external users
Each of these areas, hosts a variety of platforms to help users and the organizations in the quest for making decisions based on data.
Automation is in the DNA of this ecosystem and it is helped by CI/CD tools.
Data pipelines in the data processing zone are fully configurable