2nd visualisatie - groot_v2.jpg

Datastrategie en data-architectuur

1. Data Governance

De belangrijkste principes van data governance zijn eigendom, verantwoordelijkheid en aansprakelijkheid voor data. Dit omvat het delen van informatie en het overleggen met relevante belanghebbenden over hoe de gegevens gebruikt, verwerkt en opgeslagen mogen worden.Het instellen van de juiste gegevensdomeinen per product of bedrijfsonderdeel helpt om de informatie te beheren en de gegevensintegriteit te behouden.

2. Data Quality

‘Garbage in, is Garbage out’. Als een organisatie de ambitie heeft om in de toekomst voorspellende analyses te implementeren, dan is dit de eerste belangrijke stap daar naartoe. Wanneer Machine Learning (ML) modellen worden losgelaten op data dat qua kwaliteit niet goed is dan is de kans groot dat geen goede resultaten komen uit deze analyses.
Omdat deze stap zeer belangrijk is, ontwikkelen we passende checks waarbij we fouten in de data kunnen identificeren en eventueel ook een voorstel kunnen doen om dit aan te vullen of op te lossen.

3. Data Lineage

Data lineage is de reis die data aflegt vanaf het moment dat het wordt gecreëerd. Als alle data flows op elkaar zijn afgestemd en uitgelijnd kunnen eventuele fouten en veranderingen in de data makkelijker worden opgespoord en worden aangepast.

4. Data Architecture

Data architectuur is een reeks regels, modellen, beleidsregels en standaarden die bepalen hoe gegevens worden verzameld, opgeslagen, beheerd en geïntegreerd in relatie tot de databasesystemen.

Een goede architectuur maakt het mogelijk om daadwerkelijk goed te kunnen vertrouwen op de masterdata. Het hebben van één enkele bron van waarheid is essentieel voor analyses, business intelligence, herhaalbare geautomatiseerde processen en Machine Learning/AI modellen

Data kwaliteit oplossingen

Naar aanleiding van de punten die zijn gevonden ter verbetering van de kwaliteit van de data kan een plan voor implementatie worden opgesteld.

Ontsluiting complexe databronnen (data execution plans)

De afgelopen jaren zijn er steeds meer applicaties die data genereren. Door veel organisaties wordt het ontsluiten van deze bronnen als complex ervaren. Naast dat het technisch complex kan zijn moet er tevens execution plans worden opgesteld om te zorgen dat alle databronnen geen timing issues opleveren.

Wanneer alle bronnen ontsloten en ververst zijn, kan de data aan elkaar worden gekoppeld. Het data landschap van de onderneming bepaald hierin de aanpak. Indien de databronnen veel data generen en de informatiebehoefte van de onderneming groot is, zal er een centrale plek moeten zijn waar de data aan elkaar wordt gekoppeld kan worden getransformeerd. Dit geldt ook voor wanneer de onderneming een aantal eenvoudige Excel bestanden aan elkaar zou willen koppelen en de analyse zou willen automatiseren. Wanneer nieuwe data wordt verkregen, kan alleen een Power BI bestand volstaan.

Met uw informatiebehoefte in ons achterhoofd prepareren wij de data zodanig dat we met behulp van scripts de data omzetten,combineren of dit wegzetten op een andere plek. Op de plek waar de data nu staat, staan tabellen die de input voor dashboards voor verschillende groepen of afdelingen binnen de onderneming.

Christiaan Dommerholt
Amsterdam
Partner | Head of Business Risk Services
Christiaan Dommerholt
Amsterdam
Christiaan Dommerholt 
Lees meer over Christiaan Dommerholt
Christiaan Dommerholt
Partner | Head of Business Risk Services
Christiaan Dommerholt