
Deze week maakt “the founder and creator of the Data Vault” Dan Linstedt een tour door Europa. Hij begon zijn tour in Nederland waar hij gisteren een goed gevuld Figi theater in Zeist toesprak. Dan begon de avond met een hele korte samenvatting van Data Vault modellering en de Data Vault methodiek. Hij noemde daarbij de manier waarop wij jaren lang datawarehouses hebben gebouwd (en de manier waarop het soms nog steeds gebeurt), waarbij de business rules tijdens het laden van het datawarehouse worden toegepast en de data upstream veranderd wordt, old way.
Datawarehouse Old Way
De Data Vault methode, waarbij business rules pas later (downstream) worden toegepast, noemt hij de compliant way. Wanneer je de Data Vault methodiek toepast, ontstaat er een historische opslag van ongewijzigde brondata, een Raw Data Vault. Een opslag die “100% of the data, 100% of the time” bevat, één van de basisconcepten achter de Data Vault methodiek. Achter de eerste 100% plaatste Dan gisteravond al een niet onbelangrijke toevoeging: in scope. Sommigen die de Data Vault methodiek toepassen, willen die 100% nog wel eens té letterlijk nemen.
Datawarehouse Compliant Way
Na toepassing van de business rules, ontstaan gegevens waar de business user iets mee kan. Dan geeft dat de naam Business Data Vault or iets korter Business Vault. Maar in tegenstelling tot de Raw Data Vault, die volgens de Data Vault modelleringsregels is gemodelleerd, is deze Business Vault veel meer een concept dan perse iets fysieks. Dan is van mening dat de business rules steeds meer in de handen van de business users zullen komen te liggen. Hij noemt hierbij de ontwikkelingen op het gebied van self-service BI en in het bijzonder de introductie van PowerPivot waarbij de business rules in Excel vastliggen en de business user eigenlijk zelf zijn business vault maakt in PowerPivot. Dan heeft hierover eerder deze maand een interessant artikel geschreven: Business Vault and Microsoft PowerPivot. Volgens Dan past ING Real Estate dit zelfs al toe in de praktijk.
Eén van de opmerkelijkste uitspraak die Dan gisteravond maakte, vond ik wel: “a single version of the truth does not exist”. Zodra iemand van gedachten verandert over de interpretatie van een gegeven of wanneer een business rule gewijzigd wordt, is de waarheid achterhaald. Een terechte opmerking, één die tot denken zet wanneer je zelf jaren hebt verkondigd dat “het datawarehouse” de “single version of the truth” bevat… Dan sloot zijn enerverende speech, die helaas nog geen 40 minuten duurde, af met zijn visie op de toekomst, wat er volgens hem in de komende jaren gaat gebeuren. Hij noemde daarbij het steeds minder belangrijk worden van fysieke data modellering (door de ontwikkelingen rond cloud computing), de opkomst van column stores en NoSQL. Ook zal volgens hem Data as a Service steeds meer haar intrede gaan doen in ons dagelijks werk. Ook gaf hij de toehoorders mee dat wanneer je nog niets weet van de begrippen ontologieën en taxonomieën, dit het moment is je daarin te gaan verdiepen.
Als je meer wilt weten over Data Vault modellering en de Data Vault methodiek, bezoek dan de website van Dan Linstedt: http://danlinstedt.com/. Vergeet niet even te registreren op zijn web site om op de hoogte te blijven van nieuwe ontwikkelingen en om precies te weten wanneer zijn Technical Modeling Book uitkomt. Of volg Dan op Twitter: http://twitter.com/dlinstedt.