Dit is het eerste artikel in de serie “Data Warehousing voor informatica-studenten”. In deze serie wil ik een technische inleiding op DWH / BI (Data Warehousing en Business Intelligence) geven, gericht op informatica studenten. Zelf heb ik informatica gestudeerd aan de Universiteit van Amsterdam. Veel collega’s komen van informatica-opleidingen aan diverse hogescholen. Onze ervaring is dat aan de informatica-opleidingen niet heel veel aandacht besteed wordt aan DWH / BI. Tegelijk zijn we bij Info Support juist wel op zoek naar technisch goed onderlegde informatici, die zich willen gaan toeleggen op DWH / BI. Daarom deze serie artikelen, waar we aan de hand van een case het hoe en waarom van Data Warehouses verkennen.
What’s in a name: DWH? BI?
Zoals hierboven benoemd staat DWH voor Data Warehousing en BI voor Business Intelligence. Ik gebruik deze termen vaak samen in één zin. Dat kan wat verwarrend zijn: niet iedereen die aan Business Intelligence doet, bouwt Data Warehouses, en niet iedereen die Data Warehouses bouwt, heeft verstand van de business die ze gaat gebruiken. Bij Info Support zijn mensen die Data Warehouses bouwen echter bijna zonder uitzondering mensen die ook van het BI-werk houden: nauw samenwerken met de business, om de vraagstukken die klanten over hun data hebben te kunnen beantwoorden en klanten meer inzicht te geven in hun data. Daarvoor willen we slimme systemen bouwen, waar de grote technische uitdaging begint. Om de klant dát systeem te bieden dat zij daadwerkelijk nodig heeft, zijn BI’ers nodig, die de sociaal sterk moeten zijn (zodat ze bij klanten tot de kern van de zaak te komen en zich de problemen van de klant eigen kunnen maken), maar tegelijk technisch goed moeten zijn (om een goed functionerende oplossing te vinden, met name omdat het om grote hoeveelheden data gaat waar snel over gerapporteerd moet kunnen worden). Als je meer wilt weten over hoe dát in de praktijk werkt, kun je me gerust benaderen op Twitter (@kvstrien) of mailen (kooss at infosupport dot com). In deze weblogs zal ik echter vooral ingaan op de technische kant: de constructie van een Data Warehouse.
Doelgroep
De titel van deze serie zegt het al: de doelgroep zijn informatica-studenten die iets willen leren over Data Warehouses. Wanneer je informatica studeert, weleens met een database gewerkt hebt, maar de term Data Warehouse je niets zegt, behoor je tot die doelgroep. Dan bevind je je namelijk in dezelfde positie als ik een paar jaar geleden (op het feit na dat jij nu mijn blog leest, en ik dat niet kon). Wanneer je wél weet wat een Data Warehouse is, maar er nog nooit één geïmplementeerd hebt, ben je hier ook aan het juiste adres. Dat gaan we hier namelijk doen.
Case en conclusie
Zoals gezegd zal ik aan de hand van een case de noodzaak voor Data Warehousing uitwerken. De case ziet er als volgt uit:
Op Twitter heb ik een account (@kvstrien) met 18 volgers. Af en toe komt er eentje bij, af en toe gaat er eentje af. Ik zou graag willen weten of hier een patroon in te ontdekken is: wat is de regelmaat dat mensen mij beginnen te volgen (of er juist mee stoppen)? Krijg ik bepaalde followers nadat ik in een bepaald topic een post gedaan heb? Is dit te koppelen aan hashtags?
18 volgers – populariteit is aan weinigen voorbehouden ;-). Stay tuned, er volgt snel een update!
2 comments
Goed initiatief, Koos! Succes met de serie!
Hans Geurtsen
Dank! Ik kan inmiddels melden dat ik afgerond 5,6% meer followers heb sinds het posten van dit bericht – ik vermoed dat er een verband zit tussen het plaatsen van de post en het verkrijgen van meer followers, maar dat moet natuurlijk eerst aangetoond worden met data ;-).
Koos van Strien