ISKA 16-3-2016: Microsoft Azure Data Lake

Sprekers: Hans Geurtsen en Hylke Peek

Inhoud: eind oktober 2015 gaf Microsoft een nieuwe service vrij als onderdeel van het Azure platform: Azure Data Lake. De service bestaat uit twee delen: Data Lake Store (een op het Hadoop file systeem gebaseerde opslag voor kleine tot héél grote gestructureerde en ongestructureerde datasets) en Data Lake Analytics (een op Apache YARN gebouwde analyseservice om de gegevens in een data lake te analyseren). Het basis idee is het kunnen implementeren van een data lake in de cloud, een soort hub waarin een bedrijf alle mogelijke data kan verzamelen, en deze data toegankelijk maken voor gebruik binnen de hele organisatie.
In deze ISKA nemen we een diepe duik in Microsoft’s Data Lake, waarmee we de eerste praktijkervaringen al hebben opgedaan en waar het KC al training in verzorgt. Ook zullen we een demo geven van zowel de store als de analytics. Hierbij kijken we ook naar Azure services die je nodig hebt wanneer je iets met Azure Data Lake wilt gaan doen, zoals Azure Data Factory.

Doelgroep: iedereen die geïnteresseerd is in de mogelijkheden en toepassing van Microsoft Azure Data Lake.

Voorkennis: er wordt geen specifieke voorkennis veronderstelt