Afgelopen week bezocht ik met twee collega’s de grootste SQL Server conferentie ter wereld: PASS Summit 2011 in Seattle. We konden kiezen uit niet minder dan 189 sessies in 5 tracks. 57 sessies werden verzorgd door Microsoft, waaronder 11 door het SQLCAT team. Onder de sprekers waren verder 93 MVP’s en 11 MCM’s. Buiten de sessies om waren er honderden Microsoft program managers en technical specialists op de conferentie aanwezig. Daarmee is PASS Summit dé ‘place to be’ voor iedereen die iets met SQL Server doet. Het is dan ook niet verwonderlijk dat er zeker 30 Nederlanders in Seattle waren.
Announcements
Vaak worden dit soort grote conferenties door Microsoft gebruikt om grote aankondigingen te doen. In dat opzicht viel deze conferentie een beetje tegen. Dé grote aankondiging was er eentje die ik zelf al wel had voorspeld: SQL Server codenaam “Denali” gaat officieel SQL Server 2012 heten en zal in de eerste helft van volgend jaar op de markt komen. Op het gebied van naamgeving werd er nog een aankondiging gedaan: project Crescent heet voortaan Power View (ja, met spatie!). Power View is een reporting tool voor information workers die naast ReportBuilder 3.0 wordt gepositioneerd. Naast, want ReportBuilder blijft gewoon bestaan en is meer bedoeld voor de power user. Power View werkt volledig in een web browser. Tijdens de keynote op dag 1 werd gedemonstreerd dat hierbij ook alle tablets die op dit moment op de markt zijn worden ondersteund. In de demonstratie was Power View te zien op een iPad, een Samsung Galaxy Tab (Android 3) en op een Windows 8 tablet. Niet officieel maar wel tussen de regels door te horen was dat er zeer waarschijnlijk geen nieuwe CTP’s meer uit zullen komen en dat de huidige CTP3 opgevolgd zal worden door een RC0 (Release Candidate). Ook werd tijdens deze PASS Summit aangekondigd dat Microsoft Hadoop gaat ondersteunen op Windows. Hadoop is een NoSQL implementatie van Apache voor ‘big data’. Als je hier meer over wilt weten, kan ik je alleen maar aanraden de keynote van David DeWitt eens te bekijken. Hij legt haarfijn uit wat Hadoop en de onderliggende technologie precies is en waarvoor je het gebruikt.
Analysis Services en PowerPivot
Hoewel veel sessies bestaande SQL Server features als onderwerp hebben, waren er natuurlijk ook heel wat over nieuwe SQL Server 2012 features te volgen. Zo was er veel te horen over de wijzigingen in Analysis Services en PowerPivot. Analysis Services krijgt in 2012 een nieuwe mode: tabular mode. Tabular mode is bedoeld om PowerPivot modellen in Analysis Services te hosten. Maar je kunt ook vanuit Visual Studio beginnen en een nieuwe tabular mode Analysis Services database ontwerpen. Dat lijkt dan opvallend veel op het maken van een PowerPivot model in Excel! De vraag rijst al snel waarom je dat zou willen doen. Deze vraag heeft meerdere antwoorden:
- de performance van een tabular mode database is (veel) beter
- het maken van een tabular mode database is makkelijker
- sommige client tools werken beter met een tabular mode database
Denk bij het laatste antwoord vooral aan reporting tools. Iedereen die wel eens rapporten op een ‘gewone’ meerdimensionale database heeft gemaakt, weet waarschijnlijk wel dat dit kan, maar niet optimaal werkt. Reporting tools zijn nu eenmaal gemaakt te werken met tabellen met data, niet met kubussen en dimensies. Een tabular mode Analysis Services database heeft DAX als query taal en reporting tools werken daarmee beter dan met MDX. Net zoals Analysis Services in multidimensional mode meerdere manieren kent om data op te slaan (MOLAP/HOLAP/ROLAP), krijgt ook tabular mode meerdere manieren: Vertipaq en DirectQuery. Vertipaq is de inmiddels bekende manier van gecomprimeerde, column store opslag die op een server een verbluffende performance van 20 miljard row scans per seconde kan realiseren. DirectQuery kun je zien als de tegenhanger van ROLAP. De database is niet meer dan een semantische laag. De data blijft in de database, maar de client tools kunnen de data met DAX queries benaderen. Het enige wat DirectQuery eigenlijk doet is het vertalen van de DAX query naar SQL. Vooral wanneer de onderliggende database wordt geïndexeerd met de nieuwe columnstore index in SQL Server 2012, kan dit in sommige situaties een goede keus zijn.
PowerPivot versie 2 krijgt enorm veel nieuwe functionaliteit. Eigenlijk te veel om kort samen te vatten. Het meest in het oog springend zijn:
- diagram view naast table view waarmee het model wat je maakt met PowerPivot grafisch kan worden weergegeven
- aanmaken van hiërarchieën
- multiple relationships
- perspectives
- definiëren van KPI’s
- nieuwe calculation area in table view waarmee het voor Excel gebruikers intuïtiever moet worden measures te definiëren
- rank functies in DAX
- ‘mark as date table’ waardoor gebruik van time intelligence functies in DAX makkelijker wordt
Niet al deze nieuwe functionaliteit is standaard zichtbaar. PowerPivot krijgt een ‘advanced mode’ die je expliciet moet kiezen. Pas dan zie je in de ribbon een ‘Advanced’ tab waarin extra functionaliteit beschikbaar is. In mijn optiek een heel verstandige keuze. Voor veel gebruikers is PowerPivot nu al moeilijk genoeg…!
BI Semantic Model
Eén van de nieuwe features in SQL Server 2012 is het BI Semantic Model (BISM). Wat is dit nu precies? Het BISM is in mijn beleving een evolutie van het Unified Dimensional Model (UDM). Het gaat dus over Analysis Services en de uitbreiding van Analysis Services met de eerder genoemde tabular mode. Het ultieme doel van het BISM is dat client tools één model zien waarmee ze in een query taal naar keuze kunnen ‘praten’. Ultiem, want wanneer SQL Server 2012 op de markt komt, zal het BISM nog niet af zijn. Zo ‘praat’ Power View alleen maar DAX en een multidimensional mode Analysis Services database ‘verstaat’ alleen maar MDX. Er zal dus in de loop van volgend jaar waarschijnlijk een update komen op SQL Server 2012 die DAX toevoegt als query taal op een multidimensional mode database. Ik ben bang dat daardoor dit deel van SQL Server 2012 nog wel wat verwarring zal veroorzaken… Let dus ook op dat Power View (Crescent) in eerste instantie uitsluitend werkt op PowerPivot modellen of Analysis Services tabular mode databases!
Columnstore index
SQL Server 2012 is opnieuw vooral een BI release. Toch is er ook in de database engine genoeg nieuws te ontdekken. Al is daarvan één feature weer vooral voor ons BI’ers interessant: de columnstore index. De demo’s van deze nieuwe index methode blijven indrukwekkend. Een factor 20 performancewinst op grote tabellen waarbij een query die eerder 20 seconden nodig heeft in minder dan een seconde antwoord geeft, blijft natuurlijk erg leuk! Deze winst wordt gehaald door de data in een tabel anders op te slaan (kolommen met data worden opgeslagen in de data pages van de database, in plaats van rijen) en deze data wordt ook nog eens gecomprimeerd met behulp van de Vertipaq engine. Dit alles leidt in veel gevallen tot minder file IO. Toch is de columnstore index niet altijd zoveel sneller. De performancewinst is vooral afhankelijk van het soort queries dat wordt gebruikt. En een groot nadeel van de index is dat de tabellen waarop je deze index toepast read-only worden. Op TechNet is een goede FAQ te vinden over de columnstore index.
Training en certificatie
Een nieuwe SQL Server versie, vraagt natuurlijk ook om nieuwe trainingen en certificeringen. In totaal komen er 7 examens en 5 trainingen voor SQL Server 2012:
De ‘Querying Microsoft SQL Server’ training, is een nieuwe 5-daagse opvolger van de huidige SQL training. Merk verder op dat er nog slechts twee BI trainingen zijn. Beide worden 5-daagse trainingen. Trainingen voor de IT-Pro examens zijn op dit moment nog niet aangekondigd. Officieel was de melding ‘we are looking into budget’.
Keynotes
Als je nog eens wat terug wilt kijken van PASS Summit, dan kan dat in de vorm van opnames van de keynotes. Alle keynotes zijn terug te zien via deze pagina. Je moet hiervoor wel lid zijn van PASS (gratis). Eigenlijk zijn alle keynotes interessant. De keynote van Ted Kummert op dag 1 bevat de meeste aankondigingen en leuke demo’s van oa. Amir Netz. De keynote van Quentin Clark geeft een goed overzicht van de belangrijkste features in SQL Server 2012 onder de noemer “The Fantastic 12 of 2012”. De keynote van David DeWitt is een must-see wanneer je wilt weten wat Microsoft doet op het vlak van NoSQL en de aankondigingen op dag 1.