Microsoft dnes definitívne pochoval OLAP kocky – máme agregácie!

Microsoft dnes pridal posledný klinec do pomyselnej rakvy OLAP kociek. A tým pádom im dal neoficiálne definitívne zbohom. Pretože do Power BI pridal podporu pre agregácie, čím si otvoril cestu nie k terabajtom, ale rovno k petabajtom dát. Priamo na vašom desktope.

OLAP kocky boli ideálnym nástrojom pred nejakým tým desaťročím na rýchlu analýzu terabajtov dát. Problém však bol ten, že ich MS už dlho nerozvíjal, a z OLAPu sa čím ďalej, tým viac stávala výbehová technológia. Ktorá vo veľmi veľa prípadoch nezvládala analyzovať ani ten terabajt dát v reálnom čase. O jej problémoch som písal už v staršom článku.

Namiesto toho Microsoft vyvíjal niečo oveľa lepšie – serverový PowerPivot, po správnosti SSAS Tabular. Ten mal však doteraz problémy, keď ste doňho chceli naliať terabajty dát – mal na nich nízky výkon. A ten ste museli obchádzať predpočítanými agregovanými tabuľkami spolu s jazykom DAX, napr. tak ako učím na Jedi Master kurze PowerPivotu/Power BI. Potom porážal OLAP na celej čiare. Bolo to však iba náhradné riešenie. A preto, na žiadosť veľkých zákazníkov, pridal poslednú veľkú vec do PowerPivotu – podporu pre agregácie. A spolu s podporou zložených modelov či prepojení typu M:N to z neho robí tutovku. A z toho, kto dnes ide s novými riešeniami do OLAPu, večného masochistu.

Táto podpora pre agregácie bola pridaná dnes do Power BI Desktopu ako funkcia v preview režime. Technicky už viete, že Power BI Desktop používa, rovnako ako Excel, serverový PowerPivot, konkrétne SSAS Tabular v najnovšej verzii. Odkiaľ po odladení všetky novinky putujú do najnovšieho oficiálneho SSAS Tabularu, a raz za uhorský rok aj do PowerPivotu v Exceli. A aj keď nevieme, kedy vyjde nový SQL Server, ktorého súčasťou je aj SSAS Tabular, tak to už dlho nebude trvať. Jednak teraz už SQL Server vychádza dosť často. Power BI Desktop používa na pozadí túto budúcu novú verziu už asi pol roka. A predstavenie novej verzie SQL Servera sa očakáva už budúci mesiac. Takže môj skromný odhad je, že do pol roka, najneskôr do roka, to máme vonku aj v ďalšej oficiálnej verzii SSAS Tabularu.

Aktualizácia 1.10.2018: Nová verzia SQL Servera bude niesť označenie SQL Server 2019.

Aktualizácia 25.10.2018: Detailný technický popis, ako fungujú agregácie, je uvedený v tomto článku.

Technicky to funguje tak, že si v dátovom modeli vytvoríte jednu alebo viac agregovaných tabuliek. Čo je v DAX-e hračka. Ak ich je viac, tak nastavíte medzi nimi prioritu. A potom ku každej z nich nastavíte, podľa akých polí je tabuľka zagregovaná, a akými funkciami je zagregovaná. A ak všetko zbehne správne, tak na vyššej úrovni bude PowerPivot brať dáta z agregovaných tabuliek, a na nižšej úrovni z neagregovaných tabuliek. Tým dosiahnete svätý grál všetkých analýz – nezávisle od toho, koľko dát máte v dátovom modeli, tak budete môcť vidieť všetky súhrny a sumáre, a kedykoľvek si ich aj rozkliknúť na detaily. A vďaka zloženým modelom a Direct Query ani nemusíte mať tie detailné dáta u seba v modeli. Takto viete aj na desktope pracovať s gigantickými objemami dát. Vaši manažéri vás za to budú milovať.

Keď to Microsoft prezentoval na júlovej konferencii, tak ukázali report v Power BI Desktope nad 1/4 PB dát. Viete koľko to vôbec je? Je to 250 000 GB dát, a v ich prípade to zodpovedalo 17 biliardám riadkov, čiže 17 miliónov miliárd riadkov. Na sumárnej úrovni report reagoval okamžite. Na preklik na detail si už bolo treba počkať pol minúty. Čo je pri dnešných riešeniach ako OLAP a podobne priam zázrak.

Užívateľské rozhranie k tejto funkcionalite vyzerá napr. takto:

Detaily k nastaveniu tejto funkcionality prinesiem niekedy v ďalšom článku – buď keď táto funkcionalita bude stabilnejšia, alebo keď vyjde ako finálna (aktualizácia 25.10.2018: detaily nájdete v tomto článku). Pretože momentálne je jej nastavovanie dosť krkolomné a silno obmedzené. A v preview dokumentácii je sľúbené, že tie všetky obmedzenia vo finále zmiznú. Podľa roadmapy MS by to malo byť už v októbri tohto roka, ale uvidíme, či to dovtedy stihnú. Zatiaľ sa teda tešte a užívajte si nové vymoženosti Power BI Desktopu, ako napr. tieto agregácie 🙂