Query Folding – posúvanie operácií z Power Query do dátového zdroja pri príprave dát

Power Query v Power BI aj Exceli majú jednu zaujímavú funkcionalitu, nazvanú Query Folding. Ide o posúvanie niektorých operácií z Power Query do dátového zdroja, a ich vykonanie tam namiesto v Power Query. To vám vie rapídne urýchliť načítanie dát do Excelu aj Power BI, a ušetriť množstvo čakania aj operačnej pamäte počítača. Preto sa na to teraz pozrieme.

Čítajte ďalej

Regulárne výrazy v Power Query pomocou R skriptu

Občas pri príprave dát v Power Query potrebujete použiť regulárne výrazy, ľudovo regexy. Problém však je, že Power Query ich zatiaľ nepodporuje. Preto sa pozrieme, ako to obísť pomocou transformácií v R skripte, ktorý ich už dávno má.

Čítajte ďalej

Sekvenčné tabuľky v Power Query, PowerPivote a Power BI

Jednou z často používaných techník pri príprave reportov je vytvorenie špeciálnych tabuliek, ktoré nám majú uľahčiť buď výpočty, alebo reporting. Dnes si ukážeme techniku, ktorá sa nazýva sekvenčné tabuľky. A ako pomocou nich vytvoriť tabuľku, kde bude v jednom stĺpci pod sebou postupnosť hodnôt zo zadaného intervalu. Čítajte ďalej

Načítanie neštrukturovaných dát podľa príkladu v Power Query

Power Query vo všetkých jeho variantách ponúka zaujímavú funkciu, ktorá je použiteľná na načítanie dát z neštruktúrovaných alebo zle štruktúrovaných dátových zdrojov, do peknej usporiadanej analytickej tabuľky. A to všetko bez znalosti jazyka M, jednoducho automatickým odvodením si vzorca podľa príkladu zadaného užívateľom. Preto sa na ňu teraz pozrieme.

Čítajte ďalej

Analýza bezpečnosti potravín v Power BI

Dnes ma pri nákupe v potravinách napadlo, že by nebolo zlé zistiť, odkiaľ pochádza najviac nebezpečných potravín. A na analýzu bezpečnosti potravín použiť Power BI, resp. kombináciu Power Query a PowerPivotu. Výsledky celkom dosť šokovali aj mňa.

Čítajte ďalej

Ako znormalizovať tabuľky v Power Query

Ideálny dátový model v PowerPivote a v Power BI by mal byť štruktúrovaný tak, ako popisujem v mojej knihe o Power BI a PowerPivote – čiže ako dátové tabuľky a číselníky. Čo zvyčajne nie je problém, keď importujete dáta z bežných databáz, pretože zvyčajne tam sú už uložené v takomto formáte. Čo však s tým, keď tak uložené nie sú? Napr. ak vám niekto sprístupní len jednu gigantickú tabuľku so všetkými stĺpcami pokope, a vy to chcete ešte skombinovať s plánovacími údajmi, a spoločne analyzovať? V tom prípade sa nevyhnete procesu normalizácie dát. A my si teraz ukážeme, ako si to viete spraviť sami v Power Query.

Čítajte ďalej

Ako zduplikovať tabuľku v Power Query

Niekedy potrebujete mať tabuľku v dátovom modeli viackrát. Napr. pri normalizácii dát, pri oprave chýb v dátach, či pre pokročilejšie scenáre ako napr. analýza odpovedí z prieskumov. Užívatelia toto riešia bežne tým spôsobom, že jednoducho naimportujú tú istú tabuľku viackrát. Čo ale v prípade, že ste nad ňou už vykonali nejaké transformácie v Power Query, prípadne ak budete často potrebovať meniť zdrojovú databázu či server? V tom prípade na to budete musieť ísť trochu inak. Preto si teraz pozrieme, ako zduplikovať tabuľku v Power Query.

Čítajte ďalej

Limity Power Query

Aj Power Query má svoje limity. Síce sú vo väčšine prípadov veľmi štedré, ale občas narazíte na problémy, napr. pri importe z Excelu, s ktorými si nebudete vedieť dať rady. Preto si teraz spíšeme všetky oficiálne aj neoficiálne limity Power Query.

Čítajte ďalej

Nahradí Power Query PowerPivot?

Prednedávnom som sa stretol s jednou zaujímavou historkou u jedného z klientov. Boli totiž na jednom školení u jednej nemenovanej školiacej spoločnosti, kde im lektor povedal, že PowerPivot končí, a že ho nahradí Power Query. Tí, čo už čítate tento blog nejaký ten mesiac, viete, že ide o maximálny blud, ktorý ani omylom nemôže byť založený na oficiálnych informáciách. A ak náhodou neviete prečo, tak čítajte ďalej.

Čítajte ďalej

Pozor na maskovanie dát v SQL Serveri – nie je úplne bezpečné

V súvislosti so zavádzaním smernice GDPR sa v poslednej dobe rozmohli riešenia na maskovanie dát v databázach, aby užívatelia nevideli to, čo nemajú vidieť. Do SQL Servera 2016 bola na tento účel pridaná funkcionalita nazývaná dynamické maskovanie dát – Dynamic Data Masking – ktorá sa práve kvôli prechodu na GDPR začala hojne využívať aj v našich končinách. Väčšina ľudí však nevie, že táto funkcia nie je bezpečnostnou funkciou, a teda ani negarantuje bezpečnosť dát. A s modernými nástrojmi ako Power BI alebo Power Query sa dá elegantne obísť za pár minút, a dostať sa k dátam, ktoré užívateľ nemá vidieť. Preto si teraz ukážeme, ako ľahko sa to dá obísť, a ako to zabezpečiť lepšie.

Čítajte ďalej