10 Užitečná Data Analýzy Výrazy (DAX) Funkce pro Power BI Začátečníky

Úvod

pracovali Jsme na spoustu drag-and-drop nástroje v našem business intelligence (BI) cestu. Ale žádný se nepřiblížil k tomu, aby odpovídal povaze švýcarského armádního nože společnosti Microsoft Power BI. To skutečně zjednodušuje úkol křupání čísel, analýzu dat a vizualizaci vzorů.

je to jeden z nejlepších nástrojů „drag-and-drop“ v oboru. Vyberete pole, které chcete analyzovat, vložte jej do palubní desky Power BI a voila! Postřehy jsou přímo před vámi.

ale co když se chceme ponořit hlouběji do naší analýzy? Co bychom měli dělat, pokud chceme přizpůsobit určité proměnné nebo generovat nové? Jen rychlé přetažení nevyřeší náš problém. To je místo, kde power of Data Analysis Expressions (DAX) v Power BI přichází do hry.

Power BI DAX

Toto je šikovný nástroj, aby se dozvěděli o žádné vědecké údaje professional, není jen ctižádostivý business intelligence. Ušetří nám to spoustu času, který bychom jinak trávili chrlením kódu.

v tomto článku nejprve pochopíme, co je BI a typickou roli profesionála v oboru BI. Poté Vám představíme výkonný nástroj Microsoft Power BI a poté se hluboko ponoříme do deseti opravdu užitečných funkcí pro analýzu dat (DAX), které můžeme použít v Power BI.

Obsah

  • Úvod do Business Intelligence (BI)
  • Roli Business Intelligence Professional
  • Co je Power BI?
  • výrazy pro analýzu dat (DAX): co jsou a proč jsou potřebné?
  • Provádění DAX Funkce v Power BI

Úvod do Business Intelligence (BI)

Business Intelligence má široký rozsah, ale můžeme ji definovat jako proces sledování a přezkoumávání obchodní metriky.

Vezměme si příklad, abychom to pochopili.

zvažte, že provozujeme přepravní společnost, která dodává produkty našim zákazníkům v různých částech země. Stejně jako u každého podnikání chceme zlepšit naši zákaznickou zkušenost. Existuje několik metrik můžeme měřit pro měření spokojenosti zákazníků, včetně:

  • sazba, za kterou byl výrobek doručen
  • Zda byl výrobek poškozen nebo není
  • Byl správný výrobek doručen? atd.

Tato data jsou zpracovány a zobrazeny ve formě přehledného zprávy, které dělá to jednodušší, aby se přinést domů postřehy. Pokud tedy graf rychlosti doručení zobrazuje nižší hodnocení, než se očekávalo, můžeme se pokusit najít příčinu a zlepšit rychlost doručení.

Role Business Intelligence Professional

co dělá business intelligence professional? Jsem si jistý, že vám to muselo napadnout při procházení výše uvedeným scénářem. Níže je uvedeno několik běžných úkolů, které typický BI člověk dělá:

  • Write (SQL) dotazů nebo konektory načítat data z relační/NoSQL databází
  • Write (SQL) dotazy ke zpracování dat a výpočet obchodní metriky
  • Design kód pro vytvoření tabulek s interaktivní widgety, které vizualizovat obchodní metriky
  • Vytvořit řídicí panely z grafů a jejich nasazení, které mají být používány koncovým uživatelem

skillset potřebné, aby se stal BI profesionální se liší projekt od projektu. Ale obecně byste museli mít solidní znalosti o nástroji BI, jako je Tableau, PowerBI, Qlik, spolu s některými zkušenostmi v programovacím jazyce, jako je Python, R nebo SQL. Jsou také vyhledávány znalosti domény a strukturovaného myšlení.

Power BI je jedním z nejpopulárnějších a nejvýkonnějších BI nástrojů. To bude naše zaměření v tomto článku. Než se tam dostaneme, zde je nádherná ilustrace typické architektury business intelligence:

ukázka Business Intelligence architecture

co je Power BI?

Power BI je populární a neuvěřitelně výkonný nástroj business intelligence vyvinutý společností Microsoft. Má různé příchutě a nabídky. Nejzákladnější verze je zdarma, ale má schopnost provádět středně velké business intelligence cvičení snadno.

V širším smyslu, Power BI je cloud-based business analytics solution suite, která poskytuje nástroje potřebné, aby zase obrovské objemy dat napříč sila do přístupné informace. Byl trvale zařazen do kvadrantu Gartner BI Magic.

Power BI je populární pro svou univerzálnost, interaktivitu, estetické návrhy, rozsáhlé připojení k databázím a snadné vytváření řídicích panelů s nízkým úsilím. Využívá také podporu z jiných nástrojů ze svého ekosystému Microsoft-Azure, Cortana, SQL Server, Azure Active Directory, Azure Blob Storage atd.

zde je pár skvělých věcí, které Power BI dokáže:

  • upozornění a vizualizace v reálném čase pro sledování stavu výrobních zařízení. Toto je děláno tím, že projde IoT sensor data prostřednictvím IoT Azure Hub, Azure Data Factory, Cognos DB a pak analyzovány v Power BI
  • Vytvoření a načtení grafů a Power BI reportů a dashboardů tím, že hlasové pokyny pomocí Windows hlasová asistentka Cortana

analýzy Dat Výrazů (DAX): Co jsou a proč jsou potřeba?

můžeme číst data do Power BI ze souborů CSV nebo z databáze. Můžeme také sloučit tabulky v Power BI. Poměrně často jsou data potřebná pro vykreslování snadno dostupná ve sloupcích tabulky(i když tomu tak není vždy).

zvažte situaci, kdy potřebujeme upravit nebo změnit data, abychom vylepšili naše řídicí panely. Předpokládejme, že tyto vlastní úpravy, které potřebujeme, nejsou v Power BI snadno dostupné. Co budeme dělat potom? Jak můžeme provést tento druh modifikace a analýzy dat?

odpověď je DAX (zkratka pro výrazy pro analýzu dat). DAX se používá, aby některé smysluplné informace skryté uvnitř nezpracovaných dat. Jednoduše řečeno, DAX se používá pro manipulaci s daty.

při používání DAX musíme dodržovat určitá pravidla. Tato pravidla rychle pochopíte, pokud jste obeznámeni s funkcemi aplikace Excel. DAX je jen pokročilá forma.

Tam jsou dvě místa, kde jsme se napsat DAX:

  • počítaný Sloupec
  • Vypočítaný rozměr

Pojďme se podívat, co oba tyto stojan pro:

  • Vypočítané sloupce jsou velmi podobné pravidelné rubriky, které můžeme vidět ve většině datových souborů. Rozdíl je, že vypočítané sloupce jsou výsledkem našich výpočtů pomocí dvou nebo více sloupců nebo pomocí sloupců z různých tabulek. Mohou být použity, když chceme provést row-wise výpočty
  • Vypočítat Opatření, na druhé straně, je podobný vypočítaný sloupec. Nezabírají však žádnou fyzickou paměť a jejich výsledky nelze vidět ve formě sloupce. Obvykle používáme, když chceme provádět dynamické výpočty na skupině řádků nebo seskupením dat dohromady

Provádění DAX Funkce v Power BI

Budeme pracovat na několik užitečných DAX příkazy a jejich funkce v tomto oddílu. Budeme používat datovou sadu „Sample Super Store“. Zde si můžete stáhnout datovou sadu a začít experimentovat na vlastní pěst, jakož!

datová sada obsahuje tři tabulky- ‚Orders‘, ‚Returns‘ a ‚Users‘. Pokračujte a vložte ukázkový soubor Superstore dataset Excel do Power BI.

otevřete Power BI a vyhledejte „získat data“na kartě „Domů“. Vyberte Excel a poté přejděte do souboru datové sady přítomného v místním počítači. Načtěte celý soubor do okna BI.

Nyní, pojďme!

vyhledávání( )

funkce vyhledávání je velmi podobná Vlookup v aplikaci Microsoft Excel.

třetí tabulka v našem datovém souboru obsahuje podrobnosti o všech správcích v jednotlivých regionech. Nyní je zde vyhledávání v ruce. Můžeme provést vyhledávání sloupce „správce“ v tabulce „uživatelé“ proti odpovídajícímu sloupci „Region“ v tabulce „objednávky“.

jak tedy provedeme vyhledávání v Power BI? Tam jsou dvě věci, které musíme pamatovat:

  1. potřebujeme společný sloupec, aby bylo možné provádět vyhledávání
  2. potřebujeme také jedinečné hodnoty alespoň v jednom z odpovídající sloupce vybrány ze dvou různých tabulek. Základní syntaxe pro vyhledávání je:
LOOKUPVALUE(Result Column Name, Search Column Name, Search Column value)

Uvedení této syntaxe pomocí našeho datového souboru proměnné:

Manager = LOOKUPVALUE(Users,Users,Orders)

FILTR( ) & CALCULATE( )

DAX zobrazí níže je podobné skupiny podle funkce. Dynamicky agreguje sloupec založený na filtru. To je užitečné, když vytváříme tabulku v dashboardech Power BI a potřebujeme filtrovat pouze jeden sloupec (zatímco zbývající sloupec zůstává filtrem neovlivněn).

tento DAX se hodí tam, kde každý sloupec použitý v tabulce může mít svůj vlastní filtr. Vezměme si příklad, abychom pochopili, jak to funguje.

chceme vypočítat součet tržeb podle regionů. Takže nejprve funkce filtru rozdělí sloupec regionu na sever, jih, východ a západ. Poté vypočítá součet tržeb podle segregace. Používáme zde opatření, protože určitá oblast může mít v sobě libovolný počet řádků.

zde deklarujeme proměnnou reg, která slouží jako klíč pro filtr. Proměnnou můžeme deklarovat pomocí klíčového slova VAR. Klíčové slovo RETURN nám dává výsledek výpočtu (součet tržeb, v našem příkladu). Výsledek jsme si od vypočtené DAX je:

Vnořená Podmínka if

Zvažte tabulku objednávky v našem datovém souboru. Sloupec „Priorita objednávky“ má pod sebou pět hodnot. Předpokládejme, že potřebujeme nějaké celočíselné hodnoty místo původních hodnot přítomných v tomto sloupci. Vnořené if je tady náš přítel:

Nested IF = IF(Orders ="Critical", 5, IF(Orders ="High", 4, IF(Orders = "Medium", 3, IF(Orders = "Low", 2, IF(Orders = "Not Specified", 1)))))

Podmíněné Formátování

Podmíněné formátování je jedním z nejčastěji používaných funkcí aplikace Microsoft Excel. A můžeme využít i tu vnitřní sílu BI!

Podmíněné formátování pro ty, kteří jej dříve nepoužívali, je schopnost změnit barvu písma sloupce na základě podmínky z jiného sloupce. To lze provést vytvořením nového sloupce podle naší podmínky a poté pomocí tohoto sloupce nastavit pravidla na kartě podmíněné formátování.

zkusme to na příkladu z naší ukázkové datové sady Superstore.

chceme změnit barvu hodnot zobrazených ve sloupci ‚Priorita objednávky‘ tabulky objednávek. Například všechny „kritické“ hodnoty by měly být v červené barvě, všechny „vysoké“ hodnoty by měly být v zelené barvě atd.

můžeme použít vnořený sloupec IF, který jsme vytvořili výše, protože podmínky jsou již zadány. Nastavte pravidla na kartě podmíněné formátování-pokud je hodnota výše vytvořeného sloupce 1, měla by být barva písma červená, pokud je hodnota 2, pak by měla být oranžová atd.

zde je obrázek, který ukazuje, jak to můžete udělat v Power BI:

Rozdělení Řetězce na Základě Oddělovače

Další běžné funkce Excelu můžeme použít v Power BI:

customer_split_1 = PATHITEM(SUBSTITUTE(Orders," ","|"),1)

výše uvedené funkce PATHITEM vrátí výsledný řetězec. NÁHRADNÍ funkce nahrazuje oddělovač určený zejména charakter a načte odpovídající slovo na základě hodnoty uvedené.

například provedeme rozdělení v poli „Jméno zákazníka“. Zde bude oddělovač „“a nahradili jsme jej potrubím“|“. Potřebujeme pouze křestní jméno zákazníka, proto jsme zadali 1. Tuto hodnotu můžete změnit a zjistit, jaké výsledky získáte.

nyní provedeme tři takto rozdělené a pojmenujeme je jako customer_split_1, customer_split_2, customer_split_3.

načítání konkrétního dopisu ze slova

Co kdybychom chtěli extrahovat pouze konkrétní písmeno ze slova? Zní to složitě, ale ve skutečnosti je to docela snadné v Power BI:

customer_initial_1 = LEFT(Orders,1)

udělali jsme to jen v jednom řádku kódu!

řekněme, že jméno konkrétního zákazníka je „Helen Stein“ a rozdělení je rozděleno na dvě části. Používáme výše uvedený DAX, abychom získali první písmeno z prvního děleného slova (Helen). Levá funkce vrátí počet znaků umístěním na začátek řetězce. Pokud dáme 2 místo 1, výše uvedený DAX vrátí „He“ místo „H“.

Zřetězení Řetězců

My se často ocitáme v situacích, kdy potřebujeme spojit dvě slova dohromady. Abychom viděli, jak to funguje v Power BI, předpokládejme, že v našich datech máme více iniciál.

musíme ve vizualizaci zadat pouze iniciály zákazníka, nikoli celé jeho jméno. To pomůže udržet stůl čistý a kompaktní:

customer_initials = CONCATENATE(Orders,CONCATENATE(Orders,Orders))

funkce zřetězit spojuje řetězce dohromady. Zde jsme provedli zřetězení tří sloupců:

WEEKDAY ()

funkce WEEKDAY vrací celé číslo, které nám dává aktuální den. Pojďme zjistit den, kdy bylo odesláno několik objednávek:

weekday = WEEKDAY(Orders,2)

celé číslo zobrazené výše určuje počáteční den:

  • 1 – Start od neděle = 1 a končí v sobotu = 7
  • 2 – Začít od pondělí = 1 a končí v neděli = 7
  • 3 – Začít od pondělí = 0 a končí v neděli = 6

DATUM Rozdělit,

Tam jsou časy, kdy potřebujeme, aby un-kontingenční data pro určité projekty. Zde je dobrá zpráva – můžeme to udělat pomocí Dax a editoru dotazů v Power BI.

nyní máme dva sloupce-Datum objednávky a datum odeslání. Chceme zrušit data ležící mezi oběma intervaly. Vezměme si datum objednávky jako 01-01-2015 a datum odeslání jako 03-01-2015. Protože mezi nimi existuje 3denní rozdíl, bude tento řádek uveden třikrát.

můžeme to udělat pomocí editoru dotazů v Power BI. Vyberte možnost „vlastní sloupec“ na kartě „Přidat sloupec“. Níže uvedené okno se objeví a můžeme přidat název sloupce a použít DAX dotazu:

Další, najít sloupec DATUM v našem datasetu. Klikněte na malé pole uvnitř záhlaví sloupce s datem a vyberte možnost „Rozbalit na nové řádky“ :

Všimněte si, jak se hodnoty objevují ve formě celých čísel? Nyní, klepněte pravým tlačítkem myši na sloupec a změnit datový typ „Date“ format:

Komplexní Shluky na Základě DATA

Práce s data je poměrně složitý úkol. Je toho mnohem víc, než jen rozdělení různých dnů, měsíce, atd.

v této části budeme pracovat na příkladu komplexní agregace založené na datech. Například, Jaký je celkový počet hodin uvedených pro další 2 týdny nebo minulost 2 týdny?

přepneme naši datovou sadu pro tuto sekci. Nový datový soubor s názvem „Weekcal“ si můžete stáhnout z Forecast. Tato datová sada je modelována na týmovém přidělování času a plánovacím nástroji s názvem Float. Float nám pomáhá přiřazovat úkoly a vypočítat odhadované hodiny pro členy týmu.

v plováku je jedna námitka, o které bychom si měli být vědomi. Týden vždy začíná od pondělí v Plovákovém nástroji. Například, pokud chcete vypočítat přidělen hodin na příští týden od čtvrtka, najdete hodiny přidělené z poslední pondělí do pátku a to od tohoto čtvrtka do příštího čtvrtka.

dataset obsahuje níže uvedené funkce:

  • Začít den – Začít den v task
  • Koncové datum – den Konce úkolu
  • Hodiny/den – Počet hodin strávený na úkolu za den
  • Název Úkolu – Název úkolu

předpokládejme, že máme zájem na zjištění počtu hodin přidělených pro příští týden. Můžeme to udělat pomocí níže logiku:

FORECAST_1 WEEK = if (Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,Forecast1,DAY)+1 * Forecast1,IF(Forecast1 > TODAY()-(WEEKDAY(TODAY(),2)-1) ,0,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7 && Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1),DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),Forecast1,DAY)* Forecast1,IF(Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1 >=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY)* Forecast1,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)&& Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY) * Forecast1,BLANK())))))
  • DNES() – (VŠEDNÍ den(DNES(), 2) – 1 funkce vrací aktuální pondělí v týdnu,
  • DATEDIFF vrací rozdíl mezi dvěma termíny,

Podívejte se na tabulky níže vidět odhadované hodiny pro každý úkol pro následující týden:

Konec Poznámky

Power BI je výkonný a snadno použitelný nástroj k rychle vytvořit řídicí panely s různými zdroji údajů. Dotazy DAX se používají k mapování dat, vytváření nových proměnných a obchodních metrik a manipulaci s daty. Tento článek poskytuje stručný a rychlý průvodce, jak začít svou cestu DAX.

měli byste se také podívat na oficiální Návody společnosti Microsoft pro Power BI-skvělý zdroj!

doufáme, že vám tento článek připadal užitečný. Těšíme se na vaše připomínky a komentáře. Šťastný Dashboarding, nebo bychom měli říci Šťastný DAXing!

O Autorech

Kirthi Tej Yendloori

Kirthi Tej je datový analytik Indium software. Má roční zkušenosti s vizualizací dat a velmi se zajímá o strojové učení. Miluje cestování.

You might also like

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.