10 hyödyllistä Data Analysis Expressions (Dax)-toimintoa Power BI-aloittelijoille

Johdanto

olemme työstäneet runsaasti vedä ja pudota-työkaluja business intelligence (BI) – matkassamme. Mutta mikään ei ole päässyt lähellekään Microsoftin Power BI: n Swiss army knife-luonnetta. Se todella yksinkertaistaa numeroiden murskaamista, tietojen analysointia ja kuvioiden visualisointia.

se on yksi alan parhaista ”vedä ja pudota” – työkaluista. Voit valita kentän haluat analysoida, pudota se Power BI kojelautaan, ja voila! Oivallukset ovat aivan edessäsi.

mutta entä jos haluamme sukeltaa syvemmälle analyysiimme? Mitä meidän pitäisi tehdä, jos haluamme muokata tiettyjä muuttujia tai luoda uusia? Pelkkä nopea vetäminen ja pudottaminen ei ratkaise ongelmaamme. Se on, jos valta Data Analysis Expressions (DAX) Power BI tulee peliin.

 Power BI DAX

tämä on kätevä työkalu oppia kenelle tahansa datatieteen ammattilaiselle, ei vain bisnesälyä tavoittelevalle. Se säästää meiltä paljon aikaa, jonka muuten käyttäisimme koodin suolaamiseen.

tässä artikkelissa selvitetään ensin, mikä BI on ja mikä on BI-alan ammattilaisen tyypillinen rooli. Sitten esittelemme sinulle tehokkaan Microsoft Power BI-työkalun ja sitten syväsukellamme kymmeneen todella hyödylliseen data analysis expressions (DAX) – funktioon, joita voimme käyttää Power BI: ssä.

Sisällysluettelo

  • Introduction to Business Intelligence (BI)
  • Role of a Business Intelligence Professional
  • What is Power BI?
  • Data Analytics Expressions (DAX): mitä ne ovat ja miksi niitä tarvitaan?
  • Dax-toimintojen toteuttaminen potenssissa BI

Johdatus Business Intelligence (BI)

Business Intelligence on laaja soveltamisala, mutta voimme määritellä sen prosessin seuranta ja tarkistaa liiketoiminnan mittarit.

otetaan esimerkki tämän ymmärtämiseksi.

ajatellaan, että pyöritämme varustamoa, joka toimittaa tuotteita asiakkaillemme eri puolille maata. Kuten missä tahansa liiketoiminnassa, haluamme parantaa asiakaskokemustamme. Asiakastyytyväisyyden mittaamiseen on useita mittareita, kuten:

  • nopeus, jolla tuote toimitettiin heille
  • onko Tuote vahingoittunut vai ei
  • toimitettiinko oikea tuote? jne.

näitä tietoja käsitellään ja esitetään selkeinä raportteina, mikä helpottaa tietojen saamista kotiin. Joten, jos kaavio nopeus toimitus näyttää alhaisempi luokitus kuin odotettiin, voimme yrittää löytää perussyy ja parantaa toimitusnopeutta.

Business Intelligence-ammattilaisen rooli

nyt, mitä tekee business intelligence-ammattilainen? Olen varma, että tämä on käynyt mielessä käydessäsi läpi edellä skenaario. Alla on muutamia yleisiä tehtäviä tyypillinen BI henkilö tekee:

  • Kirjoita (SQL) kyselyjä tai liittimiä, joilla haetaan tietoa relaatio – /NoSQL-tietokannoista
  • Kirjoita (SQL) kyselyjä tietojen käsittelemiseksi ja liiketoiminnan metriikan laskemiseksi
  • Suunnittelukoodi, jolla luodaan kaavioita interaktiivisilla widgeteillä liiketoiminnan metriikan visualisoimiseksi
  • luo kaavioista kojelautoja ja ota ne käyttöön loppukäyttäjän käyttöön

bi-ammattilaiseksi pääsemiseen vaadittavat taidot vaihtelevat projektikohtaisesti. Mutta yleisesti, sinun pitäisi olla vankka tietämys BI työkalu, kuten Tableau, PowerBI, Qlik, sekä jonkin verran kokemusta ohjelmointikielen kuten Python, R tai SQL. Myös toimialan tuntemus ja jäsennelty ajattelu ovat haluttuja.

Power BI on yksi suosituimmista ja tehokkaimmista BI-työkaluista. Tämä on meidän painopiste tässä artikkelissa. Ennen kuin pääsemme sinne, tässä on ihana kuvaus tyypillinen business intelligence arkkitehtuuri:

Sample Business Intelligence architecture

What is Power BI?

Power BI on Microsoftin kehittämä suosittu ja uskomattoman tehokas business intelligence-työkalu. Siinä on erilaisia makuja ja tarjontaa. Perusversio on ilmainen, mutta sillä on kyky tehdä keskikokoisia business intelligence harjoituksia helposti.

Power BI on yleisesti ottaen pilvipohjainen business analytics-ratkaisupaketti, joka tarjoaa tarvittavat työkalut siilojen valtavien tietomäärien muuttamiseksi helposti saatavilla olevaksi tiedoksi. Se on johdonmukaisesti sijoittunut Gartner BI Magic Quadrant.

Power BI on suosittu monipuolisuutensa, interaktiivisuutensa, esteettisten suunnittelujensa, laajojen tietokantayhteyksiensä ja vaivattomuutensa vuoksi. Se hyödyntää myös muiden Microsoft-ekosysteeminsä työkalujen tukea-Azure, Cortana, SQL Server, Azure Active Directory, Azure Blob Storage jne.

tässä pari siistiä asiaa, joita Power BI voi tehdä:

  • reaaliaikaiset hälytykset ja visualisointi valmistuslaitteiden terveyden seurantaan. Tämä tapahtuu välittämällä IoT-sensoridataa IoT Azure Hubin, Azure Data Factoryn, Cognos DB: n kautta ja analysoimalla sitten Power BI
  • luo ja nouda kaavioita ja Power BI-raportteja sekä kojelautoja antamalla ääniohjeita Windows voice assistant Cortana

Data Analytics Expressions (DAX): mitä ne ovat ja miksi niitä tarvitaan?

voimme lukea dataa Power BI: hen CSV-tiedostoista tai tietokannasta. Voimme myös yhdistää taulukoita Power BI. Aika usein, tarvittavat tiedot piirtämistä on helposti saatavilla taulukon sarakkeita (vaikka näin ei aina ole).

harkitse tilannetta, jossa meidän on muokattava tai muutettava tietoja parantaaksemme mittaristojamme. Oletetaan, että nämä mukautetut muutokset tarvitsemme eivät ole helposti saatavilla Power BI. Mitä me sitten teemme? Miten voimme tehdä tällaista muokkausta ja tietojen analysointia?

vastaus on Dax (lyhenne sanoista Data Analysis Expressions). DAXIA käytetään tuomaan merkityksellistä tietoa, joka on piilotettu raakadatan sisään. Yksinkertaisesti sanottuna daxia käytetään tietojen manipulointiin.

Daxin käytössä on tiettyjä sääntöjä. Ymmärrät nämä säännöt nopeasti, jos olet perehtynyt Excel-toimintoja. DAX on vain kehittynyt muoto siitä.

on kaksi paikkaa, joissa kirjoitetaan DAX:

  • laskettu sarake
  • laskettu mitta

katsotaan, mitä nämä molemmat tarkoittavat:

  • lasketut sarakkeet ovat hyvin samanlaisia kuin tavalliset sarakkeet, joita näemme useimmissa aineistoissa. Erona on, että lasketut sarakkeet ovat tulosta laskelmistamme käyttämällä kahta tai useampaa saraketta tai käyttämällä sarakkeita eri taulukoista. Niitä voidaan käyttää, kun halutaan tehdä rivilaskelmia
  • laskettu mitta, toisaalta on samanlainen kuin laskettu sarake. Ne eivät kuitenkaan vie mitään fyysistä muistia, eikä niiden tuloksia voida nähdä sarakkeen muodossa. Käytämme tätä yleensä silloin, kun haluamme suorittaa dynaamisia laskutoimituksia riviryhmälle tai ryhmittämällä tiedot yhteen

Dax-funktioiden toteuttaminen potenssissa BI

työstämme muutamia hyödyllisiä DAX-komentoja ja niiden funktioita tässä osiossa. Käytämme ’Sample Super Store’ – aineistoa. Voit ladata aineiston täältä ja aloittaa kokeilut myös itse!

aineisto sisältää kolme taulukkoa – ”tilaukset”, ”Palautukset” ja ”käyttäjät”. Mene eteenpäin ja lataa näyte Superstore dataset Excel-tiedoston teho BI.

avaa Virta BI ja etsi” Get data ” ’Home’ – välilehdeltä. Valitse Excel ja selaa tietokokonaisuus läsnä paikallisessa koneessasi. Lataa koko tiedosto BI-ikkunaan.

nyt mennään!

LOOKUP ()

LOOKUP-toiminto on melko samanlainen kuin Vlookup Microsoft Excelissä.

aineistomme kolmas taulukko sisältää tiedot kaikista johtajista alueittain. Tässä kohtaa haku tulee käsi kädessä. Voimme tehdä haun ’johtaja’ – sarakkeeseen ’käyttäjät’ – taulukossa vastaavaa’ alue ’- saraketta vastaan’ tilaukset ’ – taulukossa.

Joten miten teemme haun Power BI: ssä? On kaksi asiaa, jotka meidän on muistettava.:

  1. tarvitsemme yhteisen sarakkeen, jotta voimme tehdä haun
  2. tarvitsemme myös ainutkertaiset arvot ainakin yhdessä kahdesta eri taulukosta valituista vastaavista sarakkeista. Haun perussyntaksi on:
LOOKUPVALUE(Result Column Name, Search Column Name, Search Column value)

laitamme tämän syntaksin dataset-muuttujiemme avulla:

Manager = LOOKUPVALUE(Users,Users,Orders)

suodatin () & laske ()

alla esitetty Dax on funktioittain samanlainen kuin ryhmä. Se yhdistää dynaamisesti sarakkeen suodattimen perusteella. Tämä on hyödyllistä, kun luomme taulukon Power BI mittaristot ja täytyy suodattaa vain yksi sarake (kun taas jäljellä oleva sarake pysyy ennallaan suodatin).

tämä DAX on kätevä, jossa jokaisella taulukon sarakkeella voi olla oma suodatin. Otetaan esimerkki ymmärtää, miten tämä toimii.

haluamme laskea myynnin summan alueittain. Ensin suodatinfunktio siis jakaa alueen sarakkeen pohjoiseen, etelään, itään ja länteen. Sitten se laskee myynnin summan erottelun mukaan. Käytämme tässä toimenpidettä, koska tietyllä alueella voi olla mitä tahansa rivejä.

tässä julistamme muuttujan reg, joka toimii suodattimen avaimena. Voimme julistaa muuttujan käyttämällä avainsanaa VAR. RETURN-avainsana antaa meille laskelman tuloksen (esimerkkitapauksessamme myynnin summa). Tulos saamme lasketun DAX on:

sisäkkäinen, jos ehto

tarkastellaan tilaustaulukkoa aineistossamme. Sarakkeen ”Järjestys-prioriteetti” alla on viisi arvoa. Oletetaan, että tarvitsemme joitakin kokonaisluku arvoja sen sijaan, että alkuperäiset arvot läsnä, että sarake. The Sissed IF statement is our friend here:

Nested IF = IF(Orders ="Critical", 5, IF(Orders ="High", 4, IF(Orders = "Medium", 3, IF(Orders = "Low", 2, IF(Orders = "Not Specified", 1)))))

Ehdollinen muotoilu

Ehdollinen muotoilu on yksi Microsoft Excelin yleisimmin käytetyistä ominaisuuksista. Ja voimme hyödyntää, että sisällä valtaa BI samoin!

Ehdollinen muotoilu on niille, jotka eivät ole sitä ennen käyttäneet, mahdollisuus vaihtaa sarakkeen kirjasinväri ehdon perusteella toisesta sarakkeesta. Tämä voidaan tehdä luomalla uusi sarake kohti ehtomme ja sitten käyttämällä tätä saraketta asettaa sääntöjä Ehdollinen muotoilu välilehti.

kokeillaan tätä esimerkkitapauksemme Superstore-aineistosta.

haluamme muuttaa järjestystaulukon ”Järjestysprioriteetti” – sarakkeessa esitettyjen arvojen väriä. Esimerkiksi kaikkien ”kriittisten” arvojen tulisi olla punaisia, kaikkien ”korkeiden” arvojen tulisi olla vihreitä jne.

Voimme käyttää yllä luomaamme sisäkkäistä IF-saraketta, koska ehdot on jo määritelty. Aseta säännöt ehdollisen muotoilun välilehdessä – jos yllä luodun sarakkeen arvo on 1, fontin värin tulee olla punainen, jos arvo on 2, sen pitäisi olla oranssi ja niin edelleen.

tässä kuva, joka näyttää, miten voit tehdä sen Power BI:

merkkijonon jakaminen erottimien perusteella

toinen yleinen Excel-toiminto, jota voimme käyttää potenssissa BI:

customer_split_1 = PATHITEM(SUBSTITUTE(Orders," ","|"),1)

yllä oleva PATHITEM-funktio palauttaa tuloksena olevan merkkijonon. Korvaava funktio korvaa määritellyn erottimen tietyllä merkillä ja hakee vastaavan sanan mainitun arvon perusteella.

tehdään esimerkiksi jako ”asiakkaan nimi” – kenttään. Täällä, ”” tila on erotin ja olemme korvanneet sen putki|/”. Tarvitsemme vain asiakkaan etunimen, joten olemme määrittäneet 1. Voit muuttaa tätä arvoa ja nähdä, mitä tuloksia saat.

tehdään nyt kolme jakoa näin ja nimetään ne vastaavasti nimillä customer_split_1, customer_split_2, customer_split_3.

tietyn kirjaimen hakeminen sanasta

mitä jos haluaisimme poimia vain tietyn kirjaimen sanasta? Se kuulostaa hankala, mutta se on itse asiassa melko helppoa valtaa BI:

customer_initial_1 = LEFT(Orders,1)

teimme sen vain yhdellä koodirivillä!

sanotaan, että tietyn asiakkaan nimi on ”Helen Stein” ja jako jakautuu kahteen osaan. Käytämme yllä olevaa DAXIA saadaksemme ensimmäisen kirjaimen ensimmäisestä jaetusta sanasta (Helen). Vasen funktio palauttaa merkkien määrän sijoittamalla Merkkijonon alkuun. Jos annamme 2 sijasta 1, edellä oleva DAX palauttaa ” He ”sijasta ” H”.

Jousisoinnut

joudumme usein tilanteisiin, joissa joudumme yhdistämään kaksi sanaa yhteen. Nähdä, miten tämä toimii teho BI, oletetaan meillä on useita nimikirjaimet meidän tiedot.

visualisoinnissa on ilmoitettava vain asiakkaan nimikirjaimet eikä koko nimi. Tämä auttaa pitämään pöydän siistinä ja kompaktina:

customer_initials = CONCATENATE(Orders,CONCATENATE(Orders,Orders))

konsatenaattifunktio liittää merkkijonoja yhteen. Tässä, olemme suorittaneet concatenation kolme saraketta:

WEEKDAY ()

WEEKDAY-funktio palauttaa kokonaisluvun, joka antaa meille nykyisen päivän. Mietitäänpä päivää, jolloin muutama käsky lähetettiin.:

weekday = WEEKDAY(Orders,2)

yllä näkyvä kokonaisluku määrittää aloituspäivän:

  • 1 – alkaa sunnuntaina = 1 ja päättyy lauantaina = 7
  • 2 – alkaa maanantaina = 1 ja päättyy sunnuntaina = 7
  • 3 – alkaa maanantaina = 0 ja päättyy sunnuntaina = 6

päivämäärä jako

on aikoja, jolloin meidän on poistettava päivämäärä tiettyjen hankkeiden osalta. Tässä on hyvä uutinen-voimme tehdä tämän avulla Dax ja kyselyn editori Power BI.

nyt meillä on kaksi saraketta – tilauspäivä ja toimituspäivä. Haluamme poistaa päivämäärät, jotka ovat näiden kahden välien välissä. Otetaan tilauspäivä 01-01-2015 ja toimituspäivä 03-01-2015. Koska niiden välillä on 3 päivän ero, tämä rivi listataan kolme kertaa.

voimme tehdä tämän Kyselyeditorin kautta Power BI: ssä. Valitse ’Mukautettu sarake’ vaihtoehto ’Lisää sarake’ välilehti. Alla oleva ikkuna avautuu ja voimme lisätä sarakkeen nimen ja käyttää DAX-kyselyä:

seuraavaksi, löytää päivämäärä sarake meidän aineisto. Klikkaa pieni laatikko sisällä päivämäärä sarakkeen otsikko ja valitse ’laajentaa uusille riveille’ vaihtoehto:

Huomaatko, miten arvot esiintyvät kokonaislukujen muodossa? Nyt, klikkaa hiiren oikealla sarakkeen ja muuttaa tietotyyppi ’Päivämäärä’ muodossa:

monimutkaiset aggregaatit, jotka perustuvat päivämäärään

, ovat melko monimutkaisia haasteita. On paljon enemmän kuin vain jakaminen eri päivinä, kuukausina, jne.

tässä osiossa työstämme esimerkkiä monimutkaisesta aggregaatiosta, joka perustuu päivämääriin. Mikä on esimerkiksi seuraavien 2 viikon tai viimeisten 2 viikon tuntimäärä?

vaihdamme aineistomme tähän osioon. Voit ladata uuden aineiston, nimeltään ’Weekcal’, Forecastista. Tämä tietokokonaisuus on mallinnettu tiimin ajankäytön ja Float-nimisen suunnittelutyökalun avulla. Float auttaa meitä jakamaan tehtäviä ja laskemaan tiimin jäsenten arvioidut tunnit.

Kellunnassa on yksi varoitus, josta meidän tulisi olla tietoisia. Viikko alkaa aina maanantaista Kelluntavälineessä. Jos esimerkiksi haluaa laskea ensi viikolle määrätyt tunnit torstaista alkaen, on varattu tunnit viimeisimmästä maanantaista perjantaihin eikä tästä torstaista ensi torstaihin.

nyt aineisto sisältää alla olevat ominaisuudet:

  • aloituspäivä-tehtävän aloituspäivä
  • Päättymispäivä – tehtävän Päättymispäivä
  • tuntia/päivä – tehtävään päivässä käytettyjen tuntien määrä
  • Tehtävän nimi – Tehtävän nimi

oletetaan, että olemme kiinnostuneita selvittämään ensi viikolle myönnettyjen tuntien määrän. Voimme tehdä tämän käyttämällä alla olevaa logiikkaa:

FORECAST_1 WEEK = if (Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,Forecast1,DAY)+1 * Forecast1,IF(Forecast1 > TODAY()-(WEEKDAY(TODAY(),2)-1) ,0,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7 && Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1),DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),Forecast1,DAY)* Forecast1,IF(Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1 >=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY)* Forecast1,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)&& Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY) * Forecast1,BLANK())))))
  • TODAY () – (WEEKDAY (TODAY (), 2) – 1 function returns the current Monday of the week
  • DATEDIFF function returns the difference between two dates

Check out the table to see the estimated hours for each task for the next week:

End Notes

Power BI on tehokas ja helppokäyttöinen työkalu nopeiden mittaristojen luomiseen erilaisilla tietolähteillä. DAX-kyselyjä käytetään datan kartoittamiseen, uusien muuttujien ja liiketoimintamittareiden luomiseen sekä datan manipulointiin. Tässä artikkelissa annetaan lyhyt ja nopea opas aloittaa DAX matka.

kannattaa myös tsekata viralliset Microsoft Tutorials for Power BI-a great resource!

toivomme, että tämä artikkeli on hyödyllinen. Odotamme innolla palautetta ja kommentteja. Hyvää Dashboardingia, vai pitäisikö sanoa Hyvää Daxingia!

tekijöistä

Kirthi Tej Yendloori

Kirthi Tej on indium Softwaren data-analyytikko. Hänellä on vuoden kokemus datan visualisoinnista ja hän on erittäin kiinnostunut koneoppimisesta. Hän rakastaa matkustamista.

You might also like

Vastaa

Sähköpostiosoitettasi ei julkaista.