10 expresii utile de analiză a datelor (Dax) funcții pentru începători Power BI

Introducere

am lucrat la o mulțime de instrumente drag-and-drop în călătoria noastră business intelligence (BI). Dar nimeni nu s-a apropiat de potrivirea naturii cuțitului armatei elvețiene A Power BI-ului Microsoft. Simplifică cu adevărat sarcina de a ronțăi numere, de a analiza date și de a vizualiza modele.

este unul dintre cele mai bune instrumente de drag-and-drop din industrie. Alegeți un câmp pe care doriți să îl analizați, îl aruncați în tabloul de bord Power BI și voila! Insights sunt chiar în fața ta.

dar dacă vrem să ne scufundăm mai adânc în analiza noastră? Ce ar trebui să facem dacă dorim să personalizăm anumite variabile sau să generăm altele noi? Doar făcând o tragere și plasare rapidă nu ne va rezolva problema. Aici intră în joc Puterea expresiilor de analiză a datelor (DAX) Din Power BI.

putere BI DAX

acesta este un instrument la îndemână pentru a învăța pentru orice știință de date profesionale, nu doar un aspirant business intelligence unul. Ne economisește o tonă de timp pe care altfel l-am petrece în eliminarea codului.

în acest articol, vom înțelege mai întâi ce este BI și rolul tipic al unui profesionist din industria BI. Vă vom prezenta apoi puternicul instrument Microsoft Power BI și apoi vă vom scufunda adânc în zece funcții foarte utile de analiză a datelor (DAX) pe care le putem folosi în Power BI.

cuprins

  • Introducere în Business Intelligence (BI)
  • rolul unui profesionist în Business Intelligence
  • ce este Power BI?
  • expresii de analiză a datelor( DAX): ce sunt și de ce sunt necesare?
  • implementarea funcțiilor DAX în Power BI

Introducere în Business Intelligence (BI)

Business Intelligence are un domeniu larg de aplicare, dar îl putem defini ca fiind procesul de urmărire și revizuire a valorilor de afaceri.

să luăm un exemplu pentru a înțelege acest lucru.

considerați că conducem o companie de transport maritim care livrează produse clienților noștri în diferite părți ale țării. Ca în orice afacere, dorim să îmbunătățim experiența clienților noștri. Există mai multe valori pe care le putem măsura pentru măsurarea satisfacției clienților, inclusiv:

  • rata la care produsul le-a fost livrat
  • dacă produsul a fost deteriorat sau nu
  • a fost produsul corect livrat? etc.

aceste date sunt prelucrate și afișate sub formă de rapoarte lucide, ceea ce face mai ușoară aducerea informațiilor. Deci, dacă graficul pentru rata de livrare afișează un rating mai mic decât se aștepta, putem încerca să găsim cauza principală și să îmbunătățim viteza de livrare.

rolul unui profesionist în Business Intelligence

acum, ce face un profesionist în business intelligence? Sunt sigur că acest lucru trebuie să fi trecut prin mintea ta în timp ce trece prin scenariul de mai sus. Mai jos sunt câteva sarcini comune pe care le face o persoană tipică BI:

  • scrieți interogări sau conectori (SQL) pentru a prelua date din bazele de date relaționale/NoSQL
  • scrieți interogări (SQL) pentru a procesa date și a calcula valorile de afaceri
  • cod de proiectare pentru a crea diagrame cu widget-uri interactive pentru a vizualiza valorile de afaceri
  • creați tablouri de bord din diagrame și implementați-le pentru a fi utilizate de utilizatorul final

skillset necesare pentru a deveni un profesionist bi variază de la proiect la proiect. Dar, în linii mari, ar trebui să aveți cunoștințe solide despre un instrument BI, cum ar fi Tableau, PowerBI, Qlik, împreună cu o anumită experiență într-un limbaj de programare precum Python, R sau SQL. Cunoașterea domeniului și gândirea structurată sunt, de asemenea, căutate.

Power BI este unul dintre cele mai populare și puternice instrumente BI de acolo. Acesta va fi obiectivul nostru în acest articol. Înainte de a ajunge acolo, iată o ilustrare minunată a unei arhitecturi tipice de business intelligence:

exemplu de arhitectură de informații de afaceri

ce este Power BI?

Power BI este un instrument popular și incredibil de puternic de business intelligence dezvoltat de Microsoft. Are diferite arome și oferte. Versiunea cea mai de bază este gratuită, dar are capacitatea de a efectua exerciții de business intelligence de dimensiuni medii cu ușurință.

în termeni generali, Power BI este o suită de soluții de analiză de afaceri bazată pe cloud, care oferă instrumentele necesare pentru a transforma volume mari de date din silozuri în informații accesibile. Acesta a fost clasat în mod constant în Gartner BI Magic Quadrant.

Power BI este popular pentru versatilitatea, interactivitatea, designul estetic, conectivitatea extinsă la bazele de date și ușurința de a crea tablouri de bord cu efort redus. De asemenea, utilizează suportul altor instrumente din ecosistemul Microsoft – Azure, Cortana, SQL Server, Azure Active Directory, Azure blob Storage etc.

iată câteva lucruri interesante pe care le poate face Power BI:

  • alerte în timp real și vizualizare pentru monitorizarea stării de sănătate a echipamentelor de fabricație. Acest lucru se face prin trecerea datelor senzorului IoT prin IoT Azure Hub, Azure Data Factory, Cognos DB și apoi analizate în Power BI
  • creați și preluați diagrame și rapoarte Power BI și tablouri de bord oferind instrucțiuni vocale folosind asistentul vocal Windows Cortana

expresii de analiză a datelor (DAX): ce sunt și de ce sunt necesare?

putem citi date în Power BI din fișiere CSV sau dintr-o bază de date. De asemenea, putem îmbina tabele în Power BI. Destul de des, datele necesare pentru plotare sunt ușor disponibile în coloanele tabelului (deși nu este întotdeauna cazul).

luați în considerare o situație în care trebuie să modificăm sau să modificăm datele pentru a ne îmbunătăți tablourile de bord. Să presupunem că acele modificări personalizate de care avem nevoie nu sunt ușor disponibile în Power BI. Ce facem atunci? Cum putem efectua acest tip de modificare și analiză a datelor?

răspunsul este DAX (prescurtare pentru expresii de analiză a datelor). DAX este folosit pentru a aduce unele informații semnificative ascunse în interiorul datelor brute. În cuvinte simple, DAX este utilizat pentru manipularea datelor.

există anumite reguli pe care trebuie să le respectăm pentru utilizarea DAX. Veți înțelege rapid aceste reguli dacă sunteți familiarizat cu funcțiile Excel. DAX este doar o formă avansată a acestui lucru.

sunt două locuri unde scriem DAX:

  • coloana calculată
  • măsura calculată

să vedem ce reprezintă ambele:

  • coloanele calculate sunt foarte asemănătoare cu coloanele obișnuite pe care le vedem în majoritatea seturilor de date. Diferența este că coloanele calculate sunt rezultatul calculelor noastre utilizând două sau mai multe coloane sau folosind coloane din tabele diferite. Ele pot fi folosite atunci când dorim să efectuăm calcule rând-înțelept
  • măsură calculată, pe de altă parte, este similar cu o coloană calculată. Cu toate acestea, ele nu ocupă nicio memorie fizică și rezultatele lor nu pot fi văzute sub forma unei coloane. De obicei, folosim acest lucru atunci când dorim să efectuăm calcule dinamice pe un grup de rânduri sau prin gruparea datelor

implementarea funcțiilor DAX în Power BI

vom lucra la câteva comenzi Dax utile și funcțiile lor în această secțiune. Vom folosi setul de date’ Sample Super Store’. Puteți descărca setul de date aici și puteți începe să experimentați și pe cont propriu!

setul de date conține trei tabele – ‘comenzi’, ‘returnări’ și ‘utilizatori’. Mergeți mai departe și încărcați fișierul exemplu Superstore dataset Excel în Power BI.

deschideți Power BI și căutați „obțineți date” în fila „Acasă”. Selectați Excel și apoi navigați la fișierul set de date prezent în mașina dvs. locală. Încărcați întregul fișier în fereastra BI.

acum, să mergem!

LOOKUP( )

funcția de căutare este destul de similar cu Vlookup în Microsoft Excel.

al treilea tabel din setul nostru de date conține detaliile tuturor managerilor pe regiune. Acum, aici este în cazul în care Căutare vine în mână. Putem efectua o căutare pentru coloana ‘Manager’ din tabelul ‘utilizatori’ față de coloana ‘Regiune’ corespunzătoare din tabelul ‘Comenzi’.

deci, Cum efectuăm o căutare în Power BI? Există două lucruri pe care trebuie să ne amintim:

  1. avem nevoie de o coloană comună pentru a efectua o căutare
  2. de asemenea, avem nevoie de valori unice în cel puțin una dintre coloanele potrivite alese din două tabele diferite. Sintaxa de bază pentru căutare este:
LOOKUPVALUE(Result Column Name, Search Column Name, Search Column value)

punerea această sintaxă folosind variabilele noastre set de date:

Manager = LOOKUPVALUE(Users,Users,Orders)

FILTER () & CALCULATE ()

DAX afișat mai jos este similar cu funcția group by. Agregă dinamic o coloană bazată pe filtru. Acest lucru este util atunci când creăm un tabel în tablouri de bord Power BI și trebuie să filtrăm o singură coloană (în timp ce coloana rămasă rămâne neafectată de filtru).

acest DAX vine la îndemână în cazul în care fiecare coloană utilizată în tabel poate avea propriul filtru. Să luăm un exemplu pentru a înțelege cum funcționează acest lucru.

dorim să calculăm suma vânzărilor pe regiuni. Deci, mai întâi, funcția de filtrare împarte coloana regiunii în nord, sud, est și vest. Apoi, calculează suma vânzărilor în funcție de segregare. Folosim o măsură aici, deoarece o anumită regiune poate avea orice număr de rânduri implicate în ea.

aici, declarăm o variabilă reg care acționează ca o cheie pentru filtru. Putem declara o variabilă folosind cuvântul cheie VAR. Cuvântul cheie de returnare Ne oferă rezultatul calculului (suma vânzărilor, în exemplul nostru). Rezultatul pe care îl obținem de la Dax calculat este:

imbricate dacă condiție

luați în considerare tabelul Comenzi în setul nostru de date. Coloana ‘prioritate comandă’ are cinci valori sub ea. Să presupunem că avem nevoie de niște valori întregi în loc de valorile originale prezente în acea coloană. Imbricate dacă declarația este prietenul nostru aici:

Nested IF = IF(Orders ="Critical", 5, IF(Orders ="High", 4, IF(Orders = "Medium", 3, IF(Orders = "Low", 2, IF(Orders = "Not Specified", 1)))))

formatarea condiționată

formatarea condiționată este una dintre cele mai frecvent utilizate caracteristici ale Microsoft Excel. Și putem folosi și asta în interiorul Power BI!

formatarea condiționată, pentru cei care nu au folosit-o înainte, este posibilitatea de a schimba culoarea fontului unei coloane pe baza unei condiții dintr-o altă coloană. Acest lucru se poate face prin crearea unei coloane noi conform condiției noastre și apoi folosind acea coloană pentru a seta reguli în fila Formatare condiționată.

să încercăm acest lucru cu un exemplu din setul nostru de date eșantion Superstore.

dorim să schimbăm culoarea valorilor afișate în coloana ‘prioritate comandă’ din tabelul Comenzi. De exemplu, toate valorile’ critice ‘ar trebui să fie de culoare roșie, toate valorile’ ridicate ‘ ar trebui să fie de culoare verde, etc.

putem folosi coloana imbricată IF pe care am creat-o mai sus, deoarece condițiile sunt deja specificate. Setați reguli în fila Formatare condiționată – dacă valoarea coloanei create mai sus este 1, atunci culoarea fontului ar trebui să fie roșie dacă valoarea este 2, atunci ar trebui să fie portocalie și așa mai departe.

Iată o imagine pentru a arăta cum o puteți face în Power BI:

împărțirea unui șir bazat pe delimitatori

o altă funcție comună Excel pe care o putem folosi în Power BI:

customer_split_1 = PATHITEM(SUBSTITUTE(Orders," ","|"),1)

funcția PATHITEM de mai sus returnează șirul rezultat. Funcția de substituție înlocuiește delimitatorul specificat cu un anumit caracter și preia cuvântul corespunzător pe baza valorii menționate.

de exemplu, să efectuăm o împărțire în câmpul ‘Nume client’. Aici, spațiul „” va fi delimitatorul și l-am înlocuit cu o conductă „|”. Avem nevoie doar de prenumele unui client, așa că am specificat 1. Puteți modifica această valoare și puteți vedea ce rezultate obțineți.

acum să efectuăm trei împărțiri ca aceasta și să le numim ca customer_split_1, customer_split_2, customer_split_3 respectiv.

preluarea unei anumite litere dintr-un cuvânt

ce se întâmplă dacă am vrea să extragem doar o anumită literă dintr-un cuvânt? Sună complicat, dar este de fapt destul de ușor în Power BI:

customer_initial_1 = LEFT(Orders,1)

am făcut-o într-o singură linie de cod!

să presupunem că numele unui anumit client este „Helen Stein”, iar împărțirea este împărțită în două părți. Folosim DAX-ul de mai sus pentru a obține prima literă din primul cuvânt divizat (Helen). Funcția din stânga returnează numărul de caractere prin poziționarea la începutul șirului. Dacă dăm 2 în loc de 1, DAX-ul de mai sus va returna „el” în loc de „H”.

concatenarea șirurilor

ne aflăm adesea în situații în care trebuie să combinăm două cuvinte împreună. Pentru a vedea cum funcționează acest lucru în Power BI, să presupunem că avem mai multe inițiale în datele noastre.

trebuie să specificăm doar inițialele clientului în vizualizare, mai degrabă decât numele lor întreg. Acest lucru va ajuta la menținerea mesei îngrijite și compacte:

customer_initials = CONCATENATE(Orders,CONCATENATE(Orders,Orders))

funcția de concatenare unește șirurile împreună. Aici, am efectuat o concatenare a trei coloane:

WEEKDAY()

funcția WEEKDAY returnează un număr întreg care ne dă ziua curentă. Să ne dăm seama în ziua în care au fost expediate câteva comenzi:

weekday = WEEKDAY(Orders,2)

numărul întreg afișat mai sus specifică ziua de început:

  • 1 – Începeți de duminică = 1 și se termină sâmbătă = 7
  • 2 – Începeți de luni = 1 și se termină duminică = 7
  • 3 – Începeți de luni = 0 și se termină duminică = 6

Data împărțirii

există momente când trebuie să ne-pivotăm data pentru anumite proiecte. Iată vestea bună-putem face acest lucru cu ajutorul DAX și a editorului de interogări Din Power BI.

acum, avem două coloane – data comenzii și data expedierii. Vrem să ștergem datele situate între cele două intervale. Să luăm data comenzii ca 01-01-2015 și data de expediere ca 03-01-2015. Deoarece există o diferență de 3 zile între ele, acest rând va fi listat de trei ori.

putem face acest lucru prin editorul de interogări Din Power BI. Selectați opțiunea ‘coloană personalizată’ din fila ‘Adăugare coloană’. Fereastra de mai jos apare și putem adăuga un nume de coloană și de a folosi interogarea DAX:

apoi, găsiți coloana dată în setul nostru de date. Faceți clic pe caseta mică din antetul coloanei DATE și selectați opțiunea ‘extindeți la rânduri noi’:

observați cum apar valorile sub formă de numere întregi? Acum, faceți clic dreapta pe coloană și schimbați tipul de date în format ‘data’ :

agregări complexe bazate pe data

lucrul cu datele date este o provocare destul de complicată. Există mult mai mult decât împărțirea diferitelor zile, luni etc.

în această secțiune, vom lucra la un exemplu de agregare complexă bazată pe date. De exemplu, care este numărul total de ore enumerate pentru următoarele 2 săptămâni sau ultimele 2 săptămâni?

vom schimba setul de date pentru această secțiune. Puteți descărca noul set de date, numit ‘Weekcal’, din Forecast. Acest set de date este modelat pe alocarea timpului echipei și un instrument de planificare numit Float. Float ne ajută să atribuim sarcini și să calculăm orele estimate pentru membrii echipei.

există un avertisment în Float ar trebui să fie conștienți de. O săptămână începe întotdeauna de luni în instrumentul Float. De exemplu, dacă doriți să calculați orele atribuite pentru săptămâna viitoare începând de joi, veți găsi ore alocate de la cea mai recentă luni până vineri și nu de joi până joi viitoare.

acum, setul de date conține caracteristicile de mai jos:

  • ziua de începere – ziua de începere a sarcinii
  • Data de încheiere – ziua de încheiere a sarcinii
  • ore/zi – Numărul de ore petrecute pe sarcină pe zi
  • numele sarcinii

să presupunem că suntem interesați să găsim numărul de ore alocate pentru săptămâna viitoare. Putem face acest lucru folosind logica de mai jos:

FORECAST_1 WEEK = if (Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,Forecast1,DAY)+1 * Forecast1,IF(Forecast1 > TODAY()-(WEEKDAY(TODAY(),2)-1) ,0,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)+7 && Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1),DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),Forecast1,DAY)* Forecast1,IF(Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1) && Forecast1 >=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(Forecast1,TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY)* Forecast1,IF(Forecast1<=TODAY()-(WEEKDAY(TODAY(),2)-1)&& Forecast1>=TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DATEDIFF(TODAY()-(WEEKDAY(TODAY(),2)-1),TODAY()-(WEEKDAY(TODAY(),2)-1)+7,DAY) * Forecast1,BLANK())))))
  • TODAY() – (WEEKDAY(TODAY(), 2) – 1 Funcția returnează curent luni a săptămânii
  • funcția DATEDIFF returnează diferența dintre două date

Check out tabelul de mai jos pentru a vedea orele estimate pentru fiecare sarcină pentru săptămâna următoare:

note finale

Power BI este un instrument puternic și ușor de utilizat pentru a crea tablouri de bord rapide cu o varietate de surse de date. Interogările DAX sunt utilizate pentru a mapa datele, pentru a crea noi variabile și valori de afaceri și pentru a manipula datele. Acest articol oferă un ghid scurt și rapid pentru a începe călătoria DAX.

de asemenea, ar trebui să consultați tutorialele oficiale Microsoft pentru Power BI – o resursă excelentă!

sperăm că ați găsit acest articol util. Așteptăm cu nerăbdare să auzim feedback-ul și comentariile dvs. Dashboarding fericit, sau ar trebui să spunem fericit Daxing!

despre autori

Kirthi Tej Yendloori

Kirthi Tej este analist de date la Indium software. Are un an de experiență în vizualizarea datelor și este extrem de interesat de învățarea automată. Îi place să călătorească.

You might also like

Lasă un răspuns

Adresa ta de email nu va fi publicată.