December 18, 2020
R v Power BI – uvod in primeri
V članku je uporabljen Power BI Desktop verzije 2.76.5678.782 (December 2019).
R je programski jezik, namenjen statistični obdelavi podatkov. Je odprtokoden in ima na voljo več kot 15 000 paketov, namenjenih specifičnim področjem. Poleg zmogljivih statističnih paketov je dobro podprt tudi v vizualizaciji. Power BI podpira R, kar nam daje neomejene možnosti manipulacije in vizualizacije podatkov.
Za delovanje R moramo imeti nameščen RStudio, ki je na voljo brezplačno. R je v Power BI Desktop na voljo na dveh mestih: znotraj poizvedb v Power Query in kot vizualizacija v Power BI.
R v Power Query
R lahko uporabimo znotraj poizvedbe. Vhodni podatek in izhodni podatek R vtičnika bo vedno dataframe. Oglejmo si enostaven primer.
Primer
Imamo preprosto tabelo.
Tabeli želimo dodati stolpec C, ki bo vsota stolpec A in B. Sledimo naslednjim korakom.
Izberemo Transform > Run R script.
Odpre se nam urejevalnik za R skripto. Komentar v prvi vrstici nam pove, da je vhodna tabela shranjena v spremenljivki z imenom dataset.
V urejevalnik vnesemo naslednje ukaze.
newname = dataset
newname[‘C’] = newname[‘A’] + newname[‘B’]
Prva vrstica je namenjena le temu, da ustvarimo kopijo tabele dataset z imenom newname. Izvirne tabele dataset ne moremo spreminjati, zato vedno delamo samo s kopijo.
Druga vrstica tabeli newname doda stolpec C, ki je vsota stolpcev A in B.
Potrdimo z OK. Dobimo seznam vseh tabel, ki smo jih ustvarili. V našem primeru je to le ena tabela, newname.
Kliknemo na povezavo Table. Odpre se nam nova tabela newname.
R v Power BI
R lahko uporabimo tudi za vizualizacijo podatkov znotraj poročila v Power BI. To je velika prednost, saj je R močno podprt z grafičnimi paketi in nam omogoča izdelavo grafikonov povsem po naši meri.
Primer
Oglejmo si preprost primer. Imamo tabelo časovne krivulje tečaja, ki jo želimo vizualizirati. V tabeli se nahajajo še drugi tečaji (AUS, EUR, USD, …), vendar bomo v tem primeru narisali zgolj graf za tečaj GBR.
Sledimo naslednjim korakom.
V poročilu odpremo vizualizacijo R.
Odpre se nam urejevalnik za R skripto.
V delu Fields odkljukamo stolpce, ki jih želimo narisati. Naša tabela ima veliko stolpcev, narisati pa želimo le Year in GBR.
V skriptni urejevalnik se zdaj izpišejo naslednji komentarji.
Komentar nam pove, da se v spremenljivki z imenom dataset zdaj nahaja dataframe, ki je sestavljen iz izbranih stolpcev Year in GBR. Samodejno so bili tudi že odstranjeni duplikati vrstic.
V skriptno okno zdaj vnesemo naslednji ukaz.
plot(dataset$Year, dataset$GBR,
main = “GBR curency”,
xlab = “Year”,
ylab = “GBR”,
type = “l”,
col = “blue”)
V ukaz plot smo podali:
- x os, v našem primeru stolpec Year iz dataframe-a dataset
- y os, v našem primeru stolpec GBR iz dataframe-a dataset
- Naslov, v našem primeru »GBR currency«
- Ime x osi, v našem primeru »Year«
- Ime y osi, v našem primeru »GBR«
- Tip krivulje, v našem primeru »l«, ki označuje line oz. črto
- Barvo, v našem primeru »blue« oz. modro
Kliknemo ikono Run Script.
Dobimo želeni graf.