Contact us

Pošlji
povpraševanje

Zakladnica znanja

  • Predzanje

  • Kategorije

December 18, 2020

R v Power BI – uvod in primeri

Avtor: Branka Trifunović

V članku je uporabljen Power BI Desktop verzije 2.76.5678.782 (December 2019).

R je programski jezik, namenjen statistični obdelavi podatkov. Je odprtokoden in ima na voljo več kot 15 000 paketov, namenjenih specifičnim področjem. Poleg zmogljivih statističnih paketov je dobro podprt tudi v vizualizaciji. Power BI podpira R, kar nam daje neomejene možnosti manipulacije in vizualizacije podatkov.

Za delovanje R moramo imeti nameščen RStudio, ki je na voljo brezplačno. R je v Power BI Desktop na voljo na dveh mestih: znotraj poizvedb v Power Query in kot vizualizacija v Power BI.

R v Power Query

R lahko uporabimo znotraj poizvedbe. Vhodni podatek in izhodni podatek R vtičnika bo vedno dataframe. Oglejmo si enostaven primer.

Primer

Imamo preprosto tabelo.

Tabeli želimo dodati stolpec C, ki bo vsota stolpec A in B. Sledimo naslednjim korakom.

Izberemo Transform > Run R script.

Odpre se nam urejevalnik za R skripto. Komentar v prvi vrstici nam pove, da je vhodna tabela shranjena v spremenljivki z imenom dataset.

V urejevalnik vnesemo naslednje ukaze.

newname = dataset

newname[‘C’] = newname[‘A’] + newname[‘B’]

Prva vrstica je namenjena le temu, da ustvarimo kopijo tabele dataset z imenom newname. Izvirne tabele dataset ne moremo spreminjati, zato vedno delamo samo s kopijo.

Druga vrstica tabeli newname doda stolpec C, ki je vsota stolpcev A in B.

Potrdimo z OK. Dobimo seznam vseh tabel, ki smo jih ustvarili. V našem primeru je to le ena tabela, newname.

Kliknemo na povezavo Table. Odpre se nam nova tabela newname.

R v Power BI

R lahko uporabimo tudi za vizualizacijo podatkov znotraj poročila v Power BI. To je velika prednost, saj je R močno podprt z grafičnimi paketi in nam omogoča izdelavo grafikonov povsem po naši meri.

Primer

Oglejmo si preprost primer. Imamo tabelo časovne krivulje tečaja, ki jo želimo vizualizirati. V tabeli se nahajajo še drugi tečaji (AUS, EUR, USD, …), vendar bomo v tem primeru narisali zgolj graf za tečaj GBR.

Sledimo naslednjim korakom.

V poročilu odpremo vizualizacijo R.

Odpre se nam urejevalnik za R skripto.

V delu Fields odkljukamo stolpce, ki jih želimo narisati. Naša tabela ima veliko stolpcev, narisati pa želimo le Year in GBR.

V skriptni urejevalnik se zdaj izpišejo naslednji komentarji.

Komentar nam pove, da se v spremenljivki z imenom dataset zdaj nahaja dataframe, ki je sestavljen iz izbranih stolpcev Year in GBR. Samodejno so bili tudi že odstranjeni duplikati vrstic.

V skriptno okno zdaj vnesemo naslednji ukaz.

plot(dataset$Year, dataset$GBR,

main = “GBR curency”,

xlab = “Year”,

ylab = “GBR”,

type = “l”,

col = “blue”)

V ukaz plot smo podali:

  • x os, v našem primeru stolpec Year iz dataframe-a dataset
  • y os, v našem primeru stolpec GBR iz dataframe-a dataset
  • Naslov, v našem primeru »GBR currency«
  • Ime x osi, v našem primeru »Year«
  • Ime y osi, v našem primeru »GBR«
  • Tip krivulje, v našem primeru »l«, ki označuje line oz. črto
  • Barvo, v našem primeru »blue« oz. modro

Kliknemo ikono Run Script.

Dobimo želeni graf.

Kazalo