February 12, 2021
Zaganjanje zunanjih R skript v Power BI
V članku je uporabljen Power BI Desktop verzije 2.76.5678.782 (December 2019).
Pisanje R skript v Power BI je lahko hitro oteženo, saj nam vmesnik ne ponuja izpisa ali vpogleda v vrednost spremenljivk. Enega od načinov, da si delo olajšamo, smo si že ogledali v članku R v Power BI – Debugiranje. Običajno pa skripte pišemo in urejamo v RStudio in jih nato uvozimo v Power BI.
Kako? Delujočo skripto shranimo kot R datoteko in jo v Power BI uvozimo s funkcijo source(). Oglejmo si preprost primer.
Primer: opisna statistika vseh stolpcev v tabeli
Imamo tabelo v Power Query.
Želimo statistični opis obeh stolpcev, ki ga dobimo v R dobimo s funkcijo summary(). Funkcija nam vrne aritmetično sredino, mediano, minimum in maksimum ter prvi in tretji kvartil.
Sledimo naslednjim korakom.
V RStudio odpremo novo R skripto.
V skripto vnesemo naslednje ukaze.
df = do.call(cbind, lapply(dataset, summary)) #summary function, but in dataframe form
df = cbind(rownames(df), data.frame(df, row.names=NULL)) #index to column
names(df)[names(df) == “rownames(df)”] <- “Statistics” #rename index column
Enostaven summary(dataset), ki bi vrnil tabelo, smo priredili na način, da vrne dataframe. Vedno moramo na koncu dobiti dataframe, saj je to edini objekt, ki ga bo Power BI prepoznal.
Skripto shranimo s poljubnim imenom, npr. R_Script.R, na poljubno lokacijo, npr. H:\PowerBI\Running_R_From_PowerBI.
V Power Query izberemo zgornjo tabelo in odpremo R urejevalnik z Run R script.
Vnesemo naslednji ukaz.
source(“H:\\ PowerBI\\Running_R_From_PowerBI\\R_Script.R”)
Pazimo, da v poti ni šumnikov.
Potrdimo z OK.
Dobili smo tabelo z opisno statistiko obeh stolpcev.
Vsakič, ko se bo izvirna tabela dataset osvežila, se bo izvedla tudi R skripta. Če bodo v tabelo dodane nove vrednosti, se bodo tudi vrednosti statistik spremenile.