O Rku jsem slyšel již před lety a lákalo mně začít používat vychytané balíčky na různé výpočty. R se hodí na jakákoliv data, od SEO, GA, PPC, finance. Na různé věci má konektory a předpřipravená řešení. Měl jsem představu, že když půjdu na školení od Přemka Horáčka z Média – Taste, tak budu schopen tyto balíčky používat. A stalo se.
Školení je určeno pro úplné začátečníky. Měl jsem malou výhodu, že jsem si na Udemy prolétnul základy R. Více by mi pomohlo, kdybych uměl programovat, ale i bez toho jsem se chytal.
Obsahem bylo zejména zpracování a očištění dat. Konkrétně jsme řešili: Orientace, Objekty, práce s daty, grafické zobrazení, regrese, IF a WHILE loopy, RFM analýzu. Pracovali jsme v R Studio, které je použitelnější než samotný program R.
Vytvářeli jsme tabulky (matrix) a data v nich různě měnili. Vzájemně je sčítali, odčítali, mazali, hledali konkrétní data. Například na základě hodnoty obratu jsme si označili VIP zákazníky a ty pak exportovali do csv:
zakaznici$VIP[obrat$hp > 10000] <- 1
Nejzajímavější pro mně byla funkce regrese. Díky ní je možné hledat závislosti mezi různými proměnnými. Na jedné straně modelu stojí to co nás zajímá, například tržby. A na druhé straně sestavíme model: seznam proměnných, které by tržby mohly ovlivnit. Například počet objednávek, který udělal zákazník dosud + jeho věk + pohlaví.
Můžeme porovnat, jaký má vliv na obrat (revenue), když je zákazník z Prahy, je-li muž a zda přišel z Google, Seznamu či Facebooku. R to schroustá a najde závislosti. Čím více hvězdiček, tím větší závislost.
Umím si představit, že použiji funkci mnoha dalšími způsoby na dalších datech – související zboží, navazující kategorie produktů.
Výhodou Rka jsou předpřipravená řešení, které lze využívat. Zde je například série příkazů pro instalaci balíčku v RFM
Seznam základních zdrojů o R najdete u Pavla Jaška. A nebo pokud zvažujete používání Rka, tak se jděte nachytřit k Přemkovi, jako já s Lukášem a Pavlem.