R bemutató - Kezdő útmutató az R programozás elsajátításához

Ez a blog az R bemutatón bemutatja az R eszközt, és példákkal segít megérteni az R programozás alapjait.

Az R a legnépszerűbb adatelemző eszköz, mivel nyílt forráskódú, rugalmas, több csomagot kínál és hatalmas közösséggel rendelkezik. Szoftver-programozóknak, statisztikusoknak és adatbányászoknak egyaránt készült, így népszerűvé vált .Ebben az R bemutató blogban teljes betekintést nyújtok az R-be példákkal.



Az alábbiakban bemutatom ezen R bemutató blog témaköreit, amelyeket a következő sorrendben fogok megvitatni:



  1. Miért van szükségünk Analyticsre ?
  2. Mi az üzleti elemzés ?
  3. Miért R és ki használja az R-t ?
  4. R telepítése
  5. Adatkezelők
  6. Adattípusok
  7. Flow Control

R oktatóanyag: Miért van szükségünk elemzésre?

Mielőtt válaszolnék a kérdésre, hadd tájékoztassak néhány problémát és azok megoldásait az R-ben több területen.



banki szolgáltatások - R bemutató - Edureka

Bankolás :

Mindennap nagy mennyiségű ügyféladatot generálnak a bankok. WMivel több millió ügyféllel foglalkoznak rendszeresen, nehéz lesz nyomon követni jelzálogkölcsönüket.



Megoldás :

R egy egyedi modellt épít, amely fenntartja az egyes ügyfeleknek nyújtott kölcsönöket, ami segít abban, hogy eldöntsük az ügyfél által fizetendő összeget idővel.

Biztosítás :

A biztosítás nagymértékben függ az előrejelzéstől. Nehézdöntse el, melyik politikát fogadja el vagy utasítja el.

Megoldás:

hogyan kell használni az sqlite böngészőt

A folyamatos hiteljelentés bemenetként felhasználva létrehozhatunk egy olyan modellt R-ben, amely nemcsak a kockázatvállalási hajlandóságot értékeli, hanem prediktív előrejelzést is készít.

Egészségügy:

Évente emberek milliói kerülnek kórházba, és évente milliárdokat költenek csak a felvételi folyamatba.

Megoldás :

Tekintettel a beteg előzményeire és kórtörténetére, egy prediktív modell felépíthető annak megállapítására, hogy kit fenyeget a kórházi kezelés kockázata és milyen mértékben kell méretezni az orvosi felszerelést.

Most már tudjuk, hogy az adatelemzés hogyan segíti a szervezeteket az adataik hasznosításában és felhasználásában az új lehetőségek azonosítására. Ha az elemzés szükségességéről beszélünk egy szervezetben, akkor a következő négy szempontra kell bukkannia:

Ezután lépjünk előre az R tutorial blogban, ahol először megértjük, mi is pontosan az üzleti elemzés.

R oktatóanyag: Mi az üzleti elemzés?

Az üzleti elemzés egy olyan folyamat, amelynek során nagy adatsorokat vizsgálnak, és rejtett mintákat, összefüggéseket és más meglátásokat érnek el. Alapvetően segít megérteni az összes összegyűjtött adatot, legyen szó szervezeti adatokról, piaci vagy termékkutatási adatokról vagy bármilyen más adatokról. Könnyen meghozhat jobb döntéseket, jobb termékeket, jobb marketing stratégiákat stb. A jobb megértés érdekében olvassa el az alábbi képet:

Ha megnézi a fenti ábrát, akkor az első képen lévő adatai szétszóródnak. Most, ha valami konkrétat szeretne, például egy adott rekordot az adatbázisba, az nehézkessé válik. Ennek egyszerűsítéséhez elemzésre van szükség. Az elemzéssel könnyen megkereshető az adatok közötti korreláció. Miután megállapította, mit kell tennie, meglehetősen egyszerűvé válik olyan döntések meghozatala, mint például: melyik utat kívánja követni, vagy az üzleti elemzések szempontjából, melyik út vezet a szervezet javításához.

De nem várhatja el, hogy a fenti láncban lévő emberek mindig megértsék azokat a nyers adatokat, amelyeket az elemzés után szolgáltat nekik. Tehát ennek a résnek a leküzdésére van egy koncepciónk adatmegjelenítés .

Adatok vizualizálása : Az adatmegjelenítés vizuális hozzáférés hatalmas mennyiségű adathoz, amelyet az elemzés után generált. Az emberi elme a vizuális képeket dolgozza fel, és a vizuális grafika jobb, mint a nyers adatokkal összehasonlítva. Számunkra mindig könnyű megérteni egy kördiagramot vagy egy oszlopdiagramot, összehasonlítva a nyers számokkal. Most arra lehet kíváncsi, hogyan érheti el ezt az adatmegjelenítést a már elemzett adatokból?
Különböző eszközök állnak rendelkezésre az adatmegjelenítés piacán:

Mindannyian kíváncsi arra, hogy már olyan sok eszköz van, amely segít elérni az adatok megjelenítését és bizonyos mennyiségű elemzést, miért érdemes az R-hez menni?

Tehát a következő témám az R bemutató blogban a „miért R” és a „ki használja az R-t” címmel foglalkozik.

R oktatóanyag: Miért R és ki használja az R-t?

Miért R?

R programozási és statisztikai nyelv.

R az adatok elemzésére és megjelenítésére szolgál.

R egyszerű és könnyen megtanulható, olvasható és írható.

Az R egy példa egy FLOSS-ra (Free Libre és Open Source Software), ahol szabadon terjesztheti a szoftver másolatait, elolvashatja a forráskódot, módosíthatja stb.

Ki használja az R-t?

  • A Fogyasztói Pénzügyi Védelmi Iroda R-t használ az adatok elemzéséhez
  • A John Deere statisztikusai megbízható és reprodukálható módon alkalmazzák az R-t az idősor-modellezéshez és a térinformatikai elemzéshez.
  • A Bank of America az R-t használja jelentésre.
  • Az R a Foursquare híres ajánlómotorja mögött álló technológiai verem része.
  • Az ANZ, Ausztrália negyedik legnagyobb bankja, az R felhasználásával a hitelkockázat elemzéséhez.
  • A Google az R segítségével megjósolja a gazdasági tevékenységet.
  • A Mozilla, a Firefox böngészőért felelős alapítvány az R használatával vizualizálja a webes tevékenységeket.

Az alábbiakban bemutatunk néhány domént, ahol R-t használunk:

Most lépjünk előre az R bemutató blogban, és telepítsük az R-t.

R oktatóanyag: Az R telepítése

Hadd vezessem végig az R telepítésének folyamatát. Csak kövesse az alábbi lépéseket:

1. lépés : Menjen a linkre: https://cran.r-project.org/

2. lépés : Töltse le és telepítse az R 3.3.3-at a rendszerére.

A jobb megértés érdekében olvassa el az alábbi képernyőképet.

A fenti lépések végrehajtásával elkészült az R telepítési rész. Most közvetlenül elkezdheti a kódolást az R-ben az RStudio IDE letöltésével. Ennek letöltéséhez kövesse az alábbi lépéseket:

1. lépés : Menjen a linkre: https://www.rstudio.com/

2. lépés : Töltse le és telepítse az Rstudio-t a rendszerére.

Miután mindent telepített, máris készen áll a kódolásra!

R bemutató kezdőknek | R programozási bemutató | Edureka

Ezután lépjünk előre az R Tutorial blogban, és értsük meg, mi az R adatkezelője

R Oktatóanyag: Adatkezelők R-ben

Főleg 5 különböző típusú operátor létezik, amelyeket az alábbiakban sorolunk fel:

  1. Számtani operátorok : Számtani műveletek, például összeadás, kivonás, szorzás, osztás stb.
  2. Feladatkezelők :A hozzárendelés operátorokat használják az értékek hozzárendeléséhez. Például:
  • Feladatkezelő =
    Szintaxis:
    változó neve = érték
> x = 5 >x 
Kimenet: [1] 5
  • Feladatkezelő<-
    Szintaxis:
    változó neve<- value

    > x<- 15 > x
    Kimenet: [1] 15
  • Feladatkezelő<<-
    Szintaxis:
    változó neve<<- value
> x<<- 2 > x
Kimenet: [1] 2
  • Feladatkezelő ->
    Szintaxis:
    érték -> változó neve

    > 25 -> x > x 
    Kimenet: [1] 25

3. Relációs operátor : Két entitás közötti kapcsolatot határoz meg. Például: ,<=,!= etc.

> xx! = 2
Kimenet:[1] IGAZ

4. Logikai operátorok : Ezek az operátorok összehasonlítják a két entitást, és jellemzően logikai (logikai) értékekkel, például &, | és!

> x2 és 3
Kimenet:[1] IGAZ

5. Speciális operátorok : Ezeket az operátorokat speciális célokra használják, nem logikai számításra. Például:

  • Létrehozza a számok sorozatát egy vektor számára.

    > xx
    Kimenet: [1] 2 3 4 5 6 7 8
  • % in% Ez az operátor arra szolgál, hogy azonosítsa, ha egy elem tartozik egy vektorhoz.
    Példa

    > xyy%% x-ban
    Kimenet: [1] IGAZ

R Oktatóanyag: Adattípusok

Az adattípusokat az információk tárolására használják. R-ben nem kell egy változót valamilyen adattípusként deklarálnunk. A változókat az R-Objects hozzárendeli, és az R-objektum adattípusa válik a változó adattípusává.Elsősorban hat adattípus van jelen az R-ben:

Nézzük részletesebben mindegyiket:

Vektor : A vektor ugyanazon alaptípusú adatelemek sorozata. Példa:

vtr = (1, 3, 5, 7 9)

vagy

vtr<- (1, 3, 5 ,7 9)

5 atomvektor létezik, amelyeket vektorok öt osztályának is neveznek.

Lista : A listák azok az R objektumok, amelyek különböző típusú elemeket tartalmaznak, például & mínusz számokat, húrokat, vektorokat és egy másik listát benne.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = lista (n, s, IGAZ) > x

Kimenet -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' bb '' cc '' dd '' ee '[[3]] [1] IGAZ

Tömbök : A tömbök az R adatobjektumok, amelyek kétnél több dimenzióban tárolhatnak adatokat. A vektorokat bemenetnek veszi, és a dim paraméterben lévő értékeket tömb létrehozásához használja.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) eredmény<- array(c(vector1,vector2),dim = c(3,3,2))

Kimenet -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Tömbök : A mátrixok azok az R objektumok, amelyekben az elemek kétdimenziós téglalap alakú elrendezésben vannak elrendezve. A Matrix () mátrix () függvény segítségével jön létre. Példa: mátrix (adatok, nrow, ncol, byrow, dimnames) hol,

adat az a bemeneti vektor, amely a mátrix adatelemeivé válik.

most a létrehozandó sorok száma.

ncol a létrehozandó oszlopok száma.

byrow logikus nyom. Ha IGAZ, akkor a bemeneti vektor elemek sorok szerint vannak rendezve.

homályos név a sorokhoz és oszlopokhoz rendelt nevek.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Kimenet :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Tényezők : A tényezők azok az adatobjektumok, amelyekkel az adatokat besorolják és szintként tárolják. Húrokat és egész számokat is tárolhatnak. Hasznosak az adatok elemzésében a statisztikai modellezéshez.

> adatok<- c('East','West','East','North','North','East','West','West“,'East“) > faktor_adatok<- factor(data) > faktor_adatok

Kimenet :

[1] Kelet-nyugat-kelet észak-észak-kelet nyugat-nyugat-kelet Szintek: Kelet északnyugat

Adatkeretek : Az adatkeret egy táblázat vagy egy kétdimenziós tömbszerű szerkezet, amelyben minden oszlop egy változó értékeit tartalmazza, és minden sor minden oszlop egy értékkészletét tartalmazza.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > jelölések = c (623,3 515,2 611,0 729,0 843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Kimenet :

std_id std_name jelek 1 1 Rick 623.30 2 2 és 515,20 3 3 Michelle 611.00 4 4 Ryan 729,00 5 5 Gary 843,25

Ezzel a különböző adattípusok végére érünk az R-ben. Ezután lépjünk előre az R Tutorial blogban, és értsük meg egy másik kulcsfontosságú fogalmat - a flow control utasításokat.

R oktatóanyag: Áramlásszabályozási nyilatkozatok

Az áramlásvezérlő utasítások nagyon fontos szerepet játszanak, mivel lehetővé teszik a függvényen belüli parancsfájl végrehajtásának folyamatának szabályozását. A leggyakrabban használt áramlásszabályozási utasításokat az alábbi kép mutatja:

Most beszéljük meg példáikkal mindegyiket.

R oktatóanyag: Kiválasztó nyilatkozatai

  • Ha ellenőrzési nyilatkozat : Ez az ellenőrzési utasítás egyetlen feltételt értékel. Ez meglehetősen egyszerű, mivel csak egyetlen „if” kulcsszóval rendelkezik, amelyet a feltétel követ, majd bizonyos állítások, amelyeket végre kell hajtani, ha igaz. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

Ebben a folyamatábra a kód a következő módon reagál:

  1. Először belép a ciklusba, ahol ellenőrzi az állapotot.
  2. Ha a feltétel igaz, akkor a feltételes kód vagy az írt utasítások végrehajtásra kerülnek.
  3. Ha a feltétel hamis, a kijelentéseket figyelmen kívül hagyják.

Az alábbiakban bemutatunk egy példát ha vezérlő utasítás az R-ben. Próbálja meg futtatni ezt a példát az R Studio-ban.

x = 2 ismételje meg {x = x ^ 2 print (x) if (x> 100) {break}

Kimenet :

[1] 4 [1] 16 [1] 256
  • Ha más ellenőrzési nyilatkozat :Vizsgas az ellenőrzési utasítás típusaértékeli a feltételek egy csoportját és kiválasztja az állításokat. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

Ebben a folyamatábra a kód a következő módon reagál:

  1. Először belép a ciklusba, ahol ellenőrzi az állapotot.
  2. Ha a feltétel igaz, akkor az első „ha” utasítás végrehajtásra kerül.
  3. Ha a feltétel hamis, akkor az ‘else if’ feltételre megy, és ha igaz, akkor az ’else if’ kód kerül végrehajtásra.
  4. Végül, ha az „else if” kód is hamis, akkor az „else” kódra megy, és végrehajtásra kerül. Ez azt jelenti, hogy ha ezen feltételek egyike sem igaz, akkor az „else” utasítás végrehajtásra kerül.

Az alábbiakban bemutatunk egy példát ha más vezérlő utasítás az R-ben. Próbálja meg futtatni ezt a példát az R Studio-ban.

x5) {print ('x nagyobb, mint 5')} elseif (x == 5) {print ('x egyenlő 5')} else {print ('x nem nagyobb, mint 5')}

Kimenet:

[1] 'x egyenlő 5'-vel
  • Váltson állításokat : Ezeket a vezérlő utasításokat alapvetően arra használják, hogy egy bizonyos kifejezést összehasonlítsanak egy ismert értékkel. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

Ebben a Váltási eset folyamatábra a kód a következő lépésekben válaszol:

  1. Először beírja a kapcsolót, amelynek van kifejezése.
  2. Ezután az 1. eset feltételére megy, ellenőrzi a feltételnek átadott értéket. Ha igaz, akkor a Statement blokk végrehajtásra kerül. Ezt követően elszakad ettől a kapcsolótól.
  3. Ha hamis, akkor a következő esetre vált. Ha a 2. eset feltétele igaz, akkor végrehajtja az állítást és elszakad ettől az esettől, különben ismét a következő esetre ugrik.
  4. Tegyük fel, hogy nem adott meg egyetlen esetet sem, vagy valami hibás bemenet érkezett a felhasználó részéről, akkor az az alapértelmezett esetre kerül, ahol kinyomtatja az alapértelmezett utasítást.

Az alábbiakban bemutatunk egy példát az R kapcsoló utasítására. Próbálja meg futtatni ezt a példát az R Studio-ban.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Kimenet :

[1] 275

R oktatóanyag: Loop utasítások

A hurkok segítenek megismételni bizonyos műveleteket, hogy ne kelljen azokat ismételten végrehajtani. Képzelje el, hogy 10-szer kell végrehajtania egy műveletet, ha minden egyes alkalommal elkezdi írni a kódot, a program hossza megnő, és később nehezen fogja megérteni. De ugyanakkor egy ciklus használatával, ha ugyanazt az utasítást egy hurok belsejébe írom, ez időt takarít meg és megkönnyíti a kód olvashatóságát. A kód hatékonysága szempontjából is optimalizáltabbá válik.

A fenti képen: ismétlés' és „ míg „Az állítások segítenek egy bizonyos szabályrendszer végrehajtásában, amíg a feltétel igaz, for ’ egy ciklus utasítás, amelyet akkor használnak, ha tudja, hányszor szeretné megismételni az utasítás blokkját. Most, ha tudja, hogy 10-szer meg akarja ismételni, akkor a „for” utasítással megy, de ha nem biztos abban, hogy hányszor szeretné megismételni a kódot, akkor az „ismétlés” vagy 'míg' hurok.

Beszéljük meg mindegyiket példákkal.

  • Ismétlés : Az ismétlődő ciklus segít újra és újra végrehajtani ugyanazt a kódkészletet, amíg egy leállási feltétel nem teljesül. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

A fenti folyamatábra szerint a kód a következő lépésekkel válaszol:

  1. Először beír és végrehajt egy kódkészletet.
  2. Ezután ellenőrzi a feltételt, ha igaz, akkor visszamegy, és újra végrehajtja ugyanazt a kódkészletet, amíg hamisnak nem számít.
  3. Ha hamisnak találják, akkor közvetlenül kilép a ciklusból.
  • Míg : A while utasítás segít ugyanazt a kódkészletet újra és újra végrehajtani, amíg a stop feltétel nem teljesül. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

A fenti folyamatábra szerint a kód a következő lépésekkel válaszol:

  1. Először ellenőrzi az állapotot.
  2. Ha kiderül, hogy igaz, akkor végrehajtja a kódkészletet.
  3. Ezután újra ellenőrzi a feltételt, ha igaz, akkor újra végrehajtja ugyanazt a kódot. Amint a feltétel hamisnak bizonyul, azonnal kilép a ciklusból.

Az alábbiakban egy példa a while állításra az R-ben. Próbálja meg futtatni ezt a példát az R Studio-ban.

x = 2, míg (x<1000) { x=x^2 print(x) } 

Kimenet:

4 16 256 65 536

Tehát biztosan kíváncsi vagy arra, hogy miben különbözik ez a két állítás? Engedje tisztázni a kételyét!
Itt a fő különbség az ismétlődő és míg állítás között az, hogy változik az Ön állapotához képest. Míg A ciklus alapvetően meghatározza, hogy mikor fog belépni a ciklusba az utasítások végrehajtásához ismétlés A ciklus meghatározza, hogy mikor hagyja el a ciklust az utasítások végrehajtása után. Tehát ezt a két állítást nevezzük beléptető és kilépés vezérlő hurokként. Így különböznek a míg az ismétlődő állítások.

  • Hurok esetén: A hurkok ugyanis akkor használatosak, amikor többször kell végrehajtania egy kódblokkot. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

A fenti folyamatábra szerint a kód a következő lépésekkel válaszol:

  1. Először is van egy inicializálás, ahol megadhatja, hogy hányszor ismételje meg a ciklust.
  2. Ezután ellenőrzi az állapotot. Ha a feltétel igaz, akkor a megadott számú alkalommal végrehajtja a kódkészletet.
  3. Amint a feltétel hamisnak bizonyul, azonnal kilép a ciklusból.

Az alábbiakban bemutatunk egy példát az R állításra. Próbálja meg futtatni ezt a példát az R Studio-ban.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Kimenet :

7 19 25 65 45

Ezután térjünk át az R Tutorial blog utolsó állításcsoportjára, vagyis ugrásnyilatkozatokra.

R oktatóanyag: Ugrásnyilatkozatok

Break Statement : A Break utasítások segítenek a program leállításában, és folytatják a vezérlést a ciklust követő következő utasítással. Ezeket az állításokat switch esetben is használják. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

A fenti folyamatábra szerint a kód a következő lépésekkel válaszol:

  1. Először belép a ciklusba, ahol ellenőrzi az állapotot.
  2. Ha a ciklus feltétele hamis, akkor közvetlenül kilép a ciklusból.
  3. Ha a feltétel igaz, akkor ellenőrzi a szünet állapotát.
  4. Ha a feltörési feltétel igaz, akkor a ciklusból létezik.
  5. Ha a feltörési feltétel hamis, akkor végrehajtja a ciklusban maradt utasításokat, majd megismétli ugyanazokat a lépéseket.

Az alábbiakban bemutatunk egy példát az R. ugrási utasítására. Próbálja meg futtatni ezt a példát az R Studio-ban.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Kimenet:

[1] 1 [1] 2

Következő nyilatkozat : A következő utasítás akkor kerül felhasználásra, ha a hurok aktuális iterációját ki akarja hagyni anélkül, hogy abbahagyná. A következő állítás meglehetősen hasonlít a többi programozási nyelv „folytatásához”. A jobb megértés érdekében olvassa el az alábbi folyamatábra:

A fenti folyamatábra szerint a kód a következő lépésekkel válaszol:

  1. Először belép a ciklusba, ahol ellenőrzi az állapotot.

  2. Ha a ciklus feltétele hamis, akkor közvetlenül kilép a ciklusból.

  3. Ha a ciklusfeltétel igaz, akkor az 1. blokk utasításokat hajtja végre.

  4. Ezt követően ellenőrzi a „következő” állítást. Ha jelen van, akkor az azt követő utasítások nem kerülnek végrehajtásra a hurok ugyanazon iterációjában.

  5. Ha a „következő” utasítás nincs, akkor az összes utólagos utasítás végrehajtásra kerül.

Az alábbiakban bemutatunk egy példát az R következő állítására. Próbálja meg futtatni ezt a példát az R Studio-ban.

for (i in 1:15) {if ((i %% 2) == 0) {következő} print (i)}

Kimenet :

1 3 5 7 9 11 13 15

Ezzel vége az R bemutató blognak. Remélem, hogy önök tisztában vannak minden egyes koncepcióval, amelyet fentebb tárgyaltam. Maradj velünk, a következő blogom az R képzésen lesz, ahol az R-vel még néhány fogalmat részletesen elmagyarázokbőséges.

Most, hogy megértette az R alapjait, nézze meg a az Edureka, egy megbízható online tanulási vállalat, amelynek több mint 250 000 elégedett tanulóval rendelkező hálózata elterjedt az egész világon. Az Edureka Data Analytics with R képzése segít megszerezni a szakértelmet az R programozásban, az adatkezelésben, a feltáró adatelemzésben, az adatmegjelenítésben, az adatbányászatban, a regresszióban, a hangulatelemzésben és az R Studio felhasználásában a kiskereskedelem, a közösségi média valós életének esettanulmányaihoz.

Van egy kérdésünk? Kérjük, említse meg ennek az „R Tutorial” blognak a megjegyzés rovatában, és a lehető leghamarabb kapcsolatba lépünk Önnel.