Download en Installatie

Om R te downloaden ga je naar de CRAN. Kies het Operating Systeem (Windows, OSX, Linux) en klik op download. Volg de instructies. Kies bij de installatie de aanbevolen instellingen. Het maakt niet uit of je computer op een 32x-bit of 64x-bit (86x) syteem draait, installeer ze allebei. Voor een uitgebreide uitleg zie deze tutorial op Youtube.

Kennismaking met R

R is op het eerste oog gebruiksonvriendelijk. Als je nog niet eerder gewerkt hebt vanuit een console dan is dat even wennen. Het is belangrijk je te realiseren dat R geen programma maar een programmeer-taal is. Er is niet 1 methode om een test uit te voeren, er zijn vaak verschillende methodes om dezelfde test uit te voeren en de keuze voor een bepaalde methode is een persoonlijke voorkeur. Daarom is het belangrijk om dit in het achterhoofd te houden: if it can be done, assume it has been done. Zoek altijd eerst op of iemand een package of een functie heeft geschreven specifiek voor jou situatie voordat je zelf ingewikkelde functies gaat schrijven.

R Vocabulair

  • Console: De window voor het executeren van de code in R.
  • Library: Een lijst van functies (Core en Packages) die R heeft ingeladen.
  • Workspace: Het actieve (korte termijn) werkgeheugen van R.
  • Scripts: De window voor het bewaren van de code in R.

  • Objects: Data wordt bewaard in objecten van verschillende types.
  • Vector: De belangrijkste object types.
  • Dataframe: De belangrijkste datatypes (verzameling van object types).

  • Functions: Instructies aan R om uit te voeren op een object.
  • Symbols: De naamgeving en syntax van objecten.
  • Attributes: De parameters die specificeren hoe R bepaalde functies op objecten toepast.

R Interface

De interface van R is minimalistisch. R werkt vanuit 2 schermen. De console en de script-window. Het voordeel is dat je geen zorgen hoeft te maken hoe de data bewerkt is, dit is exact terug te vinden in het script. In plaats van verschillende versies van een dataset werk je met verschillende scripts en 1 (ruw of clean) dataset.

Rstudio is een IDE (intergrated Device Interface). Dit is een apart te installeren programma dat R op de achtergrond draait. Dit is voor programmeren in R de beste interface.

Prefereer je te werken vanuit een GUI (Grafische User Interface) zoals SPSS dan zijn daar een aantal packages voor beschikbaar zoals RCommander (goed voor statistische toetsen), Deducer (goed voor data manipulatie) en Rattle (goed voor data mining en predictiemodellen).

R-GUI

De standaard GUI van R is het makkelijkst om mee te beginnen. Het is aanbevolen om eerst met R te leren werken alvorens gebruik te maken van een GUI of UDI.

Open een nieuw script Wijzig layout
install install
install install
Dit is het Script window. Dit is het Console window.

Instellingen

R werkt met Functies. Dit zijn instructies die de gebruiker aan R geeft en die R uitvoert. Hier volgen een aantal voorbeelden van functies om de instellingen van R op te roepen en te wijzigen.

Commentaar:

# het '#' teken wordt gebruikt voor "commentaar". R negeert instructies na het # teken

Working directory

De Working directory is de map op de computer waar R vanuit opereert. Als de installatie volgens de default instellingen is doorlopen is dit: “Mijn Documenten”. Klik hier voor een uitleg om de standaard Working directory te veranderen.

getwd()                                         # Wat is de huidige Working Directory?
setwd("C://")                                   # Selecteer een nieuwe Working Directory

Library

Met de library() functie wordt opgeroepen hoeveel packages ingeïnstalleerd zijn. Daarnaast wordt library() gebruikt om packages in de workspace te laden.

library()                                       # Roep de library op
library("packagenaam")                          # laad 'packagenaam' in de workspace

Workspace

De workspace is het interne geheugen van R. Alle data in R zijn objecten. Ook functies zijn objecten. Met de functie ls() wordt de workspace opgeroepen.

ls()                                            # Roep de workspace op
## character(0)

R Packages

Om een package te gebruiken moet deze eerst opgeroepen worden met de functie library(). Veel packages van elkaar. Om een package te gebruiken moeten de dependencies ook geladen worden. Dit doen de meeste packages automatisch. ggmap is bijvoorbeeld een dependencent van ggplot2. Zonder ggplot2 functioneert ggmap niet (andersom wel).

# roep de library op
library()

# laad een package in de library
library("package")

Als een package niet beschikbaar is dan kun je deze downloaden. Dit kan direct via de console met de install.packages() of via het menu. Na het installeren van een package moet deze ingeladen worden. Geeft R geen output dan was dit succesvol. Anders krijg je een error melding.

Voorbeeld van een error melding: Error in library(ggplot2) : there is no package called ‘ggplot2’

# Indien niet beschikbaar kun je deze installeren
install.packages("ggplot2", dependencies = TRUE)

# dependencies = TRUE betekent dat alle pacakages die ggplot2 nodig heeft ook worden geinstalleerd.

Bekijk deze Youtube Tutorial voor een ‘stap voor stap’ instructie voor de download en installatie van R Packages.


R afsluiten

Sluit af met Alt+F4 of het kruisje in de rechterbovenhoek. Ook kun je R afsluiten vanuit de console middels een functie:

quit()             # Sluit R af via de console
q()                # Sluit R af via de console

Elke keer dat R wordt opgestart opent R een ‘Workspace’. Hierin wordt alle data van deze sessie opgeslagen. Bij het afsluiten vraagt R of je de Workspace wilt bewaren. Dit is zelden noodzakelijk. Kies je wel voor opslaan dan wordt de workspace (.RData) opgeslagen in de ‘Working directory’ map.


Hulp

Voor hulp en extra uitleg over specifieke functies zie de documentatie. Deze is toegangelijk in R:

help(setwd)      # Gebruik de help functie om meer achter de functie setwd() te komen.

?getwd           # De help functie is ook op te roepen dmv een ? voor de functie waarvan je wat wil weten

??qplot()        # gebruik '??' voor functies uit externe packages.

Let op: De help() functie is bedoeld voor gebruikers van alle niveau’s: beginners en experts. Daardoor lijkt het ontoegankelijk. Zie onderaan de help pagina voor een simpel voorbeeld van de functie.

Hulp op het Internet

Er is tegenwoordig geen gebrek, maar een overvloed aan hulp. Het vinden van de meest relevante informatie begint met het stellen van de juiste vraag. De beste hulp is verkrijgbaar in het Engels. Formuleer je vraag met de juiste terminologie. Zie hiervoor de R Vocabulair.

Algemene hulp met R

Deze websites zijn kwalitatief de beste bronnen op het internet voor R:

  • Quick-R - R Reference website door Robert I. Kabacoff, Ph.D
  • UCLA - R Resource pagina van de Universiteit van California, Los Angeles.

Specifieke vragen

Indien je een specifieke vraag hebt of tegen een bepaalde error aanloopt en je niet weet wat je fout doet kun je hiervoor terecht op Stackoverflow. Rechtsboven kun je je vraag stellen in de zoekbar. Type in de zoekbar eerst [r] en dan je vraag. Hoogstwaarschijnlijk is de vraag waar je mee zit al gesteld. Formuleer daarom goed je vraag, gebruik de juiste terminologie. Zie hiervoor de R Vocabulair.


Online cursus in R

Indien je bekend bent met statistiek of statistische programma’s als SAS en STATA en een spoedcursus wilt in R, kan gebruik gemaakt worden van onderstaande online E-learnings. Ook voor mensen die nog nooit vanuit een console/script hebben gewerkt is dit een goede introductie.

Introductie E-learning

  • Codeschool: Laat je stapsgewijs kennismaken met R vanuit je webbrowser, geen installatie voor nodig.

  • Datacamp: Biedt gratis online course aan ter introductie van R. Er zijn geadvanceerde courses beschikbaar tegen betaling.

Online courses in statistiek met R

Indien je een online cursus wilt doorlopen voor het leren van R EN het leren van statistiek zijn er volledige opleidingen (coursera) en tutorials (R Directory) beschikbaar.

  • Coursera: Online gratis cursus die maandelijks worden aangeboden.
  • R Directory: Uitgebreide selectie aan online (gratis) R tutorials.

Youtube tutorials


Creative Commons-Licentie Dit werk valt onder een Creative Commons Naamsvermelding - Gelijk Delen 3.0 Internationaal-licentie .