Handleiding R voor in de Geneeskunde

Deze handleiding is bedoeld voor geneeskunde studenten of artsen die een wetenschappelijk onderzoek doen en voor de statistische analyse R gebruiken. Kennis van statistiek wordt aangenomen.

Deze handleiding is geschreven om je een systematiek te leren hoe je van een ruw databestand naar een eindproduct gaat. Het doel van deze handleiding is driedelig:

 • Leer werken in R
 • leer systematisch data importeren, bewerken en grafisch weergeven
 • Leer kiezen en uitvoeren van statische analyses

Zie Modules voor meer diepgang in de statistische theorie. Daarnaast wordt regelmatig verwezen naar tutorials en (gratis) boeken die verdere uitleg en achtergrond informatie bieden.


Stappenplan

 1. Introductie R: Download en installatie van R. Kennismaking met de werkopgeving. Uitleg over GUI’s (grafische User Interfaces) en packages. Introductie in de syntax van R en de belangrijskte data structuren.

 2. Data Cleanup: Importeren en exporteren van data, grafieken en tabellen. Data opmaak en labels.

 3. Data Manipulatie: Maken, recoderen en transformeren van nieuwe variabelen en dataframes.

 4. Descriptieve Statistiek: Beschrijven van de data in statistische termen, tabellen en grafieken.

 5. Statistische Analyses: Het kiezen en uitvoeren van statistische analyses.


Wat is R?

R and statistics

Statistics can mean “give me a p-value less than 5%” or “what is the data saying?”
R is good for the latter, and overkill for the former
R can be harder to learn - because it does more
R is a language, and is meant to be used interactively
Bron

R is een programmeertaal en open source softwarepakket ontwikkeld voor statistiek en data analyse. R is ontwikkeld door Ross Ihaka en Robert Gentleman en wordt nu bijgehouden door het R-core Team.

R kan gebruikt worden als simpele rekenmachine (gemiddelde, mediaan, standaard deviatie) en voor complexe statistiek (regressie analyse, bayesian statistics, neurale netwerken). Omdat R open source is kan iedereen eraan bijdragen. R-core biedt een scala aan functies maar de echte kracht van R komt uit de gemeenschap in de vorm van packages. Sinds januari 2015 zijn er meer dan 6000 packages beschikbaar op CRAN (Comprehensive R Archive Network). Lees meer over de filososfie achter packages.

Packages

Bron figuur


Onderzoek in de 21ste eeuw

De markt voor statistische software pakket is aan het veranderen. SPSS is in Nederland het meest gebruikte programma. Dit is aan het veranderen.

Gebruik van SPSS & SAS Google Scholar hits op R
alt text alt text

Rstudio (gratis & Open Source) is de meest gebruikte IDE (Intergrated Device Interface) met extra functionaliteit alsmede gebruiksgemak ten opzichte van R. Daarnaast zit Rstudio achter Rmarkdown (dynamische documenten) en Shiny (interactieve grafieken). Deze Apps staan op de voorgrond van de ontwikkelingen van de digitale publicatie.

Reproducible Research

Reproducible research is the idea that data analyses, and more generally, scientific claims, are published with their data and software code so that others may verify the findings and build upon them.” Lees meer.


Gratis boeken voor R

Maak thuis verbinding met de VU bibliotheek of van een andere universiteit/ziekenhuis. Eenmaal verbonden klik hier voor een lijst goede (gratis) R instructieboeken voor specifieke analyses.


Technische informatie:

Meest recente versie: 2015-04-16 00:13:19

versie van R:

print(sessionInfo(), locale = FALSE) 
## R version 3.1.2 (2014-10-31)
## Platform: i386-w64-mingw32/i386 (32-bit)
## 
## attached base packages:
## [1] splines  grid   stats   graphics grDevices utils   datasets 
## [8] methods  base   
## 
## other attached packages:
## [1] ROCR_1.0-7      gplots_2.16.0    caTools_1.17.1   
## [4] polycor_0.7-8    sfsmisc_1.0-27    coin_1.0-24     
## [7] pgirmess_1.5.9    PMCMR_1.1      nlme_3.1-118    
## [10] DescTools_0.99.10  manipulate_0.98.1102 HH_3.1-15      
## [13] gridExtra_0.9.1   multcomp_1.3-8    TH.data_1.0-6    
## [16] mvtnorm_1.0-2    latticeExtra_0.6-26 RColorBrewer_1.1-2 
## [19] car_2.0-24      VIM_4.1.0      data.table_1.9.4  
## [22] colorspace_1.2-4   outliers_0.14    nortest_1.0-3    
## [25] gmodels_2.15.4.1   psych_1.5.1     doBy_4.5-13     
## [28] reshape2_1.4.1    Hmisc_3.15-0     ggplot2_1.0.0    
## [31] Formula_1.2-0    lattice_0.20-29   plyr_1.8.1     
## [34] reshape_0.8.5    rmarkdown_0.5.3.1  e1071_1.6-4     
## [37] epiR_0.9-62     survival_2.37-7   vcd_1.3-2      
## [40] foreign_0.8-61   
## 
## loaded via a namespace (and not attached):
## [1] abind_1.4-0    acepack_1.3-3.3  bitops_1.0-6   
## [4] boot_1.3-13    chron_2.3-45    class_7.3-11   
## [7] cluster_1.15.3   coda_0.17-1    deldir_0.1-9   
## [10] DEoptimR_1.0-2   digest_0.6.8    evaluate_0.5.5  
## [13] formatR_1.0    gdata_2.13.3    gtable_0.1.2   
## [16] gtools_3.4.1    htmltools_0.2.6  httpuv_1.3.2   
## [19] KernSmooth_2.23-13 knitr_1.9     labeling_0.3   
## [22] leaps_2.9     LearnBayes_2.15  lme4_1.1-7    
## [25] MASS_7.3-35    Matrix_1.1-4    mgcv_1.8-3    
## [28] mime_0.2      minqa_1.2.4    mnormt_1.5-1   
## [31] modeltools_0.2-21 munsell_0.4.2   nloptr_1.0.4   
## [34] nnet_7.3-8     parallel_3.1.2   pbkrtest_0.4-2  
## [37] proto_0.3-10    quantreg_5.11   R6_2.0.1     
## [40] Rcmdr_2.1-6    RcmdrMisc_1.0-2  Rcpp_0.11.4    
## [43] rgdal_0.9-2    RJSONIO_1.3-0   robustbase_0.92-3 
## [46] rpart_4.1-8    sandwich_2.3-2   scales_0.2.4   
## [49] shiny_0.11.1    sp_1.0-17     SparseM_1.6    
## [52] spdep_0.5-88    splancs_2.01-37  stats4_3.1.2   
## [55] stringr_0.6.2   tcltk_3.1.2    tcltk2_1.2-11   
## [58] tools_3.1.2    xtable_1.7-4    yaml_2.1.13    
## [61] zoo_1.7-11

Creative Commons-Licentie Dit werk valt onder een Creative Commons Naamsvermelding - Gelijk Delen 3.0 Internationaal-licentie .