R, une suite de traitement de données statistiques
Vous êtes ici : Clio-Carto Pédagogie et outils cartographiques

R, une suite de traitement de données statistiques

Frédéric Stévenot
mardi 30 décembre 2014

R est une « suite intégrée [permettant] la manipulation, le calcul et la présentation graphique [de données statistiques] ».

Comme l’indique sa fiche sur Framasoft, R un « outil d’analyse statistique et graphique ». Qui plus est, il est non seulement libre (d’où sa présence sur Framasoft), mais aussi gratuit, et il fonctionne avec n’importe système d’exploitation (avec éventuellement une interface graphique comme RStudio).
De façon plus complète (et pour reprendre la présentation du logiciel sur son site d’origine), « R est une suite intégrée [permettant] la manipulation, le calcul et la présentation graphique [de données statistiques] ».

Autrement dit, il s’empare de séries statistiques plus ou moins complexes et il en tire des graphiques (aussi plus ou moins complexes), des calculs (moyenne, écarts-type…), mais aussi des cartes (choroplètes et autres) grâce à des fonds vectoriels provenant de l’IGN, d’OpenStreetMap, avec un résultat très professionnel. R est surtout destiné aux chercheurs — il a été conçu pour cela — qui utilisent des séries très longues et très nombreuses, en sciences humaines par exemples, et les scripts enregistrés (oui, il y a un peu de code là-dedans) permettent de refaire les manœuvres rapidement. Mais il commence à déborder ce cadre professionnel, comme les exemples ci-dessous le montreront.
R peut également nous concerner en tant qu’enseignants. Imaginons des séries trouvées sur le site de l’INSEE, de la FAO ou ailleurs : on se retrouve avec une centaine de départements, trente milliers de communes, environ deux cents pays… Mais avec des dizaines de colonnes de données sur n’importe quoi. Eh bien, R est capable d’extraire la ou les colonnes qui vous intéressent, et d’en tirer la substantifique moelle, pour peu qu’on sache y faire.

Je ne connaissais pas R avant le début novembre, mais, en passant sur Framasoft, j’ai eu l’œil attiré par un encart concernant un livre (un « framabook », puisque c’est publié par Framasoft) : R et Espace , avec en sous-titre Traitement de l’information géographique. Il est écrit par une équipe de chercheurs de Paris, réunis au sein du groupe ÉlémentR. Le livre est très clair, bien écrit. J’en ai lu une partie (sur la cartographie, évidemment), et c’est abordable : on peut faire les exercices à l’aide des données qui sont fournies en ligne, et les réussir facilement, ce qui prouve que R peut être manipulé sans guère de problème. Peu à peu, on comprend à quoi servent les lignes de code (le script), le langage n’étant pas très hermétique (« print » pour publier, par exemple). Un conseil : il y a deux cents pages environ, mais ce n’est pas une raison pour se précipiter (comme je l’ai fait) sur la partie cartographie (avant-dernier chapitre) ; la manipulation de certaines données demandent que l’on commence par le début, sous peine d’avoir quelques déboires.

Pour les plus pressés, trois recommandations en une dizaine de pages (et il y en a d’autres en français, et beaucoup plus en anglais), qui permettront d’utiliser R très rapidement avec de premiers résultats très encourageants (ce qui est évidemment un piège, puisqu’on est incité à aller de l’avant…) :

Cela constituera une bonne base de départ, qui vous permettra de mieux suivre (et tirer parti) du manuel d’ÉlémentR.

Une idée de ce qu’on peut faire avec R ? Parmi les réalisations possibles (mais il en est d’autres) :

R demande un certain apprentissage et une pratique régulière (comme LaTeX, par exemple), mais les résultats sont tels que cela vaut l’investissement. Enfin, il faut savoir que les scripts peuvent être enregistrés, et qu’il suffit d’actualiser ses données statistiques pour avoir des graphiques et des cartes à jour.

Par Frédéric Stévenot

Clio-Lycée 2017

Licence Creative Commons
Les Clionautes sous licence Creative Commons Attribution
Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International

Site développé avec SPIP, un programme sous licence GNU/GPL.

Design et Squelettes : B. Modica & X. Birnie-Scott pour Clio-Lycée.

Hébergement Clio-Lycée par