Logiciels



Il existe de nombreux logiciels d'analyse statistique généraliste. Dans le champ des sciences sociales en France, les principaux sont R, Stata, SPSS et SAS. Je ne parlerai pas des deux derniers : pour qui veut s'y former, je renvoie aux Statistiques sans maths pour psychologues pour SPSS, et au tutoriel de prise en main proposé par Olivier Godechot pour SAS. Je me concentrerai sur les deux premiers, R et Stata.

Stata

Stata est un logiciel généraliste très puissant et facile d'usage, qui présente le (gros) inconvénient d'être très cher. Pour qui peut en disposer, il existe de nombreux tutoriels en ligne - je signale les suivants qui guident l'utilisateur pour une première prise en main : 

- Bozio, A., 2005, Introduction au logiciel STATA, Paris, ENS, 18 p.

- Kpodar, K., 2007, Manuel d'initiation à STATA, Clermont-Ferrand, CERDI, 97 p.

- Bolduc, D., Godbout, M.-H., Initiation à Stata, Paris, Université Paris I, 63 p.

Pour les anglophones, la London school of economics propose une série très progressive de cours en lignes, préparés par Arnaud Chevalier :  

- Chapter 1 - Introduction to Stata ;

- Chapter 2 - Advanced data manipulation ;

- Chapter 3 - The basic of programming - do file and macro ;

- Chapter 4 - Programming ;

- Chapter 5 - Advance programming.

Stata est vendu avec une documentation plus ou moins extensive et plus ou moins facile d'usage. Pour prendre en main le logiciel, on peut se reporter au manuel suivant (en français) :

- Cahuzac, E., et Bontemps, C., 2008, Stata par la pratique. Statistiques, graphiques et éléments de programmation, Paris, Stata press, 254 p.

De nombreuses universités anglo-saxonnes ont systématisé l'usage et l'enseignement de Stata, et on trouve sur leur site de très nombreuses ressources pédagogiques. Pour se former et trouver des ressources, on peut notamment se rendre :

- sur le site de l'Université UCLA

- Sur le site de l'Université de Princeton.

- Sur le site de STATA, qui organise forums et discussions et qui propose des ressources.


R

R est en quelque sorte l'alter ego de Stata : tout aussi puissant, il est gratuit et nettement moins immédiat d'usage. La prise en main de R "brut de fonderie" est donc un peu délicate, même si on dispose maintenant de très bons tutoriels. Il existe cependant de nombreuses "librairies" qui en rendent l'usage beaucoup plus facile, en proposant des versions en menu déroulant (RCommander) ou en proposant des extensions facilitant le recours à certaines techniques, comme l'analyse géométrique (FactoMineR) ou l'analyse de séquences (TramineR). 


Télécharger R


Je suis ici la présentation que proposent Claire Lemercier et Claire Zalc sur leur site, méthodes quantitatives pour l'historien :

- Il faut se rendre sur le "miroir français" de R, sur ce site lyonnais (pour les utilisateurs de Mac, se rendre sur cette page).
 
- Télécharger la version la plus récente de R.

- Aller ensuite sur l'endroit du disque dur où R a été téléchargé et cliquer sur le fichier téléchargé : R s'installe normalement tout seul.

Pour compléter R et installer RCommander :

- Dans le fichier R que l'on vient d'installer se trouve un fichier Rgui.exe - on peut aussi cliquer sur le raccourci vers R qui a dû être installé sur le bureau. 

- Une "console R" s'ouvre : un cadre avec un peu de babil divers puis une ligne avec un signe ">" rouge, qui clignote. 

- Copier-coller la ligne de code suivante immédiatement après ce ">", puis taper sur la touche entrée : source(
"http://factominer.free.fr/install-facto.r")

S'enclenchent alors une série de téléchargements. Lorsque le chargement est arrêté, et à chaque fois que l'on souhaitera utiliser R Commander, il faut taper après le ">" la commande suivante : library(Rcmdr), puis taper sur entrée. Une fenêtre s'ouvre alors, nettement plus hospitalière que la précédente. 

Pour utiliser R Commander par la suite, ouvrir R et, dans la consolle (après le signe ">"), tapez la commande : library(Rcmdr) - la fenêtre hospitalière devrait alors s'ouvrir.


Utiliser R



Pour commencer


Pour qui veut utiliser R indépendamment des interfaces qui en facilitent l'usage, il est possible de s'appuyer sur un manuel d'introduction aux statistiques qui prend ses exemples en utilisant R et qui peut donc s'utiliser comme un manuel d'introduction à ce logiciel : 

- Cornillon, P.-A., et al., 2008, Statistiques avec R, Rennes, Presses universitaires de Rennes, 260 p. 

En anglais et dans la même approche (introduction simultanée aux statistiques et à R), on peut regarder :

- Dalgaard, P., 2008, Introductory statistics with R,
New York, Springer, 363 p.

Pour qui cherche une présentation beaucoup plus complète et néanmoins généraliste des ressources de R, qui s'appuie, là encore, sur une présentation des principaux outils statistiques, on pourra se reporter à l'un de ces deux ouvrages :

- Millot, G., 2009, Comprendre et réaliser les tests statistiques à l'aide de R, Bruxelles, De Boeck, 704 p.

- Crawley, M. J., 2007, The R book, Londres, John Wiley, 942 p.


Il existe aussi une série de tutoriels disponibles en ligne, qui proposent des éléments permettant de se familiariser à la syntaxe de R. Pour débuter, le tutoriel de Julien Barnier est très clair et très progressif : 

Barnier, J., 2010, R pour les sociologues (et assimilés), Lyon, Groupe de recherche sur la socialisation, ENS-LSH, 139 p

On peut également se reporter aux autres tutoriels suivants :

-
Paradis, E., R pour les débutants, 81 p.

-
Genolini, C., Lire ; compter ; tester... avec R, Préparation des données/analyse univariée/analyse bivariée, 31 p.

-
Venables, W.N., Smith, D.M., 2009, An introduction to R, 108 p.


Pour approfondir

Pour aller plus loin, on peut se reporter à différents tutoriels ou ouvrages, qui abordent plus particulièrement les points suivants : 

Aide-mémoire et bonnes pratiques :  

-
Kauffmann, M., 2009, Aide-mémoire des fonctions de R. Références des fonctions de R les plus courantes, 5 p

-
Genolini, C., R, bonnes pratiques, 19 p

Gestion des données :

- Spector, P., 2008, Data manipulation with R, New York, Springer, 152 p.

-
R development core team, 2009, R data Import/export, 37 p.
 
Graphiques sous R :

- Murrell, P., 2006, R Graphics, Londres, Chapman & Hall, 301 p.

-
Lobry, J.-R., 2008, Programmation statistique avec R. Graphiques de base, Lyon, Université Claude Bernard, 148 p.

-
Colors in R, 8 p.

On peut également trouver de nombreuses ressources sur les sites suivants (éventuellement anglophones) :

- Le
blog de Julien Barnier ;

- Le
site d'Olivier Godechot ;

- Le site de
l'Université UCLA ;

- Le site de
l'Université Princeton ;

- Et enfin le recueil de tutoriels de R rassemblés sur le
site Cran.


Se faciliter un peu la vie : les "librairies"


Des utilisateurs de R ont développé des "librairies" qui constituent des interfaces permettant d'utiliser R sans nécessairement maîtriser les linéaments de sa syntaxe. On a expliqué un peu plus haut comment télécharger RCommander, qui permet d'utiliser des menus déroulants, d'importer des données initialement en format excell, de les recoder, de pratiquer des tris croisés, des tests de significativité, des régressions logistiques, des classifications ascendantes hiérarchiques et des analyses factorielles.

Pour utiliser RCommander et FactoMineR, on peut se reporter à la présentation et au tutoriel suivants :

-
Fox, J., 2005, "The RCommander : A basic-statistics graphical user user interface to R", Journal of statistical software, 14 (9), p. 1-42.

-
Fox, J., 2006, Getting started with RCommander, 22 p.

On trouvera d'autres ressources sur
le site de John Fox. Pour des usages plus spécifiques (sur l'analyse géométrique et la régression), on pourra compléter la présentation générale de J. Fox par les tutoriels de Claire Lemercier et Séverine Sofio :

-
Lemercier, C., Sofio, S., Tutoriel FactoMinerR pour l'analyse des correspondances multiples, 18 p.

-
Lemercier, C., Sofio, S., Tutoriel RCommander pour la régression logistique, 6 p
.







Créer un site
Créer un site