Il existe de nombreux logiciels d'analyse statistique généraliste. Dans le champ des sciences sociales en France, les principaux sont R, Stata, SPSS et SAS. Je ne parlerai pas des deux derniers : pour qui veut s'y former, je renvoie aux Statistiques sans mathspour psychologues pour SPSS, et au tutoriel de prise en main proposé par Olivier Godechot pour SAS. Je me concentrerai sur les deux premiers, R et Stata.
Stata
Stata est un logiciel généraliste très puissant et facile d'usage, qui présente le (gros) inconvénient d'être très cher. Pour qui peut en disposer, il existe de nombreux tutoriels en ligne - je signale les suivants qui guident l'utilisateur pour une première prise en main :
Stata est vendu avec une documentation plus ou moins extensive et plus ou moins facile d'usage. Pour prendre en main le logiciel, on peut se reporter au manuel suivant (en français) :
- Cahuzac, E., et Bontemps, C., 2008, Stata par la pratique. Statistiques, graphiques et éléments de programmation, Paris, Stata press, 254 p.
De nombreuses universités anglo-saxonnes ont systématisé l'usage et l'enseignement de Stata, et on trouve sur leur site de très nombreuses ressources pédagogiques. Pour se former et trouver des ressources, on peut notamment se rendre :
- Sur le site de STATA, qui organise forums et discussions et qui propose des ressources.
R
R est en quelque sorte l'alter ego de Stata : tout aussi puissant, il est gratuit et nettement moins immédiat d'usage. La prise en main de R "brut de fonderie" est donc un peu délicate, même si on dispose maintenant de très bons tutoriels. Il existe cependant de nombreuses "librairies" qui en rendent l'usage beaucoup plus facile, en proposant des versions en menu déroulant (RCommander) ou en proposant des extensions facilitant le recours à certaines techniques, comme l'analyse géométrique (FactoMineR) ou l'analyse de séquences (TramineR).
Télécharger R
Je suis ici la présentation que proposent Claire Lemercier et Claire Zalc sur leur site, méthodes quantitatives pour l'historien :
- Il faut se rendre sur le "miroir français" de R, sur ce site lyonnais (pour les utilisateurs de Mac, se rendre sur cette page).
- Télécharger la version la plus récente de R.
- Aller ensuite sur l'endroit du disque dur où R a été téléchargé et cliquer sur le fichier téléchargé : R s'installe normalement tout seul.
Pour compléter R et installer RCommander :
- Dans le fichier R que l'on vient d'installer se trouve un fichier Rgui.exe - on peut aussi cliquer sur le raccourci vers R qui a dû être installé sur le bureau.
- Une "console R" s'ouvre : un cadre avec un peu de babil divers puis une ligne avec un signe ">" rouge, qui clignote.
S'enclenchent alors une série de téléchargements. Lorsque le chargement est arrêté, et à chaque fois que l'on souhaitera utiliser R Commander, il faut taper après le ">" la commande suivante : library(Rcmdr), puis taper sur entrée. Une fenêtre s'ouvre alors, nettement plus hospitalière que la précédente.
Pour utiliser R Commander par la suite, ouvrir R et, dans la consolle (après le signe ">"), tapez la commande : library(Rcmdr) - la fenêtre hospitalière devrait alors s'ouvrir.
Utiliser R
Pour commencer
Pour qui veut utiliser R indépendamment des interfaces qui en facilitent l'usage, il est possible de s'appuyer sur un manuel d'introduction aux statistiques qui prend ses exemples en utilisant R et qui peut donc s'utiliser comme un manuel d'introduction à ce logiciel :
- Cornillon, P.-A., et al., 2008, Statistiques avec R, Rennes, Presses universitaires de Rennes, 260 p.
En anglais et dans la même approche (introduction simultanée aux statistiques et à R), on peut regarder :
- Dalgaard, P., 2008, Introductory statistics with R, New York, Springer, 363 p.
Pour qui cherche une présentation beaucoup plus complète et néanmoins généraliste des ressources de R, qui s'appuie, là encore, sur une présentation des principaux outils statistiques, on pourra se reporter à l'un de ces deux ouvrages :
- Millot, G., 2009, Comprendre et réaliser les tests statistiques à l'aide de R, Bruxelles, De Boeck, 704 p.
- Crawley, M. J., 2007, The R book, Londres, John Wiley, 942 p.
Il existe aussi une série de tutoriels disponibles en ligne, qui proposent des éléments permettant de se familiariser à la syntaxe de R. Pour débuter, le tutoriel de Julien Barnier est très clair et très progressif :
- Et enfin le recueil de tutoriels de R rassemblés sur le site Cran.
Se faciliter un peu la vie : les "librairies"
Des utilisateurs de R ont développé des "librairies" qui constituent des interfaces permettant d'utiliser R sans nécessairement maîtriser les linéaments de sa syntaxe. On a expliqué un peu plus haut comment télécharger RCommander, qui permet d'utiliser des menus déroulants, d'importer des données initialement en format excell, de les recoder, de pratiquer des tris croisés, des tests de significativité, des régressions logistiques, des classifications ascendantes hiérarchiques et des analyses factorielles.
Pour utiliser RCommander et FactoMineR, on peut se reporter à la présentation et au tutoriel suivants :
On trouvera d'autres ressources sur le site de John Fox. Pour des usages plus spécifiques (sur l'analyse géométrique et la régression), on pourra compléter la présentation générale de J. Fox par les tutoriels de Claire Lemercier et Séverine Sofio :