Administrer la preuve statistique en sciences sociales

Gabriel Alcaras, doctorant au CMH, EHESS, ENS.

Pierre Blavier, chargé de recherche au Clersé, CNRS, U. Lille.

Samuel Coavoux, chercheur à Orange Labs.

Anton Perdoncin, post-doctorant, EHESS, CNRS.

À l’heure où les sciences expérimentales s’interrogent sur les limites des pratiques et des normes de la statistique classique et du paradigme fréquentiste, ce débat est encore peu présent dans les sciences sociales, en particulier françaises. Or la preuve statistique dans ces disciplines se caractérise par certaines particularités (données non expérimentales, données personnelles, coûts de collectes élevés, etc.) qui rendent difficiles les solutions habituellement préconisées (pre-registration, publication des résultats nuls, réplication, méta-analyses, etc.). Le séminaire vise à faire le point sur l’état des réflexions et sur leurs conséquences pour les pratiques de la recherche quantitative dans les sciences sociales.

Lors de la première année du séminaire, en 2019-2020, les séances ont essentiellement porté sur la présentation du mouvement en faveur de la reproductibilité, des controverses scientifiques récentes et des enjeux pratiques liés à la reproductibilité, et de la critique des tests d’hypothèse et du modèle fréquentiste.

En 2020-2021, nous souhaitons poursuivre les activités du séminaire, en examinant collectivement les méthodes d’analyse alternatives (statistique bayésienne, machine learning, méthodes dites « narratives ») et leurs articulations à des méthodes d’analyse plus « classiques » (réseaux et analyses géométriques).

Le séminaire est ouvert à des étudiant·e·s avancé·e·s, maîtrisant les bases du raisonnement quantitatif en sciences sociales, ainsi qu’à des doctorant·e·s et à des enseignant·e·s-chercheur·e·s souhaitant approfondir leur réflexion et leur formation en matière de quantification.

Le séminaire n’aura pas lieu en 2021-2022.

Programme 2020-2021

 

17 novembre 2020 – Le genre des sources : identifier, catégoriser, quantifier le genre dans une source historique, Anton Perdoncin

15 décembre 2020 – Self-Organizing Maps et analyse géométrique de données, Julien Bolaert (U. Lille, Ceraps) Etienne Ollion (CNRS, CREST-ENSAE)

19 janvier 2021 –  Recommandation et diversité sur un service de streaming musical. Analyse de données d’usages par un modèle multi-niveau, Samuel Coavoux

16 février 2021 – Modéliser des observations dépendantes : analyse de réseaux et modèles ERGM, François Briatte (ESPOL, U. catholique Lille)

16 mars 2021 – Peut-on identifier l’effet causal d’une mesure pénale sur les comportements de récidive ? Données australiennes, LATE et disparités dans le recours au traitement, Anaïs Henneguelle (U. Rennes 2, LiRIS)

20 avril 2021 –  Eléments de philosophie bayesienne, Gabriel Alcaras, Pierre Blavier et Samuel Coavoux

18 mai 2021 – Refuser l’inaccessible ? Quantifier l’ajustement des aspirations aux possibles objectifs de potentiels candidats à l’enseignement supérieur suédois, Yann Renisio et Emil Bertilsson (Uppsala University)

15/06 – Présentation des travaux des participant·e·s

Programme 2019-2020

 

7 octobre 2019 – La crise de la réplication : où en sont les sciences sociales ?

4 novembre 2019 – Transparence et ouverture des données : enjeux épistémologiques, déontologiques et techniques

2 décembre 2019 – Les tests d’hypothèse nulle sont-ils nuls ?

 

Les séances de 2020 n’ont pas eu lieu en raison de la mobilisation contre la réforme des retraites puis de la crise sanitaire

 

6 janvier 2020 – L’analyse géométrique des données : routines méthodologiques et administration de la preuve

3 février 2020 – Regrouper des individus : pour quoi faire… et comment ?

2 mars 2020 – Quelques éléments de philosophie bayésienne

30 mars 2020 – Ma première chaîne de Monte-Carlo (presque) sans peine

4 mai 2020 – Présentations de travaux des participant.e.s

8 juin 2020 – Présentations de travaux des participant.e.s