Chargement...
 

Courtes capsules statistiques


Autres pages de capsules:

Motiver par l'insertion du monde dans nos cours

L'actualité est la première source de ces capsules: les statistiques économiques, sociales, démographiques, les sondages électoraux, d'autres résultats d'enquête...

Pour l'avoir expérimenté fréquemment, les étudiants (et bien d'autres) sont friands d'explication de ces statistiques qu'on trouve presque tous les jours dans les médias: ils sont à l'aube de leur vie citoyenne, elles leur échappent. Il va de soi que ces explications sont nécessaires à la compréhension du monde moderne, la leur tout particulièrement, une toute nouvelle dimension entre dans leur champ d'intérêts. Ces explications doivent faire partie de la formation de la jeunesse. De surcroît, ces explications leur procurent une motivation incarnée en quelque sorte pour la statistique.

Les textes peuvent être mis à la disposition des étudiants au préalable pour qu'ils puissent en discuter entre eux et lors de leur présentation en classe, ce qui leur fait toujours plaisir! L'interaction est un bon stimulant.

Le cours de statistique, passage obligé de presque toutes les disciplines universitaires, est le lieu idéal pour transmettre ces informations (formations...).

On peut tirer de fichiers en liens ici plusieurs plus courtes capsules sur des chapitres élémentaires de la statistique:


La reproductibilité des études statistiques

Le texte long fait un court développement (sans équation) de la logique du paradigme fréquentiel de l'inférence statistique.

L'institution scientifique est en crise. Pas la statistique elle-même qui conserve intacte sa logique inférentielle, mais l'institution scientifique qui s'en sert comme outil (Donoho, 2015, 50 years of data science).

Comme a dit Maurice G. Kendall (1907 - 1983): «Figures don't lie, but liars do figure». Les vertus se perdent, en douterait-on? La nécessité de publier sous peine de périr a des conséquences bien néfastes. Publish or perish pour utiliser l'allitération courante aux États-Unis.

La reproductibilité des études est la règle d'or de toute connaissance scientifique. Seules des confirmations par des études indépendantes répliquées peuvent vraiment valider un fait de connaissance. On trouve dans les sciences pures de telles réplicationssans compter l'ndustrie de fabrication où la concurrence impose des qualités toujours plus poussées, mais pas dans les SHS&Santé. Là, la reproductibilité serait rare...Les deux premiers textes font le tour de la question:

le dernier texte montre qu'il arrive que des vérifications faites par hasard, contrairement à la grande étude de la prestigieuse revue Science, citée dans les deux premiers textes plus haut, mettent des résultats en doute, jettent à bas une réputation. C'est rare. Nous avons là un exemple qui a fait le tour de la planète en 2013:


Les sondages


Le premier exemple comprend un texte tiré du NY-Times Magazine sur l'organisation fine de la campagne démocrate en cet âge de l'utilisation de données massives et des technologies de l'information. Le second présente des graphiques sur des points de détails dont raffolent les lecteurs des grands journaux. Le dernier rapporte avec quelques commentaires l'ensemble des sondages réalisés jusqu'à 3 jours avant le premier tour des Présidentielles françaises 2017.

Les sondages sont souvent qualifiés de mensonges, d'une forme de manipulation collective au service de divers intérêts. Tout comme le veut le diction souvent cité «Il y a les mensonges, les sacrés mensonges et les statistiques!» (propos attribués à Disraeli, Churchill, Mark Twain... on ne prête qu'aux riches!).

On trouve bien sûr des sondages destinés à manipuler l'opinion publique, mais la plupart du temps, les sondages rendus publics sont étonnamment précis. C'est la reproductibilité qui est garante de leur qualité, les données aberrantes sont suspectes, on le sait: voir à ce sujet la «Traverses 1. Tonnerre et tremblements».

Tout de même, bien des politiques, des commentateurs et des bien pensants lèvent le nez sur les sondages, pestent contre les sondages, surtout s'ils sont contraires à leurs opinions... Voici un tel cas, prétendument éclairé, que nous avons décortiqué (sur un article d'opinion dans le journal Le Devoir du 22 février 2017). C'est le dernier élément de cette rubrique.



Les chroniques de l'Amérique boréale (CABxx)

Dans ces courtes capsules, on trouve un certain nombre de Chroniques de l'Amérique boréale (CAB) qui sont encore d'actualité. Elles portent ce nom car elles ont été rédigées au Québec, mais les sujets sont mondiaux. Nous les avons rédigées en bonne partie à l'aube de notre retraite, question de développer de vieilles pratiques pédagogiques de notre enseignement. Celles-là sont préfixées par CAB. Il y en d'autres très récentes.

Elles se réfèrent toutes à des articles de journaux (d'où l'idée des capsules divertissantes, comme aide à l'apprentissage de la statistique. Celles qui remontent au début de la seconde décennie, dont les références sont fournies. Elles restent d'actualité;

Il n'y a pas que les sondages électoraux qui passionnent, c'est entendu (mais en période électorale...), il y a aussi les enquêtes de toutes sortes sur des sujets socio-politiques. Et puis il y a aussi les taux, les proportions, les nombres-indices en somme: taux de mortalité, espérance de vie, taux de chômage, le PIB, les indicateurs du commerce macroéconomique, l'indice des prix à la consommation, l'indice du développement humain (IDH), l'indice du bonheur individuel ou collectif, les résultats des grandes enquêtes internationales de l'OCDE (e.g. PISA), etc. Comment sont-ils calculés? Quelle incertitude y trouve-t-on?

Il y a encore beaucoup de travail pour compléter nos productions... À qui le tour?


La paradoxe de Simpson ou un train peut en cacher un autre! Attention de ne pas escamoter des variables influentes sur des réponses, dites aussi variables de confusion, quand on analyse des tableaux de contingences, des corrélations: les effet peuvent changer de sens quand on introduit d'autres variables explicatives/causales, c'est le paradoxe de Simpson.

En réalité, on pourrait placer la CAB7 dans les plus développées, les Traverses. Il y a à boire et à manger en effet dans la sombre affaire Rogoff & Reinhart, deux économistes célébrissimes de Harvard qui auraient (ont?) trafiqué des données pour justifier leur thèse que les pays très endettés ont des développements économiques réduits. Un humble doctorant d'une humble université voisine les a démasqués. Cette affaire a eu un grand retentissement.


Autres pages de capsules: