Après L. J. Cohen (1981), G. Gigerenzer (1991) critique les hypothèses normatives de D. Kahneman et A. Tversky qu’il estime « aveugles au contenu ». Il axe son argumentation sur l’interprétation des probabilités1, défendant une position fréquentiste, par opposition au bayésianisme, et il évoque plus spécialement trois biais : l’excès de confiance, l’erreur de conjonction et l’ignorance du taux de base. Ce dernier biais a été illustré, dans l’instantané précédent2, via le scénario de l’accident impliquant un taxi dont la couleur est rapportée par un témoin. Il est évoqué par Gigerenzer (1991) au moyen d’une question différente, conçue par Casscells, Schoenberger, et Grayboys en 1978, et reprise par Kahneman et Tversky en 1982 : « si un test pour détecter une maladie, dont la prévalence est 1/1000 [taux de base], a un taux de faux positifs de 5%, quelle est la probabilité qu’une personne soit testée positive et qu’elle ait effectivement la maladie, attendu que vous ignorez les symptômes de cette personne ? »
Sur soixante étudiants d’Harvard en médecine, environ la moitié ont répondu 0,95% et seulement 18% ont obtenu 0,02%, réponse estimée juste par les concepteurs de la question. Le raisonnement étant plus complexe que celui pour les taxis, il est d’autant plus intéressant de le détailler3. Pour parvenir au résultat, il convient notamment de faire appel au théorème de Bayes et à la formule des probabilités totales. Le premier stipule la relation suivante pour une hypothèse \(h\) et des données \(D\) :
\[P(h|D) = \frac{P(D|h)P(h)}{P(D)}\]
\(P(h|D)\) correspond à la probabilité de \(h\) sachant \(D\), \(P(D|h)\) à la probabilité de \(D\) sachant \(h\), \(P(h)\) à la probabilité de \(h\) indépendamment de \(D\), et \(P(D)\) à la probabilité de \(D\) indépendamment de \(h\). Dans la problématique du test médical, \(h\) est l’hypothèse que la personne testée est malade et \(D\) le résultat positif d’un test. Notons \(\)\(\bar{h}\) l’hypothèse suivant laquelle une personne n’a pas contracté la maladie. Nous avons les probabilités suivantes :
\[P(h)\ =\ \frac{1}{1000}=0,001\ \ \ \ \ P(\bar{h})\ =\ 0,999\ \ \ \ \ P(D|\bar{h})=0,05\]
Si nous supposons par ailleurs que le test ne produit pas de faux négatifs, c’est-à-dire \(P(D|h)\ =\ 1\), on peut utiliser la formule des probabilités totales :
\[P(D)\ =\ P(D|h)P(h)\ +\ P(D|\bar{h})P(\bar{h})\]
\[P(D)\ =\ 1\ast\ 0,001\ +\ 0,05\ast0,999\ =\ 0,05095\]
Il ne reste alors plus qu’à appliquer le théorème de Bayes :
\[P(h|D)\ =\ \frac{P(D|h)P(h)}{P(D)}\ =\ \frac{1\ *\ 0,001}{0,05095}\ =\ 0,01963\]
Pour obtenir la réponse correcte, il faut donc mettre en œuvre deux théorèmes et, surtout, émettre une supposition qui n’a rien d’évident et qui ne figure pas dans l’énoncé de la question, à savoir que le test ne produit pas de faux négatifs.
La question est plus spécialement critiquée par Gigerenzer à propos de deux autres de ses aspects : elle concerne un événement singulier, par opposition à une probabilité désignant la fréquence d’un événement récurrent ; elle ne spécifie pas si la personne testée a été sélectionnée aléatoirement ou non parmi la population à laquelle correspond le taux de base. Or les cliniciens ne choisissent pas en général aléatoirement leurs malades, excepté dans des enquêtes particulièrement vastes. Sans précision du caractère aléatoire ou non du tirage du tirage au sort, il n’est pas évident de savoir comment exploiter le taux de base. Si ces deux remarques de Gigerenzer apportent un éclairage en termes d’interprétation des statistiques, elles ne me semblent pas de nature à déstabiliser le raisonnement de Kahneman et Tversky, notamment parce que la distance entre fréquentisme et bayésianisme n’apparaît pas incommensurable dès lors que les probabilités subjectives sont actualisées au fil de la reproduction des expériences, revenant ainsi à une forme de fréquentisme.
Ce que la polémique autour de la prise en compte du taux de base met en lumière, c’est que certaines questions posées lors d’expériences psychologiques relatives à l’intuition n’ont rien d’intuitif, même pour des pour des personnes sensibilisées au calcul des probabilités et aux traitements statistiques.
Références
L. Jonathan Cohen, “Can human irrationality be experimentally demonstrated?”, The Behavioral and Brain Science, 4, 1981, 317-370.
Gerd Gigerenzer, “How to Make Cognitive Illusions Disappear: Beyond “Heuristics and Biases”, European Review of Social Psychology, vol. 2, 1991, p. 83–115.
Notes
1.↑ Probability interpretations – Wikipedia
2.↑ https://damiengimenez.fr/wpdgi_instant/critique-des-hypotheses-normatives-de-d-kahneman-et-a-tversky-par-l-j-cohen/
3.↑ Je m’appuie sur le document suivant : lecture23-2×2.pdf (ed.ac.uk)