La solution du problème direct (connaître la loi de probabilité de la proportion des boules rouges dans l’échantillon en fonction de la taille N de l’échantillon et de la proportion p dans l’urne) est de Bernoulli aussi : la loi suivie est la loi binomiale de paramètres N et p.
Mais alors que pour le problème inverse, Bernoulli cherchait à estimer la proportion inconnue par un intervalle de confiance, Thomas Bayes lui, cherchait la loi de cette proportion inconnue (considérée alors comme une variable aléatoire entre 0 et 1). Avec ce qui semble être la première utilisation de la notion de probabilité conditionnelle, il découvrait alors la loi bêta.
Le miracle est que, alors que Bernoulli, de Moivre et Laplace ont cherché l’intervalle de confiance en approchant la loi de la proportion par une loi normale, la loi Beta est alle aussi assez bien approchée par une loi normale. Les démarches de Bayes (et à sa suite, Condorcet) et Laplace convergent donc pour des grands échantillons.
Pour illustrer tout ça, le fichier html ci-dessous (téléchargeable en bas de l’article) remplit une urne cachée avec une proportion inconnue (en fait, pseudo-aléatoire) de boules rouges, et permet de simuler en ligne des tirages avec remise. La proportion de boules rouges dans l’échantillon, ainsi que la loi bêta correspondante, sont alors affichées.
La réponse à la question qui ne manquera pas de pleuvoir dans le forum ci-dessous est "Si, on peut tricher, ce n’est pas un bug ; c’est juste un easter egg...
Théorie de Thomas Bayes
Dans son ouvrage paru en 1763 (An essay towards solving a problem
in the doctrine of chances
), Thomas Bayes imagine le problème suivant:
Soit une urne contenant un nombre inconnu de boules, parmi lesquelles une proportion inconnue est rouge. On veut connaître cette proportion.
Pour cela, on extrait répétitivement une boule de l'urne (avec remise) et on compte dans l'échantillon, combien sont rouges. En fait, la proportion inconnue de boules rouges est une variable aléatoire, et on représente ci-dessous la loi de densité que possède cette probabilité, à la lumière des informations données par le sondage.
Pour tirer une nouvelle boule, cliquer ici :
Sur 0 boules tirées, il y en a 0 rouges. Autrement dit, la proportion de boules rouges dans l'échantillon (constitué avec remise) est 0 %.
Au fait, il y en a quelle proportion en vrai ? : La proportion est en fait %.
Pour recommencer tout à zéro (vider l'urne et la remplir avec une proportion aléatoire de boules rouges), cliquer ici:
Commentaires