Le calcul est fait à partir de l’approximation normale de la fréquence empirique (quotient d’une binomiale par son premier paramètre), et l’intervalle de confiance n’a de valeur que si
- l’effectif N est supérieur ou égal à 25
- le nombre de succès dans l’échantillon est supérieur ou égal à 5 ;
- le nombre d’échecs dans l’échantillon est supérieur ou égal à 5
La formule utilisée est celle des programmes de STI2D/STL et de BTS, qui est plus précise que celle des autres classes de lycée.
Le source, téléchargeable en bas d’article, est libre, sous licence MIT. Ce qui autorise à l’inclure dans un site internet, le copier, le modifier (surtout pour l’améliorer) etc. [1]
Intervalle de confiance pour une proportion
Si, dans un échantillon de taille , on compte succès (ce qui fait que la fréquence de succès dans l'échantillon est 31.25 %), alors l'intervalle de confiance à 95 % pour la proportion dans la population est (en pourcents) :
[24.07;38.43]
Remarque
L'intervalle de confiance approché vu en Terminales S et ES/L est :
[23.34;39.16]
Le source en CoffeeScript
Voici le source du calculateur ci-dessus :
$(':input').bind 'change', (event) =>
N = $('#entN').val()
S = $('#entS').val()
S = Math.max S, 0
S = Math.min S, N
$("#entS").val S
f = S/N
$("#sorF").text (f*100).toFixed 2
h = 1.96*Math.sqrt f*(1-f)/N
c1 = Math.max 0, f-h
c2 = Math.min 1, f+h
$("#a1").text (100*c1).toFixed 2
$("#a2").text (100*c2).toFixed 2
#entN est le premier cadre (l’entrée de N) ; de même, #entS est le second cadre (entrée du nombre de succès). Donc $('#entS').val()
est la valeur de S (nombre de succès dans l’échantillon) ; S est tronqué à 0 en bas et à N en haut, puis réactualisé avec $("#entS").val S
. On voit donc que #entS qui est une entrée, peut aussi être traité comme une sortie...
Le nombre f, quotient de S par N, est donc la fréquence des succès dans l’échantillon, comprise entre 0 et 1 ; #sorF étant l’affichage de la fréquence (fin de la première phrase), on lui affecte 100 fois f (pour avoir en pourcents) arrondi à deux décimales (et converti en texte) avec $("#sorF").text (f*100).toFixed 2
. Le nombre h est celui qui doit être soustrait et ajouté à la fréquence dans l’échantillon pour avoir les bornes de l’intervalle. Comme #a1 et #a2 sont les affichages de ces bornes dans le texte, l’affichage de l’intervalle est mis à jour avec les deux dernières lignes.
Le tout est attaché à l’évènement « quelque chose a changé » pour chaque entrée du fichier (première ligne du script). Le script est donc lancé à chaque modification d’une des données.
Commentaires