Calculateur d’intervalles de confiance

dimanche 9 juin 2013
par  Alain BUSSER

Pour calculer l’intervalle de confiance pour une proportion (celle des succès), on a besoin de l’effectif de l’échantillon, du nombre de succès dans l’échantillon, et du niveau de confiance. Dans cet article, le niveau de confiance est fixé à 95%.

Le calcul est fait à partir de l’approximation normale de la fréquence empirique (quotient d’une binomiale par son premier paramètre), et l’intervalle de confiance n’a de valeur que si

  • l’effectif N est supérieur ou égal à 25
  • le nombre de succès dans l’échantillon est supérieur ou égal à 5 ;
  • le nombre d’échecs dans l’échantillon est supérieur ou égal à 5

La formule utilisée est celle des programmes de STI2D/STL et de BTS, qui est plus précise que celle des autres classes de lycée.

Le source, téléchargeable en bas d’article, est libre, sous licence MIT. Ce qui autorise à l’inclure dans un site internet, le copier, le modifier (surtout pour l’améliorer) etc. [1]

Intervalles de confiance

Intervalle de confiance pour une proportion

Si, dans un échantillon de taille , on compte succès (ce qui fait que la fréquence de succès dans l'échantillon est 31.25 %), alors l'intervalle de confiance à 95 % pour la proportion dans la population est (en pourcents) :

[24.07;38.43]

Remarque

L'intervalle de confiance approché vu en Terminales S et ES/L est :

[23.34;39.16]


Le source en CoffeeScript

Voici le source du calculateur ci-dessus :

	$(':input').bind 'change', (event) =>
		N = $('#entN').val()
		S = $('#entS').val()
		S = Math.max S, 0
		S = Math.min S, N
		$("#entS").val S
		f = S/N
		$("#sorF").text (f*100).toFixed 2
		h = 1.96*Math.sqrt f*(1-f)/N
		c1 = Math.max 0, f-h
		c2 = Math.min 1, f+h
		$("#a1").text (100*c1).toFixed 2
		$("#a2").text (100*c2).toFixed 2

#entN est le premier cadre (l’entrée de N) ; de même, #entS est le second cadre (entrée du nombre de succès). Donc $('#entS').val() est la valeur de S (nombre de succès dans l’échantillon) ; S est tronqué à 0 en bas et à N en haut, puis réactualisé avec $("#entS").val S. On voit donc que #entS qui est une entrée, peut aussi être traité comme une sortie...

Le nombre f, quotient de S par N, est donc la fréquence des succès dans l’échantillon, comprise entre 0 et 1 ; #sorF étant l’affichage de la fréquence (fin de la première phrase), on lui affecte 100 fois f (pour avoir en pourcents) arrondi à deux décimales (et converti en texte) avec $("#sorF").text (f*100).toFixed 2. Le nombre h est celui qui doit être soustrait et ajouté à la fréquence dans l’échantillon pour avoir les bornes de l’intervalle. Comme #a1 et #a2 sont les affichages de ces bornes dans le texte, l’affichage de l’intervalle est mis à jour avec les deux dernières lignes.

Le tout est attaché à l’évènement « quelque chose a changé » pour chaque entrée du fichier (première ligne du script). Le script est donc lancé à chaque modification d’une des données.


[1du moment qu’on ne se fasse pas passer pour l’auteur de la version originale et qu’on mette un lien vers celle-ci, on peut faire à peu près tout ce qu’on veut de ce script


Documents joints

intConf
le source en html ; on peut l’ouvrir dans un navigateur Internet, mais à condition d’être (...)
PDF - 103.6 kio

Commentaires