Castor 2020 LRG labo de maths LRG

Constitution des équipes

235 élèves ont passé le concours Castor, sur deux établissements scolaires :

La plupart des élèves ont préféré participer en binôme. Les élèves ayant préféré faire le concours seul.e.s tendent toutefois à mieux réussir (en ordonnées, les scores, allant de 0 à 480) :

Performances des filles

Les résultats comparés selon le genre révèlent qu'aucune fille n'a fait moins de 150 points, mais aussi qu'aucune n'a fait plus de 420 points (ce qui est déjà un score exceptionnel) :

Bien que les résultats ne soient pas très différents selon le genre, on va préciser le diagramme ci-dessus, par niveau.

En CM1

24 élèves de CM1 ont fait le concours :

Les filles de CM1 tendent à être plus performantes que les garçons. Le meilleur score de la classe est 260 points. Aucun élève n'a eu plus que 300 points. Le résultat visible en haut à droite est une anomalie : il s'agit d'un élève de seconde qui s'est fait passer pour un élève de CM1 au moment de l'inscription...

En CM2

En CM2, au contraire, les garçons semblent avoir été plus performants :

Ceci dit, l'effectif est de 26 élèves, ce qui est insuffisant pour une quelconque fiabilité statistique.

En seconde

140 élèves de seconde ont passé le concours, ce qui donne une meilleure fiabilité à leurs résultats (quoique certains se soient fait passer pour des élèves de cycle 3 ou 4).

En première

34 élèves ont passé le concours en première. Les résultats sont donc très peu significatifs, d'autant que la plupart des élèves de première ayant fait le concours, sont des garçons.

En terminale

Seuls les 8 élèves de terminale NSI ont passé le concours, dont une fille. Là encore les résultats ne sont pas significatifs du tout.

Résultats par niveau

Voici les résultats par niveau :

D'emblée on y voit que le meilleur résultat de CM1 est le même que le moins bon résultat de terminale (et coïncide avec le meilleur résultat de CM2 et le résultat médian de seconde), que le moins bon résultat de tous a été obtenu en seconde (ce qui est normal compte tenu des effectifs) et que le meilleur résultat a été obtenu en première.

Mais on voit également une corrélation globale entre l'âge des élèves et leurs performances au concours. Cela se confirme sur les polygones des fréquences cumulées :

Légende des couleurs :

bleuvertrougecyanmagenta
CM1CM2secondepremièreterminale
209247312334370

Ci-dessus on a donné les scores moyens par niveau.

Tendance à travailler en binôme

Voici le tableau de contingence des caractéristiques genre (en ligne) et effectif (en colonne) :

seul.een binômetotal
fille11107118
garçon3582117
total46189235

Fréquences conditionnelles

On en déduit que 91% des filles ont préféré faire le concours en binôme, contre 70% des garçons seulement (qui ont préféré faire le concours en binôme).

Par ailleurs, 76% des élèves ayant fait le concours seuls sont des garçons, et seuls 43% des élèves ayant fait le concours en binôme sont des garçons.

Cela suggère une corrélation entre le genre et le choix de faire le concours en binôme. Dans la suite (au-dessus du programme de lycée) on va essayer de quantifier cette corrélation.

Test du χ²

Sous hypothèse d'indépendance entre les deux modalités, le tableau de contingence ressemblerait à ceci :

seul.een binômetotal
fille23,194,9118
garçon22,994,1117
total46189235

Pour mesurer l'écart entre ces deux tableaux de contingence, on calcule leur χ² : on trouve environ 15,8. Or la probabilité que cette valeur soit plus petite que 3,84 est 0,95 (et même, la probabilité que la valeur soit plus petite que 10,83 est 0,999). Ce qui amène à douter de l'hypothèse nulle selon laquelle les modalités sont indépendantes.

Décomposition en valeurs singulières

La matrice de contingence

11107
3582

est le produit des trois matrices suivantes :

La première des 3 matrices est une rotation, d'angle 39,4°. L'analyse en composantes principales consiste à changer de variables, en remplaçant les modalités garçon et binôme par deux nouvelles modalités :

On voit sur cet exemple que l'interprétation des composantes principales n'est pas aisée.

C'est selon ces composantes que la matrice de contingence est

20,5740
0138,187

On décide alors de ne garder que la contingence la plus forte (celle de la seconde variable), et de prendre à la place la matrice

00
0138,187

La multiplication de cette matrice par les deux autres donne la matrice de contingence

24104
1986

Comme on n'a gardé qu'une variable, le tableau de contingence du modèle est censé être plus simple mais tout aussi pertinent que l'ancien :

seul.een binômetotal
fille24104128
garçon1986105
total43190233

Selon ce modèle, 81,25% des filles optent pour la solution binôme et 81,9% des garçons préfèrent la solution binôme.

Et toujours selon ce modèle, 45,3% des candidats en binôme sont des garçons, et 44,2% des candidats seuls sont des garçons.

L'analyse en composantes principales a donc pour effet de gommer les corrélations.