Qui sera le prochain président ?

lundi 23 avril 2012
par  Alain BUSSER

La programmation linéaire consiste à résoudre un système d’inéquations par recherche graphique du polygone des solutions, puis à utiliser la convexité de celui-ci pour montrer qu’un optimum est obtenu sur l’un de ses sommets. Ici on va juste construire le polygone puis estimer, à l’aide de son aire, la probabilité que François Hollande soit président. Rien que ça !

A priori, le problème est octodimensionnel, les 8 variables étant les proportions des électeurs des candidats éliminés qui reporteront leurs votes sur François Hollande. Mais en estimant que la quasi-intégralité des voix d’Eva Joly, Jean-Luc Mélenchon, Philippe Poutou, Nathalie Arthaud, Jacques Cheminade et bien entendu François Hollande se reporteront sur François Hollande, et que de même le réservoir de voix de Nicolas Sarkozy s’agrandira de celui de Nicolas Dupont-Aignan, ne subsistent alors que deux inconnues : La proportion x des électeurs de Marine Le Pen qui voteront pour François Hollande au second tour, et la proportion y des électeurs de François Bayrou qui voteront Hollande au second tour.

sans les abstentionnistes

Voici les pourcentages obtenus par les différents candidats, regroupés par affinité :

Hollande 28,63
Mélenchon 11,11
Joly 2,31
Poutou 1,15
Arthaud 0,56
Cheminade 0,25

Soit un minimum de 44,01% minimum pour François Hollande au second tour ;

Sarkozy 27,18
Dupont-Aignan 1,79

soit un minimum de 28,97% pour Nicolas Sarkozy.

Marine Le Pen totalise 17,9%, dont x iront à Hollande et 1-x à Sarkozy. Soit 0,179x transférés à Hollande et 0,179(1-x)=0,179-0,179x transférés à Sarkozy.

De même, les 9,13% de Bayrou se répartiront en 0,0913y pour Hollande et 0,0913(1-y)=0,0913-0,0913y pour Sarkozy.

En bref, si les abstentionnistes sont les mêmes au premier tour et au second tour, François Hollande totalisera 0,4401+0,179x+0,0913y des voix, et Nicolas Sarkozy totalisera 0,2897+0,179+0,0913-0,179x-0,0913y=0,56-0,179x-0,0913y des voix. La victoire de François Hollande est caractérisée au choix par l’une des conditions suivantes :

  • le premier nombre est supérieur au second (le candidat qui a le plus de voix, gagne) ;
  • le premier nombre est supérieur à 0,5 (plus de la moitié des voix, et c’est le tapis rouge à l’Élysée) ;
  • le second nombre est inférieur à 0,5 (moins de la moitié des voix, et c’est le congé de paternité).

On peut donc estimer les chances de victoire de François Hollande par l’aire du domaine du plan caractérisée par l’une de ces inégalités ; pour que l’aire soit finie, il faut aussi tenir compte d’autres « contraintes » comme le fait que les variables x et y sont comprises entre 0 et 1.

Pour commencer, on peut déjà dessiner la droite d’équation 0,4401+0,179x+0,0913y=0,5 ce qui, avec GeoGebra, se fait très rapidement, en entrant son équation dans la fenêtre de saisie (en bas de la figure) :

0.4401+0.179*x+0.0913*y=0.5

GeoGebra dessine alors cette droite (en bleu), tout en simplifiant l’affichage de son équation :

Ce rappel peut être utile en Seconde, surtout pour moi qui n’ai pas encore traité ce chapitre... De surcroît, il prépare à l’étape suivante, qui est la résolution de l’inéquation. Donc si dans la fenêtre de saisie, on entre 0.4401+0.179*x+0.0913*y>0.5, on voit (en rose ci-dessous) un demi-plan :

Le domaine dont l’aire est la probabilité de victoire de François Hollande, est l’intersection de ce demi-plan et du carré décrit par 0<x<1 et 0<y<1 ; si on écrit l’encadrement sur x par une double inégalité :

on voit (en vert) une bande dont l’intersection avec l’équivalent pour y est un carré :

Un bon moyen de mieux y voir est de carrément (!) mettre toutes les inégalités ensemble, séparées par des doubles esperluettes :

On voit alors que l’aire à calculer est celle d’un pentagone :

calcul de la probabilité

Le plus simple pour calculer l’aire du pentagone, est de soustraire à 1 (l’aire du carré) l’aire du triangle donnant la victoire de Nicolas Sarkozy [1] ; pour cela il suffit de connaître les coordonnées des sommets de ce triangle ; on peut les calculer en résolvant les équations 0,179x=0,0599 et 0,0913y=0,0599, ou construire avec GeoGebra les points d’intersection des axes avec la droite bleue :

Il suffit de construire le triangle pour que GeoGebra affiche son aire. Et comme le triangle s’appelle poly1 et que GeoGebra comprend, lorsqu’on utilise le nom poly1 pour un calcul, qu’il s’agit de l’aire, il suffit d’écrire 1-poly1 pour avoir la probabilité :

Avec la précision maximale permise par GeoGebra, on trouve donc une probabilité d’environ 0,890225911263133 de victoire pour François Hollande, soit environ 89% de chances. Soit, en valeur exacte, 2909739 chances sur 3268540 d’être élu.

avec les abstentionnistes

Les abstentionnistes du premier tour ne vont pas nécessairement rester abstentionnistes au second tour, donc si on appelle z la proportion d’entre eux qui votent Hollande au second tour, et 1-z la proportion de ceux qui voteront Sarkozy au second tour, Hollande récupère 0,2053z votes et Sarkozy en récupère 0,2053(1-z)=0,2053-0,2053z, si les 20,53% d’abstentionnistes votent tous au second tour. Cependant, il faut ramener les pourcentages du premier tour, non au total des suffrages exprimés, mais au total des inscrits. Le total devient alors 0,3497+0,1423x+0,0726y pour Hollande et 0,445-0,1423x-0,0726y pour Sarkozy.

Finalement, les voix obtenues par Hollande au second tour deviennent 0,3497+0,1423x+0,0726y+0,2053z dans ce nouveau modèle tridimensionnel, et la probabilité de victoire de François Hollande devient le volume de l’intersection du demi-espace d’équation 0,3497+0,1423x+0,0726y+0,2053z>0,5 avec le cube unité.

Seulement, à l’heure actuelle, GeoGebra 5.0 ne gère pas encore les demi-espaces et leur intersection [2], il va donc falloir construire les sommets du solide un par un, ce qu’on peut aussi bien faire avec CaRMetal [3], et plus précisément à l’aide des fichiers préparés par Jérôme Caré pour la 3D dans CaRMetal, et téléchargeables en bas de l’article.

Le plan représentant des scores à égalité pour les deux candidats passe par les points de coordonnées respectives

  • (1,0562 ;0 ;0)
  • (0 ;2,07 ;0)
  • (0 ;0 ;0,732)

Le script « plan et équation » permet de vérifier que c’est bien le bon plan ; et en rajoutant un cube de centre (0,5 ;0,5 ;0,5) à l’aide de la macro idoine, on n’a plus qu’à construire les points d’intersection pour avoir l’intersection du plan et du cube, qui est là encore un pentagone. La probabilité de victoire de Sarkozy devient maintenant le volume du solide représenté en marron dans la figure ci-dessous :

le solide en 3D
le volume de ce solide est la probabilité de victoire de François Hollande

calcul de la probabilité

En approchant ce volume par un tronc de pyramide, la base de la pyramide complète vaut environ 0,366 et la hauteur environ 2 ; d’où un volume de la pyramide complète environ 0,25, et en soustrayant le huitième qui sort du cube, on a un volume du tronc de pyramide d’environ 0,22, qui est donc la probabilité de victoire de Sarkozy dans ce modèle tridimensionnel.

La probabilité de victoire de François Hollande est donc plus basse avec ce modèle qu’avec le précédent, puisqu’elle n’est « plus que » 0,78...

modèle amélioré

Tout ce qui précède est basé sur l’hypothèse que les variables x, y et éventuellement z suivent une loi uniforme sur [0;1], c’est-à-dire une loi bêta de paramètres 1 et 1 ; rien ne justifie cette hypothèse !

Par exemple, un sondage suggère que 40% des électeurs de Marine Le Pen se reporteraient sur François Hollande au second tour. On peut explorer les lois bêta avec ces curseurs :

lois beta
vérification expérimentale de la position du mode

Cette exploration montre que le mode d’une de ces lois est le quotient de ses paramètres (à un décalage de 1 près). Donc pour obtenir une loi de mode 0,4, on peut choisir une loi de paramètres 3 et 4, ou 5 et 7, ou 7 et 10, ou 9 et 13 etc.

Par exemple, il semble approprié de modéliser la variable aléatoire x par une loi bêta de paramètres 3 et 4 ; et de même, la loi de y peut être modélisée par une loi bêta de paramètres 2 et 2. Plutôt que de calculer l’aire du domaine pentagonal vu précédemment (c’est-à-dire l’intégrale de la fonction constante 1 sur ce domaine), il serait plus sage d’intégrer le produit des deux lois bêta ci-dessus sur le domaine en question. Ce qui aura sans doute pour effet de diminuer encore la probabilité de victoire de François Hollande.

Mais cette intégrale double dépasse le cadre du programme du lycée...

L’activité de l’onglet 1 est parfaitement faisable en Seconde, grâce à la facilité d’utilisation de GeoGebra 4 ; celle de l’onglet 2 est à la portée de la Terminale S (géométrie repérée dans l’espace) ; celle de l’onglet 3 est hors programme...

Tout ce qu’il faut pour faire de la 3D avec CaRMetal :

pour faire de la 3D avec CaRMetal
les scripts de Jérôme qui permettent de faire presque toute la 3D avec CaRMetal

[1Ce qui, en passant, illustre graphiquement la probabilité du contraire d’un évènement.

[2On ne saurait lui en vouloir, la date de sortie du logiciel étant annoncée pour « courant 2012 », et la partie 3D est gérée par un programmeur quasiment seul sur le coup, et au demeurant fort sympathique.

[3pauvre AAA, il va encore nous faire une attaque !


Commentaires

Logo de Alain BUSSER
vendredi 18 mai 2012 à 11h32 - par  Alain BUSSER

Merci,

il est vrai que chez plusieurs élèves, l’évènement « Hollande a 89 % de chances de gagner » est vite devenu « Hollande fera 89% des votes » ; cette erreur ayant d’ailleurs même été faite par leur prof, qui, contrairement à eux, n’a pas l’excuse de ne pas avoir encore vu le cours sur les intervalles de confiance !

La statistique inférentielle présente cette difficulté que les variables aléatoires que l’on cherche à estimer sont souvent elles-mêmes des probabilités, et on a tendance à se mêler un peu les pinceaux !

Logo de Philippe Janvier
vendredi 18 mai 2012 à 10h16 - par  Philippe Janvier

Activité fort intéressante pour la classe de seconde, à plusieurs niveaux, induisant de nombreuses questions d’élèves ou à leur poser :

 pourcentages : somme de pourcentages (est-ce toujours possible ?), pourcentages de pourcentages (pourquoi le produit ?), avec le mélange des registres se traduisant au niveau des notations % et décimale : “12,1%” dont “x” (pourcentage ou décimal ?) d’entre eux ... et (1-x) ... (mais pourquoi ce 1 ? est-ce 1%, 1 candidat ? etc.)
 calcul littéral, équations de droites, tracés
 inégalités, encadrements, inéquations, parties du plan
 lectures graphiques : très riche
 probabilité en terme d’aire : l’aire totale fait 1, est-ce le même 1 que précédemment ou est-ce parce qu’il n’y aura qu’1 seul vainqueur ? pourquoi l’aire est-elle un pourcentage de victoire/défaite ? etc.
 géométrie analytique, intersection de droites
 calcul d’aires de polygones
 interprétation de nombres différents concernant un même candidat : les sondages plaçant “Hollande à 53,5%” et à la fois sa probabilité de victoire est à “89%” ... est-ce possible ? Comment interpréter ce 89%, peut-il malgré tout perdre ? etc.
 interprétations et “scénarios” de victoire ou de défaite (quel % de report d’un seul des candidats courtisés suffirait-il pour gagner ? Si on table sur au minimum tel % de report d’un candidat alors quel % est nécessaire venant de l’autre pour gagner ? etc.),
 probabilité ensembliste, ensembles matérialisant la victoire de l’un et la défaite de l’autre candidat, ensembles disjoints, évènements incompatibles, en terminale : évènements incompatibles mais pas indépendants (dépendance matérialisée graphiquement par la droite frontière ?)
 etc.

La conclusion est “Hollande a 89% de chances d’être élu, Sarkosy a 11% de chance d’être élu”, mais l’égalité parfaite, elle avait combien de chances ?...

Merci M. Busser pour ce travail très riche.
A réinvestir pour les législatives à venir, les élections des délégués de classe, les élections professionnelles, etc.

Cordialement,
Philippe Janvier
IA-IPR de mathématiques

Logo de Alain BUSSER
mercredi 2 mai 2012 à 16h30 - par  Alain BUSSER

Oui, je l’ai réellement testé en Seconde, et malgré les problèmes de démarrage, les élèves les plus lents sont arrivés au calcul de l’aire d’un triangle (ce qui la a souvent bloqués d’ailleurs). Le TP est donc tout-à-fait praticable en Seconde, à un rythme confortable. Qu’en est-il en Troisième ?

Logo de L. Talbot
mardi 1er mai 2012 à 17h40 - par  L. Talbot

Bonjour Alain,
je viens de lire ton article n°561 “Qui sera le prochain président ?”.
Je trouve très intéressant le traitement mathématique du problème (résolution d’un système d’inéquations par recherche graphique du polygone des solutions) et la présentation très claire que tu en donnes.
L’as-tu réellement testé avec une classe de seconde ?

En revanche, j’émets quelques réserves sur la modélisation de ce problème...

1) Abstention
Si j’ai bien compris, on suppose que les inscrits qui se sont exprimés au 1er tour sont exactement les mêmes au 2nd tour ?
“ les abstentionnistes du premier tour ne vont pas nécessairement rester abstentionnistes au second tour ”.
C’est vrai, mais on peut aussi penser qu’un nombre non-négligeable des inscrits exprimés du 1er tour s’abstiendront au 2nd tour, puisque leur candidat n’y est plus.

2) Report (supposé) des voix
“en estimant que la quasi-intégralité des voix d’Eva Joly, Jean-Luc Mélenchon, Philippe Poutou, Nathalie Arthaud, Jacques Cheminade et bien entendu François Hollande se reporteront sur François Hollande...”
Qui peut prévoir les intentions au 2nd tour des électeurs de Nathalie Arthaud ? de Philippe Poutou ? d’Eva Joly ? et même de Mélenchon ?
On peut supposer qu’un grand nombre de ces électeurs ne sauront choisir entre les 2 finalistes proposés (abstention ?).

De plus, l’hypothèse théorique : les gens de gauche voteront à gauche, ceux de droite voteront à droite, n’est pas toujours vraie dans la pratique !

3) L’influence de la campagne médiatique entre les deux tours
En 2007, on s’en souvient, un nombre non-négligeable de français s’étaient décidés pour le candidat UMP suite au débat télévisé, entre les deux tours. Le candidat Sarkozy a d’ailleurs souvent été présenté comme le champion des médias.
Comment évaluer l’effet de la campagne de propagande organisée entre les deux tours ? A combien peut-on estimer le nombre d’électeurs de François Hollande qui voteront finalement Sarkozy au 2nd tour, après le débat télévisé du 02/05 ? (ou l’inverse ?)

4) Les indécis
La modélisation proposée ne tient pas compte d’un nombre toujours important de français indécis...

Qui sera le prochain président ?
Pour le savoir, le mieux est encore d’aller voter et d’attendre les résultats dimanche, non ?

Merci pour ton travail et pour les explications mathématiques toujours limpides.
Au plaisir de lire ton prochain article.

Cordialement,
L. Talbot (Clg Quartier-Français)

mardi 1er mai 2012 à 00h28

Les enseignants et futurs enseignants ne peuvent QUE voter Hollande au second tour.... Ou alors ils sont masos....
Qui a encore envie d’enseigner quand on n’a le respect ni de notre ministre, ni du président, ni des élèves, ni des parents ?
Qui a encore envie de passer un concours où on exige un bac+5 + concours avec 3% de reçus, en pouvant être viré après l’année de stage ?
Ne vaut-il pas mieux faire une prépa et un concours des grandes écoles ? Ce n’est pas plus difficile, et au moins, une fois qu’on est pris dans une école, on est certain d’en sortir avec un travail. Alors qu’après 7 ans post bac, on n’a aucune assurance d’être titularisé, ne serait-ce que pour enseigner en maternelle !
De nos jours il vaut mieux être « fils de » ou « fille de » que de passer des diplômes et des concours. En effet, on peut (sauf sursaut national) être président de l’Epad avec comme seul diplôme un baccalauréat, alors qu’on est incapable de passer le cap du bac+2. On peut être ministre avec comme seule compétence d’être judoka, sans avoir aucune notion ni compétence des dossiers qu’on aura à étudier.
Pauvre France... L’avenir de la France dépendra de l’éducation et de l’instruction donné à nos enfants. On a déjà perdu 5 ans....Si on continue avec ce président, il y aura encore des suppressions de postes, et toute une génération d’enfants sera sacrifiée. Dans un département comme la Réunion, où il y a tant de chômage et de personnes vivant du RSA, le seul moyen pour nos jeunes d’avoir un avenir est de réussir scolairement.. .Alors, pourquoi leur fermer les portes ? Est-ce une machination pour les maintenir dans l’illettrisme ? Pour mieux les manipuler ensuite ? Quoi qu’il en soit, si on n’aide pas ces enfants avant qu’ils sortent du système scolaire, c’est une bombe à retardement....