Sondages : Analyse d’un statisticien professionnel sur « l’effet Mélenchon »

Ma crainte est l’effet auto-réalisateur des sondages : les électeurs hésitent à confirmer leur choix pour un candidat que les sondages ne placent pas en tête des intentions. Statisticien professionnel depuis plus de quinze ans, les intentions de vote en faveur de Jean-Luc Mélenchon pour le premier tour de l’élection présidentielle sont, selon moi, sous-estimées par les sondages d’opinion, et pas uniquement en raison des « redressements » opérés par les instituts de sondage. Par Jean-Claude Englebert.

Un sondage est une photographie à un instant donné de l’opinion. Sa validité est basée sur des hypothèses statistiques qui permettent de se faire une idée de ce que pense les électeurs à partir d’un échantillon. Ainsi, même pour une population de la taille de l’électorat français, un échantillon de +/- 1.000 personnes suffi(ra)it à se faire une idée des préférences de la population dans son ensemble.

L’hypothèse de base est que l’échantillon est « représentatif » et que la population est
« homogène ».

La représentativité pose problème : les caractéristiques (âge, catégorie socioprofessionnelle, géographie, niveau d’éducation,…) ont un lien avec le choix posé. En 2007, Sarkozy aurait été élu par les personnes plus âgées. Pour contrecarrer ces différences, les « sondeurs » redressent leur échantillon pour le faire coller au plus près de la sociologie française. Ainsi, s’il y a trop de personnes qui ont atteint le bac dans l’échantillon, le choix des détenteurs du bac sont ramenés à leur « juste proportion » dans les résultats.

L’homogénéité postule que les choix des sondés sont indépendants les uns des autres : un « sondé » en vaut un autre.

Ces deux hypothèses posent problème dans le cas du choix Mélenchon. La représentativité tout d’abord. L’électorat potentiel est sociologiquement majoritairement de gauche mais pas uniquement ! Ainsi, des cadres, des professions libérales, qui ne votent traditionnellement pas à gauche » déclarent leur adhésion au programme du candidat du Front de Gauche. Ainsi, pour ces catégories, le « choix Mélenchon » ne peut être représenté par un échantillon de 1.000 personnes. Si un sondeur constate que 5 des 30 personnes sur 1.000 appartenant à ces « catégories » portent leur choix sur le Front de Gauche, il n’en croira pas ses yeux et risque de corriger illico cette anomalie . De plus, sur des catégories marginales, l’erreur est importante.

L’homogénéité pose plus de problème encore. Le « choix Mélenchon » est un choix de groupe et militant. Dans un tel climat polémique (pour ne pas parler d’animosité), les électeurs de Mélenchon rayonnent autour d’eux, s’approprient les arguments et convainquent. Par définition, il existe moins d’électeurs isolés du Front de Gauche que pour les autres candidats. Les sondages sont incapables de rendre compte d’un tel phénomène.

Mon interprétation du sondage réalisé à Aubagne (et qui donne Mélenchon en tête) est que la taille de l’échantillon (la même que pour les sondages nationaux) corrige partiellement ces deux phénomènes ; pour reprendre l’exemple évoqué plus haut, il y a beaucoup de chances de tomber sur des électeurs appartenant à un même groupe de gens qui se connaissent et les populations marginales sont mieux représentées : s’il y a les mêmes 30 personnes « catégorisées à droite » sur l’échantillon d’Aubagne, alors il y a moins de doutes quant à la validité de leur choix.

Des électeurs pourraient ne pas oser aller au bout de leur choix en raison de sondages qui ne placent pas le Front de Gauche parmi les deux candidats en tête. Pour qu’il y ait « place au peuple », faites donc circuler ce texte !