Politique

Le Pen, les sondages et la présidentielle

Maître de conférences en science politique, Conseiller statistique

Le débat à propos de la présidentielle de 2022 est actuellement verrouillé par une avalanche de sondages prophétisant une élection cadenassée par les très bons scores de Marine Le Pen. Il est certes probable que la candidate du RN se situe aujourd’hui à des niveaux d’intention de vote élevés. Mais cette lecture emphatique de la réalité du FN/RN, constante du traitement médiatique du parti, masque l’ensemble des opérations de mesure qui donnent toutes les raisons de rester circonspect à l’égard des résultats publiés. La croyance dans la capacité véridictoire des sondages a atteint un tel niveau que l’on confond désormais le plus souvent réalité mesurée par les instituts et réalité politique.

Et c’est reparti pour un tour. À un an de l’échéance présidentielle de 2022, les médias bruissent déjà de résultats de sondages annonçant Marine Le Pen première au premier tour avec 25 à 28 % d’intentions de vote (selon les hypothèses de candidature testées), et au « coude-à-coude » avec Emmanuel Macron au second (44 % à 47 % au second tour contre 56 % à 53 %) [1]. Ainsi, comme avant chaque scrutin, la machine à spéculer sur les scores du Front National/Rassemblement National ou de ses candidats s’est remise en marche, générant, comme à chaque fois, un inévitable buzz. On peut cependant douter de la valeur de ces estimations, pour au moins trois raisons.

publicité

La première, la plus évidente, réside dans le caractère virtuel du rapport de forces qu’enregistrent les enquêtes qui sont réalisées actuellement. Virtuel car on demande aux personnes interrogées de se prononcer sur une élection qui aura lieu dans douze mois (et non « dimanche prochain », comme formulé dans la question qui leur est posée), et alors qu’interviendront entre temps les élections régionales [2]. Virtuel car la plupart des candidats testés dans les enquêtes ne sont même pas encore déclarés. Virtuel car à ce stade, les répondants sont encore en grande majorité indécis, qu’il s’agisse de leur éventuelle participation à l’élection ou de leur choix politique. On ne peut même pas dire que le sondage offre ici une « photographie de l’opinion », comme aiment à le répéter certains commentateurs, puisque cette opinion est en l’occurrence purement et simplement fabriquée : elle est artefactuelle.

La deuxième tient à la fragilité du caractère représentatif des échantillons sondagiers. Au niveau sociodémographique, les échantillons « bruts » recueillis à l’issue des phases d’enquête présentent en général un nombre toujours moins important d’ouvriers, de salariés et de personnes non diplômées, et un nombre toujours plus important de cadres et de professions intellectuelles que dans la population globale. Au niveau politique, l’abstentionnisme et le vote pour l’extrême droite sont le plus souvent sous-déclarés, tandis que le vote pour la gauche et le centre est sur-déclaré. De fait, les individus peu intéressés par la politique, qui ne se sentent pas socialement compétents pour affronter des questions d’ordre politique ou considèrent leurs pratiques ou orientations politiques comme illégitimes sont toujours moins nombreux que les autres à répondre à des sondages électoraux.

Mais d’autres problèmes se posent encore. Aujourd’hui, la très grande majorité des enquêtes se font en ligne. Or 12 % des Français de 15 ans et plus ne disposent d’aucun accès à Internet (53 % des plus de 75 ans, 34 % des personnes peu ou pas diplômées et 16 % des ménages les plus modestes selon l’INSEE). 16 % de la population française âgée de 18 ans et plus ne se connectent par ailleurs jamais à internet, tandis que 12 % en ont un usage distant (soit près de 14 millions d’individus au total). Les personnes qui répondent aux enquêtes sont donc avant tout des personnes connectées, qui ne sont pas forcément représentatives de celles qui ne le sont pas.

Enfin, pour s’assurer un nombre de répondants suffisants, certains instituts offrent des gratifications sous forme de points monnayables, attirant autant de personnes qui seront toujours moins intéressées par le fait de répondre aux questions de sondages pour donner leur « opinion » que pour cumuler ces points. Ils ne sauraient donc être « représentatifs ».

La troisième raison réside dans les opérations dites de « redressement » qui sont réalisées pour corriger les problèmes de représentativité des échantillons « bruts » et les faire se rapprocher de la composition sociodémographique et politique de la population globale. Si l’opération semble simple en principe – on augmente ou on diminue le poids des catégories sous- ou sur-représentées (ce qui va aussi modifier le poids de leurs réponses) – elle s’avère statistiquement complexe et ne doit pas produire de déformation excessive de l’échantillon : dès lors qu’on modifie le poids d’une variable, on modifie celui des autres. Plus l’échantillon a été constitué avec soin, plus les variables sont fines et tiennent compte des caractéristiques de la population (y compris la manière dont elle se distribue localement), et plus cette opération est recevable.

Il est possible de faire dire à peu près tout et n’importe quoi à un sondage, voire une chose et son contraire.

Le problème, c’est que les instituts recourent aujourd’hui à des variables bien trop grossières (par exemple, dans l’enquête Harris Interactive annonçant en janvier 2021 Marine Le Pen première au premier tour de la présidentielle, la catégorie socioprofessionnelle des interviewés est découpée en seulement trois catégories : CSP+, CSP- et inactifs [3]) et pas forcément bien liées au sujet de l’étude. Par ailleurs, ces variables sont contrôlées seulement à l’échelon national et sans tenir compte précisément de leurs interrelations.

Enfin, on ignore concrètement la nature des redressements auxquels procèdent les instituts. Depuis la loi du 25 avril 2016, les instituts sont certes tenus de mentionner, « s’il y a lieu », les critères de redressement des résultats bruts dans les notices techniques qu’ils doivent déposer sur le site Internet de la Commission des sondages. Mais en général, ces critères ne sont pas détaillés. Seules sont communiquées, sans systématicité, les données relatives aux variables constituant les quotas permettant de saisir l’écart entre la composition sociodémographique de l’échantillon brut et celle de l’échantillon redressé.

En ce qui concerne la composition politique de l’échantillon, les données sont généralement manquantes et ne concernent que les précédents scrutins : on demande en effet aux personnes interrogées ce qu’elles ont voté lors d’une élection antérieure (pour peu qu’elles s’en souviennent, la mémoire du vote étant très fragile) afin d’évaluer l’écart entre les intentions de vote déclarées et les résultats effectifs, ce qui est censé donner une idée de l’ampleur de la correction à apporter aux résultats bruts de l’enquête en cours.

Pour les sondages parus au cours de ces derniers mois, c’est le vote pour le premier tour de la présidentielle de 2017 qui sert de variable de calage. Or, concernant Marine Le Pen, les intentions de vote déclarées varient en général entre 15 et 21 %, alors qu’elle a obtenu 21,3 % des voix. Comment vont être redressés les résultats bruts d’intention de vote ? Le résultat finalement publié correspond-il strictement au produit des opérations de redressement ou fait-il encore l’objet d’ajustements ultérieurs [4] ? On ne le saura pas. Secret de fabrication, répondent en général les responsables d’instituts [5]. Ou peut-être volonté de déguiser des méthodes comportant aussi une part de « pifomètre », comme a pu le reconnaitre le fondateur de la Sofres, Pierre Weill, dans un curieux élan de sincérité. Car comment redresser précisément des intentions de vote quand on n’a aucune indication fiable sur les rapports de force politique au sein de la population, en dehors des élections passées ?

On comprend dès lors un peu mieux pourquoi les instituts peinent autant à fournir des estimations correctes des intentions de vote pour le FN/RN et ses candidats. Dans un ouvrage remarquable sur les sondages, Patrick Lehingue estimait qu’entre 1984 et 2006, le FN ou son ancien leader, Jean-Marie Le Pen, n’avaient été correctement estimés que dans moins d’un cas sur deux [6] ! Depuis lors, rien ne semble avoir changé. Ainsi, en mars 2011, un sondage Harris Interactive donne Marine Le Pen première au premier tour de l’élection présidentielle de 2012 [7] ; elle finit troisième. En mai 2014, les listes FN aux élections européennes sont créditées d’intentions de vote allant de 21 % (LH2) à 26,1 % (YouGov) [8] ; elles recueillent finalement 25 %. En mars 2015, l’institut Odoxa estime à 33 % les intentions de vote pour les binômes frontistes aux élections départementales [9], soit 8 points de plus que le résultat finalement obtenu (25 %). En décembre 2015, Ipsos affirme que le FN est « en mesure de remporter trois régions » pour les élections régionales [10] ; il n’en obtient aucune. En vue du deuxième tour de l’élection présidentielle de 2017, l’institut Kantar accorde 41 % d’intentions de vote à Marine Le Pen [11] : elle recueille finalement 33,9 % des suffrages.

Par le passé, de telles approximations ont pu s’avérer coûteuses pour les instituts de sondages, en constituant une bien mauvaise publicité dans leur quête pour décrocher d’autres contrats (les enquêtes d’opinion relayées par les médias leur servant avant tout de vitrine). Mais au vu de la progression exponentielle du simple nombre de sondages produits à l’occasion des campagnes présidentielles (111 en 1981, 560 en 2017), on comprend aisément que ces effets négatifs n’ont été que de faible portée sur le long terme.

S’en tenir à de seules estimations d’intentions de vote pour ériger le RN au rang de « premier parti » d’une classe d’âge est bien sûr insuffisant.

Aujourd’hui, ces imprécisions devraient au moins conduire à une certaine prudence dans l’interprétation des résultats des enquêtes. Mais la croyance dans la capacité véridictoire des sondages a atteint un tel niveau que l’on confond désormais le plus souvent réalité mesurée par les instituts et réalité politique – sans doute parce que la production sondagière n’est aujourd’hui quasiment plus remise en question. Et pour cause, lorsqu’ils sont publiés dans les médias, les résultats des enquêtes sont le plus souvent soit repris tels quels des rapports mis en ligne par les instituts (qui sont généralement précédés de synthèses immédiatement utilisables par les journalistes), soit directement commentés par ceux qui les fabriquent. Ils s’imposent donc d’autant plus aisément comme une évidence, alors même qu’ils prêtent généralement à discussion.

Prenons quelques exemples. Dans un article récent du Point, on pouvait lire que « plus d’un Français sur trois (36 %) affirme qu’il votera “probablement” pour Marine Le Pen » à l’élection présidentielle de 2022. Sauf que ce score est le produit de l’addition de deux des quatre réponses proposées (ou plutôt imposées) aux personnes interrogées. Or ces deux réponses ne sont en rien additionnables : les 17 % de personnes qui ont répondu qu’il était « tout à fait probable » qu’elles votent Marine Le Pen ne sont en effet pas les mêmes que les 19 % de personnes qui ont répondu qu’il était « plutôt probable » qu’elles votent Marine Le Pen. Dans tous les cas, leurs réponses ne sauraient être agrégées dans une réponse moyenne leur conférant une même « probabilité » de vote (17 % +19 % = 36 %).

On aura cependant compris ici l’intérêt éditorial de produire l’idée que plus d’un tiers des « Français » envisageraient de voter Marine Le Pen. Cette lecture emphatique de la réalité du FN/RN est un constante du traitement médiatique du parti et permet d’en augmenter la rentabilité – comme nous avons pu le démontrer dans de précédentes de publications [12]. Ainsi, dernièrement, le RN a pu être présenté dans un article du Monde comme le « premier parti de la génération des 25-34 ans » car Marine Le Pen recueillerait 29 % de leurs intentions de vote [13]. Mais s’en tenir à de seules estimations d’intentions de vote pour ériger le RN au rang de « premier parti » de cette classe d’âge est bien sûr insuffisant. Encore conviendrait-il de prendre en compte d’autres indicateurs que sondagiers, à commencer par les niveaux d’adhésion partisane, qu’il est cependant impossible de connaître avec précision. Bien plus, ce ne sont pas 29 % des « 25-34 ans » qui ont l’intention de voter Marine Le Pen, mais 29 % des votants de cette tranche d’âge, soit 20 % des inscrits (si l’on tient compte d’un taux de participation en 2022 équivalent à celui de la présidentielle de 2017, pour laquelle environ 30 % des 25-34 ans s’étaient abstenus). La confusion qui est entretenue ici laisse ainsi entendre qu’un tiers des personnes appartenant à cette tranche d’âge, présentée en outre de manière homogénéisée comme une « génération », s’apprêterait à soutenir la candidate du RN en 2022.

Il faut enfin garder en tête qu’il est possible de faire dire à peu près tout et n’importe quoi à un sondage, voire une chose et son contraire. Tout dépend de l’ordre des questions, de leur formulation et du choix des mots. Là encore, les enquêtes menées sur le FN/RN et sur sa présidente en offrent une belle illustration.

L’institut Kantar (anciennement TNS Sofres) réalise chaque année un « baromètre d’image du FN/RN » – baromètre qui, à notre connaissance, n’a d’équivalent pour aucun autre parti en France. Dans cette enquête, et depuis 2013, l’image de Marine Le Pen est évaluée à l’aide d’un ensemble de « qualificatifs » dont on demande aux personnes interrogées s’ils s’appliquent « très bien », « assez bien », « assez mal », « très mal » à l’image qu’ils ont de la présidente du RN. Dans le rapport mis en ligne par l’institut, les résultats sont ramenés à deux sous-totaux : « s’applique bien » et « s’applique mal ».

Laissons de côté le problème déjà mentionné de cumul improbable de réponses distinctes. Dans l’édition 2020 de ce baromètre [14], comme dans les précédentes, les cinq qualificatifs proposés renvoient tous à des traits d’image positifs, limitant de facto les possibilités d’émettre une appréciation négative mais aussi sa portée. Marine Le Pen apparaît ainsi d’abord « volontaire » (68 % des personnes interrogées considèrent que ce qualificatif « s’applique bien » à l’image de la présidente du FN) et « capable de prendre des décisions » (51 %). Notons par ailleurs que ces deux items sont proposés en tête de liste des qualificatifs testés.

Il se trouve que depuis 2016, l’institut Elabe propose également des enquêtes régulières sur l’image de Marine Le Pen, avec certes une majorité de qualificatifs positifs mais aussi deux qualificatifs négatifs : « autoritaire » et « arrogante ». Or, ce sont ces deux qualificatifs qui remportent le plus de suffrages (peut-être aussi parce qu’ils sont également positionnés en premier dans la liste testée). Ainsi, dans l’enquête réalisée en mars 2021 [15], respectivement 79 % et 65 % des personnes interrogées considèrent que ces deux qualificatifs s’appliquent bien à Marine Le Pen.

En somme, « l’image » de la présidente du RN dépend en grande partie de la liste et de la tonalité (positive ou négative) des qualificatifs retenus dans le questionnaire, et de l’interprétation qu’on va leur conférer, comme dans cet article déjà cité du journal Le Point, commentant les résultats de l’enquête Elabe : « Vue comme “autoritaire” (pour 79 % des personnes interrogées) ou “arrogante” (65 %), pas vraiment “sincère” (37 %), “rassurante” (29 %) ou comme ayant les “qualités nécessaires pour être présidente de la République”, la fille de Jean-Marie Le Pen a plusieurs qualités aux yeux des Français. »

Il est probable que Marine Le Pen se situe aujourd’hui à des niveaux d’intention de vote élevés. Nombre de scrutins au cours de ces dernières années (européennes de 2014, départementales de 2015, régionales de 2015, européennes de 2019) ont placé les listes ou les candidats du FN/RN en tête des suffrages exprimés au premier tour. Lors de la présidentielle de 2017, jamais un candidat du FN/RN n’avait réuni autant de voix, au premier comme second tour.

La grande question est de savoir à quel niveau se situe réellement Marine Le Pen aujourd’hui. Mais à cette question, les instituts de sondages peinent à répondre autrement que par des estimations imprécises, qui ont le tort d’être trop souvent considérées comme s’il s’agissait d’indications fiables. On a pourtant toutes les raisons de rester circonspect à l’égard des résultats des enquêtes publiées récemment, tout comme à l’égard des sondages qui ne manqueront pas de donner lieu, dans les prochains mois, à d’interminables spéculations sur l’ampleur supposée du vote mariniste. Au risque de voir se rejouer, une énième fois, la même prophétie auto-réalisatrice, forme de confiscation ou plutôt d’enfermement du débat électoral.


[1] Sondage Harris Interactive pour L’Opinion, réalisé en ligne du 2 au 4 mars 2021. Sondage Ipsos-Sopra Steria pour L’Obs et Franceinfo, réalisé en ligne les 27 et 28 janvier 2021. Sondage IFOP pour Marianne, réalisé en ligne du 5 au 11 mars 2021.

[2] Dans les sondages, la tenue de ce scrutin est complètement ignorée, comme si les résultats des régionales ne devaient en aucun cas participer de la définition des rapports de force à venir dans la campagne pour la présidentielle de 2022.

[3] Sondage Harris Interactive pour L’Opinion et CommStrat, réalisé en ligne, les 19 et 20 janvier 2021.

[4] Comme le laisse à penser Patrick Lehingue, Subunda. Coups de sonde dans l’océan des sondages ?, Éditions du Croquant, 2007, p. 119.

[5] Voir sur ce point le paragraphe II.A.6. du rapport de Hugues Portelli et Jean-Pierre Sueur, « Sondages et démocratie : pour une législation plus respectueuse de la sincérité du débat politique », Rapport d’information du Sénat n° 54, déposé le 20 octobre 2010.

[6] Mésestimations que Patrick Lehingue assigne à trois facteurs : la sous-déclaration du vote frontiste, « socialement indicible parce que perçu comme moralement blâmable ou répréhensible » ; la sous-représentation des personnes peu ou non diplômées dans les échantillons des enquêtes, parmi lesquelles la probabilité de voter pour le FN est élevée ; l’instabilité de l’électorat du FN, qui se renouvelle pour près de moitié d’une élection sur l’autre. Voir Patrick Lehingue, Subunda, op.cit., p. 119-122.

[7] Sondage Harris Interactive pour Le Parisien, réalisé en ligne du 28 février au 3 mars 2011, puis les 5 et 6 mars 2011.

[8] Voir le tableau récapitulatif précieux proposé par le site sondages en France.

[9] Sondage Odoxa pour Le Parisien, réalisé en ligne les 26 et 27 février 2015.

[10] Sondage Ipsos/Sopra Steria pour le CEVIPOF et Le Monde, réalisé en ligne du 20 au 29 novembre 2015.

[11] Sondage Kantar Sofres Onepoint pour LCI et Le Figaro, réalisé en ligne du 28 au 30 avril 2017.

[12] Voir Alexandre Dézé, « La construction médiatique de la “nouveauté” FN », dans Sylvain Crépon, Alexandre Dézé, Nonna Mayer (dir.), Les Faux-semblants du Front national. Sociologie d’un parti politique, Presses de Sciences Po, 2015, p. 453-504.

[13] Les données sondagières proviennent des instituts Ipsos et Ifop, sans autre précision communiquée dans l’article.

[14] Sondage Kantar Onepoint pour France Info et Le Monde, réalisé en face-à-face du 27 février au 2 mars 2020.

[15] Sondage Elabe pour BFM-TV, réalisé en ligne les 9 et 10 mars 2021.

Alexandre Dézé

Maître de conférences en science politique

Christian Barrault

Conseiller statistique

Notes

[1] Sondage Harris Interactive pour L’Opinion, réalisé en ligne du 2 au 4 mars 2021. Sondage Ipsos-Sopra Steria pour L’Obs et Franceinfo, réalisé en ligne les 27 et 28 janvier 2021. Sondage IFOP pour Marianne, réalisé en ligne du 5 au 11 mars 2021.

[2] Dans les sondages, la tenue de ce scrutin est complètement ignorée, comme si les résultats des régionales ne devaient en aucun cas participer de la définition des rapports de force à venir dans la campagne pour la présidentielle de 2022.

[3] Sondage Harris Interactive pour L’Opinion et CommStrat, réalisé en ligne, les 19 et 20 janvier 2021.

[4] Comme le laisse à penser Patrick Lehingue, Subunda. Coups de sonde dans l’océan des sondages ?, Éditions du Croquant, 2007, p. 119.

[5] Voir sur ce point le paragraphe II.A.6. du rapport de Hugues Portelli et Jean-Pierre Sueur, « Sondages et démocratie : pour une législation plus respectueuse de la sincérité du débat politique », Rapport d’information du Sénat n° 54, déposé le 20 octobre 2010.

[6] Mésestimations que Patrick Lehingue assigne à trois facteurs : la sous-déclaration du vote frontiste, « socialement indicible parce que perçu comme moralement blâmable ou répréhensible » ; la sous-représentation des personnes peu ou non diplômées dans les échantillons des enquêtes, parmi lesquelles la probabilité de voter pour le FN est élevée ; l’instabilité de l’électorat du FN, qui se renouvelle pour près de moitié d’une élection sur l’autre. Voir Patrick Lehingue, Subunda, op.cit., p. 119-122.

[7] Sondage Harris Interactive pour Le Parisien, réalisé en ligne du 28 février au 3 mars 2011, puis les 5 et 6 mars 2011.

[8] Voir le tableau récapitulatif précieux proposé par le site sondages en France.

[9] Sondage Odoxa pour Le Parisien, réalisé en ligne les 26 et 27 février 2015.

[10] Sondage Ipsos/Sopra Steria pour le CEVIPOF et Le Monde, réalisé en ligne du 20 au 29 novembre 2015.

[11] Sondage Kantar Sofres Onepoint pour LCI et Le Figaro, réalisé en ligne du 28 au 30 avril 2017.

[12] Voir Alexandre Dézé, « La construction médiatique de la “nouveauté” FN », dans Sylvain Crépon, Alexandre Dézé, Nonna Mayer (dir.), Les Faux-semblants du Front national. Sociologie d’un parti politique, Presses de Sciences Po, 2015, p. 453-504.

[13] Les données sondagières proviennent des instituts Ipsos et Ifop, sans autre précision communiquée dans l’article.

[14] Sondage Kantar Onepoint pour France Info et Le Monde, réalisé en face-à-face du 27 février au 2 mars 2020.

[15] Sondage Elabe pour BFM-TV, réalisé en ligne les 9 et 10 mars 2021.