géographie des élections présidentielles

Publié le par Olivier Bouba-Olga

Baptiste Coulmont s'amuse à faire quelques cartes sous R, en mobilisant des données sur les résultats du premier tour des élections présidentielles 2007. Comme il a mis à disposition les données mobilisées, je me suis moi-même amusé à faire quelques calculs statistiques.

 

A partir des données disponibles, j'ai calculé ce que l'on peut appeler un indice de spécificité pour chaque candidat/département. Prenons l'exemple du département de la Vienne et de la candidate Ségolène Royal (SR). J'ai rapporté la part des votes obtenus par SR dans la Vienne à la part des votes obtenus par SR France entière. J'obtiens un indice de 1,15 : le score de Ségolène dans ce département est 1,15 fois celui obtenu en moyenne France entière.

 

Après avoir calculé ces indices pour tous les candidats, je cherche à savoir si l'on observe des corrélations entre candidats. J'ai donc construit une matrice des corrélations, reprise ci-dessous. Si le coefficient est positif, les deux candidats concernés sont surreprésentés dans les mêmes départements. Plus le coefficient est proche de 1, plus la relation est forte. S'il est négatif, cela signifie que là où le premier candidat est surreprésenté, le deuxième est sous-représenté, et inversement. Plus le coefficient est proche de -1, plus cette relation est forte. J'ai surligné en jaune les coefficients supérieurs à 0,5 (et inférieur à -0,5), histoire d'insister sur les relations les plus significatives.

  besancenot buffet schivardi bayrou bove voynet
besancenot 1,00




buffet 0,32 1,00



schivardi 0,13 0,26 1,00


bayrou -0,27 -0,42 -0,25 1,00

bove 0,06 0,07 0,43 0,12 1,00
voynet -0,19 -0,51 -0,35 0,49 0,10 1,00
devilliers 0,08 -0,31 -0,08 0,07 -0,18 0,10
royal 0,16 0,38 0,26 0,10 0,24 -0,22
nihous 0,42 0,21 0,31 -0,13 0,36 -0,41
lepen 0,26 0,06 0,11 -0,72 -0,14 -0,22
laguiller 0,82 0,06 -0,06 -0,34 -0,25 -0,15
sarkozy -0,64 -0,35 -0,35 -0,11 -0,37 0,19







  devilliers royal nihous lepen laguiller sarkozy
besancenot





buffet





schivardi





bayrou





bove





voynet





devilliers 1,00




royal -0,22 1,00



nihous 0,16 0,14 1,00


lepen -0,06 -0,59 0,02 1,00

laguiller 0,15 -0,18 0,26 0,50 1,00
sarkozy -0,05 -0,72 -0,46 0,26 -0,30 1,00

 

On notera notamment la relation positive laguiller/lepen, ou encore la relation négative voynet/buffet. Les oppositions les plus fortes concernent royal/sarkozy, d'une part, bayrou/lepen, d'autre part. Meilleure complémentarité : laguiller/besancenot.

Bon, il y aurait d'autres choses rigolotes à faire, une analyse factorielle et/ou une classification hiérarchique par exemple... J'essaie de vous proposer ça prochainement!

Publié dans Politique

Commenter cet article

Pierre Maura 21/09/2010 20:16



Intéressant. Il faudrait pouvoir faire de même avec les récents résultats des législatives suédoises. Cela permettrait à l'éditorialiste du Monde de répondre à la question qu'il pose ce soir
: y a-t-il un lien entre la baisse historique de la social-démocratie suédoise et la percée tout aussi historique de l'extrême droite ?



Pierre 20/09/2010 09:50



Ca sert à quelque chose de calculer un indice de spécificité avant de calculer la matrice de variance-covariance? Je crois bien que la matrice de variance-covariance serait exactement la même sur
données brutes.



Olivier Bouba-Olga 21/09/2010 07:14



Les données brutes portent sur les suffrages par candidat, les résultats ne seraient pas les mêmes. En revanche, sur les pourcentages de voix, si. Mais
j'ai commencé par regarder les indices de spécificité, puis j'ai testé les corrélations sur ces indices plutôt que de recalculer les % des candidats.



michel 19/09/2010 14:43


Excusez-moi, mais je n'ai pas tout compris... Votre formule semblerait indiquer qu'il y a des départements qui votent plus à gauche que les autres, et d'autres qui votent plus à droite !
Incroyable, non ? :-)


OBO 21/09/2010 07:15



Relisez les résultats, vous verrez qu'on apprend un peu plus que cela.



Baptiste C. 19/09/2010 11:11



J'ai écrit trop vite, le CIDSP, la banque de données socio-politiques, semble disposer des résultats au niveau communal. 


On en trouve trace, par exemple, ici http://cybergeo.revues.org/index4269.html


 



Baptiste C. 19/09/2010 11:09



Je trouve dommage qu'il soit si difficile de trouver des données moins agrégées (au niveau de la commune, par exemple, ou même du bureau de vote). Ces données doivent exister quelque part, mais
le ministère de l'intérieur ne les publie pas. 


N'importe quel ordinateur, maintenant, peut traiter ces grandes bases de données, mais je ne suis pas sur que les partis politiques cherchent à en savoir plus. Il doit y avoir un ou deux
spécialistes de la carte électorale par parti, mais savent-ils faire une régression ou une C.A.H. ?