Où sont passés les programmes économiques des candidats? épisode 2

Publié le par Olivier Bouba-Olga

Retour sur un billet vieux d'une semaine : dimanche dernier, j'ai tapé quelques requêtes sous Google, histoire de voir si on trouvait souvent dans les pages consacrées à Bayrou, Royal et Sarkozy, les termes "programme économique". Petit billet sans conséquence, qui ne brille pas par sa profondeur d'analyse... d'où ma surprise de le trouver sur le site du Monde (en bas à droite, dans la rubrique "Vu sur le web"). Devant le succès rencontré (400 visiteurs du Monde sont venus se perdre ici durant la semaine pour lire ce billet), et comme on est dimanche, je récidive...

Cette fois, j'ai réduis les requêtes au couple infernal Ségolène Royal/Nicolas Sarkozy. J'ai tapé plusieurs mots clés, dont certains suggérés en commentaire du précédent billet. A chaque fois, j'associe le mot clé au nom d'un des deux candidats. Je divise le score par le nombre total de pages consacrées au candidat. Enfin, je divise le ratio ainsi calculé de Sarkozy par celui obtenu pour Royal : si l'indice obtenu est égal à 100, cela signifie que l'item se retrouve dans les mêmes proportions dans les pages Sarkozy que dans les pages Royal. S'il est supérieur à 100, on a surreprésentation chez Sarkozy. S'il est inférieur à 100, surreprésentation côté Royal. Résultats des courses :

item Ratio Sarkozy/Royal
démocratie participative 85
environnement 94
recherche 95
économie 101
culture 102
sécurité 110
démocratie 113
social 113
dette publique 124
programme économique 163
répression 181


Les items "démocratie participative" et "répression" m'ont servi de test. Résultats conformes aux attentes. On notera le bon score de Sarkozy sur les items social, dette publique et programme économique, et les bons scores de Royal sur les items Environnement et Recherche.

Avertissement pour les commentateurs ronchons : ce type d'exercice a tout un ensemble de limites. Si, par exemple, le score de l'item X associé au candidat Y est élevé, ce peut être parce que :
* Y en parle beaucoup
* les médias en parlent beaucoup (même si Y n'en parle pas beaucoup)
* les partisans de Y en parlent beaucoup (même si Y n'en parle pas beaucoup)
* les adversaires de Y en parlent beaucoup (pour dénoncer ce que Y en dit)
etc...

Ces stats ne mesurent donc pas ce que disent les candidats, mais les items associés fréquemment aux candidats, ce qui n'est pas sans intérêt, me semble-t-il (je fais du Magritte, en quelque sorte...). Et puis, de toute façon, on est dimanche, ca m'amuse, et ca permettra au Monde d'actualiser sa rubrique "Vu sur le Web"...

Publié dans Politique

Pour être informé des derniers articles, inscrivez vous :

Commenter cet article

lisette 05/02/2007 01:24

Jean Véronis a montré qu'il fallait prendre avec des pincettes les chiffres bruts sortis de google.... comme des autres moteurs de recherche : http://aixtal.blogspot.com/2005/01/web-google-perd-la-boole.html (par exemple)Il a développé des outils très intéressants, que l'on trouve à cette adresse : http://www.observatoire-presidentielle.fr/Je suis d'accord avec votre analyse : ces deux candidats sont présentés comme les favoris, donc quasiment tout commentaire sur la campagne utilise leur nom, que ce soit pour les louer ou pour les dénigrer. Il est difficile de savoir ce que ces chiffres veulent dire. Peut-être que c'est plus pertinent pour les autres candidats?

pas perdus 05/02/2007 00:14

SVP pas Le Monde, j'ai toujours peur de rencontrer Le Boucher !

PAC 04/02/2007 23:17

L'idée est intéressante, mais je me demande ce qu'on mesure exactement quand on fait ça. On regarde de quel thèmes les gens qui parlent de l'un ou l'autre des candidats parlent. Ça ne nous dit pas que ce thème est important pour les candidats. Ce qui me pose problème, c'est qu'on peut tout aussi bien parler d'un thème et d'un candidat pour dénoncer le programme ou l'absence de programme d'un candidat sur un sujet que le contraire. Par exemple, on peut imaginer que beaucoup de gens aient écrit des articles sur Ségolène Royal et sa proposition des 35 heures au collège pour les profs, mais ça ne nous dit pas grand chose sur l'importance de ce thème dans la campagne de Ségolène Royal. Si un candidat a une proposition claire et consensuelle sur une question, personne ne parlera de cette proposition sur le net. En revanche, si un candidat a une position controversée ou une position floue sur un sujet important, on risque de voir apparaître de nombreux commentaires. Je ne suis donc qu'à moitié convaincu par cet indicateur. Cela dit, l'idée de faire des mesures de ce type me plaît.Jean Véronis a déjà développé de petits outils amusants pour détecter le nombre d'occurence des mots. http://aixtal.blogspot.com/2007/01/presse-2007-nouvelle-fonction.htmlPersonnellement, je serais amusé de voir une vraie analyse lexicale des discours des candidats, avec la reconstitution de la proximité entre les mots, comme le font les sociologues sur Alceste ou d'autres logiciels du même type.