<C²: webløg />

Courriel - email address

Avatar Denis

samedi 13 mars 2004
par Denis Boudreau

Mangeur de cigogne : exploit de sémantique

Voilà un moment que j'ai envie de vous parler un peu du concours "mangeur de cigogne", visant à démontrer l'intérêt et surtout l'efficacité d'une bonne sémantisation HTML dans un processus d'indexation réussie auprès des principaux moteurs de recherche. Vous avez certainement vu passer plusieurs signatures de courriel des copains portant la mention "Mangeur de Cigogne" où encore, vous êtes tombés sur un site Web qui parlait de mangeur de cigogne.

Je vous le donne dans le mille si vous êtes un peu perdus, c'est évidemment un concours où il n'est pas plus question de mangeurs que de cigognes, mais qui porte tout de même fièrement le titre mangeur de cigogne. Ça me rapelle l'excellent roman de Boris Vian intitulé "L'automne à Pékin" où il n'était nullement question ni d'automne, ni de Pékin. Sauf qu'ici, dois-je vous le rappeler, outre l'absurdité apparente on parle plutôt de mangeurs et de cigognes...

Est-ce à dire que les mangeurs de cigogne, c'est un peu comme du Boris Vian en moins drôle mais en plus pratique  ? Je n'ose me prononcer... mais ce qui est clair, c'est que nous avons la preuve concrète que la sémantisation d'une page HTML est le meilleur moyen de s'assurer une place privilégiée auprès du moteur de recherche de plus populaire au monde. Comment expliquer autrement que le mangeur de cigogne d'Éric Daspet soit le premier en liste sur Goggle, avec rien de plus que du texte formatté en HTML ?

Denis Boudreau | 2004.03.13 @ 13:48

Alors, qu'en pensez-vous ?

Voici ce que vous aviez à en dire... vos impressions, recueillies à vif.

2004.03.13 @ 15:01 par mauriz

Google va finir par croire que tu cherches à le tromper avec autant de liens ;-) .
Enfin bon, avec un PageRank de 6/10, Google doit te faire confiance!

Haut retour au début de la page

2004.03.13 @ 15:50 par Sylvain Lelièvre

'nous avons la preuve concrète que la sémantisation d'une page HTML est le meilleur moyen de s'assurer une place privilégiée auprès du moteur de recherche de plus poupualire au monde'

mmh... oui et non. D'accord pour dire que la sémantisation aide beaucoup pour le positionnement dans Google, mais pas d'accord pour dire que mangeur-de-cigogne.info en est une preuve.
Beaucoup de blogueurs à forte audience comme toi ou Tristan font un lien vers la page, dans la liste pompeurs-css il y en a plusieurs qui mettent un lien vers la page, etc. Finalement c'est plus un Google Bombing qu'autre chose, et je crois que le positionnement est plutôt dû à ce bombing qu'à la sémantisation, même si cette dernière aide.

Haut retour au début de la page

2004.03.13 @ 16:15 par Igor

A propos de l'indexation de Google, quelqu'un à t-il un lien qui dévoile un peu plus le processus d'indexation du moteur mis à part la prédominance du page rank comme l'indique google lui-même. Car le résultat du concours actuel me semble moi aussi plus proche du google bombing que de l'exploit sémantique.

Haut retour au début de la page

2004.03.13 @ 17:07 par Eric Daspet

Je comprend la réaction (pourquoi parler de sémantique alors que le critère principal pour Google est le nombre de liens entrants ?).

Je vous prépare un texte rapidement sur le sujet (le temps que mes collègues qui gèrent le site avec moi fasse la relecture et ajoutent leurs commentaires).

Pour répondre tout de même rapidement : Oui, sans les liens nous ne serions même pas en première page (contenu valide et sémantique ou pas). Oui, avec tous ces liens nous serions probablement en première page (mais pas forcément en première position) même avec une contenu horriblement mal fait. Ceci dit non, le billet de Denis n'est pas forcément hors contexte.

Si vous attendez mon texte, il répondra probablement à une partie de votre question (l'autre sera probablement remplie par Denis lui-même).

Haut retour au début de la page

2004.03.13 @ 18:34 par Denis

Je confirme, je ne suis pas forcément hors contexte ; le roman de Boris Vian était extraordinaire. Pour le reste par contre, je vous laisse libres de décider. ;)

Haut retour au début de la page

2004.03.13 @ 22:23 par jipi

Juste une petite précision :

La répétition de lien pointant sur une même page est inutile, y sont pas trop cons chez google :)

J'attends avec impatience l'article d'eric, parce que je trouve aussi que le truc aurait été infiniment plus intéressant en interdisant justement de jouer sur le page rank, parceque là n'importe quel spam intelligemment mené, et ya des techniques redoutables pour ça, sera gagnant...

Haut retour au début de la page

2004.03.14 @ 21:58 par Jean

Pour en savoir plus sur google : http://www.webrankinfo.com/

Haut retour au début de la page

2004.03.15 @ 11:47 par Monique

Bonjour,

> plus intéressant en interdisant justement de jouer sur le page rank

Le PR est indissociable des résultats de Google, pourtant, il ne semble pas toujours avoir le rôle primordial qu'on lui attribue le plus souvent.
Ceci est juste un petit retour d'expérience récente :
- le 23 février au soir, je mets en ligne une page de photos sur le FOSDEM (dans un sous répertoire de mon site principal, sans lien depuis ni vers ce site)
- le 24 février, la page est affichée par Google avec la recherche 'fosdem 2004 photos' (nombreuses visites listées dans mes stats)
- les jours suivants, je complète la page et j'ai quelques liens depuis d'autres sites
- début mars, cette page est introuvable sur Google
- le 11 mars, je retrouve des visites depuis Google dans mes stats
- depuis, ma page est en 1ere position pour cette recherche mais elle a un PR=0 et aucune page liée (même constatation pour les résultats suivants)
- la 1ere page avec PR=6 et 10 pages liées est en 8e position (c'est le site du FOSDEM)

Amicalement,
Monique

Haut retour au début de la page

2004.03.15 @ 12:01 par Monique

J'ai oublié de dire :
- le code est valide
- la sémantique est partiellement respectée, elle devrait être améliorée... mais c'est ma 1ere création avec Nvu ;-)

Amicalement,
Monique

Haut retour au début de la page

2004.03.17 @ 13:47 par Eric Daspet

Pour Jipi et les autres (car la remarque est loin d'être stupide), j'ai rédigé un petit texte sur http://mangeur-de-cigogne...

Il devrait répondre à quelques questions pour expliquer notre position sur la promotion de la sémantique dans ce concours.

Haut retour au début de la page

2004.03.18 @ 18:05 par moi

La démonstration de la supériorité de la sémantique ne se fera pas avec des pages cloakées, des URL rewritées et le Google Bombing des petits copains en prime.
Par contre, le côté sectaire et allumé des mecs qui radotent sur les standards, ça c'est démontré !

Haut retour au début de la page

2004.03.20 @ 17:26 par seb

En fait ce concours est surtout un concours de spam. Le contenu de la page html est pris en compte certes, mais c'est un critere mineur par rapport à la popularité

Haut retour au début de la page

2004.03.24 @ 07:23 par Un mangeur de cigogne

Je pense que la popularité (le pr) aura de moins en moins d'influence dans le futur car trop facilement traficable.

Par contre une page valide est un gage de sérieux du webmaster.

Haut retour au début de la page

2004.03.26 @ 21:58 par thick

De mon côté, ma page de mangeur de cigogne est validé W3C en XHTML 1.0 et ça m'a pas empêché de faire le yoyo depuis le début du concours.

En plus, je n'ai pas vraiment le temps de collectionner les backlinks, mais par contre j'ai fait un essai en forçant sur la densité et Google n'a pas l'air de se vexer...pour l'instant.
Par contre, je sais pas trop où se situe la limite sur ce sujet (la densité des mots clefs sur la page).

Haut retour au début de la page

2004.03.27 @ 00:23 par Denis

Selon ce que m'a confirmé un spécialiste du référencement cette semaine, Google permet une densité pouvant aller jusqu'à 20% dans une même page. C'est donc dire que des mots comme 'mangeurs-de-cigogne' pourraient occuper jusqu'à un mot sur 5 avant que Google ne décide de vous brûler sous accusations de spamming. Ça peut faire beaucoup de mangeurs et de cigogne dans un même document. Pour les autres moteurs de recherche importants, le niveau de densité varie entre 5% et 15% environ. Évidemment, ces chiffres n'ont absolment rien de scientifiques.

Haut retour au début de la page

2004.03.27 @ 02:44 par thick

Ouch !

Je suis à 40% dans le corps de la page, 50% dans title, 50% dans les META et 42% en global.

Faut-il que je dilue tout ça ? J'ai peut-être poussé le bouchon un peu loin???
En tout cas, pas de blacklistage pour l'instant

Haut retour au début de la page

2004.05.26 @ 16:02 par franck

je peux annoncer un nouveau concours auquel je participe qui vise à placer le mot 'oupouaout'

le webmaster de http://www.oupouaout.biz

Haut retour au début de la page

Les commentaires et trackbacks sont désormais fermés. Pour toute remarque, vous pouvez toujours nous contacter.

Pisteur (Trackback)