<C²: webløg />

Courriel - email address

Avatar Denis

jeudi 14 octobre 2004
par Denis Boudreau

Cracker le secret de Google

Croyez-le ou non, mais je suis sur le point de percer sous vos yeux ébahis un secret mieux gardé encore que celui de la Caramilk. Bon d'accord, j'exagère peut-être un brin, mais quand même... j'ai tellement vu de gens ces dernières années se questionner sur le sujet ou prétendre posséder des vérités à propos de Google, que le simple fait d'être allé à la source pour obtenir des réponses officielles vaut définitivement quelque chose.

Voyez-vous, j'assistais hier à une journée de conférences organisées par Infopresse, portant sur plusieurs aspects de la publicité interactive. Au menu, divers acteurs reconnus de l'industrie, tous réunis pour discuter de l'avenir de la pub sur le Web, mais aussi des enjeux reliés à celle-ci. Si j'y ai entendu beaucoup d'inepties (particulièrement pendant une table ronde mortellement ennuyante où pratiquement tous le participants se mangeaient dans les mains les uns des autres), il y a quand même de nombreuses idées fort stimulantes qui sont sorties de quelques-uns des conférenciers invités.

J'aurai bien l'occasion de revenir à ces belles idées un de ces quatre, mais pour le moment, je préfère vous entretenir sur la première conférence qui, à elle seule, a fait ma journée. Avouons-le, ce n'est quand même pas tous les jours que l'on a la chance de s'entretenir en chair et en os à Wendy Muller, Head of Google Canada.

Une occasion en or de fouiller plus en profondeur la question de l'importance de la rigueur sémantique HTML dans l'algorithme d'indexation du moteur de recherche le plus puissant au monde ? You bet! Alors, d'après vous, le respect des normes et de la sémantique HTML compte t-il pour des prunes pour Google ?

Sur différents forums, dont l'excellent Webmaster-Hub, il y a des légions de webmestres qui font des pieds et des mains pour percer à jour l'algorythme de Google et déterminer comment le tromper ou lui plaire suffisamment pour gagner des points de positionnement. Certains s'essaient à des combines doûteuses pour se démarquer et se font brûler, d'autres crient sur tous les toits que la sémantique HTML est cruciale et qu'un site bien codé performe mieux qu'un autre qui le serait moins.

Eric Daspet, dans la foulée du concours mangeur-de-cigogne, l'avait bien prouvé avant que plusieurs s'allient pour le déloger avec une campagne malhonnête de backlinks. Avec un site Web tout simple, mais où chaque élément HML utilisé était intelligemment et efficacement réfléchi, l'indexation avait été quasi instantanée. Le mangeur-de-cigogne d'Éric Daspet était au-delà de la compétition et indélogeable. C'est une des raisons pour lesquelles j'ai toujours cru que la sémantique comptait réellement dans le calcul de Google.

Alors, afin d'en avoir finalement le cœur net, j'ai abordé la numéro un du tout Google canadien et je lui ai posé quelques questions devant lesquelles elle fut catégorique (propos librement relevés) :

Google's mission is to organize the world's information. As such, our algorythm needs tools to help it measure the information that's fed to it. Many elements are important in determining how well a web page scores; content relevancy, brand awareness, popularity, backlinks, etc. HTML semantics is also crucial because it gives meaningful information about the content's structure. While it is not the most important element of all, a web page with rich semantics will always score higher than an equivalent page that doesn't.

Alors voilà. C'est réglé. J'ai envoyé des questions techniques au support de Google pour comparer des bouts de code et voir lesquels performent mieux. Je vous ferai part des résultats si jamais on me répond.

Et gBrowser dans tout ça ?

Désolé pas eu le temps d'aborder la question. Vous comprendrez que la dame avait un horaire chargé et peu de temps à m'accorder (elle devait d'ailleurs courir à l'aéroport pour prendre son vol de retour pour Toronto dans l'heure). Cependant, à la lumière de ce qui a été diffusé comme nouvelle dernièrement sur l'avenir de ce navigateur, je crois que la menace est passée. Je dis bien menace, parce que selon ce que j'ai glané ça et là sur le Web, nous étions en droit de nous attendre à une autre alternative aussi condamnable que celle de Microsoft.

Diluer le marché d'Internet Explorer avec un autre produit tout aussi propriétaire et peu respectueux des normes ? Revivre une autre période de noirceur comme celle que nous avons connu à la fin des années 90, alors que Microsoft et Netscape s'en donnaient à coeur joie pendant que nous en prenions plein la gueule ? Non merci, à ce prix là, je préfère que nous continuions à concentrer tout notre fiel sur une seule victime, pas deux. Si nous sommes pour vivre une autre guerre des navigateurs, autant qu'elle se fasse avec un aspirant de qualité comme Mozilla, pas un autre champion de l'asservissement propriétaire.

Denis Boudreau | 2004.10.14 @ 20:53

Alors, qu'en pensez-vous ?

Voici ce que vous aviez à en dire... vos impressions, recueillies à vif.

2004.10.14 @ 23:21 par Nicolas

Merci Denis pour cette information capitale. Lorsque j'abordais la question, on me rétorquait que ce n'était pas vrai, que Google se foutait comme de sa première interface de la sémantique. C'est peut être aussi cela qui fait sa force!

Haut retour au début de la page

2004.10.15 @ 00:36 par ElMoustiko

Tout comme Nicolas, j'ai eu beaucoup de retour (notament sur le HUB) me disant que sémantique web et google était très largement dissocié... Qui croire alors un responsable officiel ou une foultitude de testeurs fou ?
Perso je suis toujours un peu sceptique quand on interroge un officiel et qu'il dit ce qu'on veut entendre, je prendrais cette info avec des pincettes bien que je serais ravi qu'elle soit avérée.
Je pense moi même, par simple déduction logique, qu'un contenu codé correctement selon les règles de sémantique web devrait être mieux indexé qu'un autre, car moins de données inutiles, mais ici et là on dit que les robots s'en accomodent très bien (du fatra de code) et que si les robots devaient mieux indexer les sites sémantique, ils seraient en tête des classements.
Donc mon point de vue général : Ne pas faire confiance aveuglement à des officiels qui disent souvent (pas tout le temps j'espère) ce que l'on veut entendre... (oui je suis très noir dans mon point de vue ;))

Haut retour au début de la page

2004.10.15 @ 03:30 par Yeca

La sémantique, c'est certain, influe sur les résultats dans Google. Maintenant, il serait bien qu'ils communiquent dessus afin de motiver tout le monde à respecter un maximum les standards.

Haut retour au début de la page

2004.10.15 @ 05:21 par Raphael

Effectivement, la question a toujours été floue, basée sur des rumeurs.
Avoir enfin une réponse claire à cette question est une très bonne chose.

Haut retour au début de la page

2004.10.15 @ 15:35 par Pilgrim

'Google's mission is to organize the world's information.' Or 99% de cette 'world's information' n'est pas conforme aux standards et à la qualité sémantique qui y est associée... Et pour répondre à son ambition Google doit, comme dit ElMoustiko, s'accomoder du fatras du code non standard.
Ce sont nous, les êtres humains qui attachons bcp de valuer à la sémantique. Car la sémantique est plus efficiente pour une cognition humaine... Mais le bot, n'est pas une cognition humaine...!!! Alors, subissons-nous une illusion 'cognitivo-centrisme' qui nous fait croire que...?
' A web page with rich semantics will always score higher than an equivalent page that doesn't' : Il faudrait vraiment faire le test : un contenu strictement identique injecté à la fois dans une page standard et dans une autre qui ne l'est pas. Et voir le résultat.

Haut retour au début de la page

2004.10.15 @ 16:48 par Olivier

A mon avis y'aura aucune différence si l'une est en HTML sémantique et l'autre en HTML non sémantique. Par contre is une est en Flash, elle sera pénalisée. Juste mon hypothèse, j'ai pas la preuve. Et encore... Une 'page' d'iTunes ne contenant QUE du Javascript arrive 2ème sur 'U2 Vertigo'. http://www.google.com/sea...

Haut retour au début de la page

2004.10.17 @ 07:11 par Yeca

Oui mais il faut tenir compte aussi des backlinks, c'est pas négligeable.

Haut retour au début de la page

2004.10.17 @ 10:25 par Olivier

C'est ça que je veux dire. Une page ne contenant AUCUN contenu textuel mais ayant plein de backlinks grâce à un programme d'affiliation arrive 3ème sur 152000. Alors, l'importance du contenu et de la sémantique pour Google...

Haut retour au début de la page

2004.10.19 @ 11:29 par jerome

Oui bon pour le caramilk, n'importe quel chocolatier utilise ce principe pour fourrer des chocolats...


off topic... bon...

Haut retour au début de la page

2004.10.19 @ 11:36 par DenisB.

Mon cher Jérôme, si tu savais à quel point ils font un tabac en publicité avec cette connerie de secret depuis des dizaines d'années... ;)

Haut retour au début de la page

2004.10.19 @ 12:10 par jerome

Nouvel article sur l'accessibilité et les avantages sur google: http://www.sitepoint.com/...

Haut retour au début de la page

2004.10.19 @ 12:12 par jerome

Denis: quelque chose me dit qu'une telle pub ne passerait pas en France ou en Belgique ;)

Haut retour au début de la page

2004.10.19 @ 12:17 par DenisB.

Jérôme > Vraiment, c'est tout à votre honneur. Ici, on nous sert vraiment n'importe quoi. Y'a pas un jour qui passe sans que je ne me dise que je ferais un malheur si je m'en allais en publicité.

Haut retour au début de la page

2004.10.19 @ 14:16 par Olivier

Personnellement, j'accorde plus d'importance à ce que peux dire un cadre sup de Google qu'à la performance d'Eric sur mangeur de cigogne qui n'a selon moi rien à voir avec la sémantique :
cette performance (somme toute très honorable) était majoritairement due aux backlinks des membres de la blogosphère et d'ailleurs qui ont massivement soutenu la démarche. Les concours de référencement sont aussi des concours de popularité...

Haut retour au début de la page

2004.12.08 @ 08:10 par Pierre

Bof, bof, pas convaincu... Pourquoi ?

Si l'on reprend le debut de ta citation on lit:

'Many elements are important in determining how well a web page scores; content relevancy, *brand awareness*...'

Or 'brand awareness' pour moi ca signifie que M*c D*onald's est plus pertinent sur les hamburgers que mon site perso mettant en garde sur les dangers de la junk food (ce qui est bien evidemment faux, site d'entreprise a caractere publicitaire <> site d'information)

Alors soit Google prend les marques en compte pour juger la pertinence des pages web et j'arrete de l'utiliser pour mes recherches, soit ce n'est pas le cas et la credibilite du reste de la citation me parait discutable...

Any comments ?

Haut retour au début de la page

2004.12.08 @ 09:36 par lumitra

Il faut d'abord s'accorder sur le sens du mot 'sémantique'.

Alors seulement on pourra discuter du comportement de Google face à la sémantique des pages web.

Haut retour au début de la page

Les commentaires et trackbacks sont désormais fermés. Pour toute remarque, vous pouvez toujours nous contacter.

Pisteur (Trackback)

Carnet: Encore du référencement!
Extrait: Excellent article de mon collègue Denis Boudreau ce matin a...
Weblog: <Michael Carpentier>!</concepteur interactif>
Traqué le: 2004.10.15 @ 06:04
Carnet: La Sémantique et le référencement sur Google
Extrait: Un billet s'est fait remarquer récemment, celui du blog de C...
Weblog: Blog Alsacréations : XHTML, CSS et Standards web
Traqué le: 2004.10.15 @ 05:43
Carnet: La sémantique et le réferencement
Extrait: J'en parlais il y a quelques temps, Denis Boudreau l'a confi...
Weblog: [ NikO ]
Traqué le: 2004.10.15 @ 01:47