<C²: webløg />

Courriel - email address

Avatar Denis

lundi 15 août 2005
par Denis Boudreau

Secrets de l'indexation dans Google

On dit avec raison que les voies de Google sont impénétrables et à plus d'occasion que nous n'oserons nous-mêmes l'avouer, nous nous sommes questionnés sur les ingrédients composant la recette magique d'un site bien indexé dans le plus poulaire des moteurs de recherche. Les experts du référencement se gargarisent de trucs et astuces qu'ils protègent jalousement, mais malgré tout ce que l'on peut en dire, personne ou presque ne connait vraiment le secret des algorythmes de Google. Ce secret est probablement encore mieux gardé que celui des chirurgies plastiques des grandes stars d'Hollywood.

À l'instar de plusieurs compères pro-standards, j'ai souvent soutenu qu'un code valide et dûment sémantique était forcément un avantage indéniable à l'indexation, mais rien de tel n'est officiellement prouvé. Je crois bien sûr avoir raison hors de tous doutes, mais là s'arrête ma prétention. Après tout, le succès dans Google est forcément lié à plusieurs éléments, pas un seul. On peut penser au PageRank certes, mais aussi à la pertinence des contenus, aux mots clés, aux alignements de Mars et de Vénus, etc.

Seulement voilà, en suivant un lien proposé par l'ami Jean Lespinasse sur la liste des Pompeurs, suite à une question à propos de l'intérêt de Google pour la sémantique HTML, je suis tombé sur la page suivante qui présente quelques pistes intéressantes. Je vous en sort un extrait pour la forme, mais vous invite fortement à la consulter dans son entier, car c'est quand même assez éloquent.

  • Efforcez-vous de définir une hiérarchie claire entre les pages et de créer des liens textuels efficaces. Chaque page doit être accessible à partir d'au moins un lien textuel statique
  • Créez un plan de site dont les liens pointent vers les sections les plus importantes de votre site. Si le plan de votre site comporte plus de 100 liens, nous vous conseillons de le diviser en plusieurs pages.
  • Présentez des informations utiles à l'aide de pages au contenu clair et précis.
  • Essayez d'imaginer les termes susceptibles d'être utilisés par les internautes pour trouver votre site et insérez ces termes dans vos pages.
  • Pour présenter les éléments les plus importants de votre site (noms, contenu, liens, etc.), essayez d'utiliser du texte plutôt que des éléments graphiques. En effet, notre robot d'exploration ne gère pas les informations figurant dans les graphiques.
  • Vérifiez que le texte associé aux balises TITLE et ALT est précis et descriptif.
  • Vérifiez le bon fonctionnement des liens et la qualité du code HTML.
  • Si vous utilisez des pages dynamiques (l'URL de la page contient alors le caractère « ? »), notez que certains robots de moteur de recherche sont moins efficaces sur les pages dynamiques que sur les pages statiques. Il est donc conseillé de limiter le nombre et la taille des paramètres de ces URL.
  • Sur chaque page, limitez les liens à un nombre raisonnable (moins de 100).

Allez voir le reste de la page, vous verrez, ce n'est pas piqué des vers non plus.

Denis Boudreau | 2005.08.15 @ 12:18

Alors, qu'en pensez-vous ?

Voici ce que vous aviez à en dire... vos impressions, recueillies à vif.

2005.08.15 @ 12:53 par Niko

Merci pour ce billet fort utile. Il repond à bon nombre de questions.

Haut retour au début de la page

2005.08.15 @ 12:58 par mauriz

Et si ça se résumait à : «Améliorez la qualité de votre site web» ?

Haut retour au début de la page

2005.08.15 @ 13:29 par Vincent

Pour les pages dynamiques utilisant le caractères « ? », on pourrait aussi conseiller de se passer de ce caractère et de préférer le principe du PathInfo couplé à MultiViews.

Cela permettrait par exemple pour ce billet une URL en :
/weblog/commentaires/messsage-1167

au lieu de
/weblog/commentaires/detailsCarnet.php?idmessage=1167

;-)

Haut retour au début de la page

2005.08.15 @ 14:37 par André Giguère

Quand vous dites ceci : Essayez d'imaginer les termes susceptibles d'être utilisés par les internautes pour trouver votre site et insérez ces termes dans vos pages. ce n'est pas un bon conseil! Il faur savoir et connaître exactement les requêtes effectuées dans les moteurs de recherches, à quoi bon optimiser son site avec un terme ou mot-clé que personne n'utilise.

Le Web Focus Group est de rigueur, pour plus d'info sur le sujet Tapez Web focus group dans Google et le premier site affiché explique très bien la démarche.

Haut retour au début de la page

2005.08.15 @ 23:26 par gregR

Denis, tu as oublié le meilleur passage :

> Pour vérifier le fonctionnement de votre site, utilisez un navigateur texte (Lynx, par exemple).

Si ça c'est pas un appel à écrire des pages sémantiquement correctes !! :-)

Haut retour au début de la page

2005.08.15 @ 23:32 par Thomas Mathey

Je fais moi aussi parti des gens pleinement convaincu de l'efficacité d'un site sémantiquement correct pour l'indexation. C'est pour moi équivalent à un discours à la rhétorique soignée !

Haut retour au début de la page

2005.08.16 @ 02:15 par quidam

'Les experts du référencement se gargarisent de trucs et astuces qu'ils protègent jalousement'

la liste que tu donnes est le Ba-ba de ces trucs (la base de chez base faut pas trop s'emballer donc)

pour le web semantique et le positionnement : aucun rapport, desolé pour les puristes.

observez les resultats de google sur a peu près n'importe quelle requete commerciale ou informative (ne concernant pas le webmastering) se seront des sites non conformes au w3c qui apparaitront positionnés.

la raison ? meme avec lynx vous verrez que les elements textuels d'un site non conforme sont tout à fait indexables.
le w3c c'est bien mais souvent c'est moche ou en tout cas tres standart niveau graphique, ceci lié au fait que les fans du W3C sont exclusivement passionnés par le webmastering et ne sont guere spécialistes d'autres axes de connaissance - et comme thematique c'est une infime goutte d'eau, vous en conviendrez, dans le vaste ocean de connaissance disponibles à l'internaute - fait que pour la satisfaction des internautes qui cherchent de l'info, c'est la meilleure reponse possible que les moteurs essaient de ramener à la surface (le fond, meme si l'auteur ne sait pas comment faire une page web conforme, il maitrise bien le sujet dont il parle sur son site) et non un standard de code de page (la forme)

5 ans que je ref et que je positionne des sites, 5 ans que j'ignore royalement le w3c...dont je felicite les fans d'ailleurs : grace à vous le webmaster moyen s'interesse au w3c et pense que le referencement commence par le respect des normes. fausse piste qui l'empeche de se poser les bonnes questions, et ca c'est pas plus mal aux yeux d'un referenceur pro, apres tout il n'y a que 10 resultats sur la 1ere page de resultats et moins il y a de concurrents sérieux mieux c'est !

d'ailleurs ce post pourrait etre un risque (dans le sens en reveiller certains à tel point qu'ils se mettent à reflechir pour de vrai) mais j'ai remarqué qu'il en va des fans du w3c comme des fans de Mac : un fidélité aveugle et un manque de recul inalterable... la preuve vous avez les resutlats de google sous les yeux pour vous prouver que vous avez tord, et vous continuer à y croire dur comme fer !

tant mieux :)

Haut retour au début de la page

2005.08.16 @ 04:33 par Cédric

J'ai presque honte de te répondre 'quidam' tellement c'est gros et caricatural...

un troll ?

Haut retour au début de la page

2005.08.16 @ 05:17 par Normand Lamoureux

Moi, je dis qu'on ne peut pas comparer un truc sémantiquement correct où le mec n'a rien à dire et un truc moche sur le même sujet mais traité avec brio.

Ce serait vouloir comparer des poires et des citrons.

Pour faire la démonstration de la pertinence des standards en regard du positionnement, il faudrait présenter le même contenu textuel dans un truc moche et dans un truc conforme, et ensuite voir celui des deux qui emporte la palme.

C'est fou, mais quelque chose me dit que c'est gagné d'avance pour le truc conforme.

Haut retour au début de la page

2005.08.16 @ 05:18 par -Nicolas-

> J'ai presque honte de te répondre 'quidam' tellement c'est gros et caricatural...
> un troll ?

C'est surement une blâgue ^^ Sinon c'est qu'il n'a vraiment rien compris.

Chouette article Denis, à méditer et à conseiller !

Haut retour au début de la page

2005.08.16 @ 05:49 par solo

Merci pour ce topo :)

Haut retour au début de la page

2005.08.16 @ 07:57 par DenisB.

Quidam, Quidam, Quidam, Quidam...

Tu as tout à fait raison. Je le reconnais, tu m'as convaincu, t'es le plus fort. Bon allez, tout le monde dehors les pro-standardistes, je recommence à coder comme un pied parce que là, il y a un expert du référencement qui vient de m'apprendre que moins on respecte des normes dans une industrie, plus on produit un travail de qualité.

Bon, comment ça marche déjà? Ah oui,

<font face='arial' size='1'>... c'est bon, ça me revient.</font>

Haut retour au début de la page

2005.08.16 @ 08:53 par Tonio

Là on peut dire que Quidam vous a tous mouché !!!

cela fait pas de mal de voir une réalité que personne n'ose imaginer...

Haut retour au début de la page

2005.08.16 @ 09:18 par NiKo

À quidam et consorts (en un mot) :

Un <h1>Nom de ma société</h1> sera toujours mieux indexé qu'un <img src='Logo_avec_le_nom_de_ma_societe_dedans.gif'>.

De même qu'un <li><a href='products' title='Nos différents produits, par catégories'>Produits</a></li> sera toujours mieux indexé qu'un vulgaire <a href='products'><img src='bouton_delamort.gif' /></a>.

Les moteurs modernes jonglent entre l'existant (des sites mal codés, non sémantiques) et les spam-indexeurs, mais surtout avec la popularité des liens (le fameux PageRank pour Google), d'où la remontée de sites codés 'à l'ancienne' mais néanmoins très populaires (et encore heureux).

Mais les choses changent. Les sociétés commerciales, les institutions commencent petit à petit à comprendre l'interêt du respect des standards en termes d'accessibilité mais aussi en terme de transparence (ex: Cap Gemini, qui valide et ne s'en porte pas plus mal). De leur côté, les moteurs n'ignorent pas l'interêt du web sémantique pour offrir des réponses plus pertinentes, et l'avenir appartiendra plutôt - amha - à ceux qui l'ont déjà compris.

Pour moi, ce sont les gens comme toi qui - faute de se mettre à jour - seront au chômage dans 5 ans. L'avenir nous dira...

Haut retour au début de la page

2005.08.16 @ 09:39 par Olivier

Quand les gens auront compris que le travail qualitatif est plus difficile que le travail automatique est baclé, peut être que les choses changeront...
Le travail d'un artisan ébeniste à côté d'un 'meuble' ikéa.

Je ne vois en tout cas pas en quoi l'utilisation des standards web peut nuire en quoi que ce soit :/
Et pour le 'standard c'est moche' etc, il va sérieusement falloir arreter de me faire chier GRrrr (désolé Denis, mais bon... tu sais ce que j'en pense de ce genre de remarques à 2 balles !)
Si tu veux jouer dans ce genre de trolls débiles, on peut y aller pour ta 'profession' aussi ''quidam''.

Allez, comparons les sites standards à la nourriture que grand mère nous fait le dimanche quand on va la voir, et celle du rayon surgelé de Auchan...
Quidam, sort d'Auchan !

Haut retour au début de la page

2005.08.16 @ 10:16 par Tonio

<
à vrai dire je ne sais pas quoi en penser parce que en réalité je ne sais pas trop de quoi vous parler, moi j'en suis resté au codage xhtml et validation css, moi le web sémantique, j'ai essayé <de comprendre de quoi il s'agissait mais cela reste confus
Cependant c'est comme même plus drôle quand il y a des avis divergents parce qu' au moins on ne parle pas pour ne rien dire....

Ps Olivier
s'il te plaît ne compare pas un meuble d'ébeniste et un meuble ikea, moi j'ai un meuble ikea je trouve très pratique de pouvoir le démonter avec un simple tournevis lors de déménagement en plus c'est solide esthétique bref c'est suédois pour ma part j'ai rarement vu un meuble d'ébeniste qui faisait tout ça en même tant...

ah oui pout tout ce qui n'ont pas compris c'est de l'humour....français
/>

Haut retour au début de la page

2005.08.16 @ 10:49 par Felipe

Olivier> Auchan dans la Belle Province? ^-^ (j'espère pas)

Ah cette volonté d'opposer à tout prix les 'fans du W3C' et les 'référenceurs pro' de la part de quidam tout en précisant que web sémantique et positionnement n'ont aucun rapport (admirez la cohérence!), c'est ... c'est ... un gros troll en effet.

Les graphistes les moins sectaires ont compris que standards du web et moches n'étaient pas synonymes, le célébrissime CSSZenGarden y étant pour *beaucoup*. Il est beaucoup plus difficile d'être aussi démonstratif avec le référencement: il y a tellement de facteurs qui rentrent en jeu (sans qu'on sache lesquels et dans quelle mesure).

On ne confie pas la programmation au graphiste, l'accessibilité au codeur ni le référencement au 'fan du W3C'. A condition d'avoir confié la réalisation du site à un chef de projet capable, pas à un 'webmaster moyen' qui se laisserait guider, dans toute cette équipe, par celui ayant le plus beau discours ... A lire quidam, il ne faudrait tenir aucun compte de la sémantique mais dans ce cas-là, combien coûtera la future refonte du site?? C'est 'tarif réduit' et délai raccourci quand on a pas besoin de retoucher au contenu de chacune des pages mais simplement à la forme: graphisme, reréférencement.|

Haut retour au début de la page

2005.08.16 @ 11:09 par Olivier

Tonio > Oui nous sommes bien d'accord !
Mais moi je ne demande pas à un meuble de se démonter toutes les 2 minutes, mais qu'il soit solide et qu'il fasse son temps. Et un meuble Ikéa fait une vie à peine :/

C'est pareil pour les sites web, le vite fait mal fait qui tient pas la route mais qui reste pratique face au ''légèrement'' moins rapidement fait mais qui tient la route et oui ... qui est encore plus facilement modifiable en fait :D

T'as raison, Ikéa était mal choisi ^^

Haut retour au début de la page

2005.08.16 @ 14:21 par Laurent Denis

Le billet de Denis, qui n'avait certes rien de nouveau sur le fond, mais qui rappelait avec à-propos des choses publiées de longue date, sur lesquelles les uns et les autres sont évidemment d'accord, a disparu, perdu corps et âme, gommé par le troll et la facilité avec laquelle on s'y engouffre.

Questions :

1. Pourquoi tombez-vous dans l'erreur de suivre le troll ?

2. Pourquoi ce commentaire trollesque n'a-t-il simplement pas été supprimé/modéré, n'ayant pas plus d'intérêt ou d'utilité dans ce sujet qu'un spam pornographique quelconque ?

Il y a parfois de faux débat. Celui-ci en est un, exemplaire : il n'a aucun intérêt, ni pour les arguments des uns, ni pour ceux des autres.

Haut retour au début de la page

2005.08.16 @ 14:41 par Bleizig

Je ne suis pas entièrement d'accord Laurent: le débat, bien que très connu de ceux qui suivent les standards depuis longtemps, peut intéresser les personnes qui découvrent notre univers depuis peu.

Je suis d'accord de modérer les commentaires mais quand un troll suscite des arguments bien construits où chacun s'exprime à sa manière (Auchan, Ikéa ...), je pense que l'expérience ne peut-être qu'éducative pour les néophites.

Haut retour au début de la page

2005.08.16 @ 18:49 par DenisB.

Je suis du même avis que Bleizig... et j'ajouterais qu'un beau gros troll inoffensif comme celui-là, c'est tellement abrutissant qu'y donner suite, ce n'est pas très grave; il se discrédite lui-même.

Mais je lui pardonne... comme tant d'autres, il est dans la pire des situations, ignorant de sa propre incompétence.

Quant à l'intérêt d'un tel billet, je dirais au contraire qu'il permet de faire ressortir pas mal de choses intéressantes, sous un nouvel angle.

Personnellement, je ne suis plus tellement intéressé à travailler à repousser les limites des connaissances de l'élite des experts... je n'ai plus du tout envie de faire ce type d'efforts quand je sens le gouffre s'élargir entre ceux qui comprennent et ceux qui n'y pigent rien encore. Les remarques de Quidam nous rapellent justement ça.

Revenir aux bases et de revisiter les sujets des débuts et les traiter avec un oeil nouveau et plus averti, afin d'aider tous ceux qui passent par ces réflexions pour la première fois. Voilà ce qui me semble pertinent en fait.

Haut retour au début de la page

2005.08.16 @ 19:08 par DenisB.

Oh et Quidam, si jamais tu repasses par ici...

http://cybercodeur.net/we...
http://cybercodeur.net/we...

Je sais qu'il n'y a pas que la sémantique et la conformité dans la vie, mais tu arrives à faire ça pour tes clients, avec tes techniques de pro ? ;)

Haut retour au début de la page

2005.08.17 @ 01:09 par Tonio

Jeu Set et Match

vainqueur par KO <C2 : Weblog/> contre quidam

66666
-----
11211

Haut retour au début de la page

2005.08.17 @ 07:54 par solo

S'il vous plait on dit pas du mal d'Auchan. Il y en a qui y ont travaillé et qui ont trouvé la femme de leur vie là bas. Faites allusion à Carrefour, merci.

:D

Haut retour au début de la page

2005.08.17 @ 13:45 par DenisB.

La 'boxe-tennis', tout un sport ça, Tonio! ;)

Haut retour au début de la page

2005.08.18 @ 03:12 par requid

haha j'adore, une vraie bande de scouts !

prendre des screenshots de positions sur des expressions avec seulement 12500 resultats, cela signifie-t-il que c'est ton record ?
Si tu tentais du 500000 plus (mon record perso est 1er sur 13.5 millions, mais j'ai des amis qui font bcp plus)? enfin un truc qui justifie qu'on te paye pour positionner un site ?

j'avoue que j'ai pas fait bcp d'efforts d'argumentations à mon 1er post, partant du principe qu'avec les fanatiques c'est peine perdue.
vous m'avez pas deçu :))

je vais neanmoins resumer mon idée avec un exemple simple :
- nombre de resultats sur 'toto' : 100000 resultats.
- nombre de sites conformes w3c correspondant à la requete : 10000
-nombre de resultats en 1ere page du moteur de recherche : 10

comment les 10000 sites W3C vont-il faire pour se demarquer et apparaitre en 1ere page (et me parlez pas du PR par pitié, c'est fait pour alimenter les pseudos discussions des pseudos referenceurs en herbe ca) ?

en étudiant des milliers de requetes sur les 100 premieres pages de resultats, en etudiant de pres les brevets regulierement deposés par les ORs, en s'interessant à la semantique (je parle de la vraie, c'est à dire de celle en rapport avec la philologie et pas du code html hum?), bref en y consacrant des milliers d'heures de recherche, mais aussi de reflexions personnelles : le graal ne se trouve ni sur wri, ni sur le hub.

bref, croire qu'une manière de coder la page a une quelconque influence sur les algo de google (par exemple), c'est vraiment pas voir plus loin que le bout de ses semelles de petit puriste : du moment que le contenu textuel est accessible et que l'arbo du site est bien foutue, tous les sites sont egaux dans leur chance de positionnement, ne vous en deplaise.

en fait, ce qui m'a agacé à la lecture d'un article somme toute anodin, c'est cette immense pretention à
- pretendre comprendre une thematique (le referencement naturel) qui est complexe et necessite un travail justifiant une profession à part entiere (et non un amalgame de trucs et astuces)
- penser que le simple code a une quelconque influence sur un concept aussi ardu que la pertinence

quelle pretention !

aller, continuez à bien vous tripoter le nombril !

je vous adore de la meme maniere que j'adore voir certains nanards americains, comprenne qui pourra ;)

quid

Haut retour au début de la page

2005.08.19 @ 05:42 par Olivier

J'abonde dans le sens de requidam. Beaucoup de naïveté dans ce thread.

Le code de Google.com n'est absolument pas valide, ni Yahoo,com, ni Amazon.com. Et c'est pas grave. Ils offrent un backend XML. Mieux vaut privilégier l'universalité sur tous les browsers pour le HTML et offrir des feeds et ressources standards pour les web services. Tout le monde y trouve son compte.

Il y a tellement de choses plus mal faites et plus graves sur le web que le code HTML. Ca devient de l'aveuglement de focaliser systématiquement là-dessus et d'essayer de trouver des arguments abracadabrants (meilleur indexation) pour le justifier.

Les 'secrets de l'indexation' de Google. Franchement !... Des techniques, enfin même pas des techniques, connues depuis la nuit des temps de tous. Enfin je croyais.

Haut retour au début de la page

2005.08.20 @ 03:31 par Olivier

Euh, qui a dit que l'application des standards web faisaient une première place dans google ?

Il faudrait voir à ne pas déformer les choses non plus.

Ce qui est dit c'est que l'application des standards web et d'un code HTML sémantique est bien loin de faire pire que mieux.

Et il serait bon de ne pas analyser n'importe quoi non plus, la proportion de sites web conforme est plus faible que celle de sites coder comme des cochons alors forcément il y aura plus de résultats pour les sites 'tags soup'.

Alors remballe moi tes trolls à 2 balles, retournes voir le 'sorcier glouton' qui 'mange des cigogne' et va te toucher sur ton positionnement.

C'est pas un concours de bite !
'Ehhh les mecs, j'ai fait 1er sur 123M de requete !! je te bas !'
Tu voulais qu'on t'appelle 20cm au collège et maintenant c'est 13,5M

Ne prétend pas comprendre ce qui est écris ici, tu n'en es pas capable.

Haut retour au début de la page

2005.08.20 @ 19:42 par Olivier

Apprends déjà l'orthographe, la conjuguaison, et la grammaire française, ca améliorera la qualité de ton contenu et la sémantique de ton discours. Ce sont les bases.

Haut retour au début de la page

2005.08.21 @ 04:11 par OlivierP

Eh dis donc bonhomme, t'en as de l'argumentaire !

C'est vrai que quelques fautes sans grande conséquences sur un commentaire de weblog changent tout !
Oh mon Dieu, j'ai oublié 2 's' dans ma phrase, Gasp !

Le Dieu google va me chatier.
Encore une fois, c'est totalement à côté de la question et je n'ai jamais prétendu vouloir me positionner dans les moteurs de recherche, je n'ai jamais dit que je détenais les secrets de la connaissance ultime attention, le positionnement sur google ! Ouhaou (pardonne moi l'orthographe...)

C'est marrant de lire ce genre de commentaires sur l'orthographe, la grammaire et tout ce qui s'en suit avec un impératif de la deuxième personne du singulier terminant par un 's', un cédille manquante, le tout sur 2 phrases minuscules. Commence par retirer la poutre de dans ton oeil avant de t'occuper de la brindille dans celui de ton voisin.

Continuez à déblatérer vos aneries, à conclure ce qui vous fait plaisir sur n'importe quoi. Faites votre boulot de spammeur, allez pourir le web, faites nous des belles pubs en popups partout, allez vous êtes mignons.

Attention, je conclus pour vous, 'les standardeux, ce sont des extremistes qui croient avoir raison sur tout'. C'est bon ? c'est pas trop évolué pour votre niveau ?

Allez, la prochaine fois, tâchez de comprendre ce qu'on vous dit et de ne pas l'interpréter comme le boucher du coin qui n'y connait rien.

Denis, tu peux supprimer mes interventions si tu veux, je sais même pas pourquoi je répond, ahh si je sais, certainement l'agacement le plus total envers la médiocrité ambiante, le baclage, le non professionnalisme, le refus de compréhension, le refus d'évolution le tout dans un domaine comme le web. (pour info, c'est un domaine extremement mouvant, il serait bon de ne pas rester ancrés dans vos idées reçues du 20ème siècle.)

Haut retour au début de la page

2005.08.21 @ 08:51 par Olivier

Vraiment de grosses difficultés avec les terminaison en s des verbes.

http://www.leconjugueur.com/

Je ne suis pas un spammeur, je ne mets pas de popup.

Ce n'est pas un refus d'évolution, mais du pragmatisme, comme Google.coon, Yahoo.com, eBay.com, et les autres leaders du web Vu l'état des choses, il est mieux de faire comme ça en ce moment. Refuser l'évolution serait refuser les web services XML.

Je serais le permier à abandonner les navigateurs ne supportant pas les standards, ce serait un gros gain de temps, mais ça ne me parait pas raisonnable, il faut faire des compromis. Comme le cerveau humain est capable de comprendre quelque chose écrit avec des fautes d'ortographe, un navigateur est capable de comprendre du code mal fait. C'est très puissant, profitons-en. Un web non flexible pourrait partir en miettes. Le succès du web vient peut-êre bien de cette tolérance, de ce droit à l'erreur, faut-il vraiment être en guerre contre ça. Faut-il compiler les pages HTML ?

Haut retour au début de la page

2005.08.21 @ 09:01 par OlivierP

> Vu l'état des choses, il est mieux de faire comme ça en ce moment.

Non ! Faux, archi faux...
C'est pareil voire moins bien (mais je ne pense pas vu les méthodes d'indexation).

Haut retour au début de la page

2005.08.21 @ 09:51 par Merkel

Bonjour,

Lorsque quelqu'un doit défendre son opinion en tentant de détruire celle de l'autre en faisant référence à son orthographe, ou la façon qu'il s'exprime, ce n'est pas ce que je trouve de plus intelligent. Je parle ici d'Olivier (http://kebawe.com/). Avant de juger la qualité du français d'un individu, retourne ton regard vers ta propre personne. N'as-tu pas remarqué le nombre de termes anglophones non justifiés que tu as utilisés ? Évidemment que non. Restons sérieux. Ce sont les arguments qui comptent, pas le nombre d'erreurs de français.

Pour en revenir au sujet réel de la discussion, je ne vois pas en quoi le respect des standards du Web viendrait nuire au référencement. Si nous parlons d'accessibilité, de respect des normes, de normes de qualité, au contraire, je pense fortement que cela peut venir aider au référencement. Si nous parlons uniquement sémantique Web, oui cela peut venir aider au référencement. Un exemple simple est le titrage. Entre une balise div stylée pour donner l'effet d'un titre ou de vrais titres, je crois, qu'à mon humble avis, l'impact sera très différent sur l'indexation.

Il ne faut pas oublier non plus que Denis Boudreau a parlé du respect des standards et de la sémantique Web. Il ne parlait pas que d'un code syntaxiquement correct, mais aussi de la sémantique Web. Il n'a jamais prétendu connaître de fond en comble le référencement ou que référencer un site se limitait uniquement aux quelques astuces citées plus haut. Il parlait aussi de Page Rank, de la pertinence des contenus et des mots clés utilisés. Il n'a jamais dit que le respect des normes de qualité, qui inclus syntaxe correcte, sémantique et accessibilité, pouvait remplacer un professionnel du référencement, mais plutôt venir l'aider dans sa quête au Graal. Je ne comprends pas cette réaction face à ce billet. J'ai l'impression que certaines personnes sont sur la défensive face aux standards. Ne mélangez-vous pas les discours ? Prenez le temps de lire ce qui est dit. En aucun cas il n'a été question que de la syntaxe du code. Ne focalisez pas que sur l'un des éléments d'une phrase (code standard), mais bel et bien sur tout le paragraphe.

Haut retour au début de la page

2005.08.21 @ 10:51 par DenisB.

Bon, je m'absente quelque jours et voyez ce que ça donne... tout le monde se retranche dans leurs positions et tout ce qui en ressort, ce sont des discours de sourds... et y'a même Olivier qui ressort d'on ne sait où pour ramener les mêmes observations sur la position de Google et des autres amazon face à l'adoption des standards.

Vraiment, je suis gâté.

Arrêtons de nous obstiner là-dessus car ni les uns ni les autres ne connaissons les vraies réponses à propos des secrets de Google (auxquels je n'ai jamais prétendu apporter une réponse d'ailleurs). Mes questions ont au moins le mérite de vouloir faire avancer le débat avec des constatations basées sur des résultats. Concrètement, où sont les vôtres?

À tous les 'référenceurs' qui se sentent menacés par des illuminés comme moi qui laissent sous-entendre que de coder proprement aiderait à l'indexation, je n'ai qu'une chose à dire : évoluez, autant dans vos pratiques, votre discours que vos croyances. Si vous ne le faites pas pour vous, ayez au moins la décence d'évoluer pour vos clients. Après tout, si vous êtes effectivement reconnus comme des professionnels, il serait grand temps d'agir comme tel et d'évoluer avec votre industrie.

Et comme le soulignait Merkel, relisez mon billet pour comprendre ce qui j'y avançais, car cela vous aidera peut-être à y voir plus clair et ainsi, à sortir de cette victimisation qui vous pousse à tout confondre et à vous braquer dès que quelqu'un ose s'avancer sur votre terrain sacré.

Personnellement, je n'ai pas beaucoup de temps à perdre avec des gens qui gueulent, sans même comprendre qu'on ne les menacent pas... et encore moins avec des gens qui, faute d'arguments, polluent le débat avec de faux arguments basés sur les fautes d'orthographe des autres.

Haut retour au début de la page

2005.08.22 @ 12:25 par millenium

MDR comment tu fais une généralité de ton cas, trop fort, j'applaudis

Continue mon pote t'es super bien parti !

Haut retour au début de la page

2005.08.22 @ 13:01 par Merkel

millenium, il serait peut-être préférable que tu indiques à qui tu parles, sinon il peut y avoir confusion. :)

Haut retour au début de la page

2005.08.22 @ 13:15 par DenisB.

Marrant, j'ai l'impression que c'est à moi qu'il s'adresse. Mais ce serait correct, après tout, je l'ai bien cherché. :)

Haut retour au début de la page

2005.08.24 @ 11:46 par Laurent Denis

'du moment que le contenu textuel est accessible et que l'arbo du site est bien foutue, tous les sites sont egaux dans leur chance de positionnement, ne vous en deplaise.'

'À l'instar de plusieurs compères pro-standards, j'ai souvent soutenu qu'un code valide et dûment sémantique était forcément un avantage indéniable à l'indexation'

Avez-vous seulement réalisé que vous dites exactement la même chose, en dépit des apparences et de la volonter de troller ?

Haut retour au début de la page

2005.08.24 @ 17:09 par Olivier

volonté, pas volonter

Et le code valide, on s'en fout, je pense vraiment pas que Google donne un bonus aux sites valides. Ils ont mieux à faire avec leur CPU que vérifier la validité.

Haut retour au début de la page

2005.08.24 @ 19:08 par Eric

Les moteurs de recherche (oui Google n'est pas seul dans le domaine) aiment un code sémantique. Pas un code dûment valide. Se crêper le chignon là-dessus me semble un peu léger.

À propos de troll, certains montages en épingle ont beaucoup décridibilisé la cause des standards dans un récent troll organisé à propos du dernier concours de référencement en date ;-)
Dommage.

Haut retour au début de la page

2005.08.25 @ 06:05 par Merkel

Olivier, c'est dommage que ton intérêt pour la qualité du code source (des sites Web finalement) ne soit pas aussi élevé que pour la langue française. Tu sembles porter à ce dernier une très grande importance, et c'est la même chose pour nous du côté de la qualité du Web. Je ne parles pas que de la validité du code ou la séparation du contenu de la présentation via CSS, mais aussi de la sémantique web qui elle, peut avoir un impact réel sur le référencement. Tant de choses pour améliorer la qualité du Web, et ton seul souci ne semble être que la langue française. C'est fort louable, mais le Web ne se limite pas à des mots sans fautes sur une interface graphique. Il faut évoluer. Si nous défendons les standards du Web, c'est que nous avons de bonnes raisons de le faire. Ceci n'a rien à voir avec la mode, mais avec la passion, le professionnalisme, le rêve de rendre le Web de meilleure qualité et plus accessible, plus confortable à tous.

D'ailleurs, tu as laissé quelques erreurs de français dans tes messages. Tu devrais focaliser un peu plus sur tes propres textes. ;)

Ceci dit, pour en revenir au sujet, je pense que de toutes façons, d'un côté comme de l'autre, personne ne peut prouver qu'un code syntaxiquement valide ou invalide peut avoir une influence ou non sur le référencement.

Haut retour au début de la page

2005.08.25 @ 06:35 par Olivier

J'essaie juste de vous faire comprendre - et j'échoue lamentablement -qu'on peut très bien, même mieux, vivre dans un monde non valide. On fait des fautes d'orthographe, on peut faire des fautes d'HTML. C'est pas bien grave. Ca humanise le web, ça l'a rendu très accessible, ça a participé à son succès. Le web supporte les erreurs 404, les browsers supportent les erreurs HTML, c'est beaucoup plus puissant en fin de compte qu'un système rigide. C'est comme un avion avec des ailes rigides, ça casserait tout de suite. Plus de sémantique serait génial, mais si on associe ça à du code valide, j'ai peur que ça ne se démocratise pas. Seuls les experts en feront. Ou alors fournir des compilateurs de HTML, et interdire d'upload sur le web ce qui ne passe pas la compilation.

Quid des documents PDF indexés par Google ? Y'a-t-il des PDF de meilleure qualité que d'autres ? Sémantique des PDFs ? Validité des PDF ? Si on a 3 documents ayant le même texte : un PDF, un HTML valide et sémantique, et un HTML dégueulasse. Lequel ressort premier ?

Haut retour au début de la page

2005.08.25 @ 07:51 par Merkel

Olivier, je comprends ton point de vue, mais il n'a jamais été question de forcer les documents Web à n'avoir aucune erreur syntaxique au niveau du HTML. Notre but n'est pas de faire disparaître la tolérance des navigateurs, mais plutôt d'inciter les professionnels ou passionnés de faire un travail de meilleure qualité. C'est bien que tu vois le côté accessibilité au niveau de la publication sur le Web, mais tu dois également focuser sur l'accessibilité de lecture et d'exploitation des documents. Un site au code valide est plus facile à exploiter par un logiciel ou un script qu'un site au code dégueulasse. Cela pourrait peut-être, et je précises bien peut-être, influencer les moteurs de référencement si ceux-ci désirent exploiter davantage la sémantique du document. S'il recherche le titre de premier niveau, mais que celui-ci n'est pas fermé au bon endroit, et qu'un élément invalide est encapsulé à l'intérieur, cela devient un peu hasardeux comme résultat. Ca peut être le cas de n'importe quelle partie du document. Tout ceci n'est que théorique, je ne prétends pas prouver quoique ce soit.

Le code valide, la sémantique, l'accessibilité... ce sont tous des aspects qui se rejoignent de près ou de loin. Lorsqu'on se souci d'un code valide, la plupart du temps, on s'occupe également de la sémantique. Déjà, en respectant ces points, on gagne au niveau de l'accessibilité. Ensuite, il y a l'ergonomie et les notions d'accessibilité. Les normes de qualité sont un tout et c'est pourquoi nous faisons souvent la relation entre ses divers composants.

Je suis pour le respect des standards et des normes de qualité. Personnellement, je ne demandes pas au petit gars dans son sous-sol de faire un code valide, sémantiquement correct, et compatible dans tous les navigateurs, même si ce serait merveilleux. Je rêves seulement que les entreprises, les professionnels du domaine, agissent en tant que tel et produisent des sites Web de qualité. C'est plutôt irritant de voir une entreprise offrant des services de développement Web supposément de qualité qui fait des sites :

- au code invalide
- avec une sémantique web pauvre voir inexistante
- aucune séparation du contenu de la présentation
- utilisation massive des tableaux pour la mise en page
- sans aucun souci pour l'accessibilité au niveau lecture du document
- incompatible dans certains navigateurs
- etc...

Les clients payent pour quelque chose de qualité, c'est donc de la qualité qu'ils devraient obtenir. N'importe qui peut construire une maison, mais certaines sont tout simplement mieux construites que d'autres. Elles respectent les normes techniques et de qualité, ce qui ne les empêche pas d'avoir des designs uniques et originaux.

Évidemment, de notre côté, lorsque nous avons commencé, nous étions dans la catégorie détaillée plus haut. Avec le temps, nous avons évolué et découvert les intérêts du respect des normes de qualité. C'est à la fois un gain pour les visiteurs, mais également pour nous, car la maintenance est beaucoup plus facile. Il y a tellement d'articles à ce sujet sur le Web, que j'ai du mal à concevoir que des gens n'osent pas franchir le pas, surtout quand c'est leur métier.

Haut retour au début de la page

2005.08.25 @ 09:50 par DenisB.

Merci Merkel, tu as su refléter tout à fait ma pensée. Du coup, je viens de sauver un bon vingt minutes. :)

Haut retour au début de la page

2005.08.29 @ 00:58 par Sebastien Billard

De retour de vacances... En fait des 2 cotés (pro-standards et référenceurs-frankenstein) il peut y avoir une forme de naiveté.

Deja il ne faut pas confondre balisage sémantique et validité W3C : Une page peut très bien être codée avec des balises dites sémantiques (h1, p...) et ne pas être du tout valide.

Il ne faudrait pas que les pro-standards non-avertis croient que le simple balisage sémantique est la garantie d'un bon positionnement. C'est seulement l'un des critères, et il est vrai que les moteurs se fichent pas mal de la conformité du code, car il n'indique pas la pertinence du contenu. Cependant le contenu doit être lisible et structuré, est un code valide va dans ce sens. Aucune raison de se vanter d'un code non conforme donc. En tant que pro j'ajouterais que des sites mieux construits limiteraient les recours aux artifices techniques.

Il ne faudrait pas que les référenceurs fous croient que les standards ne servent à rien : Ils utilisent eux-meme les balises sémantiques depuis belle lurette, et si des pages non-conformes sont très bien positionnées, ce n'est pas du fait de leur non-conformité, mais simplement du fait que leur scoring sur les autres critères est très haut.

Haut retour au début de la page

2005.08.29 @ 06:23 par Olivier

Merci de ton objectivité Sebastien. Juste pour préciser, je ne suis ni référenceur ni intégrateur HTML. Visible et structuré ? Google indexe aussi PDF et documents Word (qui eux sont 100% conformes en passant). Mais ok, ça doit peut-être aider très légèrement au référencement d'être structuré. Par contre, ce n'est pas parce que c'est peu ou pas utile au référencement qu'il faut faire du HTML pourri.

Haut retour au début de la page

2005.08.29 @ 07:27 par Sebastien Billard

Je parle effectivement en priorité des documents HTML et dérivés qui sont la plus grosse partie et le format 'historique' du web. PDF et DOC sont indexés, mais il faut bien avouer qu'on les retrouve rarement en tête sauf requêtes specifiques.

Les docs Word peuvent être structurés : ils possèdent une systeme de description des titres, listes et paragraphes que Google 'comprend' me semble-t-il puisque la version HTML fournie par Google utilise bien des headlines pour les titres, et des paragraphes.

J'encourage tout le monde a produire un code HTML de qualité : c'est autant d'obstacles levés pour les visiteurs comme les moteurs.

Haut retour au début de la page

2005.08.30 @ 09:31 par Freb

Bien sûr : l'utilisation des standards (que je défends bec et ongles pour tous ses avantages) n'a pas pour but premier une meilleure indexation dans les moteurs de recherche. Elle a pour but de bien s'entendre en se conformant à des règles communes. Et de produire un code assimilable de manière identique par tout navigateur (je laisse de côté volontairement tous les avantages connus ici - lisibilité du code, facilité de maintenance, etc).

Bien sûr : la sémantique HTML est aussi censée aider à classer, reconnaître, indexer les documents. Mais au vu du peu d'utilisation (et de connaîssance) de cette sémantique, les moteurs d'indexation sont *obligés* d'en faire fi, d''extrapoler'. S'ils s'en tenaient à la sémantique HTML, leurs résultats seraient pauvres et manqueraient de pertinence, puisqu'un bon nombre de sites web riches d'informations pertinentes ne s'y conforment pas. C'est un comble, c'est regrettable, mais c'est ainsi. Un site web conforme aux standards n'est pas la garantie d'un bon site web : c'est un site web bien développé - point barre.

Soyons pragmatiques : il est logique que Google n'ait que faire des 'standards'. Imaginons que je sois le programmeur du moteur d'indexation de google : est-ce-que mon but ne serait pas, dans cette forêt de sites web tous aussi disparatement développés (souvent mal) - de justement contourner les erreurs de codes ainsi que les mauvaises utilisations de balises (voire même les structurations diverses et variées) pour obtenir, au final, pour une requête donnée, les sites qui répondent le mieux à la question en terme de 'contenu visible' indépendamment des erreurs de syntaxes?

Maintenant, connaissant le poids de google sur la toile, on peut se demander dans quelle mesure il n'est pas en contrepartie un peu responsable : après tout si Google se mettait à prendre les standards en compte dans son indexation, il y a fort à parier que le monde du développement web suivrait vite fait bien fait la tendance. (ou pourquoi pas un google spécial 'web standard compliant' ou 'accessibility compliant' qui donnerait son importance à ces critères?). Mais est-ce bien son rôle?

Car c'est avant tout le contenu qui fait la qualité du site. Bien sûr, la présentation et l'architecture vont aider à rendre un site accessible et agréable! Avec un brin de scynisme, pensons à tous ces 'pauvres bien-voyants' : en tant que bien-voyant, je préfère un site agréablement imagé et présenté qu'un site purement textuel, noir sur blanc, en times. Et un site web développé selon les standards n'est pas forcément plus moche qu'un autre développé sans s'y conformer. Simplement, un non-voyant pourra également consulter avec moins de difficulté son contenu. Là je dis bravo.

Pourtant, en se limitant au code, rien ne distingue un site visuellement bien foutu d'un site visuellement mal foutu (et encore moins avec l'utilisation des css). Ni encore moins sur la qualité de son contenu.

Or, à bien y réfléchir, au final, ce qui fait la plus value d'un site en terme d'information c'est définitivement son contenu ;). Car un joli site sans contenu, hein, on en fait son quatre heure et c'est terminé. Un site moche mais bourré d'infos pertinentes, on y revient.

Selon moi, l'utilisation de la bonne sémantique est un petit plus (h1 title alt etc. ne font pas de mal et sont pris en compte dans une certaine mesure), mais largement insuffisant dans la bataille du référencement entre les techniques visant à nourrir (tromper?) le moteurs de recherche pour qu'ils vous placent dans les 10 premiers pour un mot clé donné et la réponse technique des moteurs de recherche pour ne pas se faire berner et rester pertinents.

En guise de consolation, peut être faut-il se dire qu'être premier avec un site sans pertinence et mal foutu sert surtout à faire se pâmer les référenceurs et leur client : pour le visiteur, ce ne sera guère plus qu'une mauvaise route qu'il s'empressera de quitter.

Haut retour au début de la page

2005.09.01 @ 08:33 par rerequidam

'En guise de consolation, peut être faut-il se dire qu'être premier avec un site sans pertinence et mal foutu sert surtout à faire se pâmer les référenceurs et leur client : pour le visiteur, ce ne sera guère plus qu'une mauvaise route qu'il s'empressera de quitter.'

salut les petits loups !

bon finalement ca a descendu d'un cran l'agressivité là, good !

les referenceurs et leurs clients...
je n'ai jamais eu de clients (et j'ai depassé les 200 sites depuis un bail) qui m'ont contacté en me disant en gros : on a aucun contenu mais on veut des positions.
ceux qui ont les moyens d'embaucher un ref pro ont les moyens d'avoir du contenu, en fait c'est d'ailleurs parce qu'ils ont du contenu qu'ils viennent sur le web.

le probleme du spammeur : peut etre s'agit-il d'anciens referenceurs pro (ou alors des motivés qui continuent a bosser une fois rentrés chez eux ?), mais de fait c'est surtout des mecs qui bossent pour leur gueule, sans avoir de compte à rendre à personne.
du coup en effet ils se lachent à coup de moulinette à spam de dizaines de milliers de pages qui ont pour seul but de faire cliquer le pauvre surfeur sur deux trois liens sponsos...

d'apres moi c'est mecs sont des nuisibles car ils decredibilisent des outils qui nous font vivre...si les internautes lassés du spam se tournent vers d'autres moyens d'obtenir de l'info, je fais comment pour gagner mes sous moi ?

là où je veux en venir, c'est que ces spameurs sont bien trop malins pour recourir à des techniques illicites pour spammer, et du coup les moteurs de recherche sont completement demunis car aucune violation de leur charte ne peut etre mise en evidence. je ne citerai pas de sites, mais bcp de pseudos moteurs de recherche avec des pages de requetes pretapées allant de 'adolescente nue' à 'eletromeganer pas cher' appartiennent à un grand gourou du petit monde du ref, de fondateurs de forums connus ou d'editorialistes de newsletters spécialisées.

messieurs, faire la disctinction entre le vilain referenceur qui gruge à coup de texte caché et donc spam et le gentil codeux qui fait du code propre et ne spam pas, c'est completement depassé.

c'est en general le contraire (sisi) : un ref pro s'occupe de sites riches en contenu mais avec des contraintes graphiques (en general) qui l'oblige à rustiner dans tous les sens. un spammeur fait un truc clean et genere des milliers de pages à la volée sans contenu propre mais avec optimisation visible (pas de texte caché) afin de ne pas etre blackilisté par les moteurs.

en fait il n'y a pas de camps ennemis entre referenceurs et w3cistes (mdr hein?) mais à vous lire comme à lire l'introduction de cet article, sortez vous la tetes de prejugés à l'egard d'une profession qui s'occupe bcp moins du code que vous aimeriez le croire, et surtout qui ne cherchent pas à gruger les gens en 'pretendant' connaitre google : le grand G je le connais par coeur, et je peux dire presque à coup sur pourquoi un site est positionné sur tel resultat.
et surtout ceci : le referenceur pro n'est pas un spammeur, c'est contre son interet tout simplement.

quid

Haut retour au début de la page

2005.09.20 @ 14:46 par jorge

J’espère que le travail sur les standards et qualité do référencement va nous donner un web avec plus de qualité que ça !!! :-( http://www.visit-sao-mart...

Malheureusement si fréquent sur la toile encore !!
(Ainsi que les sites en flash aussi beaux que inutiles parfois !!)

Haut retour au début de la page

Les commentaires et trackbacks sont désormais fermés. Pour toute remarque, vous pouvez toujours nous contacter.

Pisteur (Trackback)