<C²: webløg />

Courriel - email address

Avatar Denis

vendredi 22 août 2003
par Denis Boudreau

PDF : nocifs pour votre santé

C'est pas moi qui l'ai dit, c'est le (trop souvent) vénéré Jakob Nielsen :

Les utilisateurs se perdent dans les documents PDF, qui sont généralement d'énormes amalgames de textes linéarisés, optimisés pour l'impression et désagréables à naviguer ou à consulter en ligne. Les documents PDF sont excellents pour l'impression, mais sans plus. Ne les utilisez pas pour la présentation d'information en ligne.

En tant que défenseur des principes d'accessibilité, je suis toujours un peu à couteaux tirés avec mes collègues et clients quant à l'utilisation systématique des fichiers PDF pour présenter de l'information sur le Web. La tendance naturelle à tout vouloir "PDFiser", n'ayant d'égal que la volonté de certains de vouloir sabrer coûte que coûte dans les coûts associés à l'intégration de contenus sur le Web, se fait toujours au détriment de l'expérience utilisateur qui elle, pâti inmanquablement du format inadapté de ces documents. Curieusement, bien que tout le monde s'accorde pour dire que la navigation intra-PDF est désagréable et bien inférieure à la navigation intra-HTML en terme de flexibilité et de fluidité, bien rares sont ceux qui complètent l'équation toute simple : PDF + affichage écran = désagréments.

Au boulot, j'en suis justement à développer la refonte du site d'un ordre professionnel du Québec. La première version de ce site, datant de 1997 si je ne m'abuse, était truffée de documents PDF (et quand je dis truffé, je veux dire criblé). Le constat observé auprès des utilisateurs de ce site était que la très grande majorité d'entre eux ne lisaient pratiquement rien sur le site, préférant largement imprimer les dits documents et les lire à tête reposée, loin de leurs écrans. Et c'est tout aussi bien parce que vu le caractère exhaustif et aride de ces documents, l'obstacle supplémentaire du format à la lecture écran en rebutait plus d'un et rendait presque impossible la diffusion de l'information, autrement cruciale pour ces membres. Il a fallu que je fasse tout un travail de conscientisation pour faire comprendre à tout ce beau monde l'équation présentée plus haut. Apparemment très simple, cette réalité ne leur avait jamais effleuré l'esprit, habitués qu'ils étaient à produire PDF sur PDF dans le but de livrer rapidement un contenu Web. Bien sûr, la transposition vers un format HTML est un peu plus longue, mais elle assure une interopérabilité sans égal avec laquelle le document PDF ne sera jamais en mesure de rivaliser (l'avenir me prouvera peut-être le contraire, mais je demeure sceptique).

Lorsque je suis tombé sur le AlertBox de Nielsen en juillet dernier, j'ai entreprit la lecture de l'article avec la candide naïveté de celui qui s'apprête à être déçu et effectivement, je n'eus pas très longtemps à attendre avant de sentir poindre en moi le sentiment tant anticipé; les arguments qu'il déploit dans la section PDF Usability Crimes sont souvent très minces (que dire de ceux des "Linear exposition" et des "Crashes and software problems"). À mon sens, certains des plus importants manquent à l'appel seulement dans le rayon des principes d'accessibilité universelle comme par exemple :

  • le problème d'accessibilité lié à un format propriétaire qui oblige le recours à un logiciel auquel certains n'ont pas forcément accès ou ne sont pas en mesure d'opérer pour une raison ou une autre ;
  • la difficulté supplémentaire posée aux engins de recherche pour parvenir à fouiller dans ces documents, ou encore ;
  • le simple manque d'alternatives textuelles (qui entre vous et moi, déconstruirait complètement l'intérêt initial du format).

D'un point de vue de portabilité également, le PDF pose beaucoup plus de problèmes que le format HTML pour les transitions vers XML ou tout autre format dérivé / inspiré du eXtensible Markup Language. Bref, tout ça pour dire : "sauvez une expérience utilisateur, HTMLisez un document PDF".

Denis Boudreau | 2003.08.22 @ 12:43

Alors, qu'en pensez-vous ?

Voici ce que vous aviez à en dire... vos impressions, recueillies à vif.

2003.08.22 @ 13:15 par Dam

Pour le premier argument :Le format PDF est propriétaire mais il est quand même ouvert et documenté la preuve meme openoffice peut en produire nativement.
Pour le deuxieme : google arrive a produire un equivalent HTML des pdf qu'il integre meme si la sortie n'est pas identique graphiquement, il arrive quand meme a en faire quelque chose le seul reproche peu se trouver dans la sémentique mais je ne connais pas le fomat assez bien pour savoir si il peut inclure cette notion
je n'ai pas compris le troisieme point pourquoi une alternative alors que le pdf est déjà du texte ?

Dam

Haut retour au début de la page

2003.08.23 @ 06:10 par Nicolas

J'ai réagi exactement comme Dam.

Les trois arguments sont conceptuels mais certainement pas relatifs à l'expérience utilisateur.

Le principal problème que je trouve au PDF est bien un problème de navigabilité (ce doit être à cause de la 'linear exposition') qui en fait un format bon pour l'impression, mais inadapté à la lecture à l'écran, aussi bien sur le Web que comme manuel utilisateur distribué avec certains logiciels.

Il faudrait argumenter davantage sur cet aspect inadéquation du format avec le support, plutôt que d'essayer de reservir les bons vieux arguments pro standards du Web.

Nicolas

Haut retour au début de la page

2003.08.23 @ 10:35 par CYBERcodeur

Je dois avouer qu'en me relisant maintenant, le manque de transparence de certains de mes arguments peut porter à confusion. Pour avoir échangé avec un autre habitué du site hier qui partageait également votre sentiment de perplexité, je me sens dans l'obligation de les définir plus encore ici, tout en répondant à vos observations :

Format propriétaire : le simple fait que tout le monde n'ait pas Acrobat Reader d'installé sur sa machine est au départ un problème d'utilisabilité considérable (comme le serait d'ailleurs l'absence du module d'extension Flash Player -- mais ça c'est un autre débat). De plus, le fait que certains agents utilisateurs ne soient pas en mesure de permettre la consultation de documents PDF pose également problème. Un format peut être propriétaire et relativement ouvert, j'en conviens. Cependant, j'ai encore à voir un format propriétaire qui est complètement libre, portable et accessible.

Engins de recherche : bien qu'il soit vrai que certains engins de recherche évolués comme Google puissent parcourir et indexer le contenu des documents PDF n'excuse en rien le fait que la plupart des engins de recherche plus modestes soient incapables de le faire (on a qu'à penser aux services d'AtomZ, de HTDIG ou tout autre engin développé maison ne reposant pas sur Index Server de MicroSoft). Par sa nature d'encapsulation, le format est souvent hermétiquement clos, ce qui représente un non-sens pour la plupart des sites qui les utilisent
pour diffuser du contenu et qui sont frustrés de voir ce contenu innaccessible par leur engin de reherche intégré.

Alternatives textuelles : une des règles fondamentales de l'accessibilité est d'offrir un contenu alternatif pour tout format qui pourrait poser problème à l'affichage dans des sources alternatives (alt ou longdesc pour les images, version HTML pour des flash, etc.). Le point que j'essayais d'apporter émanait donc du principe que si le format PDF n'est pas à 100% utilisable par 100% des utilisateurs, il faudrait donc lui fournir une alternative textuelle qui, sans l'ombre d'un doute, serait un format HTML. Dans la mesure où le développeur fournit une version HTML de tous documents PDF, la pertinence même du document PDF devient dès lors, très discutable, si ce n'est pour l'impression (qui demeure la force incontestée du format). Certains souhaiteront tous de même l'offrir pour supporter l'impression optimisée, mais ce choix devient alors purement secondaire à une optimisation de la structure et de la présentation du code qui pourrait être atteinte par le media print en CSS.

À mon sens, il vient un moment lorsqu'on discute d'utilisabilité où les principes d'accessibilité deviennent indissociable de l'expérience utilisateur. C'est un peu comme parler de développement de sites Web en CSS sans faire mention de (x)HTML. Dans une certaine mesure, le manque d'accessibilité nuit à un bon niveau d'utilisabilité et vice versa. Ainsi donc, je crois fortement que dans la déconstruction de l'intérêt du format PDF, il faille absolument tenir compte des arguments relatifs à l'accessibilité. Mais évidemment, cette position n'engage que moi. :)

Haut retour au début de la page

2003.08.23 @ 15:06 par Patrick

Nielsen et les pdf c'est un combat a peu près aussi vieux que Nielsen contre Flash.
Je n'ai pas verifié qu'il n'en voulait plus à Macromedia mais ça ne serait pas etonnant vu qu'ils ont il y a quelque temps payé son silence en le recuperant comme consultant ...
Concernant les pdf j'ai pas trop eu le temps de faire le tour de la question mais il suffit d'aller voir un peu ce qui se dit sur un des portails consacrés aux pdf pour voir les reponses (objectives ?) aux critiques de Nielsen : http://minilien.com/?y43Q...
Pour les paresseux aller au moins voir la reponse d'Adobe : http://minilien.com/?3xYk...

Faudra-t-il attendre qu'Abode recrute aussi Nielsen pour que ce débat (sterile ?) prenne fin ?

PS : si j'ai plus de dispo ce WE je vous ferait peut-être un résumé de tout ça :)

Haut retour au début de la page

2003.08.23 @ 16:28 par Dam

' le simple fait que tout le monde n'ait pas Acrobat Reader d'installé sur sa machine est au départ un problème d'utilisabilité '

<ironique>Parce que tu concideres que les 90% d'internautes qui se balladent sur le net ont un vrai client Web de préinstallé sur les poste ? allons ?</ironique>
Même pour aller sur le net il faut savoir se doter d'un minimum d'outillage. Et je tiens a signalé que ces outils (en ce qui concerne le PDF) son disponible ailleur que chez adobe, xpdf est une implementation libre de visualiseur pdf (pour linux au moins), gosthscript en est une autre, et il existe des outils de rédaction pour le PDF comme je le signalais lors de mon premier post : OpenOffice (logiciel libre encore) exporte en pdf nativement.

Pour le cas des moteurs:
Je le repete le format est proprietaire mais ouvert, contrairement a .doc par exemple qui est proprietaire et fermé (un format libre est par essence ouvert).
Il y a un exemple de moteur, et je ne pense pas que google s'appuie sur des techno microsoft pour faire leur indexation. Ce n'est qu'un manque d'implementation, pas un manque de d'ouverture qui pose probleme en gros pour AtomZ (que je ne connais pas) 'envois un patch !!' ;))

Pour l'alternative textuel tes argument sont valable je pense. Encore que il est normal qu'un document necessite un lecteur aproprié et que donc si le lecteur est aproprié alors le document ne necéssite pas d'alternative textuele. Lorsque on commensera a proposer des document swx (format openOffice) sur le Net (pas le Web :) on devra fournir un texte alternatif avec le document pour le lire avec un navigateur? non on utilisera OpenOffice ou tt autre suite bureautique qui supportera se format. L'elternative est nécéssaire dans le cadre du HTML quand il embarque un objet a priori inconnu.

En gros je suis d'accord avec toi 'le PDF c'est pas fait pour le web !!' mais je pense que certains de tes arguments ne sont pas les bons.
Le PDF n'a que pour unique destinée l'impression du document et rien d'autre.
Je considere que le PDF prend sont sens pour assurer une mise en page nickel chrome statique dans un format de media tres precisément délimité 21x29.7 :), et que le web(HTML) necessite plus de flexibilité dans son apporche : il est difficile de lire un page web tres longue.
Je pense que le web est plotot un media consultatif, cad que on cherche quelque chose d'assez précis et quand on l'obtiens on passe a autre chose tres rapidement. L'impression PDF implique quant-a elle quelque chose de plus profond et reflechi.

Voila c'est mon avis et je le partage :)

Dam

Haut retour au début de la page

2003.08.25 @ 07:01 par Thierry Goulet

Le PDF est un format de publication d'un document. HTML est un format de diffusion. J'ai déjà eu le problème dans un précédent travail. On avait des milliers de documents (numérisés) à diffuser via le Web. On s'est vite rendu compte que le PDF était nul pour ce genre de tâche. Trop lourd, pas très convivial, complexe si on cherche quelque chose de précis dans un document (surtout que ce n'est pas du texte, mais des images!). Bref, PDF n'était pas génial.

Par contre, lorsque le client achetait le document, il fallait lui en remettre une copie numérique pour téléchargement. Alors là le PDF était parfait.

Conclusion: le PDF n'est définitivement pas un format à privilégier pour la diffusion d'information, mais plutôt pour la publication. N'oubliez pas que c'est du Post-script en arrière de tout ça, un langage d'impression très lourd et complexe.

Le débat, selon moi, s'arrête là. On utilise le HTML ou une autre technologie [http://www.lizardtech.com/] mieux adaptée pour la diffusion, et on publie un PDF au client.

Haut retour au début de la page

2003.08.25 @ 22:38 par CYBERcodeur

Pour tout ceux que le sujet intéresse, Eric Daspet s'est fendu d'une analyse personnelle sur la légitimité du format PDF par opposition au format HTML suite à la lecture de ce carnet. Très pertinent, comme toujours. Je ne suis pas forcément d'accord avec lui à 100%, mais ce sont justement les divergences d'opinions qui font que l'on évolue. Après les normes ouvertes, vive les discussions ouvertes ;)

http://blog.dreams4net.co...

En gros, une seule chose à se rapeller de tout ce (faux) débat : 'Le PDF n'est pas mauvais, il n'est ni plus ni moins bon que le HTML, il n'a simplement pas le même but.'

Haut retour au début de la page

Les commentaires et trackbacks sont désormais fermés. Pour toute remarque, vous pouvez toujours nous contacter.

Pisteur (Trackback)