Je t'envoie mon fichier Word ? Non merci !

On commence cette étude par un sujet ouvert à polémique (jargon des internautes \[JDI\] : Troll). Dans votre vie quotidienne, vous manipulez un certain nombre d'informations. Certaines de manière orale, d'autres, par écrit. Les mots s'en vont et les écrits restent. Ces écrits sont couchés de manière générale sur une feuille de papier, un tableau, un cahier, etc, puis vous rangerez cette feuille/tableau/cahier dans une bibliothèque, étagère, classeur... En informatique, c'est pareil. Lorsque vous souhaitez conserver des informations pendant un temps donné, vous allez écrire ces dernières sur une sorte de feuille, que l'on appelle un fichier. Ce fichier, vous le stockerez ensuite sur votre disque dur, une carte SD, une clé USB... Maintenant que vous appréhendez le concept du fichier, ce conteneur qui conserve vos informations, telle une feuille de papier qui retient l'encre, approchons-nous un peu plus pour observer cette bestiole dans son environnement naturel. Des fichiers, vous en croisez tous les jours, que vous soyez adepte de windows, mac ou linux, ou encore, si vous êtes allergique aux ordinateurs, sur vos smartphones (Iphone, Android) ou tablettes. Tous ces systèmes sont constitués de millions de fichiers, de types différents. En effet, en vulgarisant au maximum (ce qui nous amène à dire des choses erronées), il existe deux grands types de fichiers. Les fichiers de type "information" et les fichiers de type "exécutable". !!!Le fichier de type information C'est le fichier le plus courant. Il prend n'importe quelle forme : une photo, un texte, un dessin, un tableau. Bref, c'est un document qui regroupe des informations. Quelles informations me direz-vous ? Prenons le cas d'une photo, prise avec votre smartphone ou votre appareil photo reflex que vous avez eu pour Noël. Ce fichier comporte non seulement votre image, telle qu'elle vous apparaît, mais surtout les différentes couleurs utilisées, le nom de l'auteur, la date, le lieu, la taille et bien d'autres choses encore. Ces données sont insérées en général à votre insu et se trimbalent à l'intérieur du fichier, ce qui veut dire que, oui, chaque fois que vous copiez ou distribuez cette photo, les éléments qui s'y trouvent la suivent bien gentiment. Comparons deux fichiers dont le contenu est identique, à savoir le texte de cet article au moment où je le rédige : ((/blog/images/taille.png)) Quelque chose vous frappe-t-il l'œil ? Non ? Regardez mieux. En effet, le fichier word fait deux fois la taille du fichier texte (4.9 ko contre 2.4 ko). Pourtant, le contenu est strictement identique. Vous pouvez faire l'essai. Prenez un texte, enregistrez le avec le bloc-note (si vous êtes sous windows) et faîte de même sous word (si vous avez la licence, sinon essayez avec libre office). Mais pourquoi diantre mes deux fichiers qui ont exactement le même contenu ont un poids différent ? La réponse est simple : on vous cache des choses. Si nous faisons l'expérience d'ouvrir notre fichier word avec notre bloc-note, voici ce que nous lisons : ((/blog/images/word.png)) Qu'est-ce donc que tout ce charabia, jeune homme ? Pour être honnête, c'est un fichier... qui contient plein d'autres fichiers. Avec quelques manipulations de magiciens de l'informatique, nous obtenons la liste des fichiers contenu dans notre fichier word et ça nous donne la liste suivante : ((/blog/images/arbo.png)) Quatre dossiers (endroit où l'on classe les fichiers) et 8 fichiers (ils se finissent tous par .xml). Chaque fichier a un but unique et particulier. Un s'occupe de la forme de vos lettres, leur taille, leur graisse (on appelle cela les polices de caractères ou true type), un autre du style du document (rose bonbon ou blanc entreprise), un autre contient votre texte (heureusement !), etc. Ainsi, votre fichier de type word est un "méta" fichier qui contient plein de fichiers qui ont tous leur utilité. Vous l'aurez peut être remarqué, l'extension (les lettres après le . dans le nom du fichier. Ici, ."docx") de mon second fichier indique un format, la manière dont est construit, constitué, architecturé le fichier. Pour être plus précis, le format de document utilisé ici est celui de Microsoft Word 2007 (et versions supérieures). Cela signifie que les logiciels Microsoft Word avant 2007 ne _savent_ ni ne _peuvent_ lire ce format de fichier. Cela signifie également, dans les grandes lignes, que si vous n'avez pas Microsoft Word 2007 (ou version supérieure), vous ne pourrez pas lire ce fichier. Quand un logiciel peut lire un fichier venant d'un format d'un autre logiciel, on appelle cela la compatibilité. Ainsi, Microsoft Word 2007 est compatible avec lui-même (heureusement !) car il sait lire son format de fichier. LibreOffice sait également lire ce format "docx". On peut alors dire que LibreOffice est compatible avec \[le format de\] Microsoft Word 2007. Vous pouvez tentez l'expérience avec à peu près tout. Ouvrez un fichier avec un logiciel qui n'est pas prévu pour à l'origine. Si le logiciel arrive à lire le fichier, vous pourrez dire qu'il est compatible, dans le cas contraire, il devrait vous dire qu'il ne sait pas ouvrir le fichier (ou alors, si vous n'avez pas de chance, produire une erreur. Dans ce cas, ne jouez pas au loto prochainement !). !!!Le fichier de type exécutable Il y a un type de fichier particulier, qu'on appelle exécutable. Non, ce n'est pas un criminel. C'est un fichier qui contient des informations qui vont vous permettre d'interagir avec votre ordinateur. Quelques exemples ? Word, Excel, Firefox, Chrome, le solitaire, le démineur sont des exécutables (ou encore "applications"). Un traitement de texte où vous pouvez rédigez vos documents, un tableur pour faire vos comptes, deux navigateurs Internet, deux jeux. Ils vous servent en général à consulter, modifier d'autres fichiers, ou simplement agir avec votre ordinateur. Dans le cas du démineur, par exemple, vous jouez contre votre ordinateur qui a planqué des bombes et que vous devez découvrir sans vous faire sauter. Dans une utilisation courante d'un ordinateur, vous êtes amené à utiliser couramment quelques formats de fichiers (bureautique, internet). Mais, indirectement, vous en manipulez probablement une vingtaine sans le savoir ! !!!Une histoire de format Maintenant que vous avez compris ce qu'était un fichier (j'espère) et qu'on a entre aperçu cette question de format, on va se poser quelques instants et aborder un point qui me tient à cœur. S'il ne devait y avoir qu'un seul point à retenir dans tout ce que nous allons partager pendant ces dix semaines, ce doit être ceci : le format de votre fichier garde captif les informations qu'ils contient pour toute sa vie. Si la société Microsoft, par une étrangeté fortuite, venait à disparaître de la surface de la terre et que plus aucun logiciel ne soit en mesure de lire vos documents au format "docx", votre travail, vos informations, votre savoir coincé dans ce fichier le resteraient à jamais. C'est ce qu'on appelle un format propriétaire. En effet, seul Microsoft (et peut être quelques états souverains comme les États-Unis d'Amérique) connaissent la structure exacte nécessaire pour pouvoir lire un "docx". C'est ce qu'ils considèrent comme une recette industrielle, un secret. Ce secret vous maintien dans des menottes virtuelles, car à défaut de disparaître, la société Microsoft peut choisir, du jour au lendemain, de ne plus supporter, c'est à dire de ne plus lire ce format spécifique. Et dans ce cas, bien que vous soyez un client, vous n'aurez plus que vos yeux pour pleurer, car il faudra reprendre l'intégralité de vos documents pour les transférer (les "porter") dans un autre format. Une double peine, en quelque sorte. !!!Comment ne pas être captif de sociétés ? C'est assez simple, en fait. Un certain nombre de formats dit "ouverts" existent. Pour ces formats, les éditeurs (créateurs de ces formats) ont simplement choisi de dévoiler la documentation qui explique comment est constitué leur format de fichier, quelle en est l'ossature dans les moindre détails. De ce fait, n'importe quel informaticien est en mesure de créer une application capable de lire/modifier ces fichiers. C'est par exemple le cas des fichiers ".odt" de LibreOffice ou ".pdf" d'adobe. Et oui, le format pdf est un format ouvert ! Vous pouvez retrouver les [principaux formats ouverts sur la page de Wikipedia|http://fr.wikipedia.org/wiki/Format_ouvert#Les_principaux_formats_ouverts]. !!!Et moi ? Personnellement, j'utilise énormément de fichier au format texte. C'est simple, léger et je peux le lire n'importe où, avec n'importe quoi, ou presque ! Lorsque j'ai besoin de faire des documents plus complexes (rapports scientifiques, lettres, dossiers, publications...), j'utilise le logiciel latex qui conserve toutes ses sources au format texte et me permet de faire des copies dans d'autres formats (rtf, html, pdf). !!!Pour aller plus loin Un texte que j'ai écrit sur [les formats propriétaires|http://jp.gaulier.info/formats.html] en 2006, toujours d'actualité, mais qui demande un peu plus de connaissances. N'hésitez pas à aller faire un tour et donner un retour ! Le site [formats ouverts|http://formats-ouverts.org/] contient plus de 2600 articles sur les formats ouverts ou propriétaires. C'est très intéressant et ça ne parle pas que d'informatique. Par exemple, saviez-vous que le format d'enveloppe C6 (11,4 x 16,2 cm) ne vous permet pas d'envoyer de recommandé, mais qu'il vous faudra au moins le format DL (11 x 22 cm) ? Une histoire de format fait la différence.