Compresser un fichier consiste à appliquer un algorithme sur la séquence d'octets du fichier pour obtenir un nouveau fichier dont la taille est plus petite que l'original, mais à partir duquel on peut retrouver le fichier original. De cette façon, l'information prendra moins de place sur le disque, sera moins longue à transférer, etc.
Tout fichier informatique peut en théorie être compressé. Toutefois, ça ne signifie pas nécessairement que sa taille sera réduite! En effet, si c'était le cas, on n'aurait qu'à compresser les fichiers compressés jusqu'à ce qu'ils aient tous une taille de "1"!
Habituellement, on compresse un fichier à l'aide d'un logiciel, et on le décompresse à l'aide d'un logiciel qui "connaît" l'algorithme et le format de compression utilisé. Bien souvent, ce sera le même logiciel.
En environnement Windows, le format de compression le plus populaire est sûrement celui popularisé par le logiciel "PKZIP", que l'on appelle communément format "ZIP".
Un partagiciel appelé WinZip permet de compresser et décompresser des fichiers avec ce format.
L'encodage d'un fichier consiste à lui appliquer une transformation qui fera en sorte que sa séquence d'octets contiendra seulement des caractères imprimables, ou encore un sous-ensemble des caractères imprimables. Bien entendu, pour pouvoir réutiliser le fichier original, il faudra lui appliquer la transformation inverse, soit le décodage du fichier.
L'encodage était nécessaire auparavent lorsqu'on voulait transférer des fichiers binaires (images, documents de traitement de texte, etc.) par courrier électronique ou sur les forums. Maintenant, les logiciels de courrier qui respectent le protocole MIME nous évitent de faire l'encodage manuellement.
Les formats d'encodage les plus populaire sont le "UUENCODE" et le "BINHEX". Des logiciels existent sur toutes les plates-formes pour gérer ces formats.
Qu'est-ce qu'un format de fichier? Il s'agit tout simplement d'une méthode pour stocker de l'information dans un fichier informatique. Par exemple, si je veux stocker un texte qui contient des caractères gras, il doit y avoir une convention pour déterminer quels caractères sont en gras. Cette convention (et bien d'autres) fait partie du format de fichier.
Voici quelques éléments à considérer lorsqu'on manipule des fichiers de différents formats:
Les différents formats ne sont pas tous lisibles par les mêmes logiciels. Lorsqu'on a un fichier dans un certain format, on doit s'assurer que l'on possède un logiciel qui puisse lire ce format.
Les formats ne permettent pas tous de stocker la même information. Ceci est évidemment lorsqu'on compare, par exemple, un format d'image avec un format de traitement de textes. Mais c'est souvent le cas entre deux formats d'images, deux formats de traitement de texte, etc. Par exemple, le format d'image JPEG permet de stocker les couleurs en 24 bits, alors que le format GIF ne permet de les stocker qu'en 8 bits.
La conversion d'un format à l'autre n'est pas toujours parfaite. L'exemple précédent avec les images JPEG et GIF nous le confirme: convertir une image JPEG en GIF risque de nous faire perdre des couleurs.
La manipulation des formats de fichier est à la fois de plus en plus complexe et de plus en plus simple. En effet, il y a de plus en plus de formats de fichier, ce qui augmente la complexité. D'un nautre côté, certains formats sont en train de s'imposer comme standards de facto, en particulier sur l'Internet. C'est le cas de GIF et JPEG pour les images, HTML pour les documents hypermédias, etc.
La réponse la plus simple est celle-ci: par l'extension du nom du fichier (ce qui suit le "."). Toutefois, il s'agit dans la plupart des cas de conventions plutôt que de règles formelles. Alors on doit faire attention...
Voici deux règles pour vous aider à mieux gérer les formats de fichier:
En tant qu'auteur, respectez toujours les conventions pour nommer vos fichiers, surtout ceux qui sont destinés à un usage public, comme par exemple sur l'Internet. Vous faciliterez ainsi la vie de vos collègues, des logiciels, etc.
Lorsque vous consultez un nouveau fichier, prenez pour acquis que le format est celui indiqué par l'extension. S'il y a un problème, c'est que l'auteur n'a pas respecté les conventions, et vous devrez essayer de trouver le bon format. Malheureusement, il n'y a pas de recette générale, et ça ne fonctionne pas toujours.
Il existe une très grande quantité de formats de fichier. Pour en avoir une liste assez exhaustive, consultez le manuel du cours, à la page 239. Toutefois, voici quelques formats que vous risquez de rencontrer dans vos aventures sur l'Internet.
Extension | Type d'information | Description |
---|---|---|
exe | Application | Un programme exécutable, habituellement dans l'environnement DOS ou Windows. |
txt | Texte | Fichier texte seulement, sans code de formatage. On doit toutefois faire attention au jeu de caractères utilisé |
gif | Image | Image en format Graphic interchange format , très commun dans les documents du Web. |
jpg ou jpeg | Image | Image en format JPEG, que l'on retrouve de plus en plus dans les documents du Web. |
aiff | Son | Fichier sonore Mac/SGI. |
au | Son | Fichier sonore commun dans l'environnement UNIX. |
ra ou ram | Son | Document sonore utilisant la technologie Real Audio , qui permet d'entendre le contenu à mesure que l'information arrive. Permet notamment la retransmission en direct d'événements. |
wav | Son | Fichier sonore dans le format natif de Windows. |
avi | Vidéo | Format de fichiers vidéos natif dans l'environnement Windows. |
mov ou qt | Vidéo | Vidéos en format Quicktime , d'abord populariés sur les Macintosh, mais maintenant sur Windows également. |
mpg ou mpeg | Vidéo | Format MPEG, norme de documents vidéos qui prend de plus en plus d'importance. |
htm ou html | Hypermédia | Hypertext Markup Language , format de documents hypermédias que l'on retrouve surtout sur le Web. |
Hypermédia | Documents formatés selon la technologie Portable document format de Adobe. |
Les virus informatiques représentent une menace constante pour les environnements informatiques. Par exemple, à chaque fois que vous transférez un fichier exécutable d'un serveur vers votre poste, il y a un risque d'infection. Voici quelques remarques à ce sujet:
Seuls des fichiers exécutables peuvent transmettre des virus. Par exemple des logiciels, des fichiers compressés auto-extractants, etc. De plus, des macros pour des logiciels peuvent aussi causer des problèmes, comme on a pu le voir avec des macros Word ou Excel récemment.
Il existe des outils qui permettent de vérifier systématiquement les fichiers téléchargés sur votre poste à partir de l'Internet. L'installation de tels outils peut s'avérer une solution très intéressante.
Quoi qu'il en soit, on doit toujours avoir à l'esprit les virus informatiques lorsqu'on copie un fichier exécutable sur notre poste, que ce soit à partir d'une disquette, d'un réseau local, d'un CD-ROM ou encore de l'Internet.
Les canulars: quand le message est le virus
Vous avez entendu parler des virus par courrier électronique nommés Good Times et Penpal? Ces présumés virus ne sont malheureusement que deux des nombreux canulars qui circulent sur le réseau.
Il n'y a pas (actuellement) de virus qui peuvent se propager à la seule lecture d'un message. Il y a cependant plusieurs canulars qui, par bonne volonté, sont propagés et encombrent inutilement les liens Internet et les boîtes postales. Je vous conseille la lecture de ces pages sur le sujet: http://www.kumite.com/myths/.
Pour les personnes intéressées, voir une étude détaillée sur le paiement sur Internet de Laurent Caprani dans le cadre du cours, niveau maîtrise, Systèmes répartis de l'Université du Québec à Montréal (http://www.er.uqam.ca/nobel/m237636/paiement/intro.html)
Allez aussi visiter la liste des mécanismes de paiements pour approfondir le sujet (anglais)
Plusieurs parties de cette page viennent de Martin Sévigny et de Jean Lalonde
Jacques Masson, hiver 1998