Cours 10: La gestion de l'information


1. - Compression et encodage de fichiers

1.1 - La compression des fichiers

Compresser un fichier consiste à appliquer un algorithme sur la séquence d'octets du fichier pour obtenir un nouveau fichier dont la taille est plus petite que l'original, mais à partir duquel on peut retrouver le fichier original. De cette façon, l'information prendra moins de place sur le disque, sera moins longue à transférer, etc.

Tout fichier informatique peut en théorie être compressé. Toutefois, ça ne signifie pas nécessairement que sa taille sera réduite! En effet, si c'était le cas, on n'aurait qu'à compresser les fichiers compressés jusqu'à ce qu'ils aient tous une taille de "1"!

Habituellement, on compresse un fichier à l'aide d'un logiciel, et on le décompresse à l'aide d'un logiciel qui "connaît" l'algorithme et le format de compression utilisé. Bien souvent, ce sera le même logiciel.

En environnement Windows, le format de compression le plus populaire est sûrement celui popularisé par le logiciel "PKZIP", que l'on appelle communément format "ZIP".

Un partagiciel appelé WinZip permet de compresser et décompresser des fichiers avec ce format.

1.2 - L'encodage des fichiers

L'encodage d'un fichier consiste à lui appliquer une transformation qui fera en sorte que sa séquence d'octets contiendra seulement des caractères imprimables, ou encore un sous-ensemble des caractères imprimables. Bien entendu, pour pouvoir réutiliser le fichier original, il faudra lui appliquer la transformation inverse, soit le décodage du fichier.

L'encodage était nécessaire auparavent lorsqu'on voulait transférer des fichiers binaires (images, documents de traitement de texte, etc.) par courrier électronique ou sur les forums. Maintenant, les logiciels de courrier qui respectent le protocole MIME nous évitent de faire l'encodage manuellement.

Les formats d'encodage les plus populaire sont le "UUENCODE" et le "BINHEX". Des logiciels existent sur toutes les plates-formes pour gérer ces formats.


2. - Les formats de fichiers

2.1 - Quelques mots sur la notion de format

Qu'est-ce qu'un format de fichier? Il s'agit tout simplement d'une méthode pour stocker de l'information dans un fichier informatique. Par exemple, si je veux stocker un texte qui contient des caractères gras, il doit y avoir une convention pour déterminer quels caractères sont en gras. Cette convention (et bien d'autres) fait partie du format de fichier.

Voici quelques éléments à considérer lorsqu'on manipule des fichiers de différents formats:

La manipulation des formats de fichier est à la fois de plus en plus complexe et de plus en plus simple. En effet, il y a de plus en plus de formats de fichier, ce qui augmente la complexité. D'un nautre côté, certains formats sont en train de s'imposer comme standards de facto, en particulier sur l'Internet. C'est le cas de GIF et JPEG pour les images, HTML pour les documents hypermédias, etc.

2.2 - Comment connaître un format de fichier

La réponse la plus simple est celle-ci: par l'extension du nom du fichier (ce qui suit le "."). Toutefois, il s'agit dans la plupart des cas de conventions plutôt que de règles formelles. Alors on doit faire attention...

Voici deux règles pour vous aider à mieux gérer les formats de fichier:

2.3 - Les principaux formats de fichier

Il existe une très grande quantité de formats de fichier. Pour en avoir une liste assez exhaustive, consultez le manuel du cours, à la page 239. Toutefois, voici quelques formats que vous risquez de rencontrer dans vos aventures sur l'Internet.

Extension Type d'information Description
exe Application Un programme exécutable, habituellement dans l'environnement DOS ou Windows.
txt Texte Fichier texte seulement, sans code de formatage. On doit toutefois faire attention au jeu de caractères utilisé
gif Image Image en format Graphic interchange format , très commun dans les documents du Web.
jpg ou jpeg Image Image en format JPEG, que l'on retrouve de plus en plus dans les documents du Web.
aiff Son Fichier sonore Mac/SGI.
au Son Fichier sonore commun dans l'environnement UNIX.
ra ou ram Son Document sonore utilisant la technologie Real Audio , qui permet d'entendre le contenu à mesure que l'information arrive. Permet notamment la retransmission en direct d'événements.
wav Son Fichier sonore dans le format natif de Windows.
avi Vidéo Format de fichiers vidéos natif dans l'environnement Windows.
mov ou qt Vidéo Vidéos en format Quicktime , d'abord populariés sur les Macintosh, mais maintenant sur Windows également.
mpg ou mpeg Vidéo Format MPEG, norme de documents vidéos qui prend de plus en plus d'importance.
htm ou html Hypermédia Hypertext Markup Language , format de documents hypermédias que l'on retrouve surtout sur le Web.
pdf Hypermédia Documents formatés selon la technologie Portable document format de Adobe.


3. La question des virus

Les virus informatiques représentent une menace constante pour les environnements informatiques. Par exemple, à chaque fois que vous transférez un fichier exécutable d'un serveur vers votre poste, il y a un risque d'infection. Voici quelques remarques à ce sujet:

Quoi qu'il en soit, on doit toujours avoir à l'esprit les virus informatiques lorsqu'on copie un fichier exécutable sur notre poste, que ce soit à partir d'une disquette, d'un réseau local, d'un CD-ROM ou encore de l'Internet.

Les canulars: quand le message est le virus

Vous avez entendu parler des virus par courrier électronique nommés Good Times et Penpal? Ces présumés virus ne sont malheureusement que deux des nombreux canulars qui circulent sur le réseau.

Il n'y a pas (actuellement) de virus qui peuvent se propager à la seule lecture d'un message. Il y a cependant plusieurs canulars qui, par bonne volonté, sont propagés et encombrent inutilement les liens Internet et les boîtes postales. Je vous conseille la lecture de ces pages sur le sujet: http://www.kumite.com/myths/.


4. La sécurité

4.1 Les difficultés du paiement électronique

4.2 Quelques méthodes de transactions sécuritaires

Pour les personnes intéressées, voir une étude détaillée sur le paiement sur Internet de Laurent Caprani dans le cadre du cours, niveau maîtrise, Systèmes répartis de l'Université du Québec à Montréal (http://www.er.uqam.ca/nobel/m237636/paiement/intro.html)

Allez aussi visiter la liste des mécanismes de paiements pour approfondir le sujet (anglais)

4.3 Le contrôle des accès

4.4 Le cryptage à clés secrètes

4.5 Le cryptage à clés publiques (ou asymétriques)

4.6 Les cookies sont-ils dangereux?


Plusieurs parties de cette page viennent de Martin Sévigny et de Jean Lalonde
Jacques Masson, hiver 1998