IV-14 (01/05/2005) : Métadonnées où je pense


Avant-hier est officiellement sortie la nouvelle version de Mac OS, surnommée ‘Tiger’. Parmi 200 nouvelles fonctions plus ou moins importantes annoncées, l’une d’elles, présentée comme “révolutionnaire”, sort du lot : “Spotlight”, un moteur de recherche de fichiers ultra-rapide basé sur les métadonnées.

Les métadonnées, mais quoi ça donc ? Littéralement, une métadonnée est une donnée concernant une donnée. Dans son disque dur, l’utilisateur stocke des fichiers dont le contenu a une signification pour lui mais pas pour l’ordinateur, ce pourquoi les recherches de fichiers se résument à des critères basiques que le système maîtrise, comme leur nom, leur taille ou leur date de création. Mais en apprenant à l’ordinateur à lire et interpréter le contenu de ces fichier, puis à remplir et maintenir une sorte de compte-rendu de ce qu’il trouve sur un disque dur, alors on crée des métadonnées qui permettent l’utilisation des critères beaucoup plus proches de celui qu’utilise l’humain pour trier ses données.

L’exemple le plus simple de métadonnées que vous connaissez tous est l’extension des noms de fichiers : “.txt”, “.jpg”, “.mp3”, et tant d’autres. Ces quelques lettres ne font pas partie des données brutes mais servent de discriminant aux applications pour qu’elles sachent quels fichiers elles sont capables de lire. Autre exemple très connu, les fameux “tags” sur les fichiers MP3, qui servent à organiser des listes de lecture au sein juke-box logiciels ou portatifs. Eh oui, vous utilisiez déjà tous des métadonnées sans le savoir !

Spotlight fait en gros avec votre disque dur ce que Google fait avec le web : il en explore chaque recoin et analyse le contenu des fichiers quel que soit leur format au moyen de modules descripteurs. Une fois ceci fait, le moindre mot-clé saisi par l’utilisateur déclenche un moteur de liaison entre ce mot et ce qui a été analysé. Il devient ainsi capable de trouver l’information cherchée dans des fichiers texte bien sûr, mais aussi dans ses mails, ses archives de discussion online, ses contacts, ses images, ses musiques, ses vidéos…

L’intérêt d’un tel système est double : donner des résultats de recherche très pertinents et très rapides, et ce d’autant plus que le disque est rempli de choses diverses et variées. Avant cela, il fallait créer une hiérarchie de dossiers exhaustive et donner des noms explicites à chaque fichier. Et, paradoxe bien connu du rangement hiérarchique, plus le rangement était rigoureux, plus la profondeur hiérarchique devenait grande et ainsi la navigation longue pour atteindre chaque fichier. Avec un moteur dopé aux métadonnées, tout ceci n’est plus nécessaire : stockez et retrouvez tout en tapant quelques lettres au clavier.

La micro-informatique moderne dispose donc d’un outil à la fois simple et puissant s’il est bien implémenté. Mais on peut tout de même lui trouver un revers de médaille, à savoir celui d’inciter naturellement au désordre. Imaginez-vous chez vous avec un outil du même genre : sans avoir à trier vos papiers, n’avoir qu’à demander la recherche de “mes relevés bancaires déficitaires entre 2002 et 2004” ou bien “toutes mes photos de vacances avec Momone”, pour avoir tout ça posé sur votre bureau en quelques secondes. Auriez-vous envie de prendre la peine de tout classer et ranger dans des armoires ? Franchement, non. Vous mettriez tout pèle-mêle dans une grande malle, et à vous la tranquillité ! Il en va de même pour votre disque dur.

Après tout, une fois acquis un tel outil de recherche, pourquoi passer son temps à tout ordonner ? Question bien légitime. Mais une fois le désordre irrémédiablement semé, il devient indispensable que tous vos logiciels sachent exploiter les métadonnées propres aux documents qu’il sait lire. Sinon vous voilà parti pour ranger et classer tous ces fichiers-là à part et jongler entre deux façons opposées de travailler.

Par ailleurs, un problème se pose dès lors que l’utilisateur travaille en environnement hétérogène. Deux systèmes différents ne donneront pas le même poids aux mêmes métadonnées, de la même façon que deux moteurs de recherche sur le web concurrents ne retournent pas les mêmes réponses à une requête identique. Les métadonnées ne sont pas un miracle, mais seulement un système d’indices à l’intention de logiciels qui les exploitent dès lors à leur façon.

Les métadonnées sont sans aucun doute une évolution très intéressante des possibilités de l’informatique personnelle, car elles permettent à l’utilisateur de s’affranchir des procédures d’organisation fort coûteuses en temps, tout en simplifiant la navigation. Elles deviennent d’ailleurs à la mode ces temps-ci, comme en témoignent la version “disque dur” de Google et les annonces faites par Microsoft autour du prochain système de fichiers pour Windows. Cela dit, il ne faudrait pas que cet outil serve de tremplin à une bordélite aiguë chez l’utilisateur, ne serait-ce que pour garder un pied dans le monde réel, où il n’existe pas encore de moteur de recherche autre que le cerveau, dont les capacités d’indexage restent limitées en quantité et en vitesse.

Et bonjour chez vous !