Les métadonnées

exemples de métadonnées

Cette page se veut une ressource pour élèves de seconde (cours de SNT). Par conséquent, nous ne développerons pas les aspects techniques des métadonnées (sauf un peu pour le HTML) et nous nous contenterons de montrer quelques exemples d’affichages.

 

Les métadonnées

Une métadonnée est une donnée un peu particulière. Elle apporte des informations sur le contenu d’un fichier, en particulier sur sa création, tout en faisant partie de celui-ci. Habituellement, certaines métadonnées sont directement lue par l’utilisateur et d’autres non.

À titre de comparaison, un livre comprend lui aussi des informations en dehors de l'œuvre dont certaines sont toujours lues (l’auteur…) alors que d’autres le sont beaucoup moins souvent (l’adresse de l’éditeur, le numéro d’imprimeur…).

Ces informations diffèrent selon le type de fichier. Par exemple, la localisation précise d’une prise de vue peut décrire une photo mais présente moins d’intérêt pour un morceau de musique (le studio d’enregistrement peut toutefois faire partie des métadonnées).

Il n’y a pas de règle sur la quantité de métadonnées accessibles dans un fichier. Vous pouvez en trouver très peu ou beaucoup, selon les intentions de son auteur. Pour revenir à la localisation, il est évident que vous ne trouverez pas la moindre information sur un fichier image qui provient d’un appareil photo non équipé d’une fonction GPS.

Et comme vous souhaitez quelques exemples, en voici.

 

Exemple d’une page web

Une page web comprend des balises de description en HTML. La balise de métadonnées se nomme… meta. Son contenu n’est pas toujours lu par les internautes mais il l’est par les moteurs de recherche.

Les balises <meta> sont placées dans le head.

Prenons par exemple deux lignes de code de la page que vous lisez en ce moment.

<meta name = "author" content = "Jean-Yves Baudot" />
<meta name = "Description" content = "Quelques exemples de métadonnées. Niveau classe de seconde (ressources de SNT) " />

La première donne le nom de l’auteur et la seconde indique quel est le contenu de la page afin d'orienter les moteurs de recherche. Vous remarquerez la syntaxe : le type de métadonnée (name) est lié à un contenu (content). Il est recommandé que la « meta description » contienne une phrase allant de 70 à 155 caractères. Un moteur de recherche peut ne pas tout lire si la description est trop longue (plus de 230 caractères).

D’autres types pourraient être ajoutés, par exemple name = "Keywords". Un certain nombre de mots-clés suivrait alors : métadonnées, HTML, photo… Mais en raison d’abus, les moteurs de recherche n’exploitent plus cet attribut tombé en désuétude.

Sans entrer dans les détails, sachez que <meta charset="utf-8"> se trouve sur la quasi-totalité des pages web. L’attribut charset déclare l’encodage de la page.

 

Exemple d’un fichier Word

Sur Windows, le plus simple pour lire les métadonnées d’un fichier Word consiste à ouvrir l’explorateur puis à faire un clic droit sur le nom du fichier. Dans le menu contextuel, cliquez sur Propriétés puis sur Général ou Détails selon les informations cherchées.

Dans le sous-menu Général, vous trouvez l’emplacement du fichier, sa taille, sa date de création, sa date de dernière modification et celle du dernier accès.

Le sous-menu Détail fournit davantage d’informations. En plus les mots clés, vous trouverez des commentaires s’il y en a, le nom de l’auteur, etc. Vous avez aussi des indications sur le contenu, par exemple :

Vous trouvez ensuite la taille du fichier, les dates déjà vues dans le sous-fichier Général, le ou les ordinateurs sur lesquels le fichier a été créé et modifié…

De même, si vous visualisez les métadonnées d’un fichier Powerpoint, vous connaîtrez le nombre de mots, de paragraphes, de diapositives, etc.

 

Exemple d’un fichier image

La même procédure de visualisation s’applique aux fichiers images mais les informations sont évidemment d’une autre nature.

Elles concernent l’image en elle-même (dimensions en pixels, représentation des couleurs…) tandis que d’autres ont été enregistrées par l’appareil photo numérique. Exemple :

Notez que les métadonnées peuvent aussi être extraites avec un petit programme en Python. Il faut pour cela charger la bibliothèque PIL.