Les données structurées

Tables de données

Ce qui vous attend ici est une initiation à la structuration des données, matière première de tout traitement numérique. Une initiation qui peut s’insérer dans un cours de SNT (classe de seconde).

 

Table des données

Les données sont des valeurs qui décrivent des objets (des personnes, des concepts…).

Elles sont structurées dans des tables, pouvant être représentées sous forme de tableaux parfois gigantesques, où la première ligne est un intitulé qui décrit le format des lignes suivantes.

Ces intitulés sont les noms des champs (ou critères).

Un ensemble de données ayant la même description est appelé série de données ou collection.

Une donnée peut être élémentaire (caractéristique de base) ou non (par exemple une adresse qui concatène un numéro, une rue, un code postal, une commune… ou encore un pourcentage calculé à partir de deux valeurs élémentaires).

Elle se distingue aussi selon sa nature : nombre, date, texte, son, image… Le descripteur définit les caractéristiques d’une donnée. Par exemple, une adresse peut être une chaîne de 30 caractères. Notez que dans cet exemple le numéro et le code postal ne sont pas considérés comme des nombres (on ne fait aucun calcul dessus).

Ci-dessous apparaissent les menus et sous-menus d’Access, logiciel de gestion de base de données de Microsoft, lors d’une création de table. La capture d’écran vous donne un aperçu des différents formats que peut prendre une donnée.

Une base de données est un ensemble de tables liées entre elles.

Voici par exemple deux extraits de tables qui peuvent être reliées, formant ainsi une base de données :

Collection Services

Service Code Budget
Cardiologie CA00121 450000
Chirurgie CH00245 800000
Urgences UR77770 250000

Collection Commandes

Code produit Intitulé produit Code fournisseur Montant Code service
XXCF45V Blouse DES541 522,00 CH00245
CCDD89O Seringue 10 ml KKJ888 200,00 OB18771
SSCW66L Drap d’examen DES541 230,00 UR77770

Par exemple, on remarque que le service de chirurgie (code CH00245) a passé une commande de blouses pour 522 €.

 

Formats de fichiers

Ne pas confondre avec les formats de données définis par les descripteurs (numérique, date…).

Un fichier est enregistré selon un format déterminé (CVS, XML, JSON…). Si un type de donnée réclame un format particulier (son, photo, dessin, vidéo…), il se trouve dans un fichier distinct mais une clé permet de faire le lien avec le reste de la collection.

Le format CVS (Comma Separated Values) est facile à gérer. Comme son nom l’indique, les valeurs sont séparées par des virgules ou des points-virgules. Dans les pays anglo-saxons, le séparateur décimal étant le point, le séparateur de champs est la virgule.

Voici par exemple un tout petit fichier CVS avec points-virgules :

Une ouverture de ce fichier avec Excel rend sa lecture plus aisée.

Aujourd’hui, les données que l’on peut obtenir par Internet de la part des grands organismes (INSEE, SNCF…) ne sont plus disponibles en CVS mais en XLSX, c’est-à-dire en format Excel.