Quand vous pensez « données », vous pensez naturellement aux données structurées : un numéro de client, le montant HT d’une facture, un code postal, etc. Ce sont des données que l’informatique est depuis longtemps capable de collecter, stocker, mais surtout d’analyser.
Une donnée structurée est une donnée pour laquelle on connait par avance le format (la taille, la position), et le type de contenu (nombre, texte, date…).
Une donnée structurée peut être conservée dans la cellule d’une feuille de calcul, dans un champ d’une base de données, etc.
Seule la donnée structurée peut être directement analysée par l’ordinateur. Les autres types de données (semi-structurées, non-structurées) nécessitent d’être converties en données structurées avant de pouvoir être analysées (voir ces termes).
Un exemple de la normalisation qu’il est nécessaire de faire : les adresses postales. Alors qu’une adresse postale incomplète, truffée de fautes d’orthographes, mal organisée, sera comprise par le facteur; de son côté l’ordinateur devra d’abord la transformer en une suite de données structurées (numéro, type de voie, nom de la voie) avant de pouvoir partir à la recherche de doublons éventuels. Lorsque le formulaire vous demande de saisir séparément ces différents champs, c’est pour structurer l’adresse dès sa saisie.
A garder donc en mémoire : l’ordinateur ne sait analyser directement que des données structurées.
Voir aussi : Donnée (Data), Donnée multi-structurée, Donnée non structurée, Donnée semi-structurée