Une donnée est un élément se rapportant à un objet, une personne ou un événement. Une donnée est dépourvue de sens alors qu'une information est l'interprétation d'une donnée. Les données ont :
Les données structurées sont organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d'information spécifique. Les principaux formats utilisés pour représenter un ensemble de données sont le CSV , le JSON et le XML.
Les données non structurées sont des informations qui ne suivent pas un format ou un modèle prédéfini, ce qui les rend difficiles à organiser et à analyser à l'aide des outils traditionnels de gestion de bases de données. Contrairement aux données structurées, qui sont organisées en tableaux avec des lignes et des colonnes, les données non structurées n'ont pas de structure fixe.
Identifiez les éléments de la liste qui correspondent à des données structurées et à des données non structurées :
Définition
Une donnée structurée est une donnée qui a été prédéfinie et formatée selon une structure précise avant d’être placée dans un data warehouse, un processus désigné par « schema-on-write », ou schéma à l’écriture. La base de données relationnelle est le meilleur exemple de données structurées : les données ont été formatées dans des champs précisément définis, comme le numéro de carte de crédit ou l’adresse, pour être facilement interrogées avec SQL.
Les données, avant d’être exploitées, peuvent être contenues dans des fichiers CSV (Commaseparated values). Dans ces fichiers, elles sont sous un format texte simple et séparées les unes des autres par un caractère (virgule, point-virgule, tabulation). Il est ainsi possible d’exporter ou d’importer des données, par exemple un carnet d’adresses.
Ces fichiers peuvent être convertis sous forme d’une table de données : chaque ligne du fichier CSV correspond à une ligne du tableau et les séparateurs à ses colonnes. Il devient alors possible d’organiser et de trier les données.
Il existe d’autres formats de données structurées :
Le CSV et le JSON sont simples à écrire et à lire, contrairement au XML qui nécessite des lignes de code. Le CSV est rigide (tous les descripteurs doivent être renseignés), contrairement au XML et au JSON. Le XML est le format le plus rapide à traiter par la machine.
Note: Découverte du format XML, JSON et YAM
L'open data correspond à une volonté politique d'ouvrir les données jugées d'intérêt public afin d'encourager leur réutilisation par tout un chacun. Cela permet d'encourager la transparence démocratique, de bénéficier de services au quotidien ou de prendre des décisions plus éclairées.
L'État français rend publique les données qu'il a développé dans le cadre de ses missions et qu'il juge non sensibles à l'adresse suivante : https://www.data.gouv.fr.