slam:donneestructurees:introduction

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
slam:donneestructurees:introduction [2024/12/19 14:29] dthevenotslam:donneestructurees:introduction [2025/02/06 11:19] (Version actuelle) – [Données ouvertes] dthevenot
Ligne 1: Ligne 1:
 ~~SLIDESHOW~~ ~~SLIDESHOW~~
-Une donnée est un élément se rapportant à un objet, une personne ou un événement. Une donnée est dépourvue de sens alors qu'une information est l'interprétation d'une donnée.+====== Les données structurées et non structurées ====== 
 +=====  ===== 
 +Une **donnée** est un élément se rapportant à un objet, une personne ou un événement. Une donnée est dépourvue de sens alors qu'une information est l'interprétation d'une donnée.
 Les données ont : Les données ont :
   * Des formats divers : nombre, caractère, chaîne de caractères, oral, écrite,…   * Des formats divers : nombre, caractère, chaîne de caractères, oral, écrite,…
   * Des longueurs variables : 1 caractère, 500 caractères,   * Des longueurs variables : 1 caractère, 500 caractères,
   * Des valeurs    * Des valeurs 
-  + 
-====== Les bases de données relationnelles : données structurées ou non structurées ? ======+Les **données structurées** sont organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d'information spécifique. Les principaux formats utilisés pour représenter un ensemble de données sont le CSV , le JSON et le XML. 
 + 
 +Les **données non structurées** sont des informations qui ne suivent pas un format ou un modèle prédéfini, ce qui les rend difficiles à organiser et à analyser à l'aide des outils traditionnels de gestion de bases de données. Contrairement aux données structurées, qui sont organisées en tableaux avec des lignes et des colonnes, les données non structurées n'ont pas de structure fixe. 
 + 
 +Identifiez les éléments de la liste qui correspondent à des données structurées et à des données non structurées : 
 +  - Un relevé bancaire 
 +  - Un courriel 
 +  - Une circulaire d’épicerie 
 +  - Un bulletin scolaire 
 +  - Les résultats trouvés par un moteur de recherche en ligne  
 + 
 +===== Les bases de données relationnelles : données structurées ou non structurées ? =====
  
   * Un contexte (qui utilisera ? quel objectif ?)   * Un contexte (qui utilisera ? quel objectif ?)
Ligne 14: Ligne 27:
   * Mise en place de liens évident entre les données   * Mise en place de liens évident entre les données
   * Facilement exploitable, interrogeable (SQL)   * Facilement exploitable, interrogeable (SQL)
 +=====  =====
 => Les bases de données relationnelles = un moyen de recueillir et présenter des données structurées => Les bases de données relationnelles = un moyen de recueillir et présenter des données structurées
 {{ :promo_2025:slam:bdr.png?600 |}} {{ :promo_2025:slam:bdr.png?600 |}}
-**définition**+=====  ===== 
 +**Définition**
  
 Une donnée structurée est une donnée qui a été prédéfinie et formatée selon une structure précise avant d’être placée dans un data warehouse, un processus désigné par « schema-on-write », ou schéma à l’écriture. La base de données relationnelle est le meilleur exemple de données structurées : les données ont été formatées dans des champs précisément définis, comme le numéro de carte de crédit ou l’adresse, pour être facilement interrogées avec SQL. Une donnée structurée est une donnée qui a été prédéfinie et formatée selon une structure précise avant d’être placée dans un data warehouse, un processus désigné par « schema-on-write », ou schéma à l’écriture. La base de données relationnelle est le meilleur exemple de données structurées : les données ont été formatées dans des champs précisément définis, comme le numéro de carte de crédit ou l’adresse, pour être facilement interrogées avec SQL.
  
-====== Autres exemples de données structurées : CSV, JSON, XML ======+===== Autres exemples de données structurées : CSV, JSON, XML =====
  
 ===== Le format CSV ===== ===== Le format CSV =====
    
 Les données, avant d’être exploitées, peuvent être contenues dans des fichiers CSV (Commaseparated values). Dans ces fichiers, elles sont sous un format texte simple et séparées les unes des autres par un caractère (virgule, point-virgule, tabulation). Il est ainsi possible d’exporter ou d’importer des données, par exemple un carnet d’adresses.  Les données, avant d’être exploitées, peuvent être contenues dans des fichiers CSV (Commaseparated values). Dans ces fichiers, elles sont sous un format texte simple et séparées les unes des autres par un caractère (virgule, point-virgule, tabulation). Il est ainsi possible d’exporter ou d’importer des données, par exemple un carnet d’adresses. 
 +=====  =====
 Ces fichiers peuvent être convertis sous forme d’une table de données : chaque ligne du fichier CSV correspond à une ligne du tableau et les séparateurs à ses colonnes. Il devient alors possible d’organiser et de trier les données.  Ces fichiers peuvent être convertis sous forme d’une table de données : chaque ligne du fichier CSV correspond à une ligne du tableau et les séparateurs à ses colonnes. Il devient alors possible d’organiser et de trier les données. 
 +=====  =====
 Il existe d’autres formats de données structurées : Il existe d’autres formats de données structurées :
   * Le format **JSON** (JavaScript Object Notation) associe les données avec une étiquette (descripteur) sous forme d’une liste, c’est un format de données textuelles dérivé du langage JavaScript. ;    * Le format **JSON** (JavaScript Object Notation) associe les données avec une étiquette (descripteur) sous forme d’une liste, c’est un format de données textuelles dérivé du langage JavaScript. ; 
   * Le format **XML** (Extensible Markup Language) utilise des balises (mot entre < et >) pour organiser les informations en sous-éléments.  C’est un format utilisé pour l'échange automatisé entre systèmes d'informations.   * Le format **XML** (Extensible Markup Language) utilise des balises (mot entre < et >) pour organiser les informations en sous-éléments.  C’est un format utilisé pour l'échange automatisé entre systèmes d'informations.
-  * +=====  ===== 
 Le CSV et le JSON sont simples à écrire et à lire, contrairement au XML qui nécessite des lignes de code. Le CSV est rigide (tous les descripteurs doivent être renseignés), contrairement au XML et au JSON. Le XML est le format le plus rapide à traiter par la machine. Le CSV et le JSON sont simples à écrire et à lire, contrairement au XML qui nécessite des lignes de code. Le CSV est rigide (tous les descripteurs doivent être renseignés), contrairement au XML et au JSON. Le XML est le format le plus rapide à traiter par la machine.
 {{ :promo_2025:slam:formatsdonnees.png?600 |}} {{ :promo_2025:slam:formatsdonnees.png?600 |}}
-Découverte du format XML+<bootnote>Découverte du format XML, JSON et YAM</bootnote> 
 + 
 +===== Données ouvertes ===== 
 + 
 +L'**open data** correspond à une volonté politique d'ouvrir les données jugées d'intérêt public afin d'encourager leur réutilisation par tout un chacun. Cela permet d'encourager la transparence démocratique, de bénéficier de services au quotidien ou de prendre des décisions plus éclairées.
  
 +L'État français rend publique les données qu'il a développé dans le cadre de ses missions et qu'il juge non sensibles à l'adresse suivante : https://www.data.gouv.fr.
  • slam/donneestructurees/introduction.1734614986.txt.gz
  • Dernière modification : 2024/12/19 14:29
  • de dthevenot