slam:introduction_aux_donnees_non_structurees

Ceci est une ancienne révision du document !


INTRODUCTION

Sources :

Une donnée est une valeur (numérique ou textuelle) représentant une information.

Les données structurées sont organisées en éléments prédéfinis, chacun correspondant à un concept ou à un élément d'information spécifique. Les principaux formats utilisés pour représenter un ensemble de données sont le CSV , le JSON et le XML.

Les données non structurées sont des informations qui ne suivent pas un format ou un modèle prédéfini, ce qui les rend difficiles à organiser et à analyser à l'aide des outils traditionnels de gestion de bases de données. Contrairement aux données structurées, qui sont organisées en tableaux avec des lignes et des colonnes, les données non structurées n'ont pas de structure fixe.

Les données non structurées englobent une variété de formats, notamment :

  • Documents texte : fichiers Word, PDF, etc.
  • E-mails : contenu des courriels et pièces jointes.
  • Images : photos, graphiques, etc.
  • Vidéos : enregistrements, films, etc.
  • Enregistrements audio : podcasts, messages vocaux, etc.
  • Publications sur les réseaux sociaux : tweets, posts Facebook, etc.
  • Données issues de capteurs IoT : flux de données en temps réel sans format prédéfini.
Caractéristique Données Structurées Données Non Structurées
Format Organisées en tableaux avec des lignes et des colonnes. Pas de structure prédéfinie ou de modèle fixe.
Exemples Bases de données relationnelles, feuilles de calcul. Documents texte, images, vidéos, enregistrements audio.
Stockage Stockées dans des bases de données relationnelles avec des schémas définis. Stockées dans leur format d'origine, souvent dans des systèmes de fichiers ou des bases de données NoSQL.
Analyse Facilement analysées à l'aide de requêtes SQL et d'outils analytiques traditionnels. Nécessitent des techniques avancées comme le traitement du langage naturel ou l'analyse d'images.
Gestion Bien prises en charge par les systèmes de gestion de bases de données traditionnels. Requièrent des solutions spécialisées pour le stockage, la gestion et l'analyse.
  • slam/introduction_aux_donnees_non_structurees.1738743533.txt.gz
  • Dernière modification : 2025/02/05 09:18
  • de dthevenot