slam:analyse_de_donnees_non_structurees

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
slam:analyse_de_donnees_non_structurees [2025/02/06 10:14] – [Consignes] dthevenotslam:analyse_de_donnees_non_structurees [2025/02/06 22:13] (Version actuelle) – [Consignes] dthevenot
Ligne 1: Ligne 1:
 +~~SLIDESHOW~~
 ====== Cas pratique ====== ====== Cas pratique ======
 Lecture de fichiers texte bruts et extraction d'informations via des outils simples comme grep ou PHP(avec expressions régulières) : **Analyse de Logs Serveur avec PHP et Expressions Régulières** Lecture de fichiers texte bruts et extraction d'informations via des outils simples comme grep ou PHP(avec expressions régulières) : **Analyse de Logs Serveur avec PHP et Expressions Régulières**
Ligne 9: Ligne 10:
  
 **Exemple d'une ligne de log Apache :** **Exemple d'une ligne de log Apache :**
 +=====  =====
 192.168.1.10 - - [05/Feb/2025:10:15:32 +0100] "GET /index.php HTTP/1.1" 200 5320 192.168.1.10 - - [05/Feb/2025:10:15:32 +0100] "GET /index.php HTTP/1.1" 200 5320
  
Ligne 29: Ligne 30:
   * Ouvrir et lire le fichier ligne par ligne avec **fopen()** et **fgets()**.   * Ouvrir et lire le fichier ligne par ligne avec **fopen()** et **fgets()**.
   * Utiliser **preg_match()** pour extraire les IP, les URLs et les codes HTTP.   * Utiliser **preg_match()** pour extraire les IP, les URLs et les codes HTTP.
-  * Stocker et compter les occurrences avec un tableau associatif (array_count_values()).+  * Stocker et compter les occurrences avec un [[https://www.pierre-giraud.com/php-mysql-apprendre-coder-cours/tableau-associatif/|tableau associatif]] (array_count_values()). 
 +=====  =====
   * Afficher les résultats sous forme de statistiques :   * Afficher les résultats sous forme de statistiques :
     * Nombre total de requêtes     * Nombre total de requêtes
Ligne 35: Ligne 37:
     * pages demandées et leur fréquence     * pages demandées et leur fréquence
     * Répartition des codes HTTP     * Répartition des codes HTTP
 +=====  =====
 **Exemple d'algorithme attendu ** **Exemple d'algorithme attendu **
   - Lire le fichier ligne par ligne   - Lire le fichier ligne par ligne
Ligne 42: Ligne 44:
   - Analyser les données (compter les occurrences)   - Analyser les données (compter les occurrences)
   - Afficher les résultats sous forme de statistiques   - Afficher les résultats sous forme de statistiques
 +=====  =====
 **Méthodologie** **Méthodologie**
   - fichier de log [[https://drive.google.com/file/d/1159hXGScDcxLvoYV5fZTTDKbolEPvW6b/view?usp=drive_link|access.log]] fourni   - fichier de log [[https://drive.google.com/file/d/1159hXGScDcxLvoYV5fZTTDKbolEPvW6b/view?usp=drive_link|access.log]] fourni
  • slam/analyse_de_donnees_non_structurees.1738833244.txt.gz
  • Dernière modification : 2025/02/06 10:14
  • de dthevenot