Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
slam:analyse_de_donnees_non_structurees [2025/02/06 09:47] – dthevenot | slam:analyse_de_donnees_non_structurees [2025/02/06 22:13] (Version actuelle) – [Consignes] dthevenot | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ~~SLIDESHOW~~ | ||
====== Cas pratique ====== | ====== Cas pratique ====== | ||
Lecture de fichiers texte bruts et extraction d' | Lecture de fichiers texte bruts et extraction d' | ||
Ligne 9: | Ligne 10: | ||
**Exemple d'une ligne de log Apache :** | **Exemple d'une ligne de log Apache :** | ||
+ | ===== ===== | ||
192.168.1.10 - - [05/ | 192.168.1.10 - - [05/ | ||
Ligne 29: | Ligne 30: | ||
* Ouvrir et lire le fichier ligne par ligne avec **fopen()** et **fgets()**. | * Ouvrir et lire le fichier ligne par ligne avec **fopen()** et **fgets()**. | ||
* Utiliser **preg_match()** pour extraire les IP, les URLs et les codes HTTP. | * Utiliser **preg_match()** pour extraire les IP, les URLs et les codes HTTP. | ||
- | * Stocker et compter les occurrences avec un tableau associatif (array_count_values()). | + | * Stocker et compter les occurrences avec un [[https:// |
+ | ===== ===== | ||
* Afficher les résultats sous forme de statistiques : | * Afficher les résultats sous forme de statistiques : | ||
* Nombre total de requêtes | * Nombre total de requêtes | ||
Ligne 35: | Ligne 37: | ||
* pages demandées et leur fréquence | * pages demandées et leur fréquence | ||
* Répartition des codes HTTP | * Répartition des codes HTTP | ||
+ | ===== ===== | ||
**Exemple d' | **Exemple d' | ||
- Lire le fichier ligne par ligne | - Lire le fichier ligne par ligne | ||
Ligne 42: | Ligne 44: | ||
- Analyser les données (compter les occurrences) | - Analyser les données (compter les occurrences) | ||
- Afficher les résultats sous forme de statistiques | - Afficher les résultats sous forme de statistiques | ||
+ | ===== ===== | ||
**Méthodologie** | **Méthodologie** | ||
- fichier de log [[https:// | - fichier de log [[https:// | ||
- fichier à compléter [[https:// | - fichier à compléter [[https:// | ||
- récupérer les 2 fichiers, les mettre sur votre serveur php dans un dossier **donnees** | - récupérer les 2 fichiers, les mettre sur votre serveur php dans un dossier **donnees** | ||
- | - comprendre le code fourni, notamment la fonction [[Aide preg_match]] utilisée | + | - comprendre le code fourni, notamment la fonction |
- que fait le code actuel ? que manque t'il ? | - que fait le code actuel ? que manque t'il ? | ||
- | - compléter le code et tester | + | - commenter, |