Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
slam:analyse_de_donnees_non_structurees [2025/02/06 08:50] – [Consignes] dthevenot | slam:analyse_de_donnees_non_structurees [2025/02/06 22:13] (Version actuelle) – [Consignes] dthevenot | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ~~SLIDESHOW~~ | ||
====== Cas pratique ====== | ====== Cas pratique ====== | ||
- | |||
Lecture de fichiers texte bruts et extraction d' | Lecture de fichiers texte bruts et extraction d' | ||
- | ===== Objectif | + | ===== Objectif |
Voius allez analyser un fichier de logs serveur (format Apache, Nginx, ou autre) en utilisant PHP et les expressions régulières. Vous devrez extraire des informations spécifiques comme les adresses IP, les codes de réponse HTTP, et les URLs demandées. | Voius allez analyser un fichier de logs serveur (format Apache, Nginx, ou autre) en utilisant PHP et les expressions régulières. Vous devrez extraire des informations spécifiques comme les adresses IP, les codes de réponse HTTP, et les URLs demandées. | ||
- | ===== Contexte | + | ===== Contexte |
Un site web génère un fichier de logs où chaque ligne contient des informations sur une requête effectuée par un utilisateur. Ces logs sont essentiels pour analyser le trafic, détecter des erreurs ou repérer des comportements suspects. | Un site web génère un fichier de logs où chaque ligne contient des informations sur une requête effectuée par un utilisateur. Ces logs sont essentiels pour analyser le trafic, détecter des erreurs ou repérer des comportements suspects. | ||
**Exemple d'une ligne de log Apache :** | **Exemple d'une ligne de log Apache :** | ||
+ | ===== ===== | ||
192.168.1.10 - - [05/ | 192.168.1.10 - - [05/ | ||
Ligne 22: | Ligne 20: | ||
* 5320 → Taille de la réponse en octets | * 5320 → Taille de la réponse en octets | ||
- | ===== Objectifs du cas pratique | + | ===== Objectifs du cas pratique |
* Charger un fichier de logs en PHP : [[https:// | * Charger un fichier de logs en PHP : [[https:// | ||
* Extraire : | * Extraire : | ||
Ligne 31: | Ligne 28: | ||
===== Consignes ===== | ===== Consignes ===== | ||
- | + | | |
- | | + | * Utiliser |
- | * Utiliser preg_match() pour extraire les IP, les URLs et les codes HTTP. | + | * Stocker et compter les occurrences avec un [[https:// |
- | * Stocker et compter les occurrences avec un tableau associatif (array_count_values()). | + | ===== ===== |
* Afficher les résultats sous forme de statistiques : | * Afficher les résultats sous forme de statistiques : | ||
* Nombre total de requêtes | * Nombre total de requêtes | ||
- | * Liste des IP uniques | + | * Liste des IP uniques |
- | * Top 5 des pages les plus demandées | + | * pages demandées |
* Répartition des codes HTTP | * Répartition des codes HTTP | ||
+ | ===== ===== | ||
**Exemple d' | **Exemple d' | ||
- Lire le fichier ligne par ligne | - Lire le fichier ligne par ligne | ||
Ligne 47: | Ligne 44: | ||
- Analyser les données (compter les occurrences) | - Analyser les données (compter les occurrences) | ||
- Afficher les résultats sous forme de statistiques | - Afficher les résultats sous forme de statistiques | ||
+ | ===== ===== | ||
**Méthodologie** | **Méthodologie** | ||
- fichier de log [[https:// | - fichier de log [[https:// | ||
- fichier à compléter [[https:// | - fichier à compléter [[https:// | ||
- récupérer les 2 fichiers, les mettre sur votre serveur php dans un dossier **donnees** | - récupérer les 2 fichiers, les mettre sur votre serveur php dans un dossier **donnees** | ||
- | - comprendre le code fourni, notamment la fonction preg_match utilisée | + | - comprendre le code fourni, notamment la fonction |
- | - compléter le code et tester | + | - que fait le code actuel ? que manque t'il ? |
+ | - commenter, |