Réalisé dans le cadre d'une simulation de partenariat avec le Ministère de la Transition Écologique, ce projet consiste en la conception, l'implémentation et la validation d'une base de données relationnelle centralisée dédiée au suivi de la qualité de l'air en France.
L'objectif principal était de structurer la collecte massive de données issues de capteurs régionaux (CO₂, CH₄, N₂O) pour permettre leur analyse par des agences décentralisées. Ce projet démontre une expertise complète en ingénierie des données, allant de la modélisation conceptuelle (MCD) à l'optimisation de requêtes SQL complexes pour le décisionnel.
| Compétence Clé | Détail de l'Implémentation |
|---|---|
| Architecture de Données | Conception d'un schéma relationnel normalisé (3NF) gérant des entités interconnectées complexes : Agences, Personnel, Capteurs, et Séries Temporelles de mesures. |
| SQL Avancé | Développement de scripts DDL (structure) et DML (manipulation). Création de requêtes d'agrégation, de jointures multiples et de fenêtrage pour les rapports d'analyse. |
| Qualité & Intégrité | Mise en place de contraintes fortes (Clés étrangères, CHECK, UNIQUE) pour garantir la fiabilité des données environnementales critiques. |
| Gestion de Projet SI | Simulation d'un contexte professionnel réel : hiérarchie des utilisateurs (Chefs d'agence, Techniciens), gestion des rapports d'incidents et conformité réglementaire. |
Le système est bâti autour de quatre piliers fonctionnels interconnectés :
Modélisation de la structure administrative des Agences Régionales.
- Hiérarchie : Gestion des rôles (Directeurs, Agents Administratifs, Techniciens).
- Ressources Humaines : Suivi des effectifs par région et département.
Gestion de l'inventaire matériel déployé sur le territoire.
- Suivi Matériel : État des capteurs (En service, En panne), localisation précise, dates de maintenance.
- Typologie : Classification des capteurs selon les gaz mesurés.
Le cœur du système : stockage et historisation des relevés.
- Séries Temporelles : Enregistrement des concentrations de polluants datées et géolocalisées.
- Alertes : Détection de dépassements de seuils critiques via requêtes d'analyse.
Production d'indicateurs pour le Ministère.
- Statistiques Régionales : Moyennes de pollution par zone géographique.
- Rapports d'Analyse : Stockage des interprétations rédigées par les agents administratifs.
- Un SGBD compatible SQL (MySQL, MariaDB, ou PostgreSQL).
- Un client SQL (DBeaver, MySQL Workbench, ou ligne de commande).
-
Cloner le dépôt :
git clone [https://github.com/votre-username/projet-cleardata.git](https://github.com/votre-username/projet-cleardata.git)
-
Importer la base de données : Exécutez le script SQL principal pour créer la structure et peupler les données initiales.
SOURCE REQUETES/BASE DE DONNEE FINALE.sql;
-
Tester les requêtes : Utilisez le fichier
REQUETES/all_requetes.txtpour lancer des analyses exemples (ex: "Moyenne de CO2 en Île-de-France").
Une documentation complète détaillant le dictionnaire des données et les choix d'architecture est disponible dans le fichier DOCUMENTATION.md ou sur le GitBook du projet.