Open_prices

Contexte et objectifs

Le projet « Open Prices » exploite un jeu de données open data recensant les prix de produits de consommation courante, alimentaires et non alimentaires.
Trois axes ont été définis :

  • Identifier d’éventuelles anomalies de prix
  • Analyser les tendances tarifaires par produit et zone géographique
  • Étudier la dynamique des promotions et remises

À ce stade, j’ai uniquement mené l’analyse des tendances tarifaires, tandis que le volume et la qualité des données disponibles limitent encore les autres axes.

Méthodologie

Pour traiter ce projet, j’ai appliqué une approche rigoureuse :

Transformations spécifiques : extraction du nom des magasins, nettoyage des labels via expressions régulières pour isoler l’information pertinente.

Compréhension et préparation des données : typage des colonnes, traitement des valeurs nulles, suppression des colonnes inutiles ou redondantes, standardisation des chaînes de caractères.

Analyse exploratoire : étude des variables numériques et catégorielles, distributions, statistiques descriptives et corrélations numériques.

Les contraintes techniques et le volume de données ont limité certaines analyses : pas de corrélation catégorielle complète, pas d’analyse temporelle exhaustive, pas de visualisation géographique complète.

Résultats obtenus

  • Analyse des tendances tarifaires par produit et zone géographique
  • Visualisations interactives via Streamlit pour explorer les données
  • Documentation complète du projet via MkDocs

Perspectives

  • Le projet pourra évoluer à mesure que le dataset s’enrichira
  • Les analyses d’anomalies et des promotions seront abordées lorsque le volume et la qualité des données le permettront