Mozart
Prisma Media
Contexte
Developpement de pipelines de donnees avec Python, Apache Airflow et BigQuery sur Google Cloud Platform. Mozart orchestre les flux de donnees de l'ecosysteme Prisma Media, alimentant les outils d'analyse et de segmentation d'audience.
Contexte de l'entreprise
Prisma Media IT-DATA - 1er groupe francais de presse magazine sur Internet. 17 sites, 46 applications, 20 millions de vues/mois.
Objectifs
- 01 Developper des pipelines de donnees robustes avec Apache Airflow
- 02 Integrer BigQuery pour le stockage et l'analyse de donnees a grande echelle
- 03 Automatiser les workflows de transformation de donnees
- 04 Assurer la fiabilite et le monitoring des pipelines
Mon rôle
Data Engineer - Conception et developpement des pipelines Airflow, integration BigQuery, monitoring des workflows data.
Fonctionnalités clés
Pipelines de donnees Apache Airflow
Stockage et analyse BigQuery
Orchestration des flux de donnees
Transformation et enrichissement de donnees
Monitoring et alerting des pipelines
Résultats
Pipelines data Mozart operationnels, automatisant les flux de donnees de l'ecosysteme Prisma Media sur GCP.