← Tous les Projets
Médias / Édition Pipeline de Données Data Engineering

Mozart

Client Prisma Media
Employeur Fidesio
Période
Envergure Traitement de donnees pour 20 millions de vues/mois, 17 sites web
01

Contexte

Developpement de pipelines de donnees avec Python, Apache Airflow et BigQuery sur Google Cloud Platform. Mozart orchestre les flux de donnees de l'ecosysteme Prisma Media, alimentant les outils d'analyse et de segmentation d'audience.

Contexte de l'entreprise

Prisma Media IT-DATA - 1er groupe francais de presse magazine sur Internet. 17 sites, 46 applications, 20 millions de vues/mois.

02

Objectifs

  1. 01 Developper des pipelines de donnees robustes avec Apache Airflow
  2. 02 Integrer BigQuery pour le stockage et l'analyse de donnees a grande echelle
  3. 03 Automatiser les workflows de transformation de donnees
  4. 04 Assurer la fiabilite et le monitoring des pipelines
03

Mon rôle

Data Engineer - Conception et developpement des pipelines Airflow, integration BigQuery, monitoring des workflows data.

04

Fonctionnalités clés

Pipelines de donnees Apache Airflow

Stockage et analyse BigQuery

Orchestration des flux de donnees

Transformation et enrichissement de donnees

Monitoring et alerting des pipelines

06

Résultats

Pipelines data Mozart operationnels, automatisant les flux de donnees de l'ecosysteme Prisma Media sur GCP.

Envergure Traitement de donnees pour 20 millions de vues/mois, 17 sites web