Phoenix CMS Accéder au BO

SCIENCES, TECHNOLOGIES - MATHÉMATIQUES, STATISTIQUES

Stage en Data Quality dans un environnement Cloud F/H


Orange SA
Montigny-le-Bretonneux

Réf. 1049949 - publié le 30 octobre 2024


M'alerter sur les offres

Informations générales

DOMAINE DE FORMATION

Sciences, technologies - Mathématiques, statistiques

NIVEAU D'ÉTUDES

Bac +5

GRATIFICATION

0 10000 ANNEE



Missions

Orange SA vous propose une offre de stage dans les domaines Sciences, technologies, Mathématiques, statistiques à Montigny-le-Bretonneux.

Le stagiaire rejoindra l'équipe Collecte de DATA IA sur la mise en place d'indicateur généraux de qualité de service sur les données disponibles sur le Cloud public. Il pourra côtoyer les data Engineer et les data-scientists de la communauté d'Orange.

La Data Mediation Zone collecte les données de 450 sources différentes. Son patrimoine est d'un peu plus de 4000 flux. Assurer la qualité des données est essentiel pour garantir un usage efficace et éclairé. Les équipes utilisant ces données doivent être informées de leur niveau de qualité, classé en trois catégories : Or, Argent et Bronze (L'utilisation de données de catégorie Bronze, qui présentent une qualité de service insuffisante, peut compromettre les résultats des traitements)

Pour cela, il faudra travailler sur 4 étapes principales :
- Elaboration des règles de classification " Or ", " argent ", " Bronze " : Analyser divers indicateurs de qualité de service (complétude, fraîcheur, taux de rejet, etc.) et proposer des règles de classification pour les données.
- Développement de la classification : Concevoir, tester et valider les classifications dans un environnement de développement, puis les déployer en production.
- Création d'un tableau de bord " Golden Data " : Mettre en place un tableau de bord classant les données en catégories Or, Argent et Bronze, avec des justifications pour chaque classement. Ce tableau servira de référence pour les utilisateurs et aidera à identifier les sources nécessitant des améliorations en qualité de service et qualité des données.
- Validation des performances d'exécution : S'assurer que la solution est compatible avec les développements de collecte de données, tout en portant une attention particulière aux coûts opérationnels.
L'outil doit pouvoir traiter un très grand nombre de données (tant en quantité qu'en variété). Il doit être frugale (coûts peu élevés)

Sous la responsabilité d'un tuteur et dans le respect des règles de l'art et des normes de sécurité Orange, le stagiaire aura la charge de définir, modéliser, et mettre en place cet outil ainsi que de le documenter.


Profil

Etudiant.e en école d'ingénieur ou de master dans le domaine de l'informatique, vous possédez :
- Connaissance des Bases de Données : Compréhension des systèmes de gestion de bases de données (SQL, NoSQL).

- Compétences en Programmation : Maîtrise de langages comme Python,  Spark ou Java pour le traitement des données.

- Analyse de Données : Capacité à utiliser des outils d'analyse et de visualisation (ex. : Tableau, Power BI).

Optionnel :
- Connaissance de l'environnement GCP (GCS, dataflow, composer, BQ)


Postuler

Nom du recruteur : Karine WACHEUX


Offres similaires

Nos sélections d'offres de stages

Les articles en lien

Partagez sur les réseaux sociaux !