Utilité des traces de mobilité synthétiques : application à la prédiction de la qualité de l'air F/H
Stage Lannion (Côtes-d'Armor)
Description de l'offre
votre rôle
Orange est en train d’établir un observatoire de la mobilité (des personnes et des marchandises), reposant sur l’analyse anonymisée des données de signalisation des réseaux mobiles.
Les données individuelles relatives à la mobilité humaine sont riches en information mais, à l’état brut, elles peuvent révéler des éléments sensibles sur les personnes sous-jacentes. Leur exploitation exige donc des mécanismes de protection limitant le risque de réidentification. Dans ce contexte, les traces de mobilité synthétiques, générées artificiellement à partir de données réelles, représentent une alternative prometteuse : elles visent à préserver la confidentialité des individus tout en conservant les caractéristiques statistiques nécessaires à l’analyse. Le stage évaluera précisément si, et dans quelle mesure, ces données synthétiques peuvent remplacer les données réelles sans dégrader la valeur analytique.
L’objectif principal du stage est d’évaluer dans quelle mesure l’utilisation de traces de mobilité synthétiques issues de modèles génératifs profonds peut alimenter des modèles de prédiction de la qualité de l’air, en comparaison avec l’utilisation de données réelles.
Le stage s’inscrit dans un projet collaboratif de recherche visant à construire une chaine de modélisation de la qualité de l’air à partir des traces de mobilité dérivées des données de signalisation des réseaux mobiles. Le ou la stagiaire interagira avec les différentes parties prenantes du projet (data scientists, experts mobilité/air, ingénieurs), afin d’aligner les hypothèses, partager les résultats et consolider les recommandations.
Dans ce cadre, le ou la stagiaire commencera par réaliser un état de l’art sur l’intégration des données de mobilité dans la prédiction de la qualité de l’air et les métriques associées, afin de bien comprendre les approches existantes et les enjeux associés.
Il ou elle analysera ensuite différentes versions de traces de mobilité synthétiques, à partir d’une base de données de trace de mobilité réelles en étudiant leurs caractéristiques statistiques (distributions des trajets, dynamiques temporelles, matrices origine–destination, corrélations spatio-temporelles). Ces traces synthétiques seront intégrées dans un ou plusieurs modèles de prédiction de la qualité de l’air, afin d’évaluer leur impact sur la performance prédictive par rapport à des modèles entrainés avec des traces de mobilités réelles, en mobilisant des métriques appropriées. Enfin, une analyse approfondie des résultats permettra d’identifier les limites de des données synthétiques du point de vue de l’utilité et de proposer des pistes d’amélioration ou des perspectives pour de futurs travaux.
Le travail aboutira à un protocole d’évaluation reproductible, un corpus de code documenté (Python) pour l’intégration et l’évaluation des données synthétiques. Selon l’avancement, des contributions scientifiques (papier de recherche) pourront être envisagées.
votre profil
Ce sujet demandera au stagiaire de faire preuve de curiosité et d’esprit d’analyse afin d’évaluer les traces de mobilité synthétiques, en particulier pour nourrir des modèles de prédiction de la qualité de l’air. Largement collaboratif, l’étudiant devra rapidement entrer en interaction avec les différentes parties-prenantes du projet, et savoir faire preuve de synthèse. Enfin, le travail d’analyse statistique sollicitera ses compétences en développement et en traitement de données. Le candidat recherché aura donc un profil de niveau M2 ou supérieur, data scientist, développeur ou ingénieur généraliste, avec des connaissances de base en Python et certaines librairies d’analyse de données (Pandas).
Profil Bac +4 ou +5 en école d’ingénieur ou master en informatique, data science et intelligence artificielle, ou mathématiques appliquées, Connaissance des méthodes de machine learning.
· Connaissances en mathématiques appliquées : statistiques et algorithmes
· Connaissances et expériences en Datascience : apprentissage automatique, deep learning
· Expérience de développement en Python, ainsi que des librairies de datascience (pandas, dask, numpy) et machine learning (sklearn, keras, pytorch)
· Capacité à lire des articles scientifiques en anglais
· Esprit de synthèse et communication aisée
entité
Au sein d’Orange Innovation, la direction FCW (Future Communication & Workplace) a pour mission de définir les orientations, de concevoir et de construire les services de communication, collaboration et environnement de travail.
Vous intégrez le département BDW (Business Digital Workplace) qui vise à améliorer l’efficacité au travail et à fluidifier la collaboration en apportant des solutions d’orchestration, d’intégration et de simplification pour les services digitaux et d’analyse des données. Au sein de ce département, vous piloterez l’équipe WIDE (Workplace, Interactions and Data for Enterprise) dont le large panel d’activités va de la recherche, à l’exploration et au développement de services pour les entreprises.
contrat
Stage
Durée : 6 mois
Date souhaitée de prise de poste : 01 févr. 2026
Niveau d’études préparé pendant le stage
Indemnité brute selon école
Bac+5
de 1621 € à 2162 € / mois
Seules vos compétences comptent
Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante : n'hésitez pas à nous faire part de vos besoins spécifiques.