Les offres de “Orange”

Nouveau Orange

Stage-Étude d'impact de la langue sur la latence des modèles de transcription de la parole en streaming

  • Stage
  • Cesson-Sévigné (Ille-et-Vilaine)

Description de l'offre

votre rôle

Vos missions quotidiennes :


·  Vous menez une revue de littérature ciblée et formalisez des hypothèses de recherche sur les facteurs de latence en streaming selon les langues, accents et conditions audio
·  Vous concevez un protocole expérimental rigoureux pour mesurer la latence (token emission delay, latence E2E, RTF), avec critères d’inclusion, variables de contrôle et tests statistiques
·  Vous mettez en place et optimisez des pipelines d’inférence streaming en Python/PyTorch, en instrumentant précisément les métriques et en assurant la reproductibilité (scripts, seeds, versions)
·  Vous comparez plusieurs architectures ASR (end-to-end, transducteurs, attention-based…) et analysez les compromis qualité/latence par langue et configuration d’inférence, avec ablations contrôlées
·  Vous réalisez une analyse d’erreurs multilingue (WER/CER par catégories, effets accents/bruit/parole rapide), et investiguez les goulots d’étranglement (chunking, VAD, décodage)
·  Vous documentez vos travaux (journal d’expériences, figures, tableaux, protocole) et préparez des supports en vue d’une diffusion scientifique (rapport, présentation, éventuelle soumission).

 

Vos missions ponctuelles et/ou exemples de projets :

·  Vous réalisez un état de l’art sur l’ASR en streaming et les techniques de réduction/mesure de latence, en synthétisant les approches et leurs limites
·  Vous implémentez un module plug-and-play de mesure fine de la latence et de la qualité, accompagné d’un package de reproductibilité (scripts, configs, README)
·  Vous étudiez l’impact des stratégies de détection de voix (VAD) sur la latence bout-en-bout et recommandez des réglages selon les cas d’usage, étayés par des tests statistiques
·  Vous formalisez un guide de bonnes pratiques “latence vs qualité” par langue, avec recommandations d’inférence (chunking, caching, quantization), profils matériels (CPU/GPU) et check-list de validation.

 

Les compétences que vous aurez l’opportunité de développer grâce à ce stage:

·  Vous consoliderez votre compréhension des systèmes ASR en contexte streaming et votre maîtrise de la méthodologie expérimentale (définition d’hypothèses, protocoles, ablations, tests statistiques)
·  Vous gagnerez en aisance sur la mesure et l’analyse de la latence multilingue, le benchmarking de modèles et l’analyse d’erreurs
·  Vous renforcerez vos pratiques de recherche reproductible (gestion d’expériences, paquets de réplication, documentation) ainsi que vos capacités de synthèse et de rédaction scientifique.

votre profil

Etudiant en M2 (école d’ingénieur ou université), spécialisation IA/ML/traitement de la parole .

Une première expérience en deep learning (projets académiques ou stage) est appréciée.

·  Excellente maîtrise de Python (NumPy, pandas) et de PyTorch pour l’inférence/expérimentation reproductible.
·  Connaissance des modèles et outils ASR, y compris streaming (torchaudio, Hugging Face, architectures type Conformer/Transducer/Whisper).
·  Évaluation et analyse: WER/CER, latence E2E, RTF; bases en statistiques appliquées (tests de signification, bootstrap) et visualisation (matplotlib/seaborn)
·  Environnement de dev: Git, Linux, Docker.
·  Rédaction et diffusion scientifique de base : structuration de résultats, figures/tables claires (LaTeX apprécié).

le plus de l'offre

·  Les avantages de l'offre : Un sujet de recherche appliquée à fort apprentissage, au cœur de la R&D IA d’Orange, avec accès à des ressources de calcul (CPU/GPU).
·   Un encadrement scientifique: mentorat dédié, relectures méthodologiques et séminaires internes.
·  Un cadre de travail bienveillant avec un accès à un écosystème d’experts Data/IA.
·   Les perspectives d’évolution Vos travaux pourront être valorisés par des séminaires internes, un rapport technique structuré, un package de reproductibilité (code, scripts, documentation) et, selon la maturité des résultats, une contribution open source. Une soumission d’article scientifique pourra être envisagée en corédaction avec l’équipe.
·  La promesse employeur Chez Orange, vous mettez votre curiosité au service d’une tech responsable: mesurer, expliquer et optimiser la latence selon les langues pour garantir une expérience équitable, utile et économe en ressources. Ici, relever le défi, c’est allier exigence scientifique, sobriété de calcul et impact concret. Vous questionnez les biais, documentez vos choix et rendez vos résultats reproductibles et transparents. Nous privilégions des solutions qui respectent les utilisateurs et l’environnement, sans céder aux effets de mode. Vous évoluez dans une culture attentionnée où l’audace d’expérimenter va de pair avec l’excellence opérationnelle. Quand vous voulez relever le défi d’une tech responsable, Orange est là.

entité

L’équipe MAS au sein de l'entité DATA AI mène des travaux de R&D sur les technologies de la parole au sens large : reconnaissance automatique de la parole (ASR) multilingue, diarisation, TTS, évaluation et optimisation des modèles.

Nous ancrons nos recherches dans la méthode scientifique : revue de littérature, formulation d’hypothèses, protocoles expérimentaux robustes, analyse statistique et reproductibilité.

Nos résultats sont partagés via rapports techniques, séminaires internes, contributions open source et, lorsque pertinent, soumissions à des ateliers/conférences spécialisées.

contrat

Stage

Durée : 6 mois

Date souhaitée de prise de poste : 01 févr. 2026

Niveau d’études préparé pendant le stage

Indemnité brute selon école

Bac+5

de 1621 € à 2162 € / mois

Seules vos compétences comptent

Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante :  n'hésitez pas à nous faire part de vos besoins spécifiques.

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements