Data Scientist / ML Engineer (F/H) stage
Stage Nanterre (Hauts-de-Seine)
Description de l'offre
*
- Collecte et nettoyage de documents scannés (PDF, images)
- Extraction du texte et de la structure via des modèles OCR
- Enrichissement sémantique via NER
- Constitution de corpus annotés de haute qualité
- Technos : LayoutLMv3, TrOCR, Tesseract OCR 5, VLMs, spaCy
- Fine-tuning de LLMs via LoRA / QLoRA
- Adaptation de SLMs / TLMs pour des tâches NLP ciblées
- Évaluation des performances (BLEU, ROUGE, F1, OCR accuracy)
- Spécialisation de modèles sur des cas métiers AXA
- Technos : Hugging Face Transformers, PEFT, LoRA
- Construction de pipelines ETL & Feature Engineering
- Intégration des modèles dans des APIs REST
- Garantie de la reproductibilité et de la traçabilité
- Technos : Kedro, FastAPI, Docker
- Entraînement des modèles sur Azure ML / OpenShift AI
- Hyperparameter tuning (Optuna, Ray Tune)
- Arbitrage performance / coûts
- Containerisation des modèles
- Déploiement sur Kubernetes via Helm / Kustomize
- Mise en place de pipelines CI/CD
- Sécurisation, scalabilité et robustesse des services
- Technos : Docker, Kubernetes, Azure DevOps
- Suivi de la performance en production
- Détection de dérives (concept drift, latence, erreurs)
- Automatisation du retraining
- Technos : OpenTelemetry, Dynatrace, Azure ML Pipelines
- Code reviews, pair programming
- Documentation technique et MLOps
- Outils : Markdown, MkDocs, Confluence
Profil recherché
Qualifications :
Vous êtes étudiant en Master 2 ou dernière année de cycle d'ingénieur spécialisé en Data Science, Statistiques, Mathématiques appliquées, Informatique, IA. Vous recherchez un stage de fin d'études (PFE) de 6 mois à partir de février / avril 2026.
Compétences techniques :
Programmation
· Python (pandas, numpy, PyTorch)
Machine Learning & NLP
· Classification, régression, clustering
· Transformers & LLMs (BERT, GPT, LLaMA, T5)
· OCR & Document AI (spaCy, Tesseract, LayoutLM, TrOCR)
MLOps & Cloud
· Git & bonnes pratiques de code
· Pipelines ML
· Microservices
· Docker, Kubernetes, Helm, Kustomize
· Expérience Cloud (Azure apprécié)
Soft skills :
· Autonomie et curiosité intellectuelle
· Esprit d'équipe et collaboration
· Capacité de vulgarisation technique
· Communication claire (écrit / oral)
La motivation, la capacité d'apprentissage et la rigueur sont essentielles.
Rejoignez-nous et contribuez à améliorer les processus de demain grâce à l'intelligence artificielle !