Date et heure de dépôt : 13/06/2025 16:28:52
Référence : 221712
DÉBUT DE MISSION
01/07/2025
BUDGET
550 € HT / jour
DURÉE
6 mois
LIEU
Paris
Hybride
CATÉGORIE TECHNIQUE
BI / Data
Python
Expert
Teradata
Expert
Airflow
Expert
Nous cherchons actuellement un Data Scientist Sénior (H/F) pour l’un de nos clients en Ile de France.
Contexte :
Dans le cadre du renfort de l’équipe Data Science en charge de la modélisation de la consommation énergétique, nous recherchons un Data Scientist sénior (HF) afin d’accompagner les travaux de préparation de données, de développement, de modélisation statistique et d’industrialisation des traitements.
Activités :
Préparation de données :
- Nettoyage, enrichissement et standardisation de données massives (mesures de consommation, données géographiques, données socio-économiques)
- Intégration de sources hétérogènes et structuration des jeux de données en vue de leur exploitation
Développement :
- Développement d’outils et de pipelines en Python structuré et modulaire, avec mise en œuvre de tests unitaires et documentation
- Requêtes et transformations en SQL sur des volumes importants (notamment via Teradata)
Modélisation et analyses statistiques :
- Amélioration continue des modèles de profilage clients et de thermosensibilité
- Traitement de séries temporelles, analyses exploratoires et sélection de variables explicatives
- Application de méthodes statistiques à la modélisation de la consommation et de la production électrique
Automatisation & MCO :
- Mise en place et supervision de workflows de traitement récurrents avec Apache Airflow
- Gestion du code via GitLab CI/CD : tests automatisés, intégration continue, versioning
- Suivi de la qualité des traitements via logs, alertes, supervision technique
Compétences souhaitées :
- Python : structuré, modulaire, avec tests
- SQL (Teradata) : extraction, transformation, requêtes performantes
- Airflow : orchestration de traitements récurrents
- GitLab CI/CD : industrialisation, tests automatisés, versioning
- API REST : exposition et consultation de données
- Statistiques & modélisation
- Traitements de séries temporelles
- Méthodes statistiques appliquées à la consommation/production électrique
- Modèles de profilage client et de thermosensibilité
- Analyse exploratoire, choix de variables explicatives
Profil du candidat
Formation Bac+5 ou doctorat en mathématiques appliquées, statistiques, data science ou équivalent
Profil sénior (minimum 10 ans) en traitement de données massives, modélisation statistique et développement Python.
Très bonne maîtrise des environnements de production : orchestration, automatisation, CI/CD
Capacités analytiques et rigueur dans la validation des résultats
Expérience appréciée dans le secteur de l’énergie (notamment données de consommation/production).
Airflow
GitLab
Python
REST
SQL
Teradata