Date et heure de dépôt : 21/05/2025 09:47:34
Référence : 221528
DÉBUT DE MISSION
ASAP
BUDGET
selon le profil € HT / jour
DURÉE
12 mois
LIEU
toulouse / full remote
Hybride
CATÉGORIE TECHNIQUE
Systèmes (Infras, Cloud, DevOps, ...), réseaux, sécurité
Kubernetes
Expert
CI/CD & GitOps
Expert
Terraform / Ansible
Confirmé
GCP/AWS
Confirmé
Contexte de la mission :
--------------------------------
Dans le cadre du développement d'une plateforme IA globale pour les usages internes et externes, une grande organisation recherche un Site Reliability Engineer (SRE) pour assurer la fiabilité, la résilience et la performance de ses systèmes IA en production.
Expérience requise : 5 ans minimum en SRE/Kubernetes, certification CKA appréciée
Missions :
-------------
-Gestion d’infrastructure scalable et résiliente pour modèles IA.
-Déploiement automatisé via CI/CD, GitOps.
-Monitoring, alerting et amélioration continue de la performance.
-Sécurisation des plateformes Kubernetes (IAM, audit, secrets).
-Collaboration avec les équipes Data Science, DevOps, Produits.
-Mise en place de stratégies de reprise d’activité.
-Suivi des coûts et optimisation des ressources.
Compétences & technologies clés :
------------------------------------------------
-Orchestration : Kubernetes, Kubeflow, Rancher
-CI/CD & GitOps : GitLab CI, ArgoCD, Helm
-IaC & Automatisation : Terraform, Ansible, Bash, Python
-Monitoring : Prometheus, Grafana, ELK Stack
-Cloud & GPU : GCP, AWS, clusters GPU, gestion du scaling
-Sécurité : RBAC Kubernetes, secrets management
-Environnement de travail : Linux, conteneurisation avancée
Kubernetes
gitops