Loading
Certification incluseprésentiel

AI, ML, BigData & Kafka with GCP

Formation intensive de 10 semaines pour maîtriser les pipelines données massives, streaming temps réel, ML en production et observabilité avec OpenTelemetry sur Google Cloud Platform.

Individuel300 000 FCFA
Étudiant250 000 FCFA
Corporate3 500 000 FCFA12 pers. max
Durée

10 semaines — 100 heures

Niveau

Avancé

Objectifs de la formation

  • Concevoir et déployer des pipelines données en streaming avec Kafka/GKE
  • Maîtriser les opérateurs Kubernetes spécialisés pour la donnée
  • Implémenter une stratégie d'observabilité complète avec OpenTelemetry
  • Exploiter BigQuery, Dataflow, Dataproc pour données massives
  • Développer et déployer modèles ML en production avec Vertex AI
  • Créer dashboards Grafana et gérer SLO/SLI

Prérequis

  • Bases cloud (GCP ou AWS), connaissances SQL, concepts conteneurs
  • Expérience Linux, scripting Python/Bash, notions réseau

Programme Détaillé

Une progression pédagogique pensée pour vous accompagner de la théorie à la pratique.

1

S1-S2 — Kafka & Streaming

8 sujets
  • 1.1
    Architecture Apache Kafka : Brokers, Topics, Partitions, Offsets
  • 1.2
    Consumer Groups et garanties de livraison
  • 1.3
    Kafka Connect : connecteurs source et sink
  • 1.4
    Schema Registry avec Avro/Protobuf
  • 1.5
    Kafka Streams : Topology, KStream vs KTable, Joins, Windowing
  • 1.6
    Google Pub/Sub : architecture Push/Pull, Dead Letter Topics
  • 1.7
    Comparatif Kafka vs Pub/Sub
  • 1.8
    Lab : Pipeline Kafka end-to-end
2

S2 (suite) — Déploiement Kafka sur GKE

5 sujets
  • 2.1
    Installation opérateur Strimzi sur GKE
  • 2.2
    Configuration cluster Kafka hautement disponible
  • 2.3
    Persistent Volumes et StorageClass
  • 2.4
    Kafka Exporter + Prometheus JMX Exporter
  • 2.5
    Lab : Déploiement Kafka sur GKE avec résilience
3

S3-S4 — Kubernetes (GKE) pour la Data

10 sujets
  • 3.1
    Architecture GKE : Autopilot vs Standard
  • 3.2
    Node Pools spécialisés : haute mémoire, GPU
  • 3.3
    StatefulSets vs Deployments pour applications data
  • 3.4
    Persistent Volume Claims et StorageClass régionales
  • 3.5
    Helm 3 : création charts pour Kafka, Spark, Flink
  • 3.6
    Cluster Autoscaler et Node Auto-provisioning
  • 3.7
    HPA basé sur métriques custom (Kafka Consumer Lag)
  • 3.8
    RBAC Kubernetes pour la data
  • 3.9
    Network Policies et Workload Identity
  • 3.10
    Lab : Déploiement job Spark sur GKE
4

S5-S6 — Observabilité & OpenTelemetry

10 sujets
  • 4.1
    Les 3 piliers : Métriques, Logs, Traces
  • 4.2
    Standard OpenTelemetry : spécification, SDK, Collector
  • 4.3
    Instrumentation automatique vs manuelle
  • 4.4
    OTel Collector : pipelines receivers/processors/exporters
  • 4.5
    Tracing distribué : Spans, Traces, W3C TraceContext
  • 4.6
    Backends : Jaeger, Tempo, Cloud Trace
  • 4.7
    Métriques Prometheus : compteurs, jauges, histogrammes
  • 4.8
    Prometheus Operator sur GKE
  • 4.9
    Exportation vers Google Cloud Operations
  • 4.10
    Lab : Instrumentation FastAPI avec OTel
5

S7-S8 — BigData & Processing

10 sujets
  • 5.1
    Apache Beam : modèle batch/streaming unifié
  • 5.2
    Google Dataflow : runners managés, Flex Templates
  • 5.3
    Windowing : Fixed, Sliding, Session Windows
  • 5.4
    Watermarks et Late Data
  • 5.5
    Dataproc : clusters Hadoop/Spark managés
  • 5.6
    BigQuery : colonnes, slots, réservations
  • 5.7
    Partitionnement et Clustering BigQuery
  • 5.8
    BigQuery Storage API
  • 5.9
    Cloud Storage : formats optimaux (Parquet, Avro, ORC)
  • 5.10
    Lab : Pipeline déduplication en streaming vers BigQuery
6

S9-S10 — ML & Monitoring Avancé

9 sujets
  • 6.1
    Vertex AI Studio : exploration, génération prompts
  • 6.2
    Vertex AI Pipelines : orchestration workflows ML
  • 6.3
    Feature Store Vertex AI
  • 6.4
    BigQuery ML : régression, classification, forecasting
  • 6.5
    MLflow sur GKE : tracking, model registry
  • 6.6
    Grafana : datasources multiples, alertes
  • 6.7
    Gestion SLO/SLI
  • 6.8
    AlertManager
  • 6.9
    Lab : Dashboard Grafana + métriques OTel

Prêt à propulser votre carrière ?

Rejoignez nos prochaines sessions et bénéficiez de l'accompagnement de nos experts pour obtenir votre certification.