Apache Spark

Apache Spark est un moteur de traitements distribués sur des gros volumes de données.

Souvent mis en opposition au modèle mapreduce implémenté dans Hadoop, il en est en fait une extension qui peut en diviser les temps d’exécution jusqu’à un facteur de 100 en maximisant le travail « in-memory ».

Spark exploite les principes de programmation fonctionnelle afin d’optimiser l’empreinte mémoire nécessaire à son exécution. Conçu pour mettre en œuvre des traitements distribués, Spark peut s’appuyer sur plusieurs types de clusters, dont YARN le négociateur de ressources intégré à Hadoop.

  • +15
    ans d'expérience pour tous nos formateurs
  • 3
    jours

À qui s’adresse cette formation "Apache Spark" ?

Architectes
Chefs de projet
Data Scientists
Développeurs
Inscrivez-vous

Description de la formation "Apache Spark"

Les prochaines dates pour cette formation

Aucune formation planifiée...

Nos autres formations en hautes technologies

Prêt(e) à vous former ? Demandez l'excellence

  1. Vous remplissez ce formulaire
  2. Nous vous recontactons sous 48h
  3. Nous finalisons ensemble votre inscription