Dans la suite de l’épisode précédent ou nous avions instancié un cluster Hadoop/Spark sur Google Cloud, on va manipuler quelques données avec Spark.
Le code pour lancer le REPL et Filtrer quelques logs :
Dans la suite de l’épisode précédent ou nous avions instancié un cluster Hadoop/Spark sur Google Cloud, on va manipuler quelques données avec Spark.
Le code pour lancer le REPL et Filtrer quelques logs :