Vous trouverez ici toutes les ressources pour la partie travaux pratiques du cours sur Spark donné à Télécom pour le Mastère Spécialisé Big Data.
Il y a 3 fichiers de TP:
- TP_1_spark_shell_et_word_count.md
- TP_2_projet_et_pre_processings.md
- TP_3_machine_learning_avec_spark.md
Ce sont les fichiers qu'on utilisera lors des séances de TP.
Vous trouverez également deux autres fichiers : setup.md qui décrit comment installer tout ce qui est nécessaire pour pouvoir faire tourner Spark et créer un projet, et spark_notes.md qui rassemble quelques ressources et généralités sur Spark et sa documentation mais également sur Scala. Il est plus que recommandé de lire ces deux fichiers.