Программа для начинающих «датологов» — Data Scientists, которая в том числе учит применять PySpark (компонент Apache Spark) для исследования данных.
Не требует предыдущего опыта с Apache Spark, но требует знать или быстро изучить Python (мини-курс по которому также предлагает).
Цитируем:
«The course assignments include Log Mining, Textual Entity Recognition, Collaborative Filtering exercises that teach students how to manipulate data sets using parallel processing with PySpark».