O Apache Spark é um framework para processamento paralelo e oferece suporte ao processamento na memória para aumentar o desempenho de aplicações de big data.
Em relação aos RDDs e a suas operações, assinale a afirmativa incorreta.
Os RDDs suportam dois tipos de operações: transformações, que criam um novo conjunto de dados a partir de um existente, e ações, que retornam um valor ao Driver Program após executar uma computação no conjunto de dados.
Map é uma transformação que passa cada elemento do conjunto de dados por uma função e retorna um novo RDD representando os resultados.
Reduce é uma ação que agrega todos os elementos do RDD usando alguma função e retorna o resultado final ao Driver Program.
Todas as transformações no Spark são lazy, pois não calculam seus resultados imediatamente. Em vez disso, eles apenas lembram as transformações aplicadas a algum conjunto de dados.
As transformações só são computadas quando uma ação ou determinadas transformações exigem que um resultado seja retornado Driver Program.