Analiz korporativnykh dannykh nachinaetsja s chtenija, filtratsii i obedinenija fajlov i potokov iz mnogikh istochnikov. Mekhanizm obrabotki dannykh Spark sposoben obrabatyvat eti raznoobraznye obemy informatsii kak priznannyj lider v etoj oblasti, obespechivaja v 100 raz bolshuju skorost, chem naprimer Hadoop. Blagodarja podderzhke SQL, intuitivno ponjatnomu interfejsu i prostomu i jasnomu mnogojazykovomu API vy mozhete ispolzovat Spark bez glubokogo izuchenija novoj slozhnoj ekosistemy. Eta kniga nauchit vas sozdavat polnotsennye i zavershennye analiticheskie prilozhenija. V kachestve primera ispolzuetsja polnyj konvejer obrabotki dannykh, postupajuschikh so sputnikov NASA.
Dlja chtenija etoj knigi ne trebuetsja kakoj-libo predvaritelnyj opyt raboty so Spark, Scala ili Hadoop.
Perevodchik: Snastin A. V.