3 | Configuration de Java Spark et filtrage des données

Ce qui suit montre comment utiliser l'API Java d'Apache Spark pour charger des données, filtrer les nombres pairs et calculer leur somme. Apache Spark est un puissant framework informatique distribué adapté aux tâches de traitement de données à grande échelle.

Créer un projet Maven

Tout d'abord, nous devons créer un projet Maven afin de gérer les dépendances. pom.xmlAjoutez les dépendances Spark suivantes aux fichiers du projet :

<dependencies>
    <dependency>
        <groupId>org.apache.spark</groupId>
        

Supongo que te gusta

Origin blog.csdn.net/weixin_44510615/article/details/132629402
Recomendado
Clasificación