Directorio de artículos
En Spark, join
la operación es una operación muy común, que se usa para conectar dos RDD o DataFrame/DataSet de acuerdo con alguna clave común (clave). Aquí, explicaré join
en detalle el funcionamiento de Spark RDD y DataFrame en la versión Scala.
Operaciones en RDD join
:
join
Las operaciones se definen en los RDD de la siguiente manera:
def join[K: ClassTag, V: ClassTag, W: