オペレータ一般的に使用されるスパーク要約(8) - フィルタ

コレクトの一定数を超えるアウト

ヴァルfilterRdd = sc.parallelize(リスト(1,2,3,4,5))地図(_ * 2).filter(_> 5)。
filterRdd.collect 
#res5:配列[INT] =配列(6,8 、10)

 

おすすめ

転載: www.cnblogs.com/pocahontas/p/11441040.html