常用的键值对转换操作

data.sortByKey(False).collect()#只能对键值对data操作,如果想要输出结果,可以用collect以数组形式或.foreach(print),False代表降序
data.sortBy(lambda x: x[1],False).collect()#按value降序
data.mapValue(lambda x:x+1)#给每个value+1
data3 = data1.join(data2)#对key相同的键值对合并value(“spark”,(1,1))这种

发布了25 篇原创文章 · 获赞 0 · 访问量 388

猜你喜欢

转载自blog.csdn.net/qq_45371603/article/details/104585934