RDD,Spark SQL,DF排序 - 代码天地

RDD,Spark SQL,DF排序

其他 2019-03-17 10:31:11 阅读次数: 0

一、单一字段排序

1、用RDD
RDD使用takeOrdered(num,key=None)方法排序资料

升序排列
a = userrdd.takeOrdered(5, key=lambda x: int(x[1]))
print(a)

降序
a = userrdd.takeOrdered(5, key=lambda x: -int(x[1]))
print(a)

2、Spark SQL
使用关键字order by

降序
sqlContxt.sql('''
select userid,age,gender,occupation,salary from user_table order by age desc
''').show(5)


升序排列
sqlContxt.sql('''
select userid,age,gender,occupation,salary from user_table order by age 
''').show(5)

3、df排列


df.select('userid','occupation','gender','age').orderBy('age').show(5)
df.select('userid','occupation','gender','age').orderBy('age'，ascending=0).show(5)

二、多字段排序
1、rdd 排列

# RDD 排序 lambda x:(-int(x[1]),x[2]))年龄降幂排列，性别生序排列
a = userrdd.takeOrdered(5, key=lambda x: (-int(x[1]), x[2]))
print(a)

2 、Spark SQL

sqlContxt.sql('''
select userid,age,gender,occupation,salary from user_table order by age desc,gender
''').show()

3、DF排列

df.orderBy(['age', 'gender'], ascending=[0, 1]).show(5)

df.orderBy(df.age.desc(), df.gender).show(5)

猜你喜欢

转载自blog.csdn.net/weixin_40161254/article/details/87920501

RDD,Spark SQL,DF排序

RDD,Spark SQL,DF分组

RDD,Spark SQL,DF群组统计

spark rdd 和 DF 转换

Spark编程方式RDD转DF

Spark Streaming计算中，根据DF或RDD方便用SQL进行join，filter，aggregate等action

spark教程(11)-RDD-DF-DS 汇总 Spark中RDD、DataFrame和DataSet的区别

spark rdd dataset sql udf udaf

spark sql之RDD转换DataSet（十一）

Spark SQL：RDD、DataFrames、DataSet之间的转换

Spark SQL-DataFrame，DataSet与RDD

Spark SQL及RDD、DataFrame、DataSet数据抽象

十、 RDD编程和Spark SQL

[总结]基于Java的Spark、DF、RDD常用代码

一零一二、Spark- RDD-DF-DS 相互转换

spark --IDEA开发Spark SQL（ sql查询 RDD、DF、DS之间相互转化 Spark SQL完成WordCount 多数据源交互）

Spark编程基础3RDD编程、Spark SQL

Spark SQL_sql查询 RDD、DF、DS之间相互转化 Spark SQL完成WordCount 多数据源交互

Spark SQL_sql查询 RDD、DF、DS之间相互转化 Spark SQL完成WordCount 多数据源交互

利用Spark RDD实现组内排序之简单代码

spark学习六——自定义排序以及JDBC RDD

11.spark sql之RDD转换DataSet

Spark-SQL之RDD转换为DataFrame

spark sql 之 RDD与DataFrame互相转化

Spark分组TopN（SQL风格SDL风格）另附：RDD操作

(Scala版)Spark Sql RDD/DataFrame/DataSet 相互转换

Spark SQL实战(06)-RDD与DataFrame的互操作

Spark RDD的简单使用+Spark SQL的简单使用+Spark Streaming的简单使用

Spark RDD

[Spark]-RDD

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)