sparksql_monotonically_increasing_id 生成唯一自增ID - 代码天地

sparksql_monotonically_increasing_id 生成唯一自增ID

其他 2020-01-19 17:12:02 阅读次数: 0

#发现有重复的ID，我们可能需要重新给每行数据分分配唯一的新的ID来标示它们
# 增加一个新列
df.withColumn('new_id', fn.monotonically_increasing_id()).show()
#withColums 新增一列
#monotonically_increasing_id 生成唯一自增ID
+---+------+------+---+------+-------------+
| id|weight|height|age|gender|       new_id|
+---+------+------+---+------+-------------+
|  5| 133.2|   5.7| 54|     F|  25769803776|
|  4| 144.5|   5.9| 33|     M| 171798691840|
|  2| 167.2|   5.4| 45|     M| 592705486848|
|  3| 124.1|   5.2| 23|     F|1236950581248|
|  5| 129.2|   5.3| 42|     M|1365799600128|
+---+------+------+---+------+-------------+

发布了273 篇原创文章 · 获赞 1 · 访问量 4706

私信关注

猜你喜欢

转载自blog.csdn.net/wj1298250240/article/details/103944979

sparksql_monotonically_increasing_id 生成唯一自增ID

全局唯一自增id生成

分布式架构生成全局唯一自增ID

分布式唯一ID自增（雪花算法）

分布式全局唯一ID与自增序列

C语言实现分布式自增有序的唯一ID生成算法-snowflake算法

生成唯一的Id

生成唯一ID

应用级自增ID的生成

利用Redis实现自增ID生成

sql循环生成自增id

js生成唯一的id

Java 生成唯一的ID

Java生成唯一ID

Sequence生成唯一的ID

PHP生成唯一ID

自动生成唯一id

Vue生成唯一id

oracal自增id

mysql 自增id

mysql自增ID

oracle id 自增

MongoDB自增ID

python for 循环生成新列表给每个字段添加一个自增id

一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)

生成一个唯一的ID

生成一段唯一的id

分布式自增id生成算法SnowFlake

Redis生成分布式自增ID

mybatis 实现插入一条记录的同时,并返回主键自增策略是自增生成的主键ID

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)