MySQL生产环境_使用SQL中的ROW_NUMBER()函数查找每个ID的最新记录 - 代码天地

MySQL生产环境_使用SQL中的ROW_NUMBER()函数查找每个ID的最新记录

企业开发 2023-12-17 02:29:49 阅读次数: 0

生产需求

应生产环境要求，需要获取到每个id的最新位置及其他GL属性

ROW_NUMBER函数

ROW_NUMBER()函数是一种窗口函数，可以根据指定的列对结果集中的行进行编号。通过结合PARTITION BY子句和ORDER BY子句，ROW_NUMBER()函数能够对数据进行分组排序，并为每个分组中的行分配一个唯一的数字序号。

SQL代码：

select *

from

(select *,row_number() over (partition by `id` order by `time` desc ) as rank

from `table1`) 

where rank = 1

-- by_https://blog.csdn.net/qq_52128187?spm=1010.2135.3001.5343

代码逻辑：

首先使用ROW_NUMBER()函数对表中的数据按照ID进行分区（partition by id），然后按时间降序排序（order by time desc）。这样就创建了一个排名（rank），每个ID组内的第一行将获得排名1，第二行将获得排名2，依此类推。接着，外层查询选择了排名为1的行，即每个ID的最新记录

PySpark代码

# 导入所需的库
from pyspark.sql import SparkSession
from pyspark.sql.window import Window
import pyspark.sql.functions as F

spark = SparkSession.builder.appName("latest_records").getOrCreate()

data = [
    (1, "Record 1", "2022-01-01 12:00:00"),
    (2, "Record 2", "2022-01-02 10:00:00"),
    (1, "Record 3", "2022-01-03 08:00:00"),
    (3, "Record 4", "2022-01-04 14:00:00"),
    (2, "Record 5", "2022-01-05 16:00:00")
]

columns = ["id", "description", "time"]

df = spark.createDataFrame(data, columns)
df = df.withColumn("time", F.to_timestamp("time"))
# 定义窗口规范
windowSpec = Window.partitionBy("id").orderBy(F.col("time").desc())

# 使用ROW_NUMBER()函数查找每个ID的最新记录
ranked_df = df.withColumn("rank", F.row_number().over(windowSpec)).filter(F.col("rank") == 1).drop("rank")

ranked_df.show()

猜你喜欢

转载自blog.csdn.net/qq_52128187/article/details/134893065

MySQL生产环境_使用SQL中的ROW_NUMBER()函数查找每个ID的最新记录

SQL中ROW_NUMBER()函数的使用

SQL Server中ROW_NUMBER()函数的使用

SQL中row_number函数用法

SQL中开窗函数row_number() over的用法

SQL server中ROW_NUMBER() OVER()函数的使用方法

hive中：row_number()排序函数的使用

SQL Server中row_number的用法

row_number()函数

hive中ROW_NUMBER()函数

row_number()over函数的使用(转)

Oracle 分析函数 ROW_NUMBER() 使用

ROW_NUMBER()函数使用详解

MySQL中row_number的实现

SQL SERVER/ROW_NUMBER() OVER (ORDER BY id)高效分页

HiveSQL中row_number使用介绍

关于Oracle的一些内置函数在MySQL中的使用(row_number() over(partition by xxx order by xxx))

SQL ROW_NUMBER() OVER

sql row_number() over(...)

sql之Row_Number()

MSSQL sql server 2005/2008 row_number()函数应用之–删除表中重

SQL中的排名函数（ROW_NUMBER、RANK、DENSE_RANK、NTILE）简介

oralce查询重复记录函数row_number() over()

SQL SERVER 的窗体函数OVER的使用：row_number/rank/dense_rank

mysql：实现oracle、sql server中的row_number() over功能

用普通sql代替row_number函数

SQL去重复 ROW_NUMBER() OVER函数的基本用法

[SQL挖掘机] - 窗口函数 - row_number

【转载】Sqlserver数据库中无自增Id的情况下使用ROW_NUMBER()函数进行数据分页

Mysql中自定义开窗函数，row_number,dense_rank.

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)