Hive零基础从入门到实战 进阶篇(十九) HiveQL:随机抽样

目录

前言

1. 什么是随机抽样

2. Hive实现简单随机抽样(不放回)

2.1 语法

2.2 举例


前言

当数据量非常大的时候,对全体数据进行处理存在困难时,我们可能需要通过随机抽样其中的一部分数据,来代表总体进行分析。本文介绍如何使用Hive对数据集进行随机抽样。

1. 什么是随机抽样

随机抽样就是调查对

猜你喜欢

转载自blog.csdn.net/qq_23897391/article/details/101468425