目录
前言
1. 什么是随机抽样
2. Hive实现简单随机抽样(不放回)
2.1 语法
2.2 举例
前言
当数据量非常大的时候,对全体数据进行处理存在困难时,我们可能需要通过随机抽样其中的一部分数据,来代表总体进行分析。本文介绍如何使用Hive对数据集进行随机抽样。
1. 什么是随机抽样
随机抽样就是调查对
当数据量非常大的时候,对全体数据进行处理存在困难时,我们可能需要通过随机抽样其中的一部分数据,来代表总体进行分析。本文介绍如何使用Hive对数据集进行随机抽样。
随机抽样就是调查对