Oracle 12c 新特性(2)_Approximate Count Distinct

Oracle 12c New Feature:

http://docs.oracle.com/database/121/NEWFT/chapter12102.htm#NEWFT498

1.2 Approximate Count Distinct

近似Count Distinct

新的优化的SQL 函数:APPROX_COUNT_DISTINCT(),  提供近似count distinct 集合函数。处理大量的数据时,它显著快于精确集合方法,尤其对于不同值数量比较大的数据集合,处理结果仅仅会相比精确值带有微不足道的偏离。

在当下的数据分析中,统计数据集合中的不同值个数是常见的。凭借数量级(orders of magnitude )当提供几乎精确的结果,加速任何已经存在的处理过程并且提供新的洞察力分析水平,优化处理时间和资源使用。

Approximate Count Distinct SQL Detail:

Note: The APPROX_COUNT_DISTINCT function is available starting with Oracle Database 12c Release 1 (12.1.0.2).

语法:
APPROX_COUNT_DISTINCT (expr)

说明:

APPROX_COUNT_DISTINCT 返回包括不同expr数据的行数(返回数据类型)。

这个函数提供近似 COUNT (DISTINCT expr) 功能, COUNT (DISTINCT expr) 返回包含不同值得expr的精确行数。  APPROX_COUNT_DISTINCT 处理大量数据时明显快于 COUNT, 虽然带有微不足道的偏差相比精确值(至于这个偏差是多大,还有待进一步实验验证,总之效率高是一个特色)。

顺便说一句,对于 这个 expr,除了BFILEBLOBCLOBLONGLONG RAW, or NCLOB 这些数据类型,可以指定具有任何数据量级别的一列。

APPROX_COUNT_DISTINCT 忽略带有空值(null)行, 返回数据类型( NUMBER).

COUNT (DISTINCT expr) 也是忽略null值所在行。 

举个栗子:
SELECT APPROX_COUNT_DISTINCT(manager_id) AS "Active Managers"
  FROM employees;

还可以带group by,order by
SELECT prod_id, APPROX_COUNT_DISTINCT(cust_id) AS "Number of Customers"
  FROM sales
  GROUP BY prod_id
  ORDER BY prod_id;

猜你喜欢

转载自blog.csdn.net/handan725/article/details/52701111