Hive的analyze

其他 2021-03-27 10:36:08 阅读次数: 0

1、使用

分区表，无论字段

analyze TABLE td.pt_pmart_ceo_FIN_TRSF_CTR_SITE_MAP partition (dt) COMPUTE STATISTICS noscan

ps：一致报错的可能性在UDF函数建在了某个库下，只有在hue上的active database选择某个库的时候才能用UDF

2、目的

见名知意，它的目的就是为了统计和分析的作用，它将统计的信息存储到metastore中，后续再来查询的时候就不需要在执行查询计算，而是直接获取即可

3、范围

统计信息支持新建的和现有的表，支持分区表和普通表的统计信息以及列统计信息

4、ANALYZE相关

1、表统计

表统计的信息包括:行数，文件数，大小（以字节为单位）

1、hive 是默认自动收集统计信息，由hive.stats.autogather 配置参数决定，默认是true。但是对于load data 方式是不支持的。（想一下也可以知道，他应该是在计算的时候去计算出这些统计信息）

-注意:这个在hive中是自动收集的。在sparkThriftserver中并不适用，虽然用的hive的元数据信息，但是它们两个在这方面不相通。

2、手动收集。我们这边也可以指定手动收集，手动收集的指令为

ANALYZE TABLE [db_name.]tablename [PARTITION(partcol1[=val1], partcol2[=val2], …)]
COMPUTE STATISTICS
[FOR COLUMNS] – (Note: Hive 0.10.0 and later.)
[CACHE METADATA] – (Note: Hive 2.1.0 and later.)
[NOSCAN];

其中如果指定了NOSCAN的话，该命令将不会去扫描文件，仅会收集文件数和文件大小的信息

3、查看表的统计信息

desc formatted tableName

2、列统计

相关文档

https://cwiki.apache.org/confluence/display/Hive/Column+Statistics+in+Hive

1、在表信息的基础上进行了扩展，可以对列信息进行统计，命令为

analyze table t [partition p] compute statistics for [columns c,…];

2、查看列信息统计的命令为

describe formatted [table_name] [column_name];

猜你喜欢

转载自blog.csdn.net/someInNeed/article/details/112007364

Hive的analyze

Hive性能优化简介（顺便介绍了性能工具--ANALYZE）

Analyze Table

ORACLE ANALYZE

mysql优化Analyze Table

Postgresql vacuum analyze

mysql优化Analyze Table .

analyze table & index

关于analyze table命令

MySQL ANALYZE TABLE

Eclipse Memory Analyze 使用

WinDbg使用01 analyze

xdebug's attack analyze

how to analyze jmeter results

Analyze Data 分析数据

Git Analyze 工具实现与原理

[转]Analyze Java Thread Dumps

oracle oradebug analyze 的日常使用

Elasticsearch之Analyze（分析过程）

gaia:app startup log analyze

Script to analyze table space usage

Histograms - 1 : Find, Plot, Analyze !!!

Analyze and compare the performance of UKF and PF

Hive

hive not in

hive：

hive (with as)

使用analyze命令收集统计信息

MySQL optimize/analyze/check/repair table

Paoding Analyze 庖丁解牛分词

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)