Kylin快速入门 - 代码天地

Kylin快速入门

其他 2019-01-13 00:53:33 阅读次数: 0

在Hive中准备数据

Hive

需要被分析的数据必须先保存为Hive表的形式，然后Kylin才能从Hive中导入数据，创建Cube。Apache Hive是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为数据库表，并可以将SQL语句转换为MapReduce或Tez任务进行运行，从而让用户以类SQL（HiveQL，也称HQL）的方式管理和查询Hadoop上的海量数据
星形模型
星形模型中有一张事实表，以及零个或多个维度表；事实表与维度表通过主键外键相关联，维度表之间没有关联，就像很多星星围绕在一个恒星周围，故取名为星形模型。Kylin只支持星形模型的数据集
维度表要求
1）要具有数据一致性，主键值必须是唯一的；
2）维度表越小越好，默认的阈值是300MB。
3）改变频率低
4）维度表最好不要是Hive视图（View）
Hive表分区支持多分区
如果Hive表正好是按此时间属性做分区的话，那么就可以利用到Hive分区的好处，每次在Hive构建的时候都可以直接跳过不相干日期的数据，节省Cube构建的时间。
了解维度的基数
维度的基数（Cardinality）指的是该维度在数据集中出现的不同值的个数；

猜你喜欢

转载自blog.csdn.net/shulixu/article/details/84991379

Kylin快速入门

Kylin 快速入门

Kylin之快速入门

快速学习-Kylin入门

kylin -- 快速入门概述

Kylin(一)：快速入门

Kylin快速入门系列(2) | Kylin的快速入门

Kylin快速入门系列(1) | Kylin的简单介绍及安装部署

Kylin快速入门系列(5) | 如何使用JDBC连接操作Kylin

Kylin快速入门系列(6) | 如何通过Zepplin来访问Kylin服务

第3章大数据Kylin快速入门

Kylin快速入门系列(3) | Cube构建原理

Kylin快速入门系列(4) | Cube构建优化

快速学习-Kylin概述

Apache Kylin的入门安装

Apache kylin 入门

Kylin系列（一）—— 入门

kylin -- 入门实战演练！！！

Kylin --入门安装介绍

Kylin_入门

快速学习-Kylin环境搭建

本地快速体验 Kylin「分析篇」

快速学习-Kylin Cube构建优化

快速学习-Kylin可视化

kylin

Apache Kylin 入门 1 - 基本概念

Apache Kylin 入门 2 - 原理与架构

Apache Kylin 入门 6 - 优化 Cube

Apache Kylin 入门 3 - 安装与配置

kylin从入门到实战：实际案例

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)