如何从0开始了解一个数据引擎

其他 2020-01-25 16:23:17 阅读次数: 0

根据本人浅薄的经验，了解一个数据引擎可能涉及以下问题：

目录

5. 写数据链路

6. 查询链路

一些经常被关心的功能和特点

7. 旧数据清理

8. 数据的hash

9. 离线文件导入导出

10. 故障恢复时间

11. 对比其他DB

1. 概念

先粗略看看是否适合自己的需求，从官网/社区/技术博客，初步了解这个KV适合哪些场景，最佳实践，不适合哪些场景（不一定完善，不完善的自己进行测试不要人云亦云）。不适合的场景也跑一跑，看看到什么程度（数据大小到什么级别，请求量到什么级别会有比较大的性能拐点）看看性能到底什么样？

2. 架构

都有哪些节点，每个节点负责什么功能，通过什么协议进行交互的

3. 部署

部署起来跑一跑：使用一下api看看基本的相应时间和支持的操作

4. 元数据

元数据管理，元数据信息分发，客户端是否有缓存？

5. 写数据链路

flush?,数据副本是同步发送还是异步发送，串行还是广播？、一致性,故障时候如何保证不丢失数据，故障到什么程度会阻止写入/读取？

6. 查询链路

数据只能从一个进程查询还是从多个服务进程查询？是否可以写在一个节点，读在另外的节点？

阶段总结

给出一句话的总结：适合什么场景，不适合什么场景。

总结就是总结，不要给长篇大论看半天还不知道到底是否适合自己的需求

一些经常被关心的功能和特点

7. 旧数据清理

TTL，后台文件合并：HBase的compaction，Opentsdb的compaction，druid的文件合并

8. 数据的hash

数据按什么策略分到不同的进程中的？HBase可以做预分区。Es是根据分片策略进行分发

9. 离线文件导入导出

是否有工具是否支持跨集群

10. 故障恢复时间

故障恢复时间决定了这个服务大部分适合对接线上需求还是更适合离线场景

11. 对比其他DB

和其他在应用方面类似的系统/DB进行对比:
* 数据类型支持哪些不支持哪些
* 支持哪几种api操作
* 数据导入导出是否有工具支持
* 扩容如何进行对用户是否有影响
* 底层支持的存储的数据量
* 一条数据最优大小
* 一次操作最优数据Size
* TTL:表级别？列级别？ cell级别？
* 事务支持级别
* 其他独有特性：HBase支持动态列，二级索引

gloria_y

发布了52 篇原创文章 · 获赞 4 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/Gloria_y/article/details/83834421

如何从0开始了解一个数据引擎

如何开始一个数据科学项目？

LSM设计一个数据库引擎

一个数据仓库时代开始--Hive

如何从0开始开发一个实时联机游戏

如果是个穷光蛋：如何从零开始学习成为一个数据科学家？

从零开始，写一个搜索引擎（0x01）

从零开始，写一个搜索引擎（0x00）

从0开始写一个 SGX

从0开始实现一个promise

如何自己开发一个大数据SQL引擎？

如何架构一个数据工程

如何创建一个数据科学项目？

JavaScript 如何判断一个数据的类型

如何准确的判断一个数据的类型

如何创建一个数据表

如何搭建一个数据仓库

如何从零开始编写一个企业级的生物匹配引擎

12个数据让你了解物联网的下一个十年

求一个数的阶乘中0的个数

怎样从0开始搭建一个测试框架_0

利用python生成一个从0开始的n个数字的列表（也可以是从m到n）

如何从多个数据中选择一个数据

从零开始手撕一个数据结构（1）——双向链表

从零开始搭建一个数据湖架构

如何用Python从0开始创建一个区块链？

【程序员必看】如何用Python从0开始创建一个区块链？

从0到1如何开始一个前端项目（电商）

从0开始，如何设计一个社交电商产品

一个数据分析小白需要了解的行业黑话（指标）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)