哈希表的企业级运用=》淘宝分布式文件系统TFS - 代码天地

哈希表的企业级运用=》淘宝分布式文件系统TFS

其他 2020-06-20 10:24:37 阅读次数: 0

项目背景介绍

根据淘宝 2016 年的数据分析，淘宝卖家已经达到 900 多万，有上十亿的商品。每一个商品有包括大量的图片和文字(平均：15k)，粗略估计下，数据所占的存储空间在 1PB 以上，如果使用单块容量为 1T 容量的磁盘来保存数据，那么也需要 1024x1024 块磁盘来保存.

注意

并不是把一块一块的硬盘放在一起就可以组成容量大的内存的，小型机做处理，了解一下 EMC.一般TB级别以上的都要百万级别的小型级的。

思考？

这么大的数据量，应该怎么保存呢？就保存在普通的单个文件中或单台服务器中吗？显然是不可行。

设计思路

以 block 文件的形式存放数据文件(一般 64M 一个 block),以下简称为“块”，每个块都有唯一的一个整数编号，块在使用之前所用到的存储空间都会预先分配和初始化。（通过一个脚本实现）
每一个块由一个索引文件、一个主块文件和若干个扩展块组成，“小文件”主要存放在主块中，扩展块主要用来存放溢出的数据。
每个索引文件存放对应的块信息和“小文件”索引信息，索引文件会在服务启动是映射（mmap）到内存，以便极大的提高文件检索速度。“小文件”索引信息采用在索引文件中的数据结构哈希链表来实现。

可以通过提高哈希桶的数量来提高算法的执行效率。

每个文件有对应的文件编号，文件编号从 1 开始编号，依次递增，同时作为哈希查找算法的 Key 来定位“小文件”在主块和扩展块中的偏移量。文件编号+块编号按某种算法可得到“小文件”对应的文件名

这里的哈希表索引块的数据结构，我们已经在上一篇的博客中模拟的实现了这里我们就不在探讨了

猜你喜欢

转载自blog.csdn.net/qq_44065088/article/details/102801674

哈希表的企业级运用=》淘宝分布式文件系统TFS

分布式运用之ELK企业级日志分析系统

Zabbix企业级分布式监控系统

企业级分布式任务调度系统介绍

zabbix：企业级分布式监控系统

【分布式】 ELK 企业级日志分析系统

分布式存储系统学习笔记(二)—分布式文件系统(2)—淘宝文件系统(TFS)

手画TFS淘宝分布式文件系统框架图

企业级JAVA大型分布式电商项目实战高并发集群分布式系统架构

分布式文件系统TFS(taobao File System)安装

什么是TFS-分布式文件系统

分布式文件系统之Tfs是什么？

Zabbix 3.0 alpha6企业级分布式监控系统发布

《Zabbix企业级分布式监控系统》学习笔记（二）——告警

《Zabbix企业级分布式监控系统》学习笔记（一）——配置

Zabbix企业级分布式系统网络监视解决方案实战课程

企业级互联网分布式系统应用架构学习

用GO开发企业级分布式云存储系统

企业级分布式 HTAP 数据库管理系统 TBase

企业级分布式 HTAP 数据库管理系统，腾讯 TBase 正式开源

【监控系统】企业级分布式开源监控解决方案（参考）

【分布式】 ELK 企业级日志分析系统二

JavaEE企业级分布式高级架构

Zabbix 4.0企业级分布式监控实战

Zabbix企业级分布式监控实战

Zabbix—企业级的开源分布式监控平台

部署Zabbix企业级分布式监控

企业级分布式应用服务 EDAS

【分布式架构】企业级分布式应用服务EDAS使用攻略

【分布式架构】什么是企业级分布式应用服务

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)