分布式文件系统FastDFS的简介

传统的范式存储文件和第三方文件存储区别:

​FastDFS 是一个开源的高性能分布式文件系统(DFS)。
FastDFS 为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用 FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。主要解决了海量数据存储问题,特别适合以中小文件(建议范围:4KB < file_size <500MB)为载体的在线服务。

FastDFS 架构包括 Tracker server 和 Storage server。客户端请求 Tracker server 进行文件上传、下载,通过 Tracker server 调度最终由 Storage server 完成文件上传和下载。

1. Tracker server 作用是负载均衡和调度,通过 Tracker server 在文件上传时可以根据一些策略找到 Storage server 提供文件上传服务。可以将 tracker 称为追踪服务器或调度服务器。
2. Storage server 作用是文件存储,客户端上传的文件最终存储在 Storage 服务器上,Storageserver 没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将storage称为存储服务器。

服务端两个角色:
Tracker:管理集群,tracker 也可以实现集群。每个 tracker 节点地位平等。收集 Storage 集群的状态。
Storage:实际保存文件   Storage 分为多个组,每个组之间保存的文件是不同的。每个组内部可以有多个成员,组成员内部保存的内容是一样的,组成员的地位是一致的,没有主从的概念。

文件上传和下载的流程

文件上传

文件上传的过程:
1.Storage Server会定时向Tracker Server上传状态信息.当Tracker Server Cluster中的Tracker Server不止一个时,各个Tracker之间的关系是对等的,所以客户端上传时可以选择任意一个Tracker。
2-4.当客户端上传文件时,发送请求到Tracker Server,Tracker Server会将该文件分配一个Stacker的IP和端口(集群)可以存储文件的group,将信息返回到客户端
5-8. 当客户端向Storage Server发送写文件请求时,Storage Server会生成一个file_id.将上传的文件写入磁盘
9.最后将上面生成的文件信息当做文件名存储.
注: 每次上传文件后都会返回一个地址,用户需要自己保存此地址。
​
客户端上传文件后存储服务器将文件 ID 返回给客户端,此文件 ID 用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。
例:文件索引:group1/M00/02/44/wKgDrE34E8wAAAjakljd1223.sh

* 组名:文件上传后所在的 storage 组名称,在文件上传成功后有 storage 服务器返回,需要客户端自行保存。
* 虚拟磁盘路径:storage 配置的虚拟路径,与磁盘选项 store_path*对应。如果配置了store_path0 则是 M00,如果配置了store_path1 则是 M01,以此类推。
* 数据两级目录:storage 服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
* 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器 IP 地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。

文件下载

文件下载过程:
    当文件上传成功后,客户端就会生成一个文件地址(文件名),当下载的时候就会用到该文件名来获取.
    1. Storage Server会定时向Tracker Server上传状态信息.
    2-4. 当客户端向Tracker Server发送下载请求时,Tracker Server就会查询storage Server(检测同步状态),查询一个Storage Server的IP和端口号来返回给客户端
    5.当客户端需要下载哪个文件时,就会将自己本地的file_id(组名,路径,文件名)传到Storage Server上,来进行查找文件  (file_id是通过文件上传得到的保存到本地的,下载时是需要从本地获取)
    6. 当Storage Server查找到该文件时,返回给客户端file_content.

文件合并

小文件合并存储主要解决的问题:
1. 本地文件系统inode数量有限,存储小文件的数量受到限制
2. 多级目录+目录里很多文件,导致访问文件的开销很大(可能导致很多次IO)
3. 按小文件存储,备份和恢复效率低 
​
     FastDFS 提供合并存储功能,默认创建的大文件为 64MB,然后在该大文件中存储很多小文件; 大文件中容纳一个小文件的空间称作一个 Slot,规定 Slot 最小值为 256 字节,最大为 16MB,即小于 256 字节的文件也要占用 256 字节,超过 16MB 的文件独立存储;
    为了支持文件合并机制,FastDFS生成的文件file_id需要额外增加16个字节;每个trunk file 由一个id唯一标识,trunk file由group内的trunk server负责创建(trunk server是tracker 选出来的),并同步到group内其他的storage,文件存储合并存储到trunk file后,根据其文件偏移量就能从trunk file中读取文件.

猜你喜欢

转载自blog.csdn.net/weixin_41858337/article/details/84999970