分布式文件系统 - FastDfs简介及工作原理

什么是FastDfs

FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。FastDFS专为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标。使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务

为什么要使用FastDFS

①通用分布式文件系统的优缺点

NFS、GFS都是通用的分布式文件系统,通用的分布式文件系统的优点的是开发体验好,但是系统复杂性高、性能一般

②专用分布式文件系统的优缺点

专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。FastDFS非常适合存储图片等小文件,FastDFS不对文件进行分块,所以它就没有分块合并的开销,FastDFS网络通信采用socket,通信速度很快

FastDFS架构包括 Tracker serverStorageserver

客户端请求Tracker server进行文件上传、下载,通过Tracker server调度,最终由Storage server完成文件上传和下载。

Tracker

①作用

Tracker Server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。可以将tracker称为追踪服务器或调度服务器。

②集群

FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务.客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。

Storage

①作用

Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上

②集群

1.Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容量之和

2.一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系

3.不同组的Storage server 之间不会相互通信。即图中Storage群横向组不会通信。

4.同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件完全一致的。即图中Storage纵向会通信。

5.一个组的存储容量为该组内的存储服务器容量最小的那个

采用分组存储方式的好处

1.灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择

2.一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向扩容)

3.当系统容量不足时,可以增加组来扩充存储容量(横向扩容

Storage状态收集

Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态包括磁盘剩余空间、文件同步状况、文件上传下载次数等统计信息,方便Tracker server调度。

文件上传流程

文件信息

客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。

文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名

组名

文件上传后所在的storage组名称,在文件上传成功后由storage服务器返回,需要客户端自行保存

虚拟磁盘路径

storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00, 如果配置了store_path1则是M01,以此类推。

数据两级目录

storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件

文件名

是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息

如:http://10.35.30.88/group1/M00/00/00/CiMeWF2q6leASOknAABwHq4dflE53.jpeg

发布了59 篇原创文章 · 获赞 13 · 访问量 2534

猜你喜欢

转载自blog.csdn.net/qq_40885085/article/details/102779577