FastDFS分布式文件系统 -- 工作原理

版权声明:转载请标明出处 https://blog.csdn.net/gymaisyl/article/details/84574370

FastDFS介绍

FastDFS分布式文件管理系统,是用 c 语言编写的一款开源的分布式文件系统。FastDFS 为互联网量身定制, 充分考虑了冗余备份负载均衡线性扩容等机制,并注重高可用高性能等指标,使用 FastDFS 很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。

FastDFS组成及其作用

FastDFS是一个开源的轻量级分布式文件系统,由跟踪服务器(tracker server)、存储服务器(storage server)和客户端(client)三个部分组成,主要解决了海量数据存储问题,特别适合以中小文件(建议范围:4KB < file_size <500MB)为载体的在线服务。
在这里插入图片描述

Tracker server:

  • 作用是负载均衡和调度,通过 Tracker server 在文件上传时可以根据一些 策略找到 Storage server
    提供文件上传服务。可以将 tracker 称为追踪服务器或调度服务器。
  • 管理集群,tracker 也可以实现集群。每个 tracker 节点地位平等。收集 Storage 集群的状态。

Storage server:

  • 作用是文件存储,客户端上传的文件最终存储在 Storage 服务器上, Storageserver
    没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将 storage 称为存储服务器;

  • 实际是用来保存文件, Storage 分为多个组,每个组之间保存的文件是不同的。每个组内部可以有多个成员,组成员内部保存的内容是一样的,组成员的地位是一致的,没有 主从的概念。

工作原理/流程

上传交互流程
在这里插入图片描述

  • Tracker会定期询问storage的状态,是否还有存储空间,是否down机,是否还在运行;
  • clinet上传连接请求;
  • Tracker查询可用的storage;
  • Tracker将可用storage的ip和端口返回给client;
  • 客户端将文件的内容和文件的属性(file content, metadata)上传到storage中;
  • storage根据client上传的文件生成file_id;
  • storage将上传的内容存储到本地;
  • storage将file_id返回给client;
  • 客户端将file_id存储在本地

file_id:
此文件 ID 用于以后访问该文 件的索引信息。文件索引信息包括:
组名,虚拟磁盘路径,数据两级目录,文件名
在这里插入图片描述

  • 组名:文件上传后所在的 storage 组名称,在文件上传成功后有 storage 服务器返回, 需要客户端自行保存。

  • 虚拟磁盘路径:storage 配置的虚拟路径,与磁盘选项 store_path*对应。如果配置了 store_path0 则是 M00,如果配置了 store_path1 则是 M01,以此类推。

  • 数据两级目录:storage 服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据 文件。
    在这里插入图片描述

  • 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含: 源存储 服务器 IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。

下载交互流程

  1. client询问tracker下载文件的storage,参数为文件标识(卷名和文件名);
  2. tracker返回一台可用的storage;
  3. client直接和storage通讯完成文件下载。

在pycharm中,通过客户端上传图片到FastDFS,并通过nginx来进行访问获取图片的demo :

https://blog.csdn.net/gymaisyl/article/details/84555620

猜你喜欢

转载自blog.csdn.net/gymaisyl/article/details/84574370