MFS介绍

MFS

什么是MFS:
MooseFS是一个具备冗余容错功能的分布式网络文件系统,它将数据分别存放在多个物理服务器或单独磁盘或分区上,确保一份数据有多个备份副本,然而对于访问MFS的客户端或者用户来说,整个分布式网络文件系统集群看起来就像一个资源一样,从其对文件系统的情况看MooseFS就相当于UNIX的文件系统。

MFS特性:
(1)高可靠性: 每一分数据可以设置多个备份(多分数据),并可以存储在不用的主机上。
(2)高扩展性: 可以很轻松的通过增加主机的磁盘容量或增加主机数量来动态扩展整个文件系统的存储量。
(3)高可容错性: 我们可以通过对MFS进行系统设置,实现当数据文件被删除后的一段时间内,依旧存放于主机的回收站中,以备误删除回复数据。
(4)高数据一致性: 即使文件被写入,访问时,我们依然可以轻松完成对文件的一致性快照。

MFS缺点:
(1)Master目前是单点,虽然会把数据信息同步到备份服务器,但是恢复需要时间
(2)Master服务器对主机的内存略高
(3)默认metalogger(元数据备份服务器)复制元数据时间较长(可调整)
(4)内存使用问题: 处理一百万个文件chumkserver,大概需要300M的内存空间。据此,推算如果未来要处理一个亿的文件chumserver,大概需要30G内存空间

应用场景:
(1)大规模高并发的线上数据 存储及访问(小文件,大文件都适合)
(2)大规模的数据处理,如日志分析,小文件强调性能不用HDFS

MFS组件说明:
管理服务器managing server 简称master: 这个组件的角色是管理整个MFS文件系统的主服务器,除了分发用户请求外,还用来存储整个文件系统中每个数据文件的metadata信息,metadata(元数据)信息包括文件(也可以是目录,socket,管道,块设备等)的大小,属性,文件的路径等。
元数据备份服务器metadata backup servers 简称metalogger: 这个组件的作用是备份管理服务器master的变化的metadata信息日志文件,文件类型为changelog.*.mfs。以便于在管理服务器出现问题时,可以经过简单的操作即可让新的服务器进行工作。
数据存储服务器组data servers(chunk servers)简称 data: 这个组件就是真正存放数据文件实体的服务器了,这个角色可以有多台不同的物理服务器或不同的磁盘及分区来充当,当配置数据的副本多余一份时,据写入到一个数据服务器后,会根据算法在其他数据服务器上进行同步备份。
客户机服务器组(client servers)简称 client: 这个组件就是挂载并使用mfs文件系统的客户端,当读写文件时,客户端首先会连接主管理服务器获取数据的meradara信息,然后根据得到的metadata信息,访问数据服务器读写或写入文件实体,mfs客户端通过fusemechanism实现挂载mfs文件系统的,因此,只有系统支持fuse,就可以作为客户端访问mfs整个文件系统

Guess you like

Origin blog.csdn.net/weixin_44946147/article/details/102629625