信息存储与管理(四)

第9章 内容寻址存储

固定内容:不太可能被改变但仍被多个应用程序和用户所访问的数据。
内容寻址存储(CAS)技术:基于对象的存储系统,专用于存储固定内容。将用户数据和其相关属性作为独立的对象来存储。存储对象被分配了一个全局唯一的地址,即CAS中的内容地址。该地址来源于对象的二进制表示。支持单实例存储(SIS),消除同一数据的多个副本。
固定内容资产:固定数据为了其参考价值或者商业价值而保留下来,例如X光片和照片。

归档类型:
电子数据档案是那些访问较少的数据仓库。
• 在线归档:存储设备直接与主机相连,数据可以立即使用。(活动归档数据)
• 近线归档:存储设备与主机相连,信息存储在本地,访问信息必须映射或加载存储设备。
• 离线归档:存储设备与主机不直接相连,而且也没有映射或加载在主机上。要访问这些信息需要手工干预。
档案一般是存放在一次写多次读(WORM)的设备上,如CD-ROM。保护原始文件不被覆盖,硬件/软件上的文件锁也可以保护文件。
使用光盘和磁盘的传统归档技术没有进行内容优化,相同内容可能被多次归档

CAS克服了磁盘和光盘解决方案的许多明显缺陷,满足了数据可访问性、妥善保护和确保服务等级协议。
• 内容真实性:读入对象,CAS使用哈希算法重新计算它的内容地址并与其原始的内容地址作对比,验证失败会从其镜像中重建对象。
• 数据完整性:CAS的数据镜像及奇偶校验保护。
• 位置无关性:CAS使用全局唯一的标识符来检索数据。是的存储数据的物理地址与请求读取的应用程序相互独立。
• 单实例存储(SIS):全局唯一签名保证了一个对象只保存一个实例。这个签名是来源于对象的二进制表示。写入一个对象时,CAS系统会查看是否存在一个相同签名的对象。如果已经存在,只会创建一个指针指向该对象。极大简化了存储资源管理任务。
• 强制保留期:CAS为每个存储对象分别创建两个不变的组成部分:数据对象和元对象。元对象用来存储对象的属性和数据处理策略,对于支持对象的保留期的系统,保留期策略是强制执行的,直到该策略过期。
• 技术开放性:确保跨平台的兼容性。
• 记录快速检索:随机磁盘访问能够快速检索出相应记录。

客户端借助运行CAS API(应用程序编程接口)的服务器,通过局域网访问基于CAS的存储系统。CAS API主要负责使应用程序能够存储和检索数据。

CAS体系架构就是一个独立节点冗余阵列(RAIN)。由内部专用局域网络连接的一系列存储节点和访问节点组成的集群。这个内部网络可以检测配置变化并自动重配置,如增加存储或访问节点。而客户端是通过另一个独立的局域网来访问CAS的,这一局域网用于客户端、服务器与CAS系统的互连。这些节点配置了ATA硬盘驱动器,节点上的操作系统都运行了特殊软件,以实现CAS的特点与功能。
在这里插入图片描述
节点可以配置成存储节点、接入节点或者双功能节点。
存储节点用于存储和保护数据对象,也成为后端节点。
访问节点:数量由用户要求的吞吐量决定。
接入节点:它的磁盘空间不能用于存储数据对象。
双功能节点:既有存储节点又有访问节点功能,这个节点更加普遍。
• 完整性校验:确保文件内容与数字签名相匹配。读入数据时进行完整性检查,发现问题自动修复对象或重建对象。
• 数据保护和节点恢复:确保高可用性。本地复制或镜像,奇偶校验,远程复制。
• 负载均衡:提供最大的吞吐量、可用性和存储空间使用率。
• 可扩展性:添加节点到集群不会中断数据的访问。
• 自我诊断和修复
• 容错性:冗余组件和数据保护方案

第10章 存储虚拟化

虚拟化技术通过映射或抽象的方式屏蔽物理资源的复杂性。
操作系统通常将不使用的内存数据转移到交换文件(也成为页面文件或交换空间)使得有更多的内存提供给活动进程使用。

网络虚拟化:建立虚拟网络,使每个应用程序将其自身的逻辑网络独立于物理网络。例如(VLAN技术)虚拟局域网。

服务器虚拟化:在一个物理服务器上可以建立任意数量的虚拟服务器,数量取决于硬件能力。所有虚拟服务器共享相同的基本物理硬件,但是其行为是相互隔离的。

存储虚拟化:基于主机的卷管理、LUN的创建、磁带存储虚拟化和磁盘寻址(CHS到LBA)。

带外存储网络虚拟化,虚拟化设备配置在数据通道外,存储网络的虚拟化的配置信息会独立保存在外部的虚拟化应用设备上,并不保存在现有的存储网络中。这种配置也称为通道分离技术。控制盒数据通道分开(虚拟化设备只负责处理控制信息,实际数据流通过原有的存储网络进行传输)。以最优的网络线速度来处理数据,虚拟化到物理存储转化的延迟也十分微小。带外虚拟化设备并不缓存任何数据,不修改任何实际信息存储形式。使得虚拟化的过程中许多原有基于存储阵列实现的特性可以得到保留。由于带外虚拟化设备对光纤通道通信协议在硬件结构上进行优化设计,因此它可以很容易地进行扩展。
在这里插入图片描述
块级存储虚拟化可以实现存储卷在线的扩展,并实现不同卷的透明访问,并提供不中断的数据迁移。虚拟化引擎处理后端迁移数据,使得数据在迁移时LUN保持同时在线并可以访问。
在这里插入图片描述
虚拟化之前每个NAS设备或文件服务器在物理上和逻辑上都是独立的。每个主机都确切知道它拥有的共享文件位置。文件是与特定文件服务器关联的,重新分布这些共享文件时,就需要关闭文件服务,重新配置新的访问路径。
文件级虚拟化提高了档案的移动性,使得用户或应用程序文件独立于其实际的存储位置。文件级虚拟化先创建一个逻辑存储池,让用户使用一个逻辑路径存取档案,这个路径与硬件存储无关。
经过虚拟化的文件可以很方便地在不同的在线文件的服务器之间移动。


第二大部分 存储网络技术和虚拟机已经结束~ 接下来是第三大部分 业务连续性。

发布了11 篇原创文章 · 获赞 12 · 访问量 1008

猜你喜欢

转载自blog.csdn.net/qq_44710568/article/details/104945183