Conceptos relacionados con el almacenamiento de archivos distribuidos

Almacenamiento de archivos distribuido

1 Terminología común

1.1 Tecnología de copia de seguridad

Una copia adicional de los datos creados con fines de recuperación de datos

Categoría: copia de seguridad de conexión directa, copia de seguridad de conexión de red, copia de seguridad fuera de LAN, copia de seguridad fuera del servidor
, copia de seguridad en línea, copia de seguridad fuera de línea, copia de seguridad casi en línea

① copia de seguridad en frío

Cuando la copia de seguridad en frío está realizando operaciones, el servidor ya no acepta actualizaciones de datos de usuarios o aplicaciones, lo que resuelve el problema de las actualizaciones simultáneas cuando la replicación de la copia de seguridad está en curso. El tiempo de copia de seguridad en frío es demasiado largo y el servidor ya no acepta ninguna operación de actualización

② Copia de seguridad en caliente

Cuando los usuarios y las aplicaciones están actualizando datos, el sistema también puede realizar copias de seguridad y hay problemas de integridad; cada archivo o entidad de la base de datos debe tener una copia de seguridad como una versión completa y coherente.

③Copia de seguridad a nivel de archivo

Copia de seguridad a nivel de archivo: la ventaja de usar el sistema operativo del servidor y el sistema de archivos para hacer una copia de seguridad de los archivos es que es fácil restaurar uno o algunos archivos específicos. Durante la copia de seguridad, el sistema operativo y las aplicaciones pueden seguir accediendo a los archivos, pero tarda mucho tiempo Por ejemplo, la copia de seguridad de una gran cantidad de recomendaciones de documentos pequeños, la sobrecarga de acceso del sistema operativo y los metadatos de archivos y directorios es alta, y la copia de seguridad de "archivos abiertos" no se puede resolver

④Copia de seguridad a nivel de bloque

Copia de seguridad a nivel de imagen, omitiendo completamente archivos y sistemas de archivos, utilizando datos como bloques de disco sin formato, leyendo datos directamente desde el disco, independientemente de cuántos archivos haya, y sin profundizar en el archivo, y leyendo en el orden de los bloques en el disco, en lugar del orden en el archivo, por lo que no habrá degradación del rendimiento causada por la búsqueda al leer datos de archivos con una gran cantidad de fragmentos. La copia de seguridad a nivel de bloque generalmente tiene soporte de instantáneas instantáneas incorporado, que puede resolver fundamentalmente el problema de "archivo abierto". Al realizar operaciones especiales, las aplicaciones en ejecución y sus datos en la memoria del servidor entrarán en un estado consistente y se descargarán en el disco. Luego tome una instantánea, el proceso de copia de seguridad lee los bloques de datos modificados de la instantánea en lugar del volumen real, y elimina la instantánea una vez que se completa la copia de seguridad.

⑤ activo-activo

En general, existen tres métodos de copia de seguridad: copia de seguridad en caliente, copia de seguridad en frío y copia de seguridad activa-activa entre los centros de datos principal y de copia de seguridad.

En el caso de hot standby, solo el centro de datos principal se ocupa de los negocios de los usuarios, y se realiza una copia de seguridad del centro de datos principal sin parar.

En el caso del modo de espera en frío, solo el centro de datos principal realiza negocios, y el centro de datos principal está respaldado en caso de apagado.

Active-Active piensa que es demasiado derrochador que el centro de datos de respaldo solo haga respaldo, por lo que tanto el centro de datos principal como el de respaldo realizan el negocio de los usuarios al mismo tiempo. otros y realizar una copia de seguridad en tiempo real. En términos generales, la carga del centro de datos principal puede ser mayor, por ejemplo, compartiendo del 60 % al 70 % del negocio, y el centro de datos de respaldo solo comparte del 40 % al 30 % del negocio.

⑥Tres centros en dos lugares

Dos lugares = local + remoto

Tres centros = centro local + centro de recuperación de desastres local + centro de respaldo remoto

1.2 Tecnología de instantáneas

La tecnología de instantáneas es un método para crear copias de seguridad de datos en un sistema de almacenamiento. Puede registrar el estado de los datos en un momento específico en el dispositivo de almacenamiento y puede restaurar el estado en ese momento cuando sea necesario. La tecnología de instantáneas permite operaciones eficientes de copia de seguridad y recuperación mediante el registro de cambios en los datos en lugar de duplicar conjuntos de datos completos. La tecnología de instantáneas puede ayudar a los usuarios a restaurar rápidamente el estado de los datos anteriores en caso de pérdida de datos, corrupción de datos u otras fallas.

1.3 Tecnología de protección continua de datos

La tecnología de protección continua de datos es un método de copia de seguridad y recuperación de datos que proporciona una protección de datos más precisa y oportuna al registrar los cambios de datos en tiempo real. A diferencia de las copias de seguridad periódicas tradicionales, la tecnología de protección continua de datos se puede utilizar 每次数据变化时立即备份数据para reducir el riesgo de pérdida de datos. La tecnología de protección continua de datos suele utilizar una copia de seguridad incremental para registrar los cambios de datos y puede proporcionar una selección flexible del punto de recuperación, de modo que los usuarios puedan elegir cualquier punto en el tiempo para la recuperación de datos.

1.4 Tecnología RAID

La tecnología RAID (Redundant Array of Independent Disks) es una tecnología de almacenamiento que combina varios discos duros independientes para proporcionar una mayor confiabilidad y rendimiento de los datos. La tecnología RAID protege la integridad de los datos mediante la distribución de datos en varios discos duros y el uso de información de suma de comprobación redundante. Los diferentes niveles de RAID brindan diferentes características de rendimiento y protección de datos, como RAID 0 brinda alto rendimiento pero no protección de redundancia, RAID 1 brinda redundancia de datos pero no rendimiento

1.5 Tecnología multitrayecto

La ruta múltiple es un método de uso de varias rutas independientes en un sistema de almacenamiento para proporcionar mayor confiabilidad y rendimiento. Las múltiples rutas se pueden lograr mediante el uso de múltiples conexiones de red, múltiples controladores de almacenamiento o múltiples dispositivos de almacenamiento. 当一个路径发生故障时,多路径技术可以自动切换到另一个可用的路径,从而保证存储系统的连续性和可用性. Las rutas múltiples también pueden mejorar el rendimiento del sistema de almacenamiento mediante el uso de varias rutas simultáneamente, por ejemplo, mediante la transferencia de datos en paralelo o el equilibrio de carga para proporcionar un mayor rendimiento y capacidad de respuesta.

1.6 Tecnología de virtualización

La tecnología de virtualización es un método de abstracción de recursos físicos en recursos virtuales para proporcionar una mayor utilización y flexibilidad de los recursos. En el campo del almacenamiento, 虚拟化技术可以将多个物理存储设备组合成一个逻辑存储池,并为用户提供统一的存储接口. La tecnología de virtualización puede ocultar los detalles del dispositivo de almacenamiento subyacente, para que los usuarios puedan administrar y utilizar los recursos de almacenamiento de manera más conveniente. La tecnología de virtualización también puede proporcionar funciones avanzadas como instantáneas, clonación, compresión y deduplicación para mejorar la eficiencia del almacenamiento y la flexibilidad de la gestión de datos.

1.7 Replicación de datos y recuperación ante desastres

1.7.1 Objetivo de tiempo de recuperación (RTO, tiempo de inactividad máximo tolerable del servicio)

Objetivo de Tiempo de Recuperación (RTO: Recovery Time Objective), que toma como punto de partida la aplicación, es decir, el objetivo de tiempo de recuperación de la aplicación, se refiere principalmente al mayor tiempo que se puede tolerar la aplicación fuera de servicio, es decir, desde la ocurrencia de un desastre hasta la recuperación del sistema empresarial. El tiempo mínimo requerido por la función. RTO es un indicador que refleja la puntualidad de la recuperación del negocio, indicando el tiempo requerido para que el negocio vuelva a la normalidad después de la interrupción. Cuanto menor sea el valor de RTO, mayor será la capacidad de recuperación de datos del sistema de recuperación ante desastres;

1.7.2 Objetivo de Punto de Recuperación (RPO, Pérdida de Datos Máxima Tolerable)

Objetivo de punto de recuperación (RPO: Recovery Point Objective), RPO es un indicador que refleja la integridad de los datos restaurados.Toma los datos como punto de partida y se refiere principalmente a la cantidad de pérdida de datos que el sistema empresarial puede tolerar.

1.7.3 Activo/Pasivo y Activo-Activo

①Activo/Pasivo:

  • Una forma de respaldo de datos, los datos se almacenan principalmente en el centro de datos principal, y el centro de datos de respaldo solo desempeña una función de respaldo cuando el centro de datos principal falla o se apaga. Durante la falla del centro de datos principal, el centro de datos de respaldo no se utilizará para el acceso a datos en tiempo real ni para el uso de aplicaciones.

②Activo-activo: dos centros de datos realizan negocios.

  • Hyperactive piensa que es demasiado derrochador que el centro de datos de respaldo solo haga respaldo, por lo que tanto el centro de datos principal como el de respaldo pueden realizar el negocio del usuario al mismo tiempo. otros y realizar una copia de seguridad en tiempo real. En términos generales, la carga del centro de datos primario puede ser mayor, por ejemplo, compartiendo del 60 % al 70 % del negocio, y el centro de datos de respaldo solo comparte del 40 % al 30 % del negocio.

[Transferencia] Una segunda comprensión de la matriz de disco duro independiente, en clúster, en espera activa
inserte la descripción de la imagen aquí

1.8 Consulta de objeto de depósito

Objeto: un objeto es la unidad básica de un depósito, que puede ser cualquier tipo de archivo o datos. Cada objeto tiene una clave única (clave) para su identificación y recuperación.

①Gestión del ciclo de vida

La gestión del ciclo de vida es una estrategia para gestionar objetos automáticamente. Los objetos se pueden mover automáticamente de depósitos a otros niveles de almacenamiento mediante la definición de reglas y condiciones. Tales como: almacenamiento de acceso poco frecuente, almacenamiento de archivo, etc., para optimizar el costo y el rendimiento del almacenamiento.

②Gestión de fragmentación

Cuando los objetos se modifican o eliminan, puede resultar en un espacio discontinuo en el depósito. La gestión de la fragmentación puede optimizar la utilización del espacio de almacenamiento mediante la reorganización o compactación de cubos.

③Etiquetas

Las etiquetas son metadatos que se utilizan para categorizar y organizar objetos en un depósito. Puede agregar etiquetas personalizadas a los objetos, como el nombre del proyecto, el propietario, la fecha de vencimiento, etc., para administrar y consultar objetos de manera más conveniente.

1.9 Otros

① flujo de trabajo

En el almacenamiento de archivos, el flujo de trabajo (workflow) se refiere a una serie de operaciones y pasos utilizados para administrar la creación, almacenamiento, acceso, uso compartido y procesamiento de archivos. Describe las tareas y actividades involucradas en todo el proceso de un documento desde su creación hasta su procesamiento final y archivo.

  1. crear un archivo
  2. seleccione la ubicación de almacenamiento
  3. guardar el archivo
  4. Organización y Clasificación
  5. acceder y compartir
  6. Colaboración y control de versiones
  7. procesamiento y modificación
  8. revisión y aprobación
  9. Archivar y archivar
  10. destruir o borrar

② EOS (almacenamiento de objetos empresariales), OSG, XMS, 3DS

  1. EOS

EOS es la abreviatura de Enterprise Object Storage, que significa almacenamiento de objetos de nivel empresarial. Es una solución de almacenamiento para almacenar y administrar datos a gran escala. El almacenamiento de objetos es un modelo de almacenamiento diferente de los sistemas de archivos tradicionales o del almacenamiento en bloque, ya que almacena datos como objetos independientes, cada uno con un identificador único (generalmente una URL).

  1. OSG

OSG (Open Storage Gateway): Open Storage Gateway es una solución de software para conectar el almacenamiento local y el almacenamiento en la nube. OSG proporciona una interfaz y un protocolo unificados, de modo que las aplicaciones puedan acceder sin problemas al almacenamiento local y al almacenamiento en la nube, y lograr una alta disponibilidad y flexibilidad de los datos.

  1. XMS

XMS (Sistema de metadatos extensible): El sistema de metadatos extensible es un marco para administrar y almacenar metadatos. XMS puede ayudar a las organizaciones a administrar y recuperar de manera eficiente grandes cantidades de metadatos para respaldar tareas como la administración de datos, el análisis de datos y el gobierno de datos. Proporciona una arquitectura flexible e interfaces que se pueden ampliar y personalizar según sea necesario.

  1. 3ds

3 sistema de gestión de datos tridimensional

③ETag, Clave, Metadatos, Cubo, Grok

  1. ETag (Etiqueta de entidad): ETag es un mecanismo utilizado para identificar recursos en el protocolo HTTP. Es un identificador único generado por el servidor para determinar si un recurso ha cambiado. Cuando un cliente solicita un recurso, el servidor devuelve el valor de ETag del recurso al cliente. El cliente puede usar el valor de ETag en solicitudes posteriores para verificar si el recurso ha cambiado, evitando así la transmisión de datos innecesaria.
  2. Key (clave): en el sistema de almacenamiento, Key es una cadena que se utiliza para identificar de forma única un objeto de almacenamiento. Es similar a la clave principal de la base de datos y se utiliza para ubicar y acceder a objetos específicos en el sistema de almacenamiento. Las claves generalmente las especifican los usuarios y se pueden diseñar de acuerdo con los requisitos comerciales.
  3. Cubo (cubo de almacenamiento): El cubo es un contenedor para organizar y administrar objetos de almacenamiento. Es similar a una carpeta en un sistema de archivos y puede contener varios objetos de almacenamiento (como archivos). Los depósitos generalmente los crean los proveedores de sistemas de almacenamiento, donde los usuarios pueden crear, eliminar y administrar objetos de almacenamiento.
  4. Metadatos: Los metadatos son los datos que describen el objeto de almacenamiento. Contiene información de atributos sobre el objeto, como el tamaño, el tiempo de creación, el tiempo de modificación, etc. Los metadatos generalmente se almacenan junto con los objetos de almacenamiento y se pueden recuperar y modificar a través de la API del sistema de almacenamiento.
  5. ACL (Lista de control de acceso): ACL es un mecanismo de control de acceso utilizado para definir los derechos de acceso de los objetos de almacenamiento. A través de ACL, los usuarios pueden establecer permisos de lectura y escritura para objetos de almacenamiento para controlar quién puede acceder y modificar objetos.
  6. CDN (Content Delivery Network): CDN es una arquitectura de red distribuida utilizada para acelerar la transmisión y distribución de contenido estático. Al almacenar contenido en caché en nodos más cercanos a los usuarios, CDN reduce el retraso de la transmisión de datos y mejora la velocidad de acceso y la experiencia del usuario.
  7. Replicación: la replicación es una tecnología de protección de datos y recuperación ante desastres que mejora la confiabilidad y disponibilidad de los datos mediante la replicación de datos en varios nodos de almacenamiento. Cuando falla un nodo, los datos se pueden obtener de otros nodos para garantizar la persistencia y la capacidad de recuperación de los datos.
  8. Grok es una expresión para analizar y comparar datos de texto. Es un poderoso motor de coincidencia de patrones desarrollado por la comunidad de Elasticsearch y se usa a menudo en el análisis de registros y el procesamiento de datos.
# 以下是一个使用 Grok 表达式解析 Apache 访问日志的示例:
%{
    
    IP:client} %{
    
    USER:ident} %{
    
    USER:auth} \[%{
    
    HTTPDATE:timestamp}\] "%{WORD:method} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion}" %{
    
    NUMBER:response} %{
    
    NUMBER:bytes} "(?:%{URI:referrer}|-)" "%{DATA:agent}"

La diferencia entre ETag (etiqueta de entidad) y Versión (control de versión):

  1. ETag: etiqueta de entidad
    • ETag es un identificador único generado por el servidor que identifica una versión específica de un recurso.
    • La ETag se puede generar según el algoritmo hash del contenido del recurso o según otras reglas.
    • Cuando un cliente solicita un recurso, el servidor devuelve el valor de ETag del recurso al cliente.
    • El cliente puede usar el valor de ETag en solicitudes posteriores para verificar si el recurso ha cambiado, evitando así la transmisión de datos innecesaria.
    • Las ETags suelen ser adecuadas para el control detallado o la verificación de recursos, como la implementación de mecanismos de almacenamiento en caché.
  2. Versión: control de versiones
    • El control de versiones se utiliza para identificar diferentes estados o modificar el historial de recursos manteniendo diferentes versiones de recursos.
    • El control de versiones puede describir diferentes versiones de un recurso en función de marcas de tiempo, números de versión incrementados u otros mecanismos.
    • Cada vez que cambia un recurso, se crea una nueva versión y se registra la información de cambio correspondiente.
    • Los clientes pueden obtener o retroceder a una versión específica según el número de versión o el historial del recurso.
      El control de versiones suele ser adecuado para el historial completo y la gestión de recursos, como la colaboración en equipo o los sistemas de gestión de versiones de código.

La principal diferencia entre ETag y el control de versiones radica en el método de generación y los escenarios de aplicación:

  • ETag se genera en función del contenido de los recursos, adecuado para el control detallado y la verificación de los recursos, y se puede utilizar para almacenamiento en caché, solicitudes condicionales, etc., mientras que el control de versiones se genera en función del historial de cambios de recursos, adecuado para administrar y rastrear diferentes versiones. y cambios de recursos.
  • ETag se usa principalmente para controlar el almacenamiento en caché y optimizar la transmisión de la red, mientras que el control de versiones se usa principalmente para la colaboración en equipo, la gestión de código y otros escenarios que requieren un historial completo y una reversión de versiones.

④HCI, SDS, RAID, SAN

  1. HCI

HCI (infraestructura hiperconvergente): la infraestructura hiperconvergente es una arquitectura que integra funciones informáticas, de almacenamiento y de red en un solo servidor. HCI proporciona gestión y escalado simplificados, y recursos informáticos y de almacenamiento altamente integrados.

  1. SDS

SDS (Almacenamiento definido por software): El almacenamiento definido por software es una arquitectura que implementa funciones de almacenamiento a través del software. SDS puede desacoplar las funciones de almacenamiento del hardware, proporcionando flexibilidad, escalabilidad y rentabilidad.

  1. REDADA

RAID (matriz redundante de discos independientes): la matriz redundante de discos independientes es una tecnología que proporciona redundancia de datos y mejora del rendimiento mediante la combinación de varios discos. RAID puede proporcionar soluciones de almacenamiento de alta confiabilidad y alto rendimiento.

  1. SAN

SAN (red de área de almacenamiento): la red de área de almacenamiento es una arquitectura de red de alta velocidad utilizada para conectar dispositivos de almacenamiento y servidores. SAN proporciona conexiones de almacenamiento de baja latencia y gran ancho de banda, y admite varios servidores que acceden a los recursos de almacenamiento compartido al mismo tiempo.

2 sistemas de archivos distribuidos comunes

2.1 GFS (sistema de archivos de Google)

Sistema de archivos GFS de Google, un sistema de archivos distribuido escalable para aplicaciones de uso intensivo de datos a gran escala. Aunque GFS se ejecuta en dispositivos de hardware comunes y económicos, todavía tiene la capacidad de proporcionar redundancia ante desastres y brindar servicios de alto rendimiento para una gran cantidad de clientes. GFS es un gran marco de almacenamiento distribuido de datos diseñado internamente para Google. Fue propuesto por un documento publicado por Google en 2003. Desafortunadamente, Google no lo abrió, pero según el concepto de diseño de GFS, se crearon muchos archivos GFS de código abierto excelentes. nacido.sistema.

2.2 HDFS (Sistema de archivos distribuido Hadoop)

HDFS es un sistema de archivos dedicado para Hadoop (proyecto de código abierto de Apache). Hadoop es un marco de computación de big data que permite el procesamiento distribuido de grandes conjuntos de datos en clústeres de computadoras usando un modelo de programación simple. Es la implementación del algoritmo MapReduce publicado por Google. HDFS es una implementación de código abierto de GFS.

2.3 Cefalograma

Ceph es una nueva generación de sistema de archivos distribuidos de software libre diseñado por Sage Weil de la Universidad de California, Santa Cruz (cofundador de DreamHost) para su disertación doctoral, y completó su disertación usando Ceph. El objetivo principal de Ceph es diseñar un sistema de archivos distribuido basado en POSIX sin un solo punto de falla, lo que permite que los datos sean tolerantes a fallas y se repliquen sin problemas. En comparación con otros sistemas de archivos distribuidos, ceph tiene el rendimiento más alto porque está escrito en C++. Porque ceph usa el sistema de archivos btrfs, y el sistema de archivos btrfs requiere Linux 2.6.34 o kernels superiores para admitirlo. Después de graduarse en 2007, Sage comenzó a dedicarse a tiempo completo al desarrollo de Ceph para que sea adecuado para el entorno de producción. Después de más de diez años de desarrollo, Ceph ha madurado.

2.4 Brillo

Lustre es una plataforma de software de sistema de archivos paralelos, distribuidos y de código abierto, que presenta alta escalabilidad, alto rendimiento y alta disponibilidad. El objetivo arquitectónico de Luster es proporcionar un espacio de nombres compatible con POSIX coherente a nivel mundial para sistemas informáticos a gran escala, incluidos los sistemas informáticos de alto rendimiento más potentes del mundo. Admite cientos de PB de espacio de almacenamiento de datos y cientos de GB/s o incluso varios TB/s de ancho de banda agregado simultáneo.

2.5 GridFS

GridFS es el sistema de almacenamiento distribuido de MongDB para almacenar y restaurar archivos (como imágenes, audio, video, etc.) que excedan los 16 M (límite de archivos BSON). GridFS también es una forma de almacenamiento de archivos, pero se almacena en una colección de MonoDB. GridFS puede almacenar mejor archivos de más de 16M. GridFS dividirá los objetos de archivo grandes en varios fragmentos pequeños (fragmentos de archivo), generalmente de 256k cada uno, y cada fragmento se almacenará en la colección de fragmentos como un documento de MongoDB. GridFS almacena un archivo en dos colecciones: fs.files y fs.chunks. El contenido real de cada archivo se almacena en fragmentos (datos binarios) y los metadatos relacionados con el archivo (nombre de archivo, tipo de contenido y atributos definidos por el usuario) se almacenarán en la colección de archivos.

2.6 MogileFS

MogileFS es un sistema de almacenamiento de archivos distribuidos de código abierto desarrollado por Danga Interactive, una subsidiaria de LiveJournal. En la actualidad, hay muchas empresas que utilizan MogileFS, como las principales empresas de Internet de Japón y las nacionales Yupoo, digg, Douban, Dianping, Sogou, etc., que gestionan una gran cantidad de imágenes para sus organizaciones o empresas. Tomando Dianping como ejemplo, todas las imágenes de los usuarios se almacenan en MogileFS y el volumen de datos ha alcanzado más de 500 TB

2.7 FastDFS (Sistema de archivos distribuido rápido)

FastDFS es un sistema de archivos distribuido de código abierto escrito en C puro con alto rendimiento. Ella administra archivos, y sus funciones incluyen: almacenamiento de archivos, sincronización de archivos, acceso a archivos (carga de archivos, descarga de archivos), etc., lo que resuelve los problemas de almacenamiento de gran capacidad y equilibrio de carga. Es especialmente adecuado para servicios en línea con archivos como soporte, como sitios web de álbumes de fotos, sitios web de videos, etc.

2.8 TFS (Sistema de archivos Taobao)

TFS es un sistema de archivos distribuido orientado a servicios de Internet altamente escalable, de alta disponibilidad y alto rendimiento, principalmente para datos masivos no estructurados, se basa en un clúster de máquinas Linux común y puede proporcionar alta confiabilidad y alta concurrencia para el mundo exterior. acceso al almacenamiento. TFS proporciona a Taobao almacenamiento masivo de archivos pequeños, generalmente el tamaño del archivo no supera 1M, lo que satisface la demanda de almacenamiento de archivos pequeños de Taobao y se usa ampliamente en varias aplicaciones de Taobao. Adopta una arquitectura HA y una expansión fluida para garantizar la disponibilidad y la escalabilidad de todo el sistema de archivos. Al mismo tiempo, la estructura de organización de datos planos puede asignar el nombre del archivo a la dirección física del archivo, lo que simplifica el proceso de acceso al archivo y proporciona un buen rendimiento de lectura y escritura para TFS hasta cierto punto.

2.9 NFS (Sistema de archivos de red)

NFS es un protocolo de sistema de archivos distribuido para compartir archivos y directorios a través de una red. Permite que las computadoras remotas accedan y manipulen archivos compartidos a través de la red como si fueran archivos locales. NFS es un protocolo cliente-servidor en el que el servidor mantiene sistemas de archivos que almacenan archivos, y los clientes pueden montar y acceder a estos sistemas de archivos a través de la red. NFS es ampliamente compatible con muchos sistemas operativos y dispositivos de almacenamiento, y a menudo se usa en escenarios donde se comparten archivos y datos.

3 Introducción al software de servicio de almacenamiento común

3.1 Almacenamiento de objetos

①S3(Servicio de almacenamiento simple)

S3 (Simple Storage Service) es un servicio de almacenamiento de objetos altamente escalable proporcionado por Amazon Web Services (AWS). Es ampliamente utilizado para almacenar y recuperar varios tipos de datos, incluidos archivos de texto, imágenes, videos, copias de seguridad de bases de datos, registros de aplicaciones, etc.

Características S3:

  1. almacenamiento de objetos
  2. alta escalabilidad
  3. Persistencia y confiabilidad de datos
  4. seguridad de datos
  5. baldes y llaves
  6. Acceso y transferencia de datos
  7. Gestión del ciclo de vida de los datos
  8. control de versiones
  9. evento

Artículo de referencia: https://blog.csdn.net/qq_37862148/article/details/113999206

Supongo que te gusta

Origin blog.csdn.net/weixin_45565886/article/details/130878940
Recomendado
Clasificación