Método de implementación de compresión-compresión, formato de compresión de uso común

  • La compresión es un mecanismo para reducir el tamaño del archivo de la computadora a través de un algoritmo específico, que puede reducir
    los datos almacenados por Bytes . Muchas empresas utilizan la forma de paquetes comprimidos. La base de datos se usa raramente. Un amigo, nuevo salto Después de que una empresa asignara el proyecto, inesperadamente, los datos enviados eran todos paquetes comprimidos, uno de los cuales contenía información de usuario de 4000W (no sé qué cosas específicas eran), y su computadora no se pudo abrir.
    (No somos un gran programador, Xiaobaibai)

De repente, presté atención a la compresión, porque parece que no hago nada más que descomprimir algunas películas pequeñas con compresión rápida, por lo que Mother Du tiene algunos conocimientos relevantes y quería compartirlos, y ponerlos aquí, espero que los grandes puedan dar sugerencias.

Más cerca de casa.
Nuestro entendimiento popular es que la descompresión es para eliminar espacios. De hecho, no es del todo correcto.
Hablemos de compresión.

  1. expediente
  • (Archivo) La tecnología de compresión consiste simplemente en encontrar Bytes duplicados en el archivo y luego crear un archivo de diccionario con los mismos Bytes y usar un código para representarlo.

  • Por ejemplo, en el archivo original, hay muchos Bytes repetidos o palabras como: LiEnze Te amo, esta vez se producirá un código para expresar como: sb Por supuesto, es solo un ejemplo, la operación real es mucho más problemática

  1. imagen
  • (Imagen) La computadora usa representación binaria para procesar información, y hay innumerables puntos del mismo color en una imagen, correcto, la compresión involucrará cuántos puntos azules hay en una posición determinada, y usa la fórmula (0, 1 ) Para mostrar que los
    métodos de compresión se dividen en:
    (a veces, si desea buscar la eficiencia, necesariamente descontará la calidad)
  1. Compresión con pérdida:
  • Por ejemplo, cuando comprime la imagen, falta un píxel en la esquina superior izquierda de la imagen. ¿Puede verlo a simple vista? ¡Correcto!
  • La compresión con pérdida es muy adecuada para comprimir imágenes, audio y video. El formato representativo típico es .mpeg
  1. compresión sin perdidas:
  • La compresión sin pérdida se utiliza cuando buscamos la perfección de los datos y no consideramos especialmente la eficiencia. Hay demasiados formatos representativos, como .zip .rar.
    De hecho, el punto más importante de la compresión es eliminar los duplicados, es decir, repetir la compresión.

También hay dos tipos de compresión repetida:

  1. Repetición de párrafo
  • Bytes se convierte en una oración corta después de repetir más de tres

  • Al comprimir este tipo, zip usa dos números, uno es la distancia desde la posición de repetición hasta la posición actual, y el otro es la longitud de la repetición

  • Por ejemplo: abcddddd Mi posición de repetición actual es la tercera (el índice de la primera posición es 0) y la longitud de repetición es 5, entonces puedo d (3,5) para representar la d repetida.

No crea que un Bytes tiene 256 posibilidades y tres bytes significan 256 ^ 3 posibilidades. Este método de compresión es simplemente una fantasía.

  • Por ejemplo: el nombre del protagonista en una novela y el nombre de la heroína que fue al hotel, aparecieron muchas veces en gran medida, lo que se ajusta al método de compresión repetida, pero la compresión repetida solo es adecuada para una compresión.
  • No tiene mucho sentido comprimir el archivo por segunda vez, porque la primera compresión ha destruido en gran medida la tendencia repetitiva de la oración fuente.
  1. Duplicación de bytes individuales
  • Hay 236 posibilidades en un byte, ¿no sería más probable que se repitiera así? Como es de un solo byte, el rango se reduce mucho.

  • Por ejemplo, las letras y los números se usan comúnmente en archivos de texto ASCII Se dice que E tiene la tasa de uso más alta.

  • La imagen se comprende mejor. Afirma el uso de tonos oscuros y claros.
    Por cierto, el formato de imagen png es una compresión sin pérdidas. Su algoritmo principal es el algoritmo zip. La principal diferencia entre este y el archivo de formato zip es: Un formato de imagen, que almacena información como el tamaño de la imagen y la cantidad de colores utilizados en el encabezado del archivo.

  • El resultado de la compresión de frases mencionada anteriormente también tiene esta tendencia: la repetición tiende a aparecer más cerca de la posición de compresión actual, y la longitud de la repetición tiende a ser relativamente corta (dentro de los 20 bytes).

Formatos de compresión comunes:

  1. JAR -Java Archive File
    es un formato de documento de Java. También puede entenderlo como un archivo ZIP, llamado paquete de archivos. La mayor diferencia entre este y ZIP es que el contenido del archivo JAR contiene un META-INF / MANIFEST. Archivo MF, este archivo se crea automáticamente cuando se genera el archivo JAR

  2. ZIP -
    zip es un formato de compresión muy común y no requiere un software de compresión o descompresión por separado, ya que el sistema Windows tiene soporte integrado para el formato de compresión ZIP.

  3. RAR :
    la posición de compresión de RAR es superada solo por ZIP, porque la tasa de compresión de RAR es mucho más alta que la de ZIP. Hay una estrella en ascenso llamada 7Z, que tiene una relación de compresión más alta que RAR, pero no hay forma de que RAR haya establecido una cierta base en el campo de compresión y no pueda ser sacudida.

  4. CAB
    CAB es un formato de archivo comprimido introducido por Microsoft. Se utiliza principalmente para programas de instalación. Por lo tanto, los archivos contenidos en el archivo CAB se procesan. El precio es que es posible que no podamos usarlo después de la descompresión.

  5. ISO :
    ISO es un formato de imagen de disco, ¿verdad? Los datos se guardan en el disco. Tan pronto como pueda comprender, esto es extracción de archivos.

  6. TAR -
    TAR .tar es un archivo con un sufijo, WinZIP, WinRAR, se puede abrir, porque ambos están asociados con TAR, el punto es que TAR es un formato de archivo comúnmente usado en Linux

  7. UUE -
    UUE Esto es más poderoso, usa el formato comprimido cuando encuentra códigos confusos causados ​​por codificaciones de correo mezcladas y se puede abrir con WinZIP y WinRAR.

La operación de compresión es relativamente problemática, por lo que debe estudiarla lentamente ~~~

Supongo que te gusta

Origin blog.csdn.net/weixin_47587864/article/details/108490861
Recomendado
Clasificación