14 Compresión

Published Apr 8, 2023

Linuxenvironment

La compresión en Linux es una técnica fundamental para optimizar el almacenamiento y la transferencia de archivos. En esta clase exploraremos los conceptos básicos, las herramientas más comunes y algunos casos prácticos para dominar este tema.

1. ¿Qué es la compresión?

La compresión se refiere a reducir el tamaño de un archivo o conjunto de archivos para ocupar menos espacio en disco y facilitar su transporte.

Tipos de compresión:

  1. Lossy (con pérdida): Reduce significativamente el tamaño, pero sacrifica la integridad de los datos. Ideal para medios como imágenes, audio y video.
    • Ejemplo: Comprimir un archivo de imagen de alta calidad a un formato más pequeño como JPEG.
  2. Lossless (sin pérdida): Preserva la integridad de los datos, asegurando que al descomprimir el archivo sea idéntico al original.
    • Ejemplo: Archivar scripts, documentos o bases de datos.

2. Archivos TAR: La base de la compresión

tar es una herramienta que empaqueta múltiples archivos en un solo archivo conocido como tarball. Aunque no comprime por sí mismo, suele combinarse con herramientas de compresión.

Comandos básicos de TAR:

  • Crear un tarball:

    
    tar -cvf archivo.tar archivo1 archivo2
    
    • c: Crear.
    • v: Verbosidad (muestra detalles del proceso).
    • f: Especificar el archivo de salida.
  • Listar el contenido de un tarball:

    
    tar -tvf archivo.tar
    
  • Extraer un tarball:

    
    tar -xvf archivo.tar
    

3. Herramientas de compresión

Existen varias herramientas para comprimir archivos TAR, cada una con un algoritmo único.

Gzip

  • Muy utilizado en Linux, ofrece una buena relación entre velocidad y compresión.

  • Comprimir:El resultado será archivo.tar.gz.

    
    gzip archivo.tar
    
  • Descomprimir:

    
    gunzip archivo.tar.gz
    

Bzip2

  • Más lento que gzip, pero genera archivos más pequeños.

  • Comprimir:El resultado será archivo.tar.bz2.

    
    bzip2 archivo.tar
    
  • Descomprimir:

    
    bunzip2 archivo.tar.bz2
    

Compress

  • Más rápido, pero menos eficiente en la compresión.

  • Comprimir:El resultado será archivo.tar.Z.

    
    compress archivo.tar
    
  • Descomprimir:

    
    uncompress archivo.tar.Z
    

4. Copiado de bits: El comando dd

El comando dd realiza una copia bit a bit de un archivo, sistema de archivos o disco completo, incluyendo sectores borrados. Es comúnmente utilizado en forense digital.

Sintaxis básica:


dd if=origen of=destino
  • if: Archivo de entrada (input file).
  • of: Archivo de salida (output file).

Ejemplo práctico:

Clonar una memoria USB:


dd if=/dev/sdb of=/root/copia_usb.img

Opciones útiles:

  • bs: Tamaño del bloque (por defecto, 512 bytes). Incrementarlo puede mejorar la velocidad.

    
    dd if=/dev/sdb of=/root/copia_usb.img bs=4096
    
  • conv=noerror: Ignorar errores y continuar.

    
    dd if=/dev/sdb of=/root/copia_usb.img bs=4096 conv=noerror
    

5. Consejos prácticos y observaciones

  • Combinación de herramientas: Comprime archivos grandes con TAR y luego usa Gzip, Bzip2 o Compress para reducir aún más el tamaño.
  • Verificación de espacio: Antes de usar dd, asegúrate de que tienes suficiente espacio para la copia.
  • Evita el uso excesivo de compresión: En archivos ya comprimidos, como videos o imágenes, aplicar herramientas de compresión adicionales no tendrá un impacto significativo.

Conclusión

La compresión y el copiado bit a bit son esenciales para optimizar el almacenamiento, transferir datos eficientemente y realizar tareas de recuperación o análisis forense. Con herramientas como tar, gzip, bzip2 y dd, tendrás un conjunto poderoso para manejar archivos en Linux. ¡Practica y descubre cómo estas herramientas pueden facilitar tu trabajo! 🚀

Elprogramadorgt - Blog © 2025