Siempre es mejor primero agrupar y luego comprimir que al revés, debido a cómo funcionan los algoritmos de compresión.
Los algoritmos necesarios para comprimir ISOs deben ser del tipo "lossless", es decir, que se pueda recuperar el archivo tal y cómo era antes de comprimirlo (si no fuera así...vaya gracia :). Estos algoritmos se basan en la reducción de redundancias o repeticiones, y para ello primero analizan el archivo para "ver" cuál es la mejor forma de hacerlo.
Cuanto más grande sea el archivo, y bendita sea la estadística, más se acercará el algoritmo a la forma óptima de comprimir.
Con un ejemplo: imaginate que tienes un montón de archivos dónde hay un patrón que se repite en todos. Si los comprimes por separado, la información para recuperar ese patrón se incluirá en cada archivo comprimido. Si luego juntas 100 archivos de esos en un tar, tendrás 100 veces esa información. Si primero juntas todos los archivos en un tar, y luego comprimes, tan sólo la tendrás una vez. E incluso podrán aparecer patrones que el algoritmo no había considerado comprimir individualmente pero que merece la pena hacerlo una vez están todos juntos!!!
Por cierto, acabo de comprimir el CD 4 de la SuSE 9, y ha pasado de 649MB a 627MB...no mucho compresión
--
"Put on your Perfect Smile and start sucking up..." - A.C.T
Re:Si es un solo fichero ¿tar?
(Puntos:2, Informativo)( Última bitácora: Jueves, 22 Enero de 2004, 10:22h )
Los algoritmos necesarios para comprimir ISOs deben ser del tipo "lossless", es decir, que se pueda recuperar el archivo tal y cómo era antes de comprimirlo (si no fuera así...vaya gracia :). Estos algoritmos se basan en la reducción de redundancias o repeticiones, y para ello primero analizan el archivo para "ver" cuál es la mejor forma de hacerlo.
Cuanto más grande sea el archivo, y bendita sea la estadística, más se acercará el algoritmo a la forma óptima de comprimir.
Con un ejemplo: imaginate que tienes un montón de archivos dónde hay un patrón que se repite en todos. Si los comprimes por separado, la información para recuperar ese patrón se incluirá en cada archivo comprimido. Si luego juntas 100 archivos de esos en un tar, tendrás 100 veces esa información. Si primero juntas todos los archivos en un tar, y luego comprimes, tan sólo la tendrás una vez. E incluso podrán aparecer patrones que el algoritmo no había considerado comprimir individualmente pero que merece la pena hacerlo una vez están todos juntos!!!
Por cierto, acabo de comprimir el CD 4 de la SuSE 9, y ha pasado de 649MB a 627MB...no mucho compresión
"Put on your Perfect Smile and start sucking up..." - A.C.T