Descargar con wget el enlace principal, con recursividad de nivel 1.
Localizar el Javascript browseInsideJs.aspx, que contiene los GUID de las páginas.
Utilizar tus herramientas favoritas de sustitución de texto para sacar la lista en columnas de los GUID's, alineados con los números de página y descripciones. Aunque puedes quedarte sólo con los GUID's, porque están seleccionados de modo que ordenados ascendentemente dan el orden de las páginas del libro.
Renombrar a jpg con un renombrador masivo, dejando sólo el GUID
Esta explicación debería bastar para que los miembros ingeniosos de BP tengan un excelente libro (o al menos las imágenes de uno) durante el tiempo necesario para leerlo;). Y espero que sean lo bastante enrevesadas para que los profanos no las puedan reproducir.
En fin, ha sido divertido hackear un poquito Harper Collins. En cuanto el libro alcance el mercado español, me lo compro (como todos los demás que ha publicado por aquí).
Por lo demás, me parece una iniciativa fantástica la de poder "ojear" literalmente el libro antes de comprarlo y sin salir de casa. ¡Bien por Harper Collins! Además, el buscador funciona muy bien, encontrando todas las apariciones del texto buscado en el libro. Eso no se puede duplicar en imágenes, que por otra parte son de una calidad bastante baja (470x750x16M JPG), lo que desalienta usarlo como método de distribución. Espero que veamos muchas iniciativas como esta en el futuro.
-- V.V.V.V.V.
Vi Veri Vniversum Vivus Vici
"Por el poder de la verdad, mientras viva habre conquistado el Universo"
Como complemento de tan detallado sistema de jakeo creo que no está de mas hacer saber que el libro de Gaiman está traducido y disponible en la red
http://www.bibliotheka.org/?/buscar/gaiman [bibliotheka.org]
Ya que te has tomado la molestia, he aceptado el reto de seguir tus pasos.
¡Encontrar el script.js que has puesto tenía su mérito! Una vez con él, VIM al rescate: Tras tres comandos de sustitución para dejar un ID por línea (615 me salieron), para insertar el prefijo (sin aburrime escapando caracteres) bastó ejecutar 600 y pico veces una macro. Luego utilicé wget con la opción -w 1 para no sobrecargar mucho el servidor, aunque tardara varios minutos. En total todo ocupa 56MB. Para convertir los enlaces, el rename escrito en Perl que viene incluido en Debian iba perfecto. Lo último que hice fue que los nombres de los archivos tuvieran todos la misma longitud y así el visor de imágenes los ordenara bien, con: ls *.jpg | grep '^[0-9]\{1,18\}\.jpg' | rename -v 's/^/0/'
Leí hace tiempo por casualidad una crítica de este libro, que ya lleva bastante tiempo en el mercado: American Gods [ciencia-ficcion.com]. El enlace que nos ha pasado ahí el amigo tiene el texto completo en castellano, lo cual es mucho más tentador... Y ya sabéis, si os gusta, comprádselo a alguien como regalo, jeje, que un libro siempre es un buen detalle.
Re:Menos mal que me habéis avisado
(Puntos:2, Interesante)( Última bitácora: Miércoles, 23 Enero de 2008, 18:43h )
Del método usado:
- Descargar con wget el enlace principal, con recursividad de nivel 1.
- Localizar el Javascript browseInsideJs.aspx, que contiene los GUID de las páginas.
- Utilizar tus herramientas favoritas de sustitución de texto para sacar la lista en columnas de los GUID's, alineados con los números de página y descripciones. Aunque puedes quedarte sólo con los GUID's, porque están seleccionados de modo que ordenados ascendentemente dan el orden de las páginas del libro.
- Preparar una tabla con las GUID apropiadas para cada página: El prefijo principal se puede sacar seguramente de maneras más ingeniosas: yo lo he sacado de los Temporales de IE: http://cdn.browseinside.harpercollins.com/Service
s /GetPageImage.aspx?isbn13=9780060558123&pageguid=5 819136032083539025&reqtype=0 [harpercollins.com]
(aquí la página 579, aquí unos amigos de Barrapunto).
- Poner a funcionar Wget -i
- Renombrar a jpg con un renombrador masivo, dejando sólo el GUID
Esta explicación debería bastar para que los miembros ingeniosos de BP tengan un excelente libro (o al menos las imágenes de uno) durante el tiempo necesario para leerloEn fin, ha sido divertido hackear un poquito Harper Collins. En cuanto el libro alcance el mercado español, me lo compro (como todos los demás que ha publicado por aquí).
Por lo demás, me parece una iniciativa fantástica la de poder "ojear" literalmente el libro antes de comprarlo y sin salir de casa. ¡Bien por Harper Collins! Además, el buscador funciona muy bien, encontrando todas las apariciones del texto buscado en el libro. Eso no se puede duplicar en imágenes, que por otra parte son de una calidad bastante baja (470x750x16M JPG), lo que desalienta usarlo como método de distribución. Espero que veamos muchas iniciativas como esta en el futuro.
V.V.V.V.V. Vi Veri Vniversum Vivus Vici "Por el poder de la verdad, mientras viva habre conquistado el Universo"
Re:Menos mal que me habéis avisado
(Puntos:1)Re:Menos mal que me habéis avisado
(Puntos:2)( http://guslibu.awardspace.com/ | Última bitácora: Viernes, 18 Marzo de 2011, 08:29h )
¡Encontrar el script
ls *.jpg | grep '^[0-9]\{1,18\}\.jpg' | rename -v 's/^/0/'
Leí hace tiempo por casualidad una crítica de este libro, que ya lleva bastante tiempo en el mercado: American Gods [ciencia-ficcion.com]. El enlace que nos ha pasado ahí el amigo tiene el texto completo en castellano, lo cual es mucho más tentador... Y ya sabéis, si os gusta, comprádselo a alguien como regalo, jeje, que un libro siempre es un buen detalle.
¡Un saludo!