Historias
Slashboxes
Comentarios
 

Login Barrapunto

Login

[ Crear nueva cuenta ]

SegFault (339)

SegFault
  (email no mostrado públicam.)
http://barrapunto.com/~SegFault/bitacora

Pues nada, disfruto como un enano en las guerras santas KDE vs. Gnome, en la que me he posicionado en la facción KDE. Soy asiduo de Barrapunto, y poco más: me gusta el rol, el heavy metal y la Heineken!

Down Kill Up Publicidad

Bitácora de SegFault (339)

Jueves, 25 de Agosto 2011

Olvidaos de Steve Jobs ¡CmdrTaco deja Slashdot!

01:59h.
Slashdot
Rob Malda, "CmdrTaco" acaba de anunciar que deja Slashdot. CmdrTaco fundó Slashdot.org allá en 1997 y desde entonces ha sido un sitio de referencia, y aunque quizás haya perdido la posición que tenía ahora sigue siendo uno de los sitios imprescindibles, no tanto por las notas sino como por los comentarios. Leer Slashdot es leer los comentarios y CmdrTaco lo hizo muy bien cuando creó comentarios anidados y los sistemas de karma que permiten que leer los "5, Interesting" te aporten tanto mientras que las cadenas de "5, Funny" sacan la carcajada. Ha sido un placer señor Malda ¡y buena suerte!
Lunes, 19 de Octubre 2009

djb

09:09h.
Unix
He descubierto un artículo alabando a Dan J. Bernstein, y encontrar una opinión sobre el autor de qmail, djbdns y daemontools no tiene ningún merito, pero me ha parecido interesante los comentarios de la noticia en Reddit. Como muchos he tenido una relación amor/odio con los productos del señor Bernstein, especialmnente qmail y su idiosincrasia, pero creo que nunca está de más recordar la labor de todo un personaje y la marca que sus programas y su manera de entender las aplicaciones ha dejado.
Martes, 06 de Octubre 2009

Proveedor de DNS europeo

07:47h.
Internet
Hola, estoy intentando pensar en alternativas a un servicio de DNS como el de UltraDNS o Akamai DNS, pero uno de los requisitos que quisiera que cumpliera es que no fuera de base norteamericana, si fuera europea sería mejor, pero asiático, australiano o alguna otra opción me vale.

Desgraciadamente apenas si conozco proveedores de servicio DNS de "gama alta", los que conozco son los que ofrecen funcionalidades normales, por eso había pensado preguntar aquí, a lo mejor alguien tiene alguna opinión o experiencia que aportar.
Domingo, 15 de Marzo 2009

Nosotros no iniciamos el fuego

07:31h.
Humor
Es imposible que recuerde cómo he llegado a este vídeo: "Here comes another bubble", un vídeo con la música de "We didn't start the fire" sobre la llamada burbuja 2.0. Me ha parecido bastante gracioso y no he podido evitar dejar escapar alguna carcajada. Hay información sobre el vídeo así como una versión con subtítulos en español.

Yo en lo personal no pienso opinar sobre la existencia o no de una burbuja 2.0, pero dejaré como pista que no soy tan optimista :-)
Miércoles, 21 de Enero 2009

UTF-8 evita solucionar los problemas de codificación

06:01h.
Varios

En la anterior entrada mencioné un problema de Twitter con el Unicode, y también prometí que diría porqué creo que se producen tantos problemas con los encodings y a qué se debe que mucha gente no entienda el problema de las distintas codificaciones. ¿Por qué creo que ocurre eso? Por falta de visibilidad. Para que un problema pueda resolverse de una forma más o menos definitiva es importante que exista consciencia sobre ese problema, y el de los problemas de codificación está bastante escondido a pesar de todo.

Es más, creo que gran parte de esa invisibilidad del problema puede deberse a la existencia de UTF-8. Uno de las características de UTF-8 es su compatibilidad hacía atrás con ASCII extendido, y he ahí la fuente de gran parte de los problemas, ya que mucha gente cree no tener un problema haciendo pruebas, hasta que de repetne aparecen unos acentos, eñes, ß, umlauts o signos arábicos y todo deja de funcionar tan bien.

¿Y qué tiene de malo utilizar UTF-8? Intentaré explicarlo con un ejemplo. Supongamos que el nuevo presidente del mundo, Barack Obama decide reformar la constitución norteamericana y le envía el fichero que contiene tan sacro texto a 2 grupos de trabajo para que hagan sus modificaciones, y pasado el periodo de trabajo el señor Obama recibe los 2 ficheros de vuelta, y puesto que ha decidido hacer una apuesta fuerte por la tecnología decide que lo mejor es usar una herramienta automática para hacer merge. Obama decide revisar el nuevo borrador de la Constitución y ¡horror! hay partes que se han convertido en signos indescifrables ¿es que esos expertos no saben hacer su trabajo o qué?

Posiblemente el problema haya venido a la unión de 2 factores: la compatibilidad de ASCII con ISO-8859-1 y la compatibilidad de ASCII con UTF-8. La antigüedad de la constitución americana nos garantiza que no estaba escrita ni en ISO ni en UTF-8, lo que nos deja nada más que pensar que estaba redactada en un .txt en ASCII :-). Ese fichero ASCII se pasó a los 2 grupos de trabajo, cada uno decidió utilizar un método distinto. El primer grupo publicó el fichero de la Constitución en la portada de Slashdot para que todos los comentaristas aportaran sus modificaciones. Puesto que /. utiliza ISO-8859-1 como encoding, al pegarle todos los bytes de la constitución se sigue leyendo perfectamente. El segundo grupo decidió editar el texto en una Ubuntu usando vim, como mandan los cánones. Puesto que Ubuntu por defecto viene configurado en UTF-8 y que hay una compatibilidad, vim leyó correctamente el fichero como UTF-8 ya que la ristra de bytes es la misma.

¿Y eso que tuvo de malo? Puesto que Obama apostó por la participación de las minorías se han introducido palabras españolas, de hecho el documento que venía de Slashdot contenía la palabra América (con tilde) y en el segundo documento incluyeron la expresión "¡viva el presidente!" (abriendo exclamación). El documento resultado final puede ser ASCII, ISO o UTF-8, pero de cualquiera de las 3 formas se verían mal el la é o la ¡ (las 2 en caso de ASCII).

Moraleja

¿Cuál es la moraleja de todo esto? Que cuando estamos trabajando con textos en ISO-8859-1 y UTF-8 la compatibilidad de UTF-8 nos puede hacer creer que todo está funcionando bien sin tener que recodificar las cadenas, siempre y cuando estemos utilizando caracteres ASCII (escribiendo en ingés, no acentuando y todas esas cosas). ¿Qué ocurriría si no existiera UTF-8? Si por ejemplo las cadenas estuvieran codificadas todas en UTF-16, en nuestras pruebas sin recodificación ni un mísero "Hello world" funcionaría correctamente.

Admito que es probable que sin la compatibilidad de UTF-8 quizás la adopción de Unicode sería mucho más lento, pero también seríamos mucho más conscientes de los problemas, ya que detectariamos los problemas con las primeras pruebas, y veriamos que "simplemente no funciona", que posiblemente sea mejor que un "parece que funciona" como primer paso para resolver un problema.

Y toda esa parrafada es la explicación a porqué creo que UTF-8 tiene gran parte de culpa de que aún hoy en día haya tantos problemas trabajando con codificaciones y existan tantos problemas que desconozcan totalmente el problema.

Martes, 20 de Enero 2009

Internacionalización, Unicode y problemas en Twitter

09:41h.
Internet

Hoy le comenté a alguien una curiosidad de Twitter, y se trata de la gestión de las cadenas. Supongo que aquí la mayoría sabréis que Twitter es una herramienta de microblogging que permite mensajes de un máximo de 140 carácteres. Sin embargo ¿qué es un carácter? Para muchos sistemas de codificación un carácter equivale a un byte, al igual que en ASCII extendido, pero hoy en día está claro que ASCII y las codificaciones ISO no son suficientes y por eso se usan las codificaciones Unicode.

Desgraciadamente Unicode no es omnipresente y todavía hay muchas implementaciones que no lo soportan de forma transparente y aún trabajan en ASCII o alguna otra codificación ISO. De hecho, a botepronto los lenguajes que trabajan de forma nativa con alguna codificación Unicode son JavaScript, Java y C#, los demás tienen soporte de una forma más o menos natural.

Esto nos puede ocasionar problemas de interoperabilidad cuando trabajamos con distintos lenguajes, cosa que pasa en Twitter y así volvemos al tema de los 140 caracteres de Twitter. Cuando estamos escribiendo una entrada en Twitter, podemos ver como el contador de caracteres a medida que vamos escribiendo.

Por casualidad un día descubrí que Twitter no se porta muy bien, y podéis reproducir fácilmente el problema si intentáis escribir un twit como ññññññññññññññññññññññññññññññññññññññññññññññññññ ñññññññññññññññññññññ (71 eñes) veremos que aún nos quedan 69 caracteres, pero al publicarlo recibiremos el error:

Oops! Your update was over 140 characters. We sent the short version to your friends (they can view the entire update on the web).

¿Por qué ocurre eso? Posiblemente porque se están contando los caracteres del mensaje de 2 formas distintas. ¿Cómo se cuentan esos caracteres? Utilizando Javascript, por supuesto, no habría otra forma de hacerlo en una web. ¿Y cómo lo cuenta el servidor? Pues por lo que sabemos Twitter ha estado escrito en Ruby on Rails

Nosotros mismos podemos comprobar esa diferencia fácilmente si probamos tecleando en una consola JavaScript (Firebug en Firefox por ejemplo): 'ññ'.length y veremos como obtenemos como respuesta 2. Si probamos en Ruby 'ññ'.size obtendremos 4 (si lo hacemos en una consola Unicode). Eso es lo que provoca el error y la diferencia, lo que indica también que seguramente los datos en la base de datos estén guardados en un encoding no Unicode, probablemente apostaría por ISO-8859-1.

¿Qué deberiamos aprender de éste error de Twitter? Pues a tener cuidado con las codificaciones, ya que aunque el problema existe desde hace décadas, nunca es tarde para aprenderlo. Y otro día contaré porqué creo que UTF-8 no está ayudando a solucionar este problema :-)

Miércoles, 14 de Enero 2009

Ajuste de cuentas

02:29h.
Pasta (Gansa)

Hace varios meses comenté por aquí que medidas tomabamos mi unidad familiar para afrontar la crisis. Ahora que ha entrado un nuevo año me apetece también contar qué hemos decidido mi mujer y yo, basándonos en la experiencia y en lo que hemos decidido.

Parte de la mecánica de lo que hemos decidido lo cuentan en el programa del que he sacado el titular de la historia (presentado por Vicens Castellano) y se trata de acotar los gastos ordinarios del mes. Para ello a principio de mes sacamos de las cuentas el dinero que consideramos necesario para los gastos del día a día: comida, compras, incluso el ocio. Éste es el primer mes en el que lo hacemos, y aunque hemos ido llevando un control sobre los gastos creo que tendremos que aproximarnos a los suficiente.

Ese sería el primer nivel de ahorro, ya que conseguimos limitar los gastos, y lo que sobre irá a un segundo nivel de ahorro: por ahora es una hucha y será de donde saquemos para los caprichos de cierto esfuerzo económico: un videojuego, alguna prenda de ropa excesiva, un pequeño mueble, un fin de semana, ese tipo de cosas.

Además por fin hemos abierto una cuenta de ahorro con lo que pudimos ahorrar en el 2008, que fue un año clave en la economía de SegFault & esposa :), ya que conseguimos liquidar casi todas las deudas, ordenar los gastos y permitirnos los últimos caprichos: cámara digital, móvil nuevo para mí y algunos juegos de tablero. Esa cuenta de ahorro supone un tercerotro nivel de ahorro, ya que ahí destinaremos un dinero que por ahora no tenemos muy claro de en qué emplear, pero que creo que es necesario tener ahorrado.

Todo esto tiene que funcionar en teoría, ya que hemos hecho una reducción de gastos que tiene su culmen en la posibilidad de cambiar de hipoteca que estamos planteando, y que estamos pendiente de que una amiga experta en finanzas nos comente.

Supongo que en otros meses contaré por aquí cómo está yendo todo, por si a alguien le interesa.

Jueves, 08 de Enero 2009

La ley de Moore: Zawodny contra DHH

10:03h.
Internet

DDH escribió en el blog de 37 Signals un artículo sobre como recurrir al hardware antes de usar técnicas como sharding, argumentando que la Ley de Moore está a favor del desarrollador. Como respuesta ha recibido un artículo de otro peso pesado, Jeremy Zawodny, "Don't Bet on Moore Saving Your Ass" en el que defiende que aplicar más hardware no va a resolver todos los problemas del softw are.

Leyendo bien los artículos nos damos cuenta de que tampoco dicen cosas muy distintas, supongo que a Zawodny le ha saltado la simplicidad con la que DHH afronta el problema de escalabilidad. Imagino que viniendo Zawodny de donde viene no puede asumir que se diga que la escalabilidad es algo que se soluciona añadiendo RAM y micro.

Creo que casi todo el mundo compartiremos la opinión de DHH de que es importante centrarse en las necesidades actuales, y que si el hardware puede solucionar el problema, quizás sea una solución (habría que valorar los costes) pero creo que no hay que perder de vista como puede escalar el servicio, ya que no siempre será una solución aplicar más metal al problema. Si Basecamp (¡qué sólo tiene un servidor de BB.DD.!) no está planeado para escalar más allá de una máquina y es capaz de asumir el crecimiento de su base de clientes, entiendo que no se planteen soluciones más complejas, pero no creo que la gente de Facebook, Flickr, Google, Livejournal o Hotmail pudieran pensar lo mismo.

Mi conclusión es: el mundo de las infraestructuras es complicado, y mientras lo que vas a hacer esté dentro de los límites de lo simple no tienes porqué complicarte la vida, el problema viene en que si no tienes un plan B preparado y llega el punto en el que la RAM y más disco no te va a solucionar la papeleta realmente el tiempo de respuesta puede llegar a ser muy alto. Después de tantos años trabajando en infraestructuras creo que apoyo más a Zawodny que a DHH, aunque comprendo a los dos, pero para conseguir esa elegancia y esa simplicidad en el producto final a veces hay que mancharse mucho las manos. Como ejemplo Google, todo el mundo admira su simplicidad, sin embargo por debajo de todo lo que vemos podemos encontrarnos un gran trabajo en las infraestructuras, trabajo realizado por grandes profesionales que han tenido que buscar soluciones creativas y complejas para problemas que vienen del volumen.

Miércoles, 31 de Diciembre 2008

CA, SSL, Barrapunto y meneame.net

09:20h.
Bitácoras
A raiz de la noticia sobre la " vulnerabilidad en la infraestructura de clave pública" y cómo se ha tomado la noticia en distintos medios me he decidido a reflexionar un poco sobre lo sucedido y sobre cómo lo muestra cada sitio. En este caso hablaré de Barrapunto vs Meneame, dos archienémigos como antes lo fueron Barrapunto vs. Libertonia :-)

Comenzaré diciendo que de vez en cuando ojeo meneame.net, pero cada vez lo veo como un sitio menos relacionado con sus orígenes, ya que creo recordar que al principio las notas eran más tecnológicas y sobre soft libre, y ahora la "línea editorial" creo que es bastante diferente. Aún así quise participar en hacer pública la noticia sobre la falsificación de un CA y voté a la historia "Grave vulnerabilidad en la infrastructura PKI de los navegadores web (Inglés)", que finalmente no llegó a portada. Entendí que esa no llegara y pensé que quizás se publicaba otra nota más informativa que no habría visto (tampoco conozco muy bien el proceso y no busqué "duplicadas" ni notas anteriores). Sin embargo mi sorpresa fue descubrir que la nota publicada fue "Cómo unos hackers rompieron la seguridad del SSL usando 200 PS3", que no sólo es incorrecta sino que además se centra en el detalle de que se usaron unas videoconsolas para generar la colisión.

Creo que esta anécdota es signo de lo que suele pasar en sitios como meneame, y posiblemente lo que está ocurriendo con los medios tradicionales, donde se busca la anécdota y el titular. Y ya puestos a criticar y cambiando totalmente de tercio, diré que creo que sitios como Slashdot, Barrapunto o incluso reddit.com (que quizás sea más parecido a meneame) consiguen una mayor calidad gracias al sistema de comentarios anidados, que incita a mejores discusiones.

Obviamente mi opinión no se basa sólo en esa nota, pero tampoco soy un experto en análisis de medios. Quizás sea una exageración, quizás sea una tontería o sólo que estoy viendo cosas donde en realidad no las hay. Hay que ver cómo estoy, me tiro más de 3 meses sin pisar Barrapunto y al segundo día que vuelvo lo primero es compararlo bon meneame.net :-)
Martes, 30 de Diciembre 2008

Sobre noestudiesinformatica

10:45h.
Varios
En la cola de envíos hay una historia, que no creo que vaya a pasar a portada, en la que se enlazan a 2 respuestas al follón: Contestando sandeces y chiquilladas y No estudies informatica Dot Com. En esas historias se habla de la profesión (o más bien profesiones, puntualizaría yo) y no tanto de la titulación.

Personalmente creo que existe una gran confusión cuando se habla de la titulación en ingeniería o el grado y cuando se habla de la profesión, ya que existen muchas otras formas (y muy dignas todas ellas) de llegar a ser un profesional de un campo tan amplico como "la informática". Y a veces tengo la sensación de que se abusa de esa confusión, no se si de forma intencionada o no, pero no puedo evitar que se juegue con ella para defender los argumentos.

Creo que el principal problema de las profesiones informáticas hoy en día son más de carácter laboral y profesional y serían más defendibles por sindicatos o comités de empresas. Sería más interesante un estatuto bien claro y más trabajado que regulando las atribuciones de ingeniería, creo que lo primero llegaría a una mayor parte de la sociedad.

No creo que haya aportado mucho a este tema, pero era por reflejar en parte lo que pienso sobre este tema.