04:08h.
Hace algún tiempo se mostró como realizar un buscador de texto completo de altas prestaciones jugando con la base de datos de la wikipedia en castellano. Este, se realizó con apache+php+mysql y por supuesto la herramienta libre SPHINX.
Ahora he liberado un
stemmer para el idioma español para SPHINX. Está basado en el algoritmo de Porter y aunque lo desarrollé hace unos meses necesitaba una buena fase de pruebas.
Se puede probar en el
buscador de la wikipedia, o en un proyecto tan ambicioso como interesante de
agregación de blogs de habla hispana (llevado a cabo por Pau Iglesias).
Mas detalles y descarga en:
Stemmer en castellano para sphinx.
En cristiano
(Puntos:2, Divertido)