¿Qué hace el Google Mini que no haga el ht://dig [htdig.org]?
Me parecen bastante parecidos. Pego de la web de htdig:
The ht://Dig system is a complete world wide web indexing and searching system for a domain or intranet. This system is not meant to replace the need for powerful internet-wide search systems like Lycos, Infoseek, Google and AltaVista. Instead it is meant to cover the search needs for a single company, campus, or even a particular sub section of a web site.
Estos soportan herramientas libres de conversión como:
catdoc ( Word )
unrtf ( RTF )
pdftotext ( PDF )
xls2csv ( Excel )
Estas convierten los formatos a texto plano para poder hacer los índices. Es mas traen wrappers Perl para tener una API común ante diversas herramientas de estas.
Para índice interno yo estoy usando namazu, tiene sus propias bases binarias muy rápidas.
mnogosearch es bastante bueno también para internet, soporta robots.txt, cabeceras de keywords y descriptions, puede usar mysql o postgresql y tiene una interfas en php con api nativa
Quisiera saber como va a hacer mnoGoSearch con el tema de la patente de Google de resaltar las palabras, ya que dispone de un cache de los documentos indexados con el resalte de las palabras encontradas.
Alternativas al Google Search Appliance
(Puntos:2, Informativo)Incluso hay alguna con licencia GPL.
[dirson.com]¿Qué tal ht://dig?
(Puntos:3, Informativo)( Última bitácora: Domingo, 05 Diciembre de 2010, 22:01h )
Me parecen bastante parecidos. Pego de la web de htdig:
The ht://Dig system is a complete world wide web indexing and searching system for a domain or intranet. This system is not meant to replace the need for powerful internet-wide search systems like Lycos, Infoseek, Google and AltaVista. Instead it is meant to cover the search needs for a single company, campus, or even a particular sub section of a web site.
Soluciones Libres
(Puntos:3, Informativo)ht://dig ( www.htdig.org )
mnoGoSearch ( www.mnogosearch.org )
namazu ( www.namazu.org )
Estos soportan herramientas libres de conversión como:
catdoc ( Word )
unrtf ( RTF )
pdftotext ( PDF )
xls2csv ( Excel )
Estas convierten los formatos a texto plano para poder hacer los índices. Es mas traen wrappers Perl para tener una API común ante diversas herramientas de estas.
Para índice interno yo estoy usando namazu, tiene sus propias bases binarias muy rápidas.
mnogosearch es bastante bueno también para internet, soporta robots.txt, cabeceras de keywords y descriptions, puede usar mysql o postgresql y tiene una interfas en php con api nativa
as1
Petente de Google
(Puntos:1)as1
Re:¿Pequeña y mediana empresa?
(Puntos:1)