2006/10/3, Camaleón
Hola,
Estoy buscando un script (perl, php) para utilizar en Apache (con hosting virtual) que permita realizar búsquedas en los directorios seleccionados por el usuario.
He visto que SuSE tiene los paquetes compilados de Htdig y Namazu, pero no he probado ninguno de estos dos antes, por lo que no sé cuál sería más conveniente.
Las páginas a indexar están en su mayoría en inglés y español, y utilizan codificación iso-8859-1 y utf-8. La idea es que el buscador esté disponible en todos los dominios de Apache2 y que cada usuario lo pueda personalizar a su gusto con base de datos independientes.
¿Alguna experiencia con estos dos buscadores o con algún otro que se me haya escapado?
mmm... te puedo mencionar que en una época no muy lejana ( 2 anos atras ??? ) estuve trabajando con swich+e (o algo por el estilo) y era bastante mas rápido que htdig y otros indexadores que probé en la época (no me recuerdo, exactamente cuales eran ahora)... mmmm.. pero la diferencia era bastante notoria en favor de swich+e !!! por ejemplo.. la idea era scannear todos los documentos de la empresa y procesarlos con gocr y guardalos para que despues fueran indexados.. se no me equivoco, llegamos a tener ~ 25.000 documentos procesados y hacendo pruebas con swich y htdig los resultados de indexacion entre ambas ambas herramientas llegaba a ser de hasta 8 minutos !!!! mmm.. en todo, caso la diferencia principal entre uno y otro (IMHO) es solamente el tema de la velocidad !!! ambos hacen básicamente el mismo !!!! suerte -- -- Victor Hugo dos Santos Linux Counter #224399