El Viernes, 14 de Septiembre de 2007 10:59, miguel gmail escribió:
A ver, esto es un poco despelote.
Lo que el cliente _dice_ que quiere: Digitalizar e indexar con GSA su fondo documental (creo que de contratos) en papel, y poder realizar búsquedas.
* Si desean usar GSA que sea a posteriori es decir cuando los documentos esten en una base documental aunque teniendo implementado un DMS potente que te los pone en red, GSA puede ser un añadido y ojo por que hay muchas herramientas de indexado y busqueda de codigo abierto.
Lo que yo creo que necesitan: Una solución que aparte de indexar, categorize los documentos tal y como dices. por autor, por fecha de creación, por tipo de documento, etc...
Y efectivamente, a raíz de todo esto, pienso que la estimación inicial de tiempo no es correcta, y seguramente la herramienta que han escogido ellos, tampoco.
* Bueno, en la opcion creo que mas barata, aunque muy efectiva y pocos errores o ninguno en comparacion con labores automatizadas y cerradas, la cosa deberia ir asi. * Te bajas software de OCR ya sea para linux o windows para Arabe, Readiris creo que tiene uno especializado si no hay demos al edonkey y eliges el que mejor te vaya con el peinado, aqui uno para linux http://www.vividata.com/be_xtr_overview.html , mira las caracteristicas sobre arabe, una vez elegido el fabricante dara scanners recomendados, gran volumen, medio, etc. * Instala DocMGR (usa postgre) o Knowledge-tree (usa Mysql), asi que mira los requerimientos de acceso de GSA si ese va a ser el final. * Se inicia el desgrapado, clasificado, de los documentos en cajas o carpetas donde conste, destino de coleccion o subcoleccion, numerado y por orden (importante el orden con el listado, que no haya que volver a revisarlo y emparejarlo), y segun numero, se referencia, fecha, autor, confidencialidad o no, etc .... (es decir se añade un listado a cada caja/carpeta si el software de escaneado o scanner no permite esto de forma facil o casi automatico pasa de ello, tira por el listado manual), esta ultima parte es un trabajo importante por que permitira que los trabajos anteriores y posteriores puedan hacerlo meros introductores de datos (a la vista del idioma de los documentos) y debe intervenir alguien por la parte del cliente o similar. * Se crea la estructura en el DMS de colecciones, subcolecciones, etc, usuarios, permisos de lectura, modificacion, edicion, borrado, insercion de objetos o no, etc, de acuerdo con la conveniencia de los clientes ambas herramientes tienen controles muy granulares, yo haria una subcarpeto o subcoleccion por caja/carpeta esto te permite localizar o solucionar errores de forma facil y migrar masivamente despues documentos o colecciones completas a otra estructura del arbol del DMS o una nueva es un simple click ..... Esto en una pizarra pensando un poco en cuatro o cinco dias se puede llegar perfectamente a una decision, procurando que sea lo mas granular posible pensando en su escalamiento, purga, borrado de antiguos es decir en una gestion futura y mantenimiento, que por este lado tienes una linea de ingresos. * Hechas las pruebas de escaneado con documentos buscando el mejor resultado en mi opinion el peso es poco importante ha de ser legible, convertible y visibles luego en el DMS como listados o Iconos con el contenido visible (el propio DMS ya ofrece la descarga en diferentes formatos incluido pdf) , se almacenan o convierten en tiff, ps, u otro a tu conveniencia (parecen ser documentos legales con caracteres bien legibles) en directorio relacionado esto es muy automatico con unos scanners y una sola persona alimentando y vigilando varios scanners. * Se finaliza una caja/carpeta se pasa a los introductores de datos (varios) que efectuan la importacion masiva desde los directorios con un mero click (el DMS les va pasan el ocr produciento uno de texto y tsearch va indexando de forma desatendida), al DMS empleando el tiempo en colocar las referencias del listado, renombrando y relacionando "hojas" que son ficheros separados pero constituyen un unico documento si los scanners o herramientas usadas no soportan esta caracteristica de forma nativa (vamos que pueden unirse a posteriori). * Control de errores, depurado de la herramienta de indexado segun la instalacion. * Mantenimiento de la instalacion que puede estar a vuestro cargo, los usuarios ya pueden subir los documentos que produccan en distintos formatos, word, pdf, etc, y almacenarlos de forma ordenada, asi como los documentos que entren en papel a la empresa se escanean y se importan al DMS, si la empresa no obliga a esto no se hara es muy facil guardar-como y a cascarla. * Presenta un plan de etapas lo mas exaustivo posible, ademas del como y el por que de las cosas presente y trabajo futuro, es decir que no sea un trabajo puntual si no algo de beneficio mutuo. * Pierde algo de tiempo en decidir el DMS puede que tal o cual caracterisca no la incorpore y necesites trabajar algo mas, pero ya sabes que en el mundo del Codigo Abierto no hay limitacion, un dinero al proyecto y te sirven en bandeja esa tal o cual caracteristica. * PD. Puede que lo de la gestion documental "no" te lo hayan pedido pero a ti te facilitara la tarea y control y una vez visto se ha de ser muy bobo para que no vean las bondades del asunto y hay tienes la segunda parte contratante de la tercera parte.