[OT] Programa scan, por fin un programa desente en linux
Estimados, siento si esto no es un tema del foro en particular, pero recuerdo que había gente interesada en tener un programa para el scaner ( reconocer texto ) que fuera bueno en linux, bueno me dicen que autotrace es muy pero muy bueno, no lo he probado por que no tengo scaner, pero viendo la pagina parece que es realmente bueno. En fin ahí les va: http://autotrace.sourceforge.net/ Mis sinceras disculpas a quien no le interese el tema. Saludos Marcel - M3 Linux User #328858 http://counter.li.org/
Marcel, todo lo que tenga que ver con SuSE nos interesa, por eso nos inscribimos en la lista ;-) El resto es off-topic, pero si lo podemos utilizar en nuestro SuSE, pues como que se pierde un poco el OT... Saludos El Mar 25 Nov 2003 8:28 AM, Marcel Mourguiart escribió:
Estimados, siento si esto no es un tema del foro en particular, pero recuerdo que había gente interesada en tener un programa para el scaner ( reconocer texto ) que fuera bueno en linux, bueno me dicen que autotrace es muy pero muy bueno, no lo he probado por que no tengo scaner, pero viendo la pagina parece que es realmente bueno. En fin ahí les va:
http://autotrace.sourceforge.net/
Mis sinceras disculpas a quien no le interese el tema.
Saludos Marcel - M3 Linux User #328858 http://counter.li.org/
-- . . ________________________________________________________ |__|ugo (__ | |__________)andoval______________________________________________ hugo@softwarelibre.com.ve - spock@linux.org.ve hugo480@hotmail.com - hugospock@yahoo.com 58-261-7560687 / 58-261-7560836 -------------------------------------------------------------------- ____________________________________________________________________ |Linux Administrator | |Information Technology Industry Knowledge |> BrainBench Certified |Computer Technical Support | --------------------------------------------------------------------
El 2003-11-25 a las 09:28 -0300, Marcel Mourguiart escribió:
Estimados, siento si esto no es un tema del foro en particular, pero recuerdo que había gente interesada en tener un programa para el scaner ( reconocer texto ) que fuera bueno en linux, bueno me dicen que autotrace es muy pero muy bueno, no lo he probado por que no tengo scaner, pero viendo la pagina parece que es realmente bueno. En fin ahí les va:
Ah. Pero ese proyecto no es para Reconocimiento Optico de Caracteres (OCR), sino para convertir gráficos de pixels (bitmaps) a gráficos vectoriales, al estilo del CorelTrace - y la SuSE 8.2 trae la versión 0.31.1, que es la misma que está en la web... luego no han desarrollado nada en un tiempo considerable. Ciertamente, el programa tiene utilidad para escanear letras, como punto de entrada para el software que luego las reconozca... siempre y cuando encontremos otro programa que continue a partir de ese punto y saque el texto. Más abajo hago una prueba con él. En la versión 8.2 de SuSE el kde trae kooka, un manejador del escaner, que esta vez trae linkado un OCR _comercial_ y _propietario_ que funciona: KADMOS OCR engine. ¿Las malas noticias? 1) Se cuelga - el kooka, no solo el kadmos. Parece un programa de winbug. Una de las veces empezó a comer memoria, ¡hasta tragarse los dos gigas de swap que tengo! Por supuesto, el kernel empezó a cargarse tareas hasta que acertó con la culpable. Normalmente son cuelgues más benignos, pero que te hacen perder el trabajo hecho hasta el momento, siquiera sea configurar el programita. 2) A pesar de colgarse como el winbugs, no es tan bueno como el OCR que trae mi Epson para winbugs, que es capaz de escanear paginas de novelas sin equivocarse ni una letra - o al menos que yo me de cuenta - incluyendo incluso el formato correcto en el Word (tipos de letra, margenes, etc). Voy a poner un ejemplo; lo he hecho a partir de una página de un cuento de Asimov (Robot AL-76 Goes Astray - Robot AL-76 va a la deriva). El texto está en inglés, porque el de español no lo tengo escaneado en windows (en formato grafico para usar en linux, lo borré) y entonces no sirve para esta comparación. El texto ocupa bastante (son tres copias); pensé limitarlo a un párrafo, pero entonces no podriais comparar bien los rseultados... así que he dejado el trozo completo en los tres ejemplos. +++--- kooka + kadmos ----------- RobotAL-76G0esAsuay 91 bottonl ofthe trees; at the end he was winging wildly froIn one of the topnlost branches. The salne impulse that had driven the_,osse horizonta_y had driven hinl ver__y. As to how he had covered the 6fty feet froIn roots to top - Ivhether he had clhnbed,iuln_d, or 00_n - he did not know, and he didn't give a __ar_cle ofnever-lnind. 1Vhat he did know wasthat;_roperty had been desuoyed by a robot teIn_rarily in his possession. AU visiwls of reIvards vanished and _vere replaced by trenlbHng nightInares of hostile citizenry, shrieking lynch lm,bs, lalvsults, nlurder charges, andwhat M_andy Payne would say. Mostly _vhat Mirandy Payne would say. He was yelH_ wildly and hoarsely,_Hey, you robot, yoU slnash thatthing, d0 you hear? Slnash it good! You forget I ever had anything to do with it. You're a stranger to lne, see? You don't ever say a word about it. Forget it, yOU hear?' He didn't expect his orders to d0 any good; it _as o_ reflex action. \Vhat he didn't knw was that a robot always obeys a huInan order except _vhere carrying it out invoIves dangerto another hunlan. , AL-76, therefore, calnlly and InethodicaHy proceeded to denlolish his Disinto into nlbble and Mnders. Just as he was stalnping the last cubic inch under foot, Saln Tobe andhis cont_gent arrived, and RandoWlPayne, sensing thatthe re_ owners of the robot had conle, drop_ out of the tree head-6rst and rnade for regions unknolvn feet-6rst. He did not wait for his re_ard. Austill W4lde, Robotical Engineer,turned to SaIn Tobe and said,_Did you get anythhlg out ofthe robot?' 'I'obe shook his head and snarled deep in his throat. _Nothing. Not one thing. I-Ie's forgotten everythiag that_s ha;,_ed since he left the factory. He Inust have goaen --------------------------------- +++--- kooka + gocr ---------- No hace nada, no funciona. Ojo, a veces funciona, pero la imagen que tengo escaneada no le gusta y no saca nada. Así que lo hago por linea de comandos a continuación --------------------------------- +++--- gocr --------------------- ' ' Ro_orAL-76,GoesAs___ _ 9l ' bottom ofthe trees; at ?eend hewas ewingingwil_yfrom one of the t_pmost branches. The same _p_se ?at had driven ?e possehor_ontQy had driven him ve__y. _ , As _to how he had co_ered ?e Miy feet from roots to top - whether he _ad climbed, i_ped, or nown - be _'d ' not know, Qd he didn't give a p_cle ofnever-_d. What he d_ _ow was ?at property had been des_oyed _y_ a robot temporar_y _ _s _ssession. _ visions of rewards v_shed and were replaced by _emb_g ' __ ?gh_es of hos_' e ci__ny, sh_e_g lynch mobs, la_suits, murder charges, Qd what MirQdy Payne would say. Mos_y what Mirandy Payne _o_d say._ He was yellingwil' dly Qd hoarsely, 'Hey, you robot, you _ smash ?at ?ing, do you hear? Smash it good! Y_ou f_rget I ever had an_g to do wi_? it. You're a s_Qger tD me, ,see? You don't _ver say a_ word _bout it. Forget it, you hea_?' . ' ' . , He didn't expect hi's _rders to do any good; it w&s only renex action. What _e _dn't know was ?at a robot alw_ys obeys a humQ oider except where ca_ing it _ut _volves danger to another h_Q. ' _ _. AL-76, ?erefore, _almly Qd me?_cQy proceeded to demolish his Disinto inio _bble _d ninders. , ' Just as he was e?_m__g ?e last cubic _ch _der,f_t,_ SamTobeQdhiscon_gent_Rived, QdRQdolphPayne, sensing?, at thirealownersof?erobotbadcome, _op_ ' out of ?e _ee head-_st Qd made for regions _o_' feet-__t.' , _ He _'d notwait for _s rewar, d. _ ' , Au,s_Wilde, Robo_cal En_eer, _edto S_To_Q_ _ _d, 'Did you get Q_gout of?e robot3' ,, Tobe,,shook his head Qd sn_led deep _ _bis _oat. , '?o_g. Not oae, _g. He's forgonen.eve_' _t's bappened,, 's,_ce he leh ?. e factoy. He m, ust bave gonea , --------------------------------- Nota: en el caso del Presto! (a continuación), la salida es un fichero .rtf, por lo que al convertirlo a ascii he tenido que añadir 8 o 9 retornos de carro para que se vean los párrafos (sale una linea larga por párrafo, pero el Pine no lo sabe). +++--- epson + Presto! OCR ------ Robot AL-76 Goes Astray 91 bottom of the trees; at the end he was swinging wildly from one of the topmost branches. The same impulse that had driven the posse horizontally had driven him vertically. As to how he had covered the fifty feet from roots to top - whether he had climbed, jumped, or flown - he did not know, and he didn't give a particle of never-mind. What he did know was that property had been destroyed by a robot temporarily in his possession. All visions of rewards vanished and were replaced by trembling nightmares of hostile citizenry, shrieking lynch mobs, lawsuits, murder charges, and what Mirandy Payne would say. Mostly what Mirandy Payne would say. He was yelling wildly and hoarsely, 'Hey, you robot, you smash that thing, do you hear? Smash it good! You forget I ever had anything to do with it. You're a stranger to me, see? You don't ever say a word about it. Forget it, you hear?' He didn't expect his orders to do any good; it was only reflex action. What he didn't know was that a robot always obeys a human order except where carrying it out involves danger to another human. AL-76, therefore, calmly and methodically proceeded to demolish his Disinto into rubble and flinders. Just as he was stamping the last cubic inch under foot, Sam Tobe and his contingent arrived, and Randolph Payne, sensing that the real owners of the robot had come, dropped out of the tree head-first and made for regions unknown feet-first. He did not wait for his reward. Ausdn Wilde, Robotical Engineer, turned to Sam Tobe and said, 'Did you get anything out of the robot?' Tobe shook Tlis head and snarled deep in his throat. 'Nothing. Not one thing. He's forgotten everything that's happened since he left the factory. He must have gotten --------------------------------- Se ve claramente que este último programa gana por goleada (creo que veo un unico error en el texto) - y es uno de esos que viene incluido con el escanner, para windows, ni siquiera es uno de los buenos comprados aparte. El fichero gráfico es el mismo para todos - lo cual me obliga a empezar en windows con la prueba, porque ese ocr está cap**o y no puede coger un fichero de imagen, por narices tienes que escanear el documento. Eso lo han hecho para que otros no usen el OCR sin haber comprado el escanner, es un medio de protección. "Ventajas" del software comercial... ------ Probando el autotrace, mediante su GUI frontline (gnome). He trazado la misma página, y me ha tardado varios minutos, usando como un giga de swap y 600 megas de ram o así. El PC se me ha ralentizado, y es un PIV 1800Mhz con 700Mb de ram. Ahora pide permiso para sobredibujar las lineas, avisando de que necesitará memoria y tiempo... ... Lo he tenido que matar. Ha empezado a chupar memoria, y se ha tragado poco a poco los dos gigas de swap. He tenido que ir cerrando como he podido aplicaciones como el Mozilla, OpenOffice, la sesión de kde que tenía abierta (tenía el gnome y el kde en sendas "consolas virtuales" simultaneas). Y me ha costado matarlo, porque tardaba en dibujar cada pantalla un minuto. Puf... me temo que para reconocimiento de caracteres no vale, porque si se pone así para una página de cuartillo... :-( Es un problema: cuando una aplicación se desmadra y pide demasiada memoria, el kernel debía suspenderlo antes de que la ocupe toda, para que el usuario puede matarla. O matar aplicaciones por orden de más memoria a menos, que no se como hace la decisión. En este caso he podido matar al culpable manualmente, pero si me hubiera ido a lo mejor se me cae la maquina :-(
Mis sinceras disculpas a quien no le interese el tema.
Cualquier cosa que funcione en linux no es offtopic. Más rollo he puesto yo O:-) -- Saludos Carlos Robinson
Lo siento, no me resisto a hacer un poco de humor. Que quede claro que no voy a aportar nada en este correo. Por si quereis dejar de leer antes.
1) Se cuelga - el kooka, no solo el kadmos. Parece un programa de winbug. Una de las veces empezó a comer memoria, ¡hasta tragarse los dos gigas de swap que tengo! Por supuesto, el kernel empezó a cargarse tareas hasta que
Por supuesto, te falta swap!! :-P
Voy a poner un ejemplo; lo he hecho a partir de una página de un cuento de Asimov (Robot AL-76 Goes Astray - Robot AL-76 va a la deriva). El texto está en inglés, porque el de español no lo tengo escaneado en windows (en formato grafico para usar en linux, lo borré) y entonces no sirve para esta comparación.
Ah, Asimov... mira que si llegas a coger uno que sepa escribir de verdad! que use metaforas, frases complejas, etc etc Entonces ni el soft de Epson ni historias :-D Bueno, vaya por delante que solia ser un fanático de La Fundación, de Asimov, pero solo de la trilogia original. Y de muchos de los cuentos de robots, esas tres leyes de la robotica... ah, que tiempos aquellos!
Puf... me temo que para reconocimiento de caracteres no vale, porque si se pone así para una página de cuartillo... :-(
Bueno, has pasado el rato probando :-P !
Es un problema: cuando una aplicación se desmadra y pide demasiada memoria, el kernel debía suspenderlo antes de que la ocupe toda, para que el usuario puede matarla. O matar aplicaciones por orden de más memoria a menos, que no se como hace la decisión. En este caso he podido matar al culpable manualmente, pero si me hubiera ido a lo mejor se me cae la maquina :-(
esta claro, te falta swap y memoria! Como sale soft asi?? es decir, supongo que los desarrolladores habran hecho pruebas y les ha tenido que salir algo parecido a lo tuyo... vaya, si yo fuese un desarrollador de este producto, no se si lo liberaria asi... Si las cosas no funcionan... más fuerza bruta!! Lo siento por todo este rollo sin venir a cuento, prometo enmendarme :-$ miguel
El 2003-11-25 a las 22:29 +0100, miguel.listas escribió:
1) Se cuelga - el kooka, no solo el kadmos. Parece un programa de winbug. Una de las veces empezó a comer memoria, ¡hasta tragarse los dos gigas de swap que tengo! Por supuesto, el kernel empezó a cargarse tareas hasta que
Por supuesto, te falta swap!! :-P
Fale. Yo es que esa regla del doble de ram no le hago mucho caso. Tengo por ahí un P120 con 32Mb de ram y casi un giga de swap - por culpa del yast de la 7.1/7.3, que tiene un bug al actualizar que come memoria. Perdon, no es un bug: es una caracteristica :-)
Ah, Asimov... mira que si llegas a coger uno que sepa escribir de verdad! que use metaforas, frases complejas, etc etc Entonces ni el soft de Epson ni historias :-D
Si, ya; le meto la "critica de la razón pura" y entonces ninguno ve los errores, porque no hay quien se lo lea ni aún sin problemas :-p
Bueno, vaya por delante que solia ser un fanático de La Fundación, de Asimov, pero solo de la trilogia original. Y de muchos de los cuentos de robots, esas tres leyes de la robotica... ah, que tiempos aquellos!
Tengo unos cuantos. La Fundación creo que la tengo completa, y los de robots hasta repes, en diferentes ediciones solapadas. La mayoria en pikinglis. ¿Que tiempos, dices? Ahora estoy leyendo "Lenny" (uno de los de Dra. Susan Calvin), por enesima vez. Y hace poco "Nightfall".
Puf... me temo que para reconocimiento de caracteres no vale, porque si se pone así para una página de cuartillo... :-(
Bueno, has pasado el rato probando :-P !
Si, bueno, quería demostrarlo con una prueba consistente. Ya está hecho, y ya se lo que hay, comparablemente.
Es un problema: cuando una aplicación se desmadra y pide demasiada memoria, el kernel debía suspenderlo antes de que la ocupe toda, para que el usuario puede matarla. O matar aplicaciones por orden de más memoria a menos, que no se como hace la decisión. En este caso he podido matar al culpable manualmente, pero si me hubiera ido a lo mejor se me cae la maquina :-(
esta claro, te falta swap y memoria!
¡Ya! Crece en los arboles, se sube a una escalera y se pone, no te...
Como sale soft asi?? es decir, supongo que los desarrolladores habran hecho pruebas y les ha tenido que salir algo parecido a lo tuyo... vaya, si yo fuese un desarrollador de este producto, no se si lo liberaria asi... Si las cosas no funcionan... más fuerza bruta!!
Bueno... se supone que esta en desarrollo; y, al fin y al cabo, el programa avisó que necesitaba mucha memoria. El problema no es ese, o no del todo. A ver. Los programas deben saber cuando llega el momento de que estan pidiendo demasiada memoria, y abortar. Y el kernel debe tener un mecanismo para averiguar que la memoria está próxima a agotarse, y negarse a dar más memoria a un unico proceso. Son dos fallos. Y luego, los desarrolladores de ese programa, sabiendo sus necesidades de memoria, deben tener una opción configurable que limite cuanta memoria van a necesitar, y no sobrepasarlo. Y, si les hace falta más, usar disco; pero no a través del mecanismo de swap del sistema operativo - porque eso ralentiza el resto del sistema - sino gestionándolo directamente con los mecanismos apropiados, porque los desarrolladores de ese software pueden saber mejor que nadie como y cuando pedir y usar la memoria, porque conocen sus algoritmos. El gimp, que es un magnífico programa - y que por ser de tratamiento gráfico tiene enormes necesidades de memoria - lo hace muy bien. He tratado fotos considerables con el.
Lo siento por todo este rollo sin venir a cuento, prometo enmendarme :-$ miguel
O:-) -- Saludos Carlos Robinson
Carlos E. R. wrote:
El 2003-11-25 a las 22:29 +0100, miguel.listas escribió:
1) Se cuelga - el kooka, no solo el kadmos. Parece un programa de winbug. Una de las veces empezó a comer memoria, ¡hasta tragarse los dos gigas de swap que tengo! Por supuesto, el kernel empezó a cargarse tareas hasta que
Por supuesto, te falta swap!! :-P
Fale.
Yo es que esa regla del doble de ram no le hago mucho caso. Tengo por ahí un P120 con 32Mb de ram y casi un giga de swap - por culpa del yast de la 7.1/7.3, que tiene un bug al actualizar que come memoria. Perdon, no es un bug: es una caracteristica :-)
Perdón, bug o caracteristica del procesador, o del sistema operativo? Los primeros pentium, tenian unas cuantas de esas "caracteristicas" que alcanzaban hasta el Pentium 3 algunas de ellas. Si revisas en el Centro de Control del KDE, en Modulos > Hardware > Informacion sobre el sistema > CPU, tenes los siguientes items a revisar: Coma bug Floating point division bug Halt bug f00f bug http://www.attrition.org/security/advisory/caldera/SA-1997.29.txt http://www.insecure.org/sploits/intel.f00f.pentiumbug.html http://www.cs.earlham.edu/~dusko/cs63/fdiv.html http://www.cctec.com/maillists/nanog/historical/9711/msg00346.html http://www.geek.com/news/geeknews/oct99/gn19991202000406.htm http://www.rcollins.org/ddj/May98/F00FBug.html
El 2003-11-26 a las 00:16 -0300, Juan Erbes escribió:
Tengo por ahí un P120 con 32Mb de ram y casi un giga de swap - por culpa del yast de la 7.1/7.3, que tiene un bug al actualizar que come memoria. Perdon, no es un bug: es una caracteristica :-)
Perdón, bug o caracteristica del procesador, o del sistema operativo?
Del programa yast2 de la version 7.1 y/o 7.3 - que para ser exactos, se llama en realidad bignfat o algo así; por tanto es una "caracteristica" si tiene ese nombre (grandeygordo).
http://www.attrition.org/security/advisory/caldera/SA-1997.29.txt http://www.insecure.org/sploits/intel.f00f.pentiumbug.html http://www.cs.earlham.edu/~dusko/cs63/fdiv.html http://www.cctec.com/maillists/nanog/historical/9711/msg00346.html http://www.geek.com/news/geeknews/oct99/gn19991202000406.htm http://www.rcollins.org/ddj/May98/F00FBug.html
Me apunto esas referencias :-) -- Saludos Carlos Robinson
participants (5)
-
Carlos E. R.
-
Hugo Sandoval
-
Juan Erbes
-
Marcel Mourguiart
-
miguel.listas