Hey !!!
El 2005-12-12 a las 17:58 +0100, Rafa Grimán escribió:
Este fin de semana estuve leyendo un PDF de esos que comentas y el KPDF sí lo abre, pdf2ps lo transfroma a ps y ps2pdf (probé los 3 ó 4 que vienen en SUSE 10) lo transforma de ps a pdf.
En NINGUNO de los casos pude copiar y pegar texto del documento. No con el propio Acrobat Reader. Se copiaba, pero al pegar ... sólo aparecía basura.
¿y con kpdf, gpdf, tampoco funcionaba el copy paste? ¿Y el grabar el fichero en disco?
Nanay :( Ni pasándolo a PS y luego a PDF ... no cuela. Cpoiarlo de un lado a otro sí funciona, pero no copiar y pegar.
Aquí en el curro lo he probado con MS-Windows XP y el Acrobat Reader (versión 7 en ambos casos: Linux y MS-Windows) y TAMPOCO me deja copiar texto ...
Es que son dos cosas. Una es el grabar el fichero a disco, y otra el poder copiar trozos con el ratón. El fichero pdf puede tener los siguientes permisos, según el acroread (la traducción es mia, puede no ser exacta):
Esto no lo he mirado ... echaré un vistazo. Je!! Lo más cachondo es que me pone: Content Copying or Extraction: Allowed ¿Eh? ... Pero he visto otra opción que pone: File -> Save as Text Poyaquetamos ... vamos aprobarlo (Acroread 7 en MS-Windows XP, luego lo pruebo en Linux) ... Resultado: texto, texto, ... sí que es ahora que sea texto legible ...: ^D^E^E^E^M ^L^C^G^E^M ^M ^V^K^N^D^^^K^T^G^M and Project Leader University of Oslo ^M He mirado las fuentes y son Helvetica y cuatro más que son típicas. Debe ser lo que se comentó en un correo anterior, que lo crean como imagen y no como texto ... :( > Yo no me he topado con un documento de esos, pero si con otros que, al
marcar el texto, la selección va a saltos en orden aleatorio por toda la página, y al empastar se ve un galimatías.
Esto no ocurre, te deja seleccionar el texto. [...]
Acabo de probar, con pdftk:
Esto no lo he probado ...
No sé cómo lo harán, pero lo hacen. Lo que dice Jose María es verdad: un sw para capturar pantallas (shutterbug, ksnapshot, ...) es útil ... pero pesado porque luego hay que echar mano de la "tecnología digital" y escribirse "amanuense" el texto. También lo puedes imprimir y pasar un OCR ;)
Si no han usado fuentes anti-ocr. Visualmente se leen, pero deben tener errores sutiles que confunden al ocr. Como las antitempest.
No lo he probado, pero también lo puedo probar. Rafa -- Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia , 120 - Planta Baja 28003 Madrid, Spain Tel: +34 91 3984200 Fax: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com