-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-01-19 a las 12:34 +0100, Camaleón escribió:
El 19/01/07, Carlos E. R. escribió:
Y sin dividirlo, tomate otro café doble a mi salud :-p
Que he hecho varias pruebas distintas ;-)
Glop, glop, glop. A ver si ahora se me abren los ojos... ya está O_O
Je, yo en uno de esos cursos de empresa, entre pausa y pausa creo que me tomé cuatro o cinco cafes con chocolate de esos de máquina. Al día siguiente tuve que ausentarme del trabajo por causa mayor, ¡imagínate cual! ;-)
Al final me lo bajó, pero no se si completo o no. El caso es que el OOo lo abre como texto plano, no lo interpreta, con lo que no vale. ¿Este XML no será el famoso xml del word? En ese caso, no hay filtro todavía o se activa de otra forma.
También lo he bajado, y además de ser un fichero de 20 MB. no puedo trabajar con él. No por el formato, es xml estándar y limpio, pero no veo la forma de que me lo ponga como debe. Ains.
No se como trabajar con los xml :-(
También bajé el html, pero es tan gordo (15 megas) que se le atraganta al OOo-writer, pero si se ve una tabla, sería importable con copy paste al calc. Sin embargo, no ha leído bien el UTF, hay caracteres acentuados mal puestos.
Este formato ya ni lo pruebo porque no me sirve, tengo que trabajar con el fichero antes y en html sólo me empeora la situación.
No, mi idea era abrir el html en OOo-writer, selecionarlo por completo y hacer copy paste en el OOo-calc, de forma que meta cada celda de la tabla html en una celda del calc. Si lo hace bien, funciona (yo lo he hecho con otros más pequeños), pero con este mi cacharro es demasiado lento para poder hacerlo.
Que no es eso. Ese café ;-)
Glop, glop...
X-)
Un programita que "parsifique" y se coma todas las comillas que estén justo antes o después de todos los punto y comas, dejando las interiores, más la comilla inicial y la final de cada linea. Eso lo hago yo en unas horas, y estoy oxidado ;-)
Bueno, como soy muy brutica estoy haciendo un "find and replace comillas por nada" en OO. A ver si me pita la placa por la temperatura del micro X-)
No son todas las comillas, te lo he puesto en otro mensaje.
No lo se.
Yo sí, al menos en Excel se comporta igual y corta los campos.
Ah, pos que bien.
Pero aún así. Todas las lineas están hechas de esa forma. ¿Porqué se equivoca precisamente en la 478 y no en todas? Puede ser por algo en la codificación UTF-8, pero no se con qué herramienta verlo. Con less no puedo tratar el original.
Los campos de texto pueden tener comillas en cualquier parte del campo, no sólo en una posición definida.
Sí y no. Pueden tenerlas, pero el significado es distinto. Una comilla detrás de un punto y coma separador de campo significa que lo que va a continuación es un string, y que terminará cuando encuentre la siguiente comilla doble pegada a otro separador de campo. El bug es que si la comilla no está pareada, no lee el punto y coma.
Se sabe cuales comillas son las delimitadoras de string porque están justo antes o después de los puntos y comas, no hay confusión. De esa manera también se pueden poner puntos y comas en el interior del texto, en vez de escaparlos.
No se pueden usar comillas simples, porque son las mismas de los apostrofos usados en el inglés. También darían problemas.
Anda que no es extenso el código ascii, juver, que cojan un carácter distinto, por ejemplo ? (alt+458) ;-)
Sí, se puede escoger cualquiera. Y las comillas interiores pueden escaparse (\"). Supongo, no conozco las especificaciones del csv estandard, si es que existen.
Mirando otra vez la 478...
Hay errores de comillas no pareadas en el texto original. Se arreglaría con un programita como el que te dije, y luego diciendole al OOo que ignore todas las comillas.
O abres en el OOo ignorando todas las comillas, y luego una busqueda y reemplazamiento de todas las comillas que estén al final o principio de linea.
Sí, ya verás que rápido lo soluciono... cuando termine de reemplazar todas las comillas ya veremos.
Je je... ya he visto que no :-p
Oye, ¿y tanto bacalao del pacífico, hypoglosusnosecuantos, pa'que sirve, que rayos es ese fichero? :-p
Es la nomenclatura combinada (sistema arancelario y de codificación de mercancías europeo), vamos, tan conocido como el eMule :-)
Ah, que guais. Vamos, la enciclopedia galactica de todos los productos :-p - -- Saludos Carlos E. R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.2 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFFsMQWtTMYHG2NR9URAh4MAJwKnCv6iNJsLcpxasP84cCFaSS85wCfeRrl YMhJHnNFZJFfCc2KqJQF8V4= =IXRi -----END PGP SIGNATURE-----