[opensuse-es] A vueltas con las codificaciones de texto

5 Aug 2016

      Lo dejo aquí como apunte por si alguien le sale el mismo problema.

Todo esto viene de tener que hacer los pdf a partir de un csv.

Todo iba a ser automático desde linux, hasta que llega con un montón de 
ficheros que los quieren hacer a medio mano.

Así que el proceso es sacar listado de los ficheros a procesar en 
windows con un dir *.csv /b> listado y luego lanzar el proceso en linux 
con plink.
El lanzador de linux lee el fichero listado y procesa los ficheros.
Todo bien hasta que, como siempre, alguien nombra los directorios con 
caracteres extras (la ñ y acentos no son extras, º ª ¬ ~ ).
Fallo al leer directorios, pos na hago la conversión a utf-8 y listo.

Ja, eso es lo que te crees. Aún salen caracteres mas raros.
Compruebas la codificación, en windows te dice que el fichero es 
ISO-8859-2, en linux ISO-8859-1 (file -bi listado).
Te lo crees y con los programitas de conversión intentas hacerlo,
iconv, recode, pero na de na, siguen convirtiendo a caracteres raros.

Hasta que se enciende la bombilla y te acuerdas en tiempos remotos del 
código de la tabla de caracteres del dos, el puñetero 850.

Y la conversión queda así:
iconv -f 850 -t UTF-8 listado >salida.txt

con el recode no lo pude hacer ya que intenta usar la codificación que 
detecta de entrada y como no es esa no lo hace bien.

saludos

-- 
Para dar de baja la suscripción, mande un mensaje a:
   opensuse-es+unsubscribe@opensuse.org
Para obtener el resto de direcciones-comando, mande
un mensaje a:
   opensuse-es+help@opensuse.org

Francisco F.

tags

participants (1)