[opensuse-es] A vueltas con las codificaciones de texto
Lo dejo aquí como apunte por si alguien le sale el mismo problema. Todo esto viene de tener que hacer los pdf a partir de un csv. Todo iba a ser automático desde linux, hasta que llega con un montón de ficheros que los quieren hacer a medio mano. Así que el proceso es sacar listado de los ficheros a procesar en windows con un dir *.csv /b> listado y luego lanzar el proceso en linux con plink. El lanzador de linux lee el fichero listado y procesa los ficheros. Todo bien hasta que, como siempre, alguien nombra los directorios con caracteres extras (la ñ y acentos no son extras, º ª ¬ ~ ). Fallo al leer directorios, pos na hago la conversión a utf-8 y listo. Ja, eso es lo que te crees. Aún salen caracteres mas raros. Compruebas la codificación, en windows te dice que el fichero es ISO-8859-2, en linux ISO-8859-1 (file -bi listado). Te lo crees y con los programitas de conversión intentas hacerlo, iconv, recode, pero na de na, siguen convirtiendo a caracteres raros. Hasta que se enciende la bombilla y te acuerdas en tiempos remotos del código de la tabla de caracteres del dos, el puñetero 850. Y la conversión queda así: iconv -f 850 -t UTF-8 listado >salida.txt con el recode no lo pude hacer ya que intenta usar la codificación que detecta de entrada y como no es esa no lo hace bien. saludos -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
participants (1)
-
Francisco F.