El día 20 de febrero de 2009 14:49, Victor Hugo dos Santos
2009/2/20 Ciro Iriarte
: El día 20 de febrero de 2009 13:12, Camaleón
escribió: El 2009-02-20 a las 13:05 -0300, Ciro Iriarte escribió:
Necesitamos saber el formato de las lineas, podrias adjuntar algunas lineas de ejemplo e indicar como quieres excluir los registros?
Son registros sencillos, del tipo:
registro1 registro2 registro3 registro1 registro4 registro1 registro5 registro3 (...)
Lo que se pretende es eliminar los registros duplicados. En el ejemplo de arriba, el resultado esperado sería:
registro1 registro2 registro3 registro4 registro5 (...)
Saludos,
-- Camaleón --
Pense que seria más complicado (filtrar por cierto campo dentro del registro) ¬¬
Asumiendo que las lineas estan en entrada.txt
Sería algo como "sort entrada.txt|uniq > salida.txt"
sort tiene la opcion "-u" que elimina la necesidad del pipe..
Eso funcionaria tambien :p
lo que podria ralentizar un poco el proceso.
============= $cat entrada.txt | wc -l
siguiendo con el topico, "wc -l entrada.txt" usaria un fork menos :D
137213
$ time sort entrada.txt | uniq > entrada1.txt real 0m1.932s user 0m1.860s sys 0m0.020s
$ time sort -u entrada.txt > entrada2.txt real 0m1.696s user 0m1.590s sys 0m0.010s =============
salu2
-- -- Victor Hugo dos Santos Linux Counter #224399 --
Saludos, -- Ciro Iriarte http://cyruspy.wordpress.com -- -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org