2009/2/20 Ciro Iriarte
El día 20 de febrero de 2009 13:12, Camaleón
escribió: El 2009-02-20 a las 13:05 -0300, Ciro Iriarte escribió:
Necesitamos saber el formato de las lineas, podrias adjuntar algunas lineas de ejemplo e indicar como quieres excluir los registros?
Son registros sencillos, del tipo:
registro1 registro2 registro3 registro1 registro4 registro1 registro5 registro3 (...)
Lo que se pretende es eliminar los registros duplicados. En el ejemplo de arriba, el resultado esperado sería:
registro1 registro2 registro3 registro4 registro5 (...)
Saludos,
-- Camaleón --
Pense que seria más complicado (filtrar por cierto campo dentro del registro) ¬¬
Asumiendo que las lineas estan en entrada.txt
Sería algo como "sort entrada.txt|uniq > salida.txt"
sort tiene la opcion "-u" que elimina la necesidad del pipe.. lo que podria ralentizar un poco el proceso. ============= $cat entrada.txt | wc -l 137213 $ time sort entrada.txt | uniq > entrada1.txt real 0m1.932s user 0m1.860s sys 0m0.020s $ time sort -u entrada.txt > entrada2.txt real 0m1.696s user 0m1.590s sys 0m0.010s ============= salu2 -- -- Victor Hugo dos Santos Linux Counter #224399 -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org