Hallo, Am Sun, 25 Jul 2004, Al Bogner schrieb:
Am Sonntag, 25. Juli 2004 01:46 schrieb David Haller:
Am Sun, 25 Jul 2004, Al Bogner schrieb:
Ich habe hier eine Textdatei, die sich nach dem Schema /usr/bin/iconv -f latin1 -t utf-8 "$DATEINEU" -o "$DATEI" nicht konvertieren lässt. [..] Ich vermute eher nicht. Aber bei 4 Mio. Zeilen ist das eher eine Vermutung. Es handelt sich um Wortlisten aus verschiedenen Sprachen, die man zB zum Testen von PW verwenden kann.
Und die sind auch unterschiedlich kodiert, u.a. auch als cp1252.
BTW: bist du sicher, daß das eine "reine" Textdatei ist?
Wenn du Lust hast, dann schau dir das an: wget ftp://ftp.se.openwall.com/pub/wordlists/all.gz
Ich glaube nicht, dass du die konvertieren kannst, wenn dann muesstest du die wohl in einzelne Brocken zerlegen, die jew. gleich kodiert sind. Du musst die Datei also als quasi-binaer betrachten. -dnh -- cat /kat/ n. A furry keyboard cover