Am Freitag, 15. September 2006 14:41 schrieb Heinz W. Pahlke:
Hallo Jan,
On 15-Sep-2006 Jan Ritzerfeld wrote:
http://www.cl.cam.ac.uk/~mgk25/unicode.html#perl Locate non-ASCII bytes: perl -ne '/^([\x00-\x7f]*)(.*)$/;print "$ARGV:$.:".($-[2]+1).":$_" if length($2)'
Wenn du dort \x00 durch \x20 ersetzt, sollten dir auch die Steuerzeichen ausgegeben werden, inkl. Position in der Datei (Zeile, Spalte). Falls du Umlaute benutzt, werden die dir allerdings auch angezeigt, weil sie ja keine ASCII-Zeichen sind.
Schade, aber es gibt praktisch keine Zeile ohne Sonderzeichen. Die Tex-Datei ist 510 000 Byte gross und die umgelenkte Ausgabe immer noch 480 000 Byte.
Okay. Wenn du mit Steuerzeichen die Zeichen mit dem ASCII-Code < 32 meinst, dann kannst natürlich die Zeichen > 127 wieder mit reinnehmen, und damit Umlaute ausblenden: \0x7f durch \0xff ersetzen sollte helfen. Es sei denn, daß die problematischen "Steuer"zeichen in Wirklichkeit solche Zeichen wie Umlaute sind. Gruß Jan -- It is not enough to succeed. Others must fail.