Am Dienstag, 14. Februar 2006 11:34 schrieb Sascha Blum:
gibt es eine Möglichkeit mit irgendeinem Tool/Programm herauszufinden welche Zeichensatzcodierungen die einzelnen Dateien in einem Verzeichnis jeweils haben und diese als übersichtliche Liste auszugeben?
Wenn man einfach so automatisch den Zeichensatz herausfinden könnte, bräuchte man ihn nie anzugeben. X-)
Also Datei a1.txt hat z.B. ISO8859-1, a2.txt hat UTF-8 usw.?
Man kann /oft/ feststellen, ob eine Datei /kein/ UTF-8 ist http://www.cl.cam.ac.uk/~mgk25/unicode.html#perl Der Einzeiler unter "Locate malformed UTF-8 sequences:" erkennt, ob in den ihm übergebenen Daten im UTF8-Sinne ungültige Zeichen sind. Die Daten können Dateien sein (dann gibt der Einzeler auch die Dateinamen aus, welche Fehler enhalten). Mit find lassen sich dann bestimmt auch ganze Verzeichnisse überprüfen. HTH Jan -- Two farmers, each claimed to own a certain cow. While one pulled on it's head and the other on the tail, the cow was milked by a lawyer.