Windows-unicode-kompatibles Mounten
Hallo, ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk. Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren. Gibt es einen Dreh, dies zu umgehen? Thx für jeden Tipp Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Joerg Thuemmler wrote:
Hallo,
ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk.
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren.
In /etc/samba/smb.conf im Abschnitt [global]: unix charset = ISO8859-15 Damit sollte das klappen. vgl. a. man smb.conf HTH Joachim -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Joachim Marx wrote:
Joerg Thuemmler wrote:
Hallo,
ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk.
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren.
In /etc/samba/smb.conf im Abschnitt [global]: unix charset = ISO8859-15
Damit sollte das klappen. vgl. a. man smb.conf
HTH Joachim
Hallo und Danke. Ich hatte eher vermutet, ich müßte mein LW unicode-fähig machen... deshalb habe ich gar nicht über das Umgekehrte nachgedacht - Windows nur Latin1 anbieten... Klingt aber - besonders im Bezug auf das nachgeschaltete DVD-Brennen natürlich besser. Werd ich morgen mit den Leuten gleich mal testen. Danke Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.
Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022. Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html HTH, -dnh -- 4: Garbage Collection Windows 95 (Kristian Köhntopp) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
David Haller wrote:
Hallo,
Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.
Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022.
Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html
HTH, -dnh
Ja, eben, weil Win dieses verkorkste Unicode verwendet, habe ich mich mal erkundigen wollen, ich teste nachher mal, was mit einer mit hübschen Sonderzeichen benannten Datei passiert, wenn Sie erst auf meiner iso8859-Platte und dann auf DVD landet ... und ich die DVD dann auf der XP-Maschine ins Laufwerk schiebe... Mal sehen, ob "unix charset" hier einen Einfluß hat... thx joerg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Joerg Thuemmler wrote:
David Haller wrote:
Hallo,
Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.
Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022.
Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html
HTH, -dnh
Ja, eben, weil Win dieses verkorkste Unicode verwendet, habe ich mich mal erkundigen wollen, ich teste nachher mal, was mit einer mit hübschen Sonderzeichen benannten Datei passiert, wenn Sie erst auf meiner iso8859-Platte und dann auf DVD landet ... und ich die DVD dann auf der XP-Maschine ins Laufwerk schiebe...
Mal sehen, ob "unix charset" hier einen Einfluß hat...
thx
joerg
Hmm, das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen. Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung. mkisofs -J -input-charset cp437 ... machte dann für XP wieder lesbare Dateinamen mit Umlauten draus. Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1 kam (auf das \r kommts an, sonst bricht recode ab). Nur so zum Abschluß Grüße Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Die, 20 Jan 2009, Joerg Thuemmler schrieb: [..]
das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen.
Das ist dann IMO falsch und der Grund für die folgende Seltsamkeit. Unix charset müßte IMO (je nachdem) latin1, latin9 oder UTF-8 sein. Windows charset (k.A. wie das bei Samba heißt) ist dann cp1252.
Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung.
cp437 ist die DOS Kodierung, Windows selber verwendet cp1252
mkisofs -J -input-charset cp437 ...
-input-charset charset Input charset that defines the characters used in local filenames. ^^^^^ Richtiger müßte also eigentlich sein: genisoimage -J -input-charset latin1 Kann aber sein, daß deine Dateinamen ne komische Kodierung haben (s.o.)
Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung
find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1
kam (auf das \r kommts an, sonst bricht recode ab).
*örks* -dnh -- Linux only became possible because 20 years of OS research was carefully studied, analyzed, discussed and thrown away. Ingo Molnar on linux-kernel -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
David Haller wrote:
Hallo,
Am Die, 20 Jan 2009, Joerg Thuemmler schrieb: [..]
das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen.
Das ist dann IMO falsch und der Grund für die folgende Seltsamkeit.
Falsch oder nicht, beim Hexcode kann man nicht schummeln ;-) "unix charset" wird übrigens ignoriert, kennt er noch gar nicht
Unix charset müßte IMO (je nachdem) latin1, latin9 oder UTF-8 sein. Windows charset (k.A. wie das bei Samba heißt) ist dann cp1252.
das habe ich auch gedacht, aber es ist eben nicht so. Zugegebenermaßen ist das hier noch Samba 2.2.5. auf einem reichlich modifizierten Suse 8.1. Das XP ist home halbwegs aktuell.
Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung.
cp437 ist die DOS Kodierung, Windows selber verwendet cp1252
ja, das habe ich ja selbst gedacht und auch erst verwendet. Aber es waren eben die Codes für DOS.
mkisofs -J -input-charset cp437 ...
-input-charset charset Input charset that defines the characters used in local filenames. ^^^^^
Richtiger müßte also eigentlich sein:
genisoimage -J -input-charset latin1
Kann aber sein, daß deine Dateinamen ne komische Kodierung haben (s.o.)
sie haben das, was XP ihnen mitgibt, da hat niemand dran gedreht...
Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung
find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1
kam (auf das \r kommts an, sonst bricht recode ab).
*örks*
hast Du eine bessere Idee? grüße jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (3)
-
David Haller
-
Joachim Marx
-
Joerg Thuemmler