Windows-unicode-kompatibles Mounten

older
4.1 Automounter: Bilder aus Audiocd

Joerg Thuemmler

19 Jan 2009 19 Jan '09

13:31

Hallo, ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk. Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren. Gibt es einen Dreh, dies zu umgehen? Thx für jeden Tipp Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

Show replies by date

Joachim Marx

19 Jan 19 Jan

14:31

Joerg Thuemmler wrote:

...

Hallo,

ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk.

Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren.

In /etc/samba/smb.conf im Abschnitt [global]: unix charset = ISO8859-15 Damit sollte das klappen. vgl. a. man smb.conf HTH Joachim -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

Joerg Thuemmler

15:10

Joachim Marx wrote:

...

Joerg Thuemmler wrote:

...
Hallo,

ich weiß, es ist eigentlich ein Windows-Problem: Ich stelle über Samba eine Platte (ext2/3) ins LAN, auf die von einer XP-Maschine Daten gesichert werden sollen, d.h. der Win-Nutzer hat die als Freigabe in seinem Netzwerk.

Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1. Mir ist es im Grunde egal, wie die Dateinamen hier lauten, aber ich will immer alle neu auf das Samba-share gekommenen kopieren und wenn es 4 GB sind, auf eine DVD packen. Dabei geht der Unicode-Schrott natürlich verloren.

In /etc/samba/smb.conf im Abschnitt [global]: unix charset = ISO8859-15

Damit sollte das klappen. vgl. a. man smb.conf

HTH Joachim

Hallo und Danke. Ich hatte eher vermutet, ich müßte mein LW unicode-fähig machen... deshalb habe ich gar nicht über das Umgekehrte nachgedacht - Windows nur Latin1 anbieten... Klingt aber - besonders im Bezug auf das nachgeschaltete DVD-Brennen natürlich besser. Werd ich morgen mit den Leuten gleich mal testen. Danke Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

David Haller

23:42

Hallo, Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:

...

Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.

Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022. Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html HTH, -dnh -- 4: Garbage Collection Windows 95 (Kristian Köhntopp) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

Joerg Thuemmler

20 Jan 20 Jan

06:24

David Haller wrote:

...

Hallo,

Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:

...
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.

Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022.

Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html

HTH, -dnh

Ja, eben, weil Win dieses verkorkste Unicode verwendet, habe ich mich mal erkundigen wollen, ich teste nachher mal, was mit einer mit hübschen Sonderzeichen benannten Datei passiert, wenn Sie erst auf meiner iso8859-Platte und dann auf DVD landet ... und ich die DVD dann auf der XP-Maschine ins Laufwerk schiebe... Mal sehen, ob "unix charset" hier einen Einfluß hat... thx joerg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

Joerg Thuemmler

13:14

New subject: Windows-unicode-kompatibles Mounten: Gelöst

Joerg Thuemmler wrote:

...

David Haller wrote:

...
Hallo,

Am Mon, 19 Jan 2009, Joerg Thuemmler schrieb:

...
Einziges Problem ist, daß Windows ja so ein verkorkstes Unicode für seine Dateinamen verwendet und ich hier obendrein _kein_ unicode am Laufen habe, sondern Latin1.

Obacht. Unicode ist der Zeichenvorrat, nicht die Kodierung, in der dieser gespeichert werden kann. Windows verwendet UCS-2 (ähnlich UTF-16) im Dateisystem (feste 2 Byte je Zeichen), Linux UTF-8 wenn nicht eine ISO-9885 Variante. Und dann gibt's z.B. noch ISO-2022.

Lesestoff: http://de.wikipedia.org/wiki/Unicode Und besonders: http://www.cl.cam.ac.uk/~mgk25/unicode.html

HTH, -dnh

Ja, eben, weil Win dieses verkorkste Unicode verwendet, habe ich mich mal erkundigen wollen, ich teste nachher mal, was mit einer mit hübschen Sonderzeichen benannten Datei passiert, wenn Sie erst auf meiner iso8859-Platte und dann auf DVD landet ... und ich die DVD dann auf der XP-Maschine ins Laufwerk schiebe...

Mal sehen, ob "unix charset" hier einen Einfluß hat...

thx

joerg

Hmm, das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen. Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung. mkisofs -J -input-charset cp437 ... machte dann für XP wieder lesbare Dateinamen mit Umlauten draus. Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1 kam (auf das \r kommts an, sonst bricht recode ab). Nur so zum Abschluß Grüße Jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

David Haller

19:50

New subject: Windows-unicode-kompatibles Mounten: Gelöst

Hallo, Am Die, 20 Jan 2009, Joerg Thuemmler schrieb: [..]

...

das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen.

Das ist dann IMO falsch und der Grund für die folgende Seltsamkeit. Unix charset müßte IMO (je nachdem) latin1, latin9 oder UTF-8 sein. Windows charset (k.A. wie das bei Samba heißt) ist dann cp1252.

...

Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung.

cp437 ist die DOS Kodierung, Windows selber verwendet cp1252

...

mkisofs -J -input-charset cp437 ...

-input-charset charset Input charset that defines the characters used in local filenames. ^^^^^ Richtiger müßte also eigentlich sein: genisoimage -J -input-charset latin1 Kann aber sein, daß deine Dateinamen ne komische Kodierung haben (s.o.)

...

Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung

find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1

kam (auf das \r kommts an, sonst bricht recode ab).

*örks* -dnh -- Linux only became possible because 20 years of OS research was carefully studied, analyzed, discussed and thrown away. Ingo Molnar on linux-kernel -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

Joerg Thuemmler

21 Jan 21 Jan

06:48

New subject: Windows-unicode-kompatibles Mounten: Gelöst

David Haller wrote:

...

Hallo,

Am Die, 20 Jan 2009, Joerg Thuemmler schrieb: [..]

...
das eigentliche Problem war wohl das Brennen der DVD, genauer das mkisofs. "unix charset" sorgte für unicode-freie Dateinamen im von Samba bereitgestellten Verzeichnis. Umlaute in Dateinamen waren dabei unter Linux unlesbar, aber definitiv 1-byte-Zeichen.

Das ist dann IMO falsch und der Grund für die folgende Seltsamkeit.

Falsch oder nicht, beim Hexcode kann man nicht schummeln ;-) "unix charset" wird übrigens ignoriert, kennt er noch gar nicht

...

Unix charset müßte IMO (je nachdem) latin1, latin9 oder UTF-8 sein. Windows charset (k.A. wie das bei Samba heißt) ist dann cp1252.

das habe ich auch gedacht, aber es ist eben nicht so. Zugegebenermaßen ist das hier noch Samba 2.2.5. auf einem reichlich modifizierten Suse 8.1. Das XP ist home halbwegs aktuell.

...

...
Mkisofs hat das auch korrekt verwendet, aber unter XP waren dann alle Umlaute durch Tiefstriche ersetzt. Interessanterweise wollte XP in der Joliot-Umsetzung dann nicht latin1 sondern codepage 437 als korrekte Codierung.

cp437 ist die DOS Kodierung, Windows selber verwendet cp1252

ja, das habe ich ja selbst gedacht und auch erst verwendet. Aber es waren eben die Codes für DOS.

...

...
mkisofs -J -input-charset cp437 ...

-input-charset charset Input charset that defines the characters used in local filenames. ^^^^^

Richtiger müßte also eigentlich sein:

genisoimage -J -input-charset latin1

Kann aber sein, daß deine Dateinamen ne komische Kodierung haben (s.o.)

sie haben das, was XP ihnen mitgibt, da hat niemand dran gedreht...

...

...
Weil ich auch den Inhalt in einer extra Content-Datei speichere, habe ich hier mit recode gearbeitet, welches aber noch ein zusätzliches am Zeilenende CR sucht, so daß zur Namensumsetzung

find . -type f -printf "%p\t%c\t%kkB\r\n" | recode pc..l1

kam (auf das \r kommts an, sonst bricht recode ab).

*örks*

hast Du eine bessere Idee? grüße jörg -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org

5584

Age (days ago)

5586

Last active (days ago)

List overview

Download

7 comments

3 participants

participants (3)

David Haller
Joachim Marx
Joerg Thuemmler