Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch. Ich habe die Daten vor der Installation von Redhat aus in eine eigene Partition kopiert. SuSE hat die Dateinamen also nicht verändert. Bei SuSE 9.1 ist de_DE.UTF-8 eingestellt. Bei Redhat war laut /etc/sysconfig/i18n LANG="de_DE@euro" SUPPORTED="de_DE@euro:de_DE:de" SYSFONT="lat0-sun16" SYSFONTACM="iso15" eingestellt. Nach einer google Recherche hab ich schon verschiedene Einstellungen in /etc/samba/smb.conf versucht. Ergebnis war nur dass die Umlaute in Dateinamen bei Windows anders falsch dargestellt wurden. Mir ist nicht ganz klar wo ich drehen muss. Am System Zeichensatz oder bei Samba oder beides. Kann mir jemand einen Tip geben, wie ich vorgehen muss? -- Gruss Bernd
Ich tippe darauf, daß Du die Option "iocharset=utf8" in der /etc/fstab für Deine Windows-Partition mache mußt. Ich hatte das Problem nähmlich auch als ich, ich glaube, von 8.2 auf 9.0 umstieg. Hier ein Beispiel für meine eigene "/etc/fstab": /dev/hda1 /windows/C vfat users,gid=users,umask=0002,iocharset=utf8 0 0 Martin Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Ich habe die Daten vor der Installation von Redhat aus in eine eigene Partition kopiert. SuSE hat die Dateinamen also nicht verändert. Bei SuSE 9.1 ist de_DE.UTF-8 eingestellt. Bei Redhat war laut /etc/sysconfig/i18n LANG="de_DE@euro" SUPPORTED="de_DE@euro:de_DE:de" SYSFONT="lat0-sun16" SYSFONTACM="iso15" eingestellt. Nach einer google Recherche hab ich schon verschiedene Einstellungen in /etc/samba/smb.conf versucht. Ergebnis war nur dass die Umlaute in Dateinamen bei Windows anders falsch dargestellt wurden. Mir ist nicht ganz klar wo ich drehen muss. Am System Zeichensatz oder bei Samba oder beides. Kann mir jemand einen Tip geben, wie ich vorgehen muss?
Martin Deppe schrieb:
Ich tippe darauf, daß Du die Option "iocharset=utf8" in der /etc/fstab für Deine Windows-Partition mache mußt. Ich hatte das Problem nähmlich auch als ich, ich glaube, von 8.2 auf 9.0 umstieg. Hmm, ich fürchte, das ist ein Missverständnis. Das ist keine NTFS oder FAT Partition sondern ext3. Es handelt sich um ein Samba-Share.
[...] -- Gruss Bernd
Bernd Obermayr wrote:
Martin Deppe schrieb:
Ich tippe darauf, daß Du die Option "iocharset=utf8" in der /etc/fstab für Deine Windows-Partition mache mußt. Ich hatte das Problem nähmlich auch als ich, ich glaube, von 8.2 auf 9.0 umstieg.
Hmm, ich fürchte, das ist ein Missverständnis. Das ist keine NTFS oder FAT Partition sondern ext3. Es handelt sich um ein Samba-Share.
[...]
Sorry! Meine DVD-Laufwerke haben diesen Parameter auch gesetzt. Wenn ich mich nicht irre, kannst Du ihn einfach für die entsprechenden Dateisysteme auch setzen. Ich bin mir nicht ganz sicher, aber das sollte eigentlich Dein Problem lösen. Das Problem könnte nur sein, falls Du schon Dateien mit Umlauten neu erzeugt hast, werden diese zur Zeit richtig angezeigt, wenn Du aber den Parameter setzt nicht mehr. Vielleicht geht es aber, daß Du selbige erst einmal auf eine andere Partition verschiebst , dann den Parameter setzt und danach sie wieder zurückverschiebst. Tja, viel Erfolg Martin
Also wenn ich das richtig verstanden habe, geht es darum, dass die Samba-Clients statt der Umlaut nur noch Sonderzeichen sehen. Ne Lösung hab ich da aber leider auch nicht für parat.
Meine DVD-Laufwerke haben diesen Parameter auch gesetzt. Wenn ich mich nicht irre, kannst Du ihn einfach für die entsprechenden Dateisysteme auch setzen. Ich bin mir nicht ganz sicher, aber das sollte eigentlich Dein Problem lösen.
Das Problem könnte nur sein, falls Du schon Dateien mit Umlauten neu erzeugt hast, werden diese zur Zeit richtig angezeigt, wenn Du aber den Parameter setzt nicht mehr. Vielleicht geht es aber, daß Du selbige erst einmal auf eine andere Partition verschiebst , dann den Parameter setzt und danach sie wieder zurückverschiebst.
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Sehen die Umlaute in den Dateinamen denn unter SuSE 9.1 nun richtig aus oder nicht (also wenn Du direkt unter Linux mit "ls" Dir die Dateien anschaust)? Falls ja, dann müssten sie, wenn Deine SuSE UTF-8 konfiguriert hat, in UTF-8 sein. Dann müsste Samba auch den Parameter "unix charset" auf UTF-8 stehen haben. Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten. Ich bin dabei, einen Samba-Server von SuSE 7.2 auf SuSE 10.0 um- zuziehen. Ich habe dazu in den Ländereinstellungen von YaST vor- erst UTF-8 deaktiviert und nutze "ISO8859-15". Dann habe ich mit "tar" und "ssh" die Dateien vom alten auf den Server rüberkopiert. Für Samba habe ich "unix charset = ISO8859-15" gesetzt. Damit gibt es bis jetzt keine Umlautprobleme. Wenn der Umzug des Servers endgültig abgeschlossen ist und Bedarf danach besteht, kann ich dann immer noch das System auf UTF-8 um- stellen und alle Umlaute in den Dateinamen konvertieren lassen. Dann muss ich natürlich auch den "unix charset"-Parameter in der "smb.conf" noch anpassen. Gruß, Steffen
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Sehen die Umlaute in den Dateinamen denn unter SuSE 9.1 nun richtig aus oder nicht (also wenn Du direkt unter Linux mit "ls" Dir die Dateien anschaust)?
Falls ja, dann müssten sie, wenn Deine SuSE UTF-8 konfiguriert hat, in UTF-8 sein. Dann müsste Samba auch den Parameter "unix charset" auf UTF-8 stehen haben. Nein
Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten.
Spielt da Gross / Kleinschreibung eine Rolle ;)
Ich bin dabei, einen Samba-Server von SuSE 7.2 auf SuSE 10.0 um- zuziehen. Ich habe dazu in den Ländereinstellungen von YaST vor- erst UTF-8 deaktiviert und nutze "ISO8859-15". Dann habe ich mit "tar" und "ssh" die Dateien vom alten auf den Server rüberkopiert.
Für Samba habe ich "unix charset = ISO8859-15" gesetzt. Damit gibt es bis jetzt keine Umlautprobleme.
unix charset = iso8859-15 Was ist mit display charset? Was sollte da drinstehen?
Wenn der Umzug des Servers endgültig abgeschlossen ist und Bedarf danach besteht, kann ich dann immer noch das System auf UTF-8 um- stellen und alle Umlaute in den Dateinamen konvertieren lassen.
Womit? Ich wollte vermeiden, da jetzt mmv, sed, wasweissich zu benutzen, es sind ca 200000 Dateien... Im Moment hab ich: server:~ # locale LANG= LC_CTYPE=de_DE.UTF-8 LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL= server:~ # testparm -vs ... dos charset = CP850 unix charset = iso8859-15 display charset = LOCALE ... server:~ # smbd -V Version 3.0.9-2.6-SUSE
Dann muss ich natürlich auch den "unix charset"-Parameter in der "smb.conf" noch anpassen.
Gruß, Steffen
-- Gruss Bernd
Hallo Bernd, hallo Leute, Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Sehen die Umlaute in den Dateinamen denn unter SuSE 9.1 nun richtig aus oder nicht (also wenn Du direkt unter Linux mit "ls" Dir die Dateien anschaust)?
Falls ja, dann müssten sie, wenn Deine SuSE UTF-8 konfiguriert hat, in UTF-8 sein. Dann müsste Samba auch den Parameter "unix charset" auf UTF-8 stehen haben.
Nein
Heißt das "Nein", dass die Dateinamen auch bei einem ls falsch aussehen? Falls das zutrifft, lass mal convmv auf das Verzeichnis los - Details siehe man convmv ;-)
Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten.
Spielt da Gross / Kleinschreibung eine Rolle ;)
Samba ist da IIRC nicht so pingelig ;-) Aber: Bevor Du die Samba-Charset-Einstellungen verdrehst, solltest Du erstmal die Dateinamen auf dem Linux-Rechner selbst korrekt angezeigt bekommen. Alles andere wird das irgendwann "richtig lustig"[tm] ;-) Gruß Christian Boltz -- The three R's of M$ support: Retry, Reboot, Reinstall ... [Anke Boernig in suse-linux]
Christian Boltz schrieb:
Hallo Bernd, hallo Leute,
Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Sehen die Umlaute in den Dateinamen denn unter SuSE 9.1 nun richtig aus oder nicht (also wenn Du direkt unter Linux mit "ls" Dir die Dateien anschaust)?
Falls ja, dann müssten sie, wenn Deine SuSE UTF-8 konfiguriert hat, in UTF-8 sein. Dann müsste Samba auch den Parameter "unix charset" auf UTF-8 stehen haben.
Nein
Heißt das "Nein", dass die Dateinamen auch bei einem ls falsch aussehen? Falls das zutrifft, lass mal convmv auf das Verzeichnis s.u.
los - Details siehe man convmv ;-)
Danke, das ist ein sehr guter Tip :)
Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten.
Spielt da Gross / Kleinschreibung eine Rolle ;)
Samba ist da IIRC nicht so pingelig ;-)
Aber: Bevor Du die Samba-Charset-Einstellungen verdrehst, solltest Du erstmal die Dateinamen auf dem Linux-Rechner selbst korrekt angezeigt bekommen. Alles andere wird das irgendwann "richtig lustig"[tm] ;-)
Ja hier sitze ich wohl schon in der Falle. Der Server hat keinen Bildschirm angeschlossen und ich bin per ssh eingeloggt. Nun habe ich meine Arbeiten immer über die KDE Console und mc ausgeführt und gerade festgestellt, dass es da auch noch Einstellungen gibt, die die Darstellung verändern. Ohne X, direkt über die Konsole per ssh sehen die Umlaute krank aus. [1] Ich habe da wohl jetzt schon einiges vermurkst und muss erst mal wieder einen guten Ausgangszustand herstellen :( Dazu eine Frage: Wie muss LANG und LC_CTYPE gesetzt sein? Momentan ist das de_DE.UTF-8 und de_DE@euro. Bei beiden meckert convmv, dass sie unbekannt sind. Wenn ich nun schon die Dateinamen konvertieren müsste, denke ich, dass es doch Quatsch ist, mit "unix charset = iso8859-15" weiterzumachen. Besser wäre doch, jetzt konsequent auf UTF-8 umzustellen, oder? Der Kunde ist auch in Osteuropa tätig, kann sein, dass da irgendwann auch noch kyrillische Dateinamen kommen ;)) 1 Sowohl neuerstellte, wie auch die alten Dateinamen. Gruss Bernd
Hallo Bernd, hallo Leute, Am Freitag, 4. November 2005 14:17 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch. [...] los - Details siehe man convmv ;-)
Danke, das ist ein sehr guter Tip :)
Ergänzend gibt es IIRC auch einen SDB-Artikel - Suchbegriff convmv ;-)
Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten.
Spielt da Gross / Kleinschreibung eine Rolle ;)
Samba ist da IIRC nicht so pingelig ;-)
Aber: Bevor Du die Samba-Charset-Einstellungen verdrehst, solltest Du erstmal die Dateinamen auf dem Linux-Rechner selbst korrekt angezeigt bekommen. Alles andere wird das irgendwann "richtig lustig"[tm] ;-)
Ja hier sitze ich wohl schon in der Falle. Der Server hat keinen Bildschirm angeschlossen und ich bin per ssh eingeloggt. Nun habe ich meine Arbeiten immer über die KDE Console und mc ausgeführt und gerade festgestellt, dass es da auch noch Einstellungen gibt, die die Darstellung verändern.
Tja, kommt vor ;-)
Ohne X, direkt über die Konsole per ssh sehen die Umlaute krank aus. [1] Ich habe da wohl jetzt schon einiges vermurkst und muss erst mal wieder einen guten Ausgangszustand herstellen :(
Dazu eine Frage: Wie muss LANG und LC_CTYPE gesetzt sein? Momentan ist das de_DE.UTF-8 und de_DE@euro. Bei beiden meckert convmv, dass sie unbekannt sind.
Probiers mal mit iso-8859-15 (= de_DE@euro) und als Ziel einfach nur utf8 oder utf-8 - eins davon müsste passen.
Wenn ich nun schon die Dateinamen konvertieren müsste, denke ich, dass es doch Quatsch ist, mit "unix charset = iso8859-15" weiterzumachen. Besser wäre doch, jetzt konsequent auf UTF-8 umzustellen, oder? Der Kunde ist auch in Osteuropa tätig, kann sein, dass da irgendwann auch noch kyrillische Dateinamen kommen ;))
Wenn das so ist, dann auf jeden Fall utf-8 ;-) Ich verwende übrigens immer noch iso-8859-15. Das hängt aber in erster Linie damit zusammen, dass ich des öfteren HTML-Dokumente bearbeite (die aber evtl. auch noch von anderen Leuten bearbeitet werden) - jedenfalls würde utf-8 da wohl zu Buchstabensuppe führen ;-) Das ist dann auch der Grund, warum sich meine Kenntnisse von convmv hauptsächlich auf dessen Existenz beschränken *g*
1 Sowohl neuerstellte, wie auch die alten Dateinamen.
Dann ist es wenigstens einheitlich ;-) Gruß Christian Boltz -- [RFCs, Etikette] Ich weiß auch dass ich vor einigen mails dagegen verstoßen habe. Nur als assozial braucht sich keiner von dir "staatlich geprüfter Flachzange" hinstellen lassen. [Matthias Reinhardt in suse-linux]
Christian Boltz schrieb:
Hallo Bernd, hallo Leute,
Am Freitag, 4. November 2005 14:17 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
[...]
los - Details siehe man convmv ;-)
Danke, das ist ein sehr guter Tip :)
Ergänzend gibt es IIRC auch einen SDB-Artikel - Suchbegriff convmv ;-)
Danke, hatte ich nach Deinem Tip schon gefunden..
Aber: Bevor Du die Samba-Charset-Einstellungen verdrehst, solltest Du erstmal die Dateinamen auf dem Linux-Rechner selbst korrekt angezeigt bekommen. Alles andere wird das irgendwann "richtig lustig"[tm] ;-)
Ja hier sitze ich wohl schon in der Falle. Der Server hat keinen Bildschirm angeschlossen und ich bin per ssh eingeloggt. Nun habe ich meine Arbeiten immer über die KDE Console und mc ausgeführt und gerade festgestellt, dass es da auch noch Einstellungen gibt, die die Darstellung verändern.
Tja, kommt vor ;-) Mir ist es eigentlich erstmal egal, wie die unter Linux aussehen. Der Zugriff erfolgt ausschliesslich über Winxxx Clients. Also ist es mir erstmal wichtig, dass sie dort richtig sind. Habe nun mit convmv alle Kombinationen ausprobiert, die mir möglich/sinnvoll erschienen. Neu erstellte Dateinamen sind durchweg okay, die alten krieg ich nicht hin :( Auch wenn ich die Dateien
[..] direkt aus dem Backup nehme, die Umlaute werden falsch dargestellt. Kann es sein, dass Redhat da irgendwelche encodings hat/hatte, die es sonst nirgends gibt? Also: grep "unix charset" /etc/samba/smb.conf unix charset = UTF8 ls Br* Br?cker.doc convmv --nosmart -t utf8 -f iso-8859-15 -r --notest --nfc Brcker.doc mv "./Brcker.doc" "./BrÂcker.doc" (Der Parameter --nfc macht keinen Unterschied) In Win2k ist dann da ein Quadrat statt dem ö Umgekehrt, also convmv from utf8 to iso-8859-15 wird ein _ draus. Gibt es ein Tool mit dem ich das encoding der Originaldateien rauskriegen kann?
Ohne X, direkt über die Konsole per ssh sehen die Umlaute krank aus. [1] Ich habe da wohl jetzt schon einiges vermurkst und muss erst mal wieder einen guten Ausgangszustand herstellen :(
Dazu eine Frage: Wie muss LANG und LC_CTYPE gesetzt sein? Momentan ist das de_DE.UTF-8 und de_DE@euro. Bei beiden meckert convmv, dass sie unbekannt sind.
Probiers mal mit iso-8859-15 (= de_DE@euro) und als Ziel einfach nur
Dass iso-8859-15 = de_DE@euro habe ich bisher auch angenommen. Ich habe noch eine dunkle Erinnerung, dass bei SuSE 8.x oder so das aber auch noch nicht so ganz funktioniert hat. IMHO hiess das damals 'de_DE=euro' oder so. Redhat 7.2 war doch etwa zu der Zeit von SuSE 8.x. Möglicherweise hat Redhat irgendeine kranke Lösung verwendet um den Euro € darzustellen... Daher fürchte ich mittlerweile, dass da irgendwo der Grund für den Fehler ist. Ich habe bei einem anderen Kunden, nach einem Upgrade von SuSE 8.1 auf 9.1 eben genau mit unix charset = ISO8859-15 den gewünschten Erfolg gehabt.
utf8 oder utf-8 - eins davon müsste passen. Ja, siehe Oben... kein Erfolg.
Wenn ich nun schon die Dateinamen konvertieren müsste, denke ich, dass es doch Quatsch ist, mit "unix charset = iso8859-15" weiterzumachen. Besser wäre doch, jetzt konsequent auf UTF-8 umzustellen, oder? Der Kunde ist auch in Osteuropa tätig, kann sein, dass da irgendwann auch noch kyrillische Dateinamen kommen ;))
Wenn das so ist, dann auf jeden Fall utf-8 ;-)
Ja, da möchte ich hinkommen ;)
Ich verwende übrigens immer noch iso-8859-15. Das hängt aber in erster Linie damit zusammen, dass ich des öfteren HTML-Dokumente bearbeite (die aber evtl. auch noch von anderen Leuten bearbeitet werden) - jedenfalls würde utf-8 da wohl zu Buchstabensuppe führen ;-)
Das ist dann auch der Grund, warum sich meine Kenntnisse von convmv hauptsächlich auf dessen Existenz beschränken *g*
Macht nix ;) Der Tip allein war schon Gold wert!
1 Sowohl neuerstellte, wie auch die alten Dateinamen.
Dann ist es wenigstens einheitlich ;-)
<g> Gruss Bernd
Hallo Bernd, hallo Leute, Am Samstag, 5. November 2005 22:09 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Freitag, 4. November 2005 14:17 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
["defekte" Umlaute in Dateinamen von altem Samba-Share]
grep "unix charset" /etc/samba/smb.conf unix charset = UTF8 ls Br* Br?cker.doc
Guck mal genauer, wie der Name aussieht -> ls -b Oder trickse ein wenig: ls --show-control-chars > dateiliste ; file dateiliste könnte mit etwas Glück das Encoding rausfinden (wieder mal ungetestet ;-)
convmv --nosmart -t utf8 -f iso-8859-15 -r --notest --nfc Brcker.doc mv "./Brcker.doc" "./BrÂcker.doc"
(Der Parameter --nfc macht keinen Unterschied)
In Win2k ist dann da ein Quadrat statt dem ö Umgekehrt, also convmv from utf8 to iso-8859-15 wird ein _ draus.
Gibt es ein Tool mit dem ich das encoding der Originaldateien rauskriegen kann?
Siehe oben. Laut man smb.conf (dos charset) von Samba 3.0 könnte auch 850 (cp850?) verwendet worden sein. Hier ein kleiner Ausschnitt aus man smb.conf von einer SUSE 9.0, Samba 2.2.8a: client code page (G) This parameter specifies the DOS code page that the clients accessing Samba are using. To determine what code page a Windows or DOS client is using, open a DOS command prompt and type the command chcp. This will output the code page. The default for USA MS-DOS, Windows 95, and Windows NT releases is code page 437. The default for western European releases of the above operating systems is code page 850. This parameter tells smbd(8) which of the codepage.XXX files to dynamically load on startup. These files, described more fully in the manual page make_smbcodepage(1) tell smbd how to map lower to upper case characters to provide the case insensitivity of filenames that Windows clients expect. Samba currently ships with the following code page files : · Code Page 437 - MS-DOS Latin US · Code Page 737 - Windows '95 Greek · Code Page 850 - MS-DOS Latin 1 · Code Page 852 - MS-DOS Latin 2 · Code Page 861 - MS-DOS Icelandic · Code Page 866 - MS-DOS Cyrillic · Code Page 932 - MS-DOS Japanese SJIS · Code Page 936 - MS-DOS Simplified Chinese · Code Page 949 - MS-DOS Korean Hangul · Code Page 950 - MS-DOS Traditional Chinese [...] If not set, client code page defaults to 850. See also : valid chars, code page directory Default: client code page = 850 HTH ;-) Gruß Christian Boltz -- MSCE Führerschein für die Maus. (Thore Tams)
Christian Boltz schrieb:
Hallo Bernd, hallo Leute,
Am Samstag, 5. November 2005 22:09 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Freitag, 4. November 2005 14:17 schrieb Bernd Obermayr:
Christian Boltz schrieb:
Am Donnerstag, 3. November 2005 17:04 schrieb Bernd Obermayr:
Steffen Moser schrieb:
>* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
["defekte" Umlaute in Dateinamen von altem Samba-Share]
grep "unix charset" /etc/samba/smb.conf unix charset = UTF8 ls Br* Br?cker.doc
Guck mal genauer, wie der Name aussieht -> ls -b
Oder trickse ein wenig: ls --show-control-chars > dateiliste ; file dateiliste könnte mit etwas Glück das Encoding rausfinden (wieder mal ungetestet ;-)
grmbl.. Danke, hätt ich auch selber draufkommen können.
convmv --nosmart -t utf8 -f iso-8859-15 -r --notest --nfc Brcker.doc mv "./Brcker.doc" "./BrÂcker.doc"
(Der Parameter --nfc macht keinen Unterschied)
In Win2k ist dann da ein Quadrat statt dem ö Umgekehrt, also convmv from utf8 to iso-8859-15 wird ein _ draus.
Gibt es ein Tool mit dem ich das encoding der Originaldateien rauskriegen kann?
Siehe oben.
Laut man smb.conf (dos charset) von Samba 3.0 könnte auch 850 (cp850?) verwendet worden sein.
Patsch ;) Ich hatte das schon ausprobiert. convmv -f cp850 -t utf8 Nun, smb.conf: unix charset = UTF8 DOS charset = 850 # convmv -f cp850 -t utf-8 . scheint zu funktionieren. Ganz am Anfang hatte ich auch mal mit "dos charset = cp850" experimentiert. (Hatte ich mit swat gemacht) Swat schreibt aber dos charset = cp850. Möglicherweise ist das falsch, offenbar muss da 850 stehen ;)
Hier ein kleiner Ausschnitt aus man smb.conf von einer SUSE 9.0, Samba 2.2.8a:
client code page (G)
[...]
If not set, client code page defaults to 850.
See also : valid chars, code page directory
Default: client code page = 850
^^^
HTH ;-)
Scheint so ;)) Muss das jetzt aber noch testen, ob ich das so auf die Dateien loslassen kann. convmv -f cp850 -t utf8 Scheint Ok zu sein. convmv -f cp850 -t iso-8859-15 ..iso-8859-15 doesnt cover all needed characters.. Na ich will ja eh UTF8 haben. Also dann nochmal Danke für Deine Mühe, ich hoffe das geht jetzt so. Grade hab ich nochmal die Doku zu convmv gelesen, ich war wohl blind B-/ Genau obiger Sachverhalt wird im Kapitel 'How to repair Samba files' beschrieben. Na, der Tag Pause hat mir offenbar gutgetan ;) Gruss Bernd PS: Diese Liste ist einfach Klasse! Ich hatte da noch ein kleines Problem wg. Imap, das hat sich so nebenbei durch mitlesen gelöst ;)
Steffen Moser schrieb:
* On Thu, Nov 03, 2005 at 12:59 PM (+0100), Bernd Obermayr wrote:
Nach dem Umstieg von Redhat 7.2 auf SuSE 9.1 sind die Umlaute in den Windows Dateinamen falsch.
Sehen die Umlaute in den Dateinamen denn unter SuSE 9.1 nun richtig aus oder nicht (also wenn Du direkt unter Linux mit "ls" Dir die Dateien anschaust)?
Falls ja, dann müssten sie, wenn Deine SuSE UTF-8 konfiguriert hat, in UTF-8 sein. Dann müsste Samba auch den Parameter "unix charset" auf UTF-8 stehen haben.
Falls nein (und das ist eher wahrscheinlich), dann sind sie vermutlich nach wie vor in "ISO8859-15", dann müsste der Para- meter in Samba "unix charset = ISO8859-15" lauten.
Hab das jetzt mal in Ruhe getestet (Kunde ist nicht mehr da) "unix charset = ISO8859-15" * Die Umlaute von _neu_ angelegten Dateien jeweils auf Linux oder Winxxx werden in Winxxx richtig dargestellt. Bei "unix charset = UTF-8" werden sie als _ dargestellt. Dann allerdings sind sie unter Linux richtig. Umlaute in "alten" Dateinamen werden aber immer falsch dargestellt. (als Kästchen oder _ ) Verstehe ich das jetzt richtig, dass es für den Redhat Zeichensatz de_DE@euro keine Entsprechung in samba gibt. testparm meckert heftig, wenn ich das als unix charset setze. Wie kann ich rauskriegen, welcher Zeichensatz das war? locale -a half nicht :) Oder gibts noch eine andere Lösung? Sind übrigens "nur" 87000 Dateien, trotzdem möchte ich gerne um die Convertierung rumkommen ;) * Gross/Kleinschreibung ist offensichtlich egal ;) -- Gruss Bernd
participants (5)
-
Bernd Obermayr
-
Christian Boltz
-
Dominik Klein
-
Martin Deppe
-
Steffen Moser