Hi Andre! On Mo, 11 Jul 2011, Andre Tann wrote:
Christian Brabandt, Montag, 11. Juli 2011:
Und dann gucken wir mal in http://www.unicode.org/charts/PDF/U0300.pdf nach was \u0308 ist. Tada: "Combining diaeresis". Und das darf auch nach dem jew. Buchstaben stehen. Was aber offenbar iconv z.B. nicht kennt.
Laß mich raten, die Datei wurde unter Apple erstellt?
Keine Ahnung, ich würde eher sagen, daß es was unixoides war, aber ich bin nicht sicher. Kommt von einem web-ftp-artigen Dienst.
Wer ist denn "Urheber" des Dateinamens: derjenige, der die Datei über ein Webformular hochlädt, oder das entgegennehmende System? Denn sicher ist auf jeden Fall, daß die Datei mal über ein Webinterface hereingekommen ist. Irgendwann später wurde der Baum dann gezippt, und ist dann bei mir gelandet.
Dann war der Sender wahrscheinlich ein Apple. Der hat dann als Name die normalised decomposed Form genutzt.
Die kodieren, soweit ich weiß, utf8 als utf8 decomposed, während unter Linux/Unix wohl composed utf8 verwendet wird. Gibt halt beide Möglichkeiten laut Standard, aber ich bin mir sicher, dass es in Zukunft noch mehr Probleme damit geben wird.
Hey mann, das ist ein unsägliches Thema, und vor allem eines: ein Haufen verlorener Zeit…
convmv kann das aber erfolgreich kodieren: #v+ chrisbra@R500 /tmp/b % touch ä chrisbra@R500 /tmp/b % ls -1 |hexdump -bc 0000000 303 244 012 0000000 � � \n 0000003 chrisbra@R500 /tmp/b % convmv --notest --nfd -t utf-8 -f utf-8 * Your Perl version has fleas #37757 #49830 mv "./ä" "./ä" Ready! chrisbra@R500 /tmp/b % ls |hexdump -bc 0000000 141 314 210 012 0000000 a � 210 \n 0000004 chrisbra@R500 /tmp/b % #v- Benutze --nfc für die normalized composed form (aka, so wie es normalerweise unter Linux gemacht wird) bzw. --nfd für die normalized decomposed form, also das was der Mac so macht. In der Manpage steht dazu auch noch was, such einfach mal nach nfc Und auf dem Mac scheint iconv das auch konvertieren zu können, wie dieser Link nahelegt: http://loopkid.net/articles/2011/03/19/groking-hfs-character-encoding Aber zumindest hier, unterstützt iconv kein utf-8-mac als encoding (iconv -l listet es auch nicht auf, ich vermute das gibt es nicht in der glibc, sondern nur bei den Macs/BSD?) Mit freundlichen Grüßen Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org