Hallo, ein Programm unter SUSE hat Umlaute in einem String als ISO 8859-1 codiert. Laut den unvollständigen Logdateien war auf diesem Server LANG UTF-8 und zeitweise POSIX, aber eben kein erweiterter ASCII-Zeichensatz. Kann es sein, dass SUSE statt POSIX ISO-8859-1 verwendet? Wahrscheinlich liegt das an dem fraglichen Programm und nicht der Distribution. Dennoch könnte es ja sein, dass jemand schonmal auf den Fehler gestoßen ist. Gruß, Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Thu, 04 Jan 2018, Chris schrieb:
ein Programm
WELCHES? VER*BLEEP* *BLEEP* *BLEEP* *BLEEP* NOCHMAL! IST DAS HIER EIN QUIZ ODER WAS???
unter SUSE hat Umlaute in einem String als ISO 8859-1 codiert.
WER? WAS? WIE? WO? WANN? Beantworten! Sonst /dev/null. [..]
Kann es sein, dass SUSE statt POSIX ISO-8859-1 verwendet?
Nö. Um die locale muß sich _immer_ der Anwender kümmern.[0] Kann es sein, daß der Anwender seine locale/sein verwendetes Programm verkonfiguriert hat? Keiner weiß es. Butter bei die Fische oder kriech unter deinen Stein zurück, unter dem du wohl die letzten 10+ Jahre verbracht hast. Und BTW: es gibt auch noch nen Haufen andere 8bit Kodierungen, z.B. KOI-8 ist in den entsprechenden Gegenden noch recht beliebt. Und bisher hast du noch _GENAU GAR NICHTS_ an Fakten geliefert. Nur Wischiwaschigelaber von dir gegeben. In zweifacher Ausführung. Wäre das hier bugzilla, gäb's ein: CLOSED INVALID Mit passenden Programmen kann ich hier immer noch problemlos ISO-8859-15 (aka de_DE@euro) verwenden (das hat in SUSE übrigens vor dem kompletten Umstieg auf UTF-8 ISO-8859-1 als default doch für _einige_ Jahre abgelöst). Und ich kann problemlos teils 8859-* teils UTF-8 verwernden[1]. Ansonsten kommst du mind. 10 Jahre zu spät um dich zu beklagen. Tschüssikowski, -dnh [0] egal wie. Z.B. per Yast während der Installation. [1] nur so Krams wie umlautig benamste Dateien vom 8859-15-system zum UTF8-chroot kopieren oder so macht Ärger, denn erstere sind oft keine gültigen UTF8 Zeichen. Andersrum hab ich dann halt ein Ã<irgendwas>, was aber nicht weiter stört, da es nur gültige Zeichen in 8859-15 sind. -- For every rational explanation there are an infinite number of irrational explanations. -- Staples' Observation -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
On Fri, 5 Jan 2018 00:38:03 +0100 David Haller wrote:
Am Thu, 04 Jan 2018, Chris schrieb:
ein Programm
WELCHES? VER*BLEEP* *BLEEP* *BLEEP* *BLEEP* NOCHMAL! IST DAS HIER EIN QUIZ ODER WAS???
Ein C-Programm, das iconv nutzt. Es ist nicht Bestandteil von SUSE und auch nicht weiter verbreitet.
unter SUSE hat Umlaute in einem String als ISO 8859-1 codiert.
Aus unerfindlichen Gründen meint das Programm es handle sich bei dem String um ASCII. iconv bringt Fehler 84, ungültige Eingabe. In der Fehlermeldung ist zu sehen, dass ein Zeichen ü (Hex. FC) ist. Daraus schließe ich, dass es sich um ISO 8859-1 handelt.
Kann es sein, dass SUSE statt POSIX ISO-8859-1 verwendet? Nö. Um die locale muß sich _immer_ der Anwender kümmern.[0]
OK.
Kann es sein, daß der Anwender seine locale/sein verwendetes Programm verkonfiguriert hat?
Ja.
Butter bei die Fische oder kriech unter deinen Stein zurück, unter dem du wohl die letzten 10+ Jahre verbracht hast.
Danke.
Und BTW: es gibt auch noch nen Haufen andere 8bit Kodierungen, z.B. KOI-8 ist in den entsprechenden Gegenden noch recht beliebt.
Kyrillisch? Nein, das kann ich ausschließen.
Wäre das hier bugzilla, gäb's ein: CLOSED INVALID
Gut, es ist ein Problem der Anwendung oder Konfiguration. Das habe ich schon befürchtet. Gruß, Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 05.01.2018 um 06:04 schrieb Chris:
On Fri, 5 Jan 2018 00:38:03 +0100 David Haller wrote:
Am Thu, 04 Jan 2018, Chris schrieb:
ein Programm
WELCHES? VER*BLEEP* *BLEEP* *BLEEP* *BLEEP* NOCHMAL! IST DAS HIER EIN QUIZ ODER WAS???
Ein C-Programm, das iconv nutzt. Es ist nicht Bestandteil von SUSE und auch nicht weiter verbreitet.
unter SUSE hat Umlaute in einem String als ISO 8859-1 codiert.
Aus unerfindlichen Gründen meint das Programm es handle sich bei dem String um ASCII. iconv bringt Fehler 84, ungültige Eingabe. In der Fehlermeldung ist zu sehen, dass ein Zeichen ü (Hex. FC) ist. Daraus schließe ich, dass es sich um ISO 8859-1 handelt.
Wenn die Eingabedaten als Datei vorliegen, könntest du ggf. das Programm "recode" darüberlaufen lassen, um den Text in den Zeichensatz zu konvertieren, den dein Programm erwartet. Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo, Am Fri, 05 Jan 2018, Chris schrieb:
On Fri, 5 Jan 2018 00:38:03 +0100 David Haller wrote:
Am Thu, 04 Jan 2018, Chris schrieb:
ein Programm
WELCHES? VER*BLEEP* *BLEEP* *BLEEP* *BLEEP* NOCHMAL! IST DAS HIER EIN QUIZ ODER WAS???
Ein C-Programm, das iconv nutzt. Es ist nicht Bestandteil von SUSE und auch nicht weiter verbreitet.
Ahhh, iconv. BerÃŒhmt fÃŒr seine Toleranz beim input...
unter SUSE hat Umlaute in einem String als ISO 8859-1 codiert.
Aus unerfindlichen GrÃŒnden meint das Programm es handle sich bei dem String um ASCII. iconv bringt Fehler 84, ungÃŒltige Eingabe. In der Fehlermeldung ist zu sehen, dass ein Zeichen ÃŒ (Hex. FC) ist. Daraus schlieÃe ich, dass es sich um ISO 8859-1 handelt.
Erstens: 0xFC ist auch in latin9/ISO-8859-15 ein Ì. Siehe die ganzen manpages die dir 'man -k latin[0-9]' vorschlÀgt... ZWEITENS: Halt! Ruft das "Programm" /usr/bin/iconv auf oder verwendet es die libc iconv Funktion??? Vergleiche: 'man 1 iconv' vs. 'man 3 iconv'... Versuche also rauszufinden, was davon zutrifft und frag dann nochmal konkret bzgl. iconv(1) oder iconv(3)...
Kann es sein, dass SUSE statt POSIX ISO-8859-1 verwendet? Nö. Um die locale muà sich _immer_ der Anwender kÌmmern.[0]
OK.
Kann es sein, daà der Anwender seine locale/sein verwendetes Programm verkonfiguriert hat?
Ja.
Butter bei die Fische oder kriech unter deinen Stein zurÃŒck, unter dem du wohl die letzten 10+ Jahre verbracht hast.
Danke.
Und BTW: es gibt auch noch nen Haufen andere 8bit Kodierungen, z.B. KOI-8 ist in den entsprechenden Gegenden noch recht beliebt.
Kyrillisch? Nein, das kann ich ausschlieÃen.
0xFC ist lt. 'man koi8-r' 374 252 FC CYRILLIC CAPITAL LETTER E Und eben kein ÃŒ. Kontext! Beim Kontext \x66\xfc\x72 f ÃŒ r // iso8859-{1,15} (hier in der mail als utf8) beim Kontext $ printf '\xfc\xd4\xcf\xd4' | recode koi8-r..utf8 > t.txt \xfc\xd4\xcf\xd4 ÐÑÐŸÑ // Koi8-r (hier in der mail als utf8) So eindeutig ist das ganze jedenfalls nicht.
WÀre das hier bugzilla, gÀb's ein: CLOSED INVALID
Gut, es ist ein Problem der Anwendung oder Konfiguration. Das habe ich schon befÃŒrchtet.
s.o. HTH, -dnh -- 25: Multithreaded Wir muÃten ein FluÃdiagramm malen, um es zu debuggen. (Kristian Köhntopp) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo David, On Tue, 9 Jan 2018 00:37:04 +0100 David Haller wrote:
Erstens: 0xFC ist auch in latin9/ISO-8859-15 ein Ì. Siehe die ganzen manpages die dir 'man -k latin[0-9]' vorschlÀgt...
8859-1 und -15 unterscheiden sich meine ich v.a. im Euro Zeichen. Das haben die Experten dann zum Glück doch nicht verwendet.
Versuche also rauszufinden, was davon zutrifft und frag dann nochmal konkret bzgl. iconv(1) oder iconv(3)...
So genau habe ich es mir noch nicht angeschaut, aber sehr wahrscheinlich die C-Funktion.
Und eben kein Ì. Kontext! Beim Kontext
Der Kontext ist eindeutig ein kleines ü (u mit zwei Punkten). Gruß, Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (3)
-
Chris
-
David Haller
-
Martin Burnicki