Jan Ritzerfeld
Am Sonntag, 21. August 2005 20:41 schrieb Dieter Kluenter:
(...). Dazu gibt es keine Option, der etwas längere Vorspann von man (1) file beschreibt die Vorgehensweise. Eine HTML Datei wird als Textdatei interpretiert, unabhängig von der locale Umgebung. Das HTML Protokoll interessiert sich nicht für locale, sondern setzt immer ascii voraus. Zeichen ,die über 7 Bit hinausgehen, müssen durch besondere Tags beschrieben werden, z.B. ü
Alsoooo: 1. es gibt kein "HTML Protokol" :-P 2. HTML setzt keinesfalls "immer ascii voraus" 3. Helga hat den Zeichensatz ihrer HTML-Dateien mittels quanta "versaut"
Gut, es gibt kein HyperText Markup Language 'Protokoll', sondern HTML ist nur ein Subset von SGML. d.h. es gibt nur Empfehlungen und Richtlinien. RFC1866, in der HTML 2.0 beschrieben wird, sspricht sinngemäss davon, dass iso-8859-1 und iso-10646 unterstützt wird, dass aber empfohlen wird, nur die ersten 7 Bit der Zeichensätze zu verwenden, darüber hinaus gehende Zeichen durch 'Special Character' darzustellen. Die RFC Spricht auch davon, dass der Zeichensatz des Dokumentes unabhängig ist von dem Zeichensatz der Darstellung. (1.2.1 Documents) Sicherlich hat Helga ihre Dokumente durch Quanta versaut, aber das Hauptproblem liegt darin, dass sie 8 Bit Zeichen nicht durch Special Characters darstellt und dadurch in den Konflikt zwischen iso-8859-1 und UTF-8 bei der Darstellung gerät. -Dieter -- Dieter Klünter | Systemberatung http://www.dkluenter.de GPG Key ID:8EF7B6C6