Probleme mit XML File und UTF-8 (Unicode)
Hallo Leute,
Hab mal ein paar grundlegende Fragen zu Unicode/UTF-8:
Wenn ich z.B. im Dreamweaver auf UTF-8 umstelle, sind alle Umlaute,
die ich
in der Layout-Ansicht schreibe (also ä,ö, ü etc.) im Code weiterhin
ä,ö,ü
und nicht irgendein Entitiy-Wert wie ä.
Das ist ja auch schonmal ganz schön, und soweit ich das richtig
verstanden
habe, ist also der Vorteil von UTF-8, dass ich alle meine Zeichen
einfach so
wie sie sind (seis ein deutsches =C4 oder ein grichisches ?) direkt in
meinen
HTML Code schreiben kann. Richtig??? Oder muss nun statt ä ä
schreiben?
Ok, nachdem das aber funktionierte, hab ich nun versucht Umlaute in
meine
XML Datei zu schreiben, die auch mit UTF-8 codiert ist. Leider bringt
mir
der XML Parser aber einen Fehler und schreibt: Input is not proper
UTF-8,
indicate encoding !
Weiß irgendjemand was ich falsch mache? Ich glaub ich hab das mit dem
UTF-8
noch nicht wirklich verstanden..
Danke und Grüße,
Michi
Re: Probleme mit XML File und UTF-8 (Unicode)
dms821 [at] gmx.de schrieb:
> Das ist ja auch schonmal ganz schön, und soweit ich das richtig
> verstanden
> habe, ist also der Vorteil von UTF-8, dass ich alle meine Zeichen
> einfach so
> wie sie sind (seis ein deutsches Ä oder ein grichisches ?) direkt in
> meinen
> HTML Code schreiben kann.
Richtig. Die Codierung ermöglicht Sonderzeichen, wenn das Dokument
*richtig* codiert gespeichert und ausgeliefert wird.
> Ok, nachdem das aber funktionierte, hab ich nun versucht Umlaute in
> meine
> XML Datei zu schreiben, die auch mit UTF-8 codiert ist. Leider bringt
> mir
> der XML Parser aber einen Fehler und schreibt: Input is not proper
> UTF-8,
> indicate encoding !
Nun, es scheint, als werde die Datei falsch abgespeichert. Dann hat es
nämlich spezielle Einleitungszeichen am Anfang der Datei und dann sollte
der Parser die Zeichen auch richtig erhalten (2 Bytes für Umlaute).
Gruss, Markus, der Dreamwaver nicht verwendet, doch unter Linux die
Programme noch extra einstellen musste, dass alles sauber funktionierte.
--
Sehr zu empfehlen:
http://www.google.ch/ oder .de/ oder .com/ usw.
Re: Probleme mit XML File und UTF-8 (Unicode)
On Jul 26, 9:44 pm, Markus Grob <lor... [at] ilnet.ch> wrote:
> dms... [at] gmx.de schrieb:
>
> > Das ist ja auch schonmal ganz schön, und soweit ich das richtig
> > verstanden
> > habe, ist also der Vorteil von UTF-8, dass ich alle meine Zeichen
> > einfach so
> > wie sie sind (seis ein deutsches =C4 oder ein grichisches ?) direkt in
> > meinen
> > HTML Code schreiben kann.
>
> Richtig. Die Codierung ermöglicht Sonderzeichen, wenn das Dokument
> *richtig* codiert gespeichert und ausgeliefert wird.
>
> > Ok, nachdem das aber funktionierte, hab ich nun versucht Umlaute in
> > meine
> > XML Datei zu schreiben, die auch mit UTF-8 codiert ist. Leider bringt
> > mir
> > der XML Parser aber einen Fehler und schreibt: Input is not proper
> > UTF-8,
> > indicate encoding !
>
> Nun, es scheint, als werde die Datei falsch abgespeichert. Dann hat es
> nämlich spezielle Einleitungszeichen am Anfang der Datei und dann sollte
> der Parser die Zeichen auch richtig erhalten (2 Bytes für Umlaute).
>
> Gruss, Markus, der Dreamwaver nicht verwendet, doch unter Linux die
> Programme noch extra einstellen musste, dass alles sauber funktionierte.
>
> --
> Sehr zu empfehlen:
>
> http://www.google.ch/oder .de/ oder .com/ usw.
Hi Markus,
Danke für die schnelle Antwort!
Hmm, also wie meinst du das die Datei falsch abgespeichert wird?
In der ersten Zeile steht:
<?xml version=3D'1.0' encoding=3D"UTF-8" standalone=3D'yes' ?>
Müsste doch stimmn oder?
Re: Probleme mit XML File und UTF-8 (Unicode)
dms821 [at] gmx.de schrieb:
> Hallo Leute,
>
> Hab mal ein paar grundlegende Fragen zu Unicode/UTF-8:
>
> Wenn ich z.B. im Dreamweaver auf UTF-8 umstelle, sind alle Umlaute,
> die ich
> in der Layout-Ansicht schreibe (also ä,ö, ü etc.) im Code weiterhin
> ä,ö,ü
> und nicht irgendein Entitiy-Wert wie ä.
>
> Das ist ja auch schonmal ganz schön, und soweit ich das richtig
> verstanden
> habe, ist also der Vorteil von UTF-8, dass ich alle meine Zeichen
> einfach so
> wie sie sind (seis ein deutsches Ä oder ein grichisches ?) direkt in
> meinen
> HTML Code schreiben kann. Richtig??? Oder muss nun statt ä ä
> schreiben?
>
> Ok, nachdem das aber funktionierte, hab ich nun versucht Umlaute in
> meine
> XML Datei zu schreiben, die auch mit UTF-8 codiert ist. Leider bringt
> mir
> der XML Parser aber einen Fehler und schreibt: Input is not proper
> UTF-8,
> indicate encoding !
Hast du bei dem Editor, den du zum editieren benutzt hast auch UTF-8 als
encoding eingestellt?
Ein Umlaut korrekt anzeigen ist was anderes wie einen Umlaut korrekt in
UTF-8 abspeichern.
Nimm mal nen Editor und stelle Encoding auf Ansi, tippe Ä ,speichere den
Text, danach stellst du auf UTF-8 speichere den Text.
Im Editor z.B. siehst du jeweils ein Ä und zwar egal welches Encoding du
eingestellt hast, die zwei gespeicherten Dateien jedoch mit dem Hex
Editor betrachtet sehen aber anders aus.
>
> Weiß irgendjemand was ich falsch mache? Ich glaub ich hab das mit dem
> UTF-8
> noch nicht wirklich verstanden..
Ich hoffe du hast es jetzt verstanden.
>
> Danke und Grüße,
> Michi
>
Re: Probleme mit XML File und UTF-8 (Unicode)
dms821 [at] gmx.de schrieb:
> Hmm, also wie meinst du das die Datei falsch abgespeichert wird?
> In der ersten Zeile steht:
> <?xml version=3D'1.0' encoding=3D"UTF-8" standalone=3D'yes' ?>
Diese Angabe versetzt AFAIR bei XHTML 1.0 Dokumenten den IE in den
Quirks mode.
Das Encoding wird korrekt via HTTP-Header übergeben. Dies lässt sich =
auf
2 bis 3 Wegen bewerkstelligen.
1. In der Konfiguration des Webservers
2. Wenn so konfiguriert, via .htaccess datei
3. mit <?php header("Content-Type: text/html; charset=3DUTF-8"); ?>
Der HTTP-Header muss aber unabdingbar vor allem anderen content erzeugt
werden, ansonsten gibts irgend was, aber nicht das erwünschte.
Wenn du aber bloss umlaute und alle anderen Zeichen die im iso-8859-15
Zeichensatz vorhanden sind brauchst, dann kannst du selbstverständlich
auch diesen nehmen und ohne Probleme umlaute in deine HTML-Dokumente
schreiben. Wichtig ist einfach das die HTML-Dokumente gleich gespeichert
sind wie im HTTP-Header angegeben und auch die DB den richtigen
Zeichensatz aus spuckt.
Gruss
Casper