[python] xml a utf8

Martin Hassman martin.hassman na vscht.cz
Pátek Duben 25 16:51:34 CEST 2003


On 25 Apr 2003 at 15:24, Petr Vaněk wrote:

> parsuji jednoduchy xml soubor pres xml.parser.expat.
> je-li v zahlavi xml uvedena znakova sada iso8859-2 a
> znaky jsou taktez stejne kodovany, probehne parsing
> v poradku. je-li ale vse v utf8 ->
> xml.parsers.expat.ExpatError: not well-formed (invalid token): line 3, column 
> 19
> kterezto koordinaty ukazuji na prvni vyskyt nonASCII znaku.
> 
> co prehlizim?
> 

Tak ja s timhle problemy nemam.
Viz prikladek, kde dokument vlastne ani poradne neparsuji, jen kontroluji 
expatem, zda je well formed, tomu uft-8 a ceske znaky nevadi.

Pro otestovani na: 
http://biomikro.vscht.cz/maldiman/hassmanm/tmp/RSSreader.py
(nacte rss z http://biomikro.vscht.cz/maldiman/hassmanm/tmp/czilla.html) 
otestuje, zda je well-formed a pokud ano, tak ho ulozi.

Ale jak na to koukam, zkusil bych misto utf8 napsat utf-8, v tom by mohl 
byt zakopany kanon.

martin
-- 
Martin Hassman
Institute of Chemical Technology in Prague
Department of Biochemistry and Microbiology
Jaky Internetovy prohlizec pouzivat? Zkuste Mozillu http://czilla.cz
Jabber: hassmanm na njs.netlab.cz, ICQ: #295399122



Další informace o konferenci Python