[python] Unicode řetězce

Radek Kaňovský rk na dat.cz
Pondělí Únor 6 18:44:59 CET 2006


On Mon, Feb 06, 2006 at 06:23:58PM +0100, Jan Matejka wrote:

> > uni_text=text.decode("iso-8859-2").encode("utf-8")
> > Vám nechodí?
> 
> Mam dojem, ze tazatel ma problem se zapisem unicodoveho retezce do souboru.
> Zapisuje ho tam myslim primo, a to selze  pri konverzi unicodoveho znaku na
> ascii.
> Jak to udelat jinym zpusobem nez unicode prevest napriklad na utf-8 nevim.

V modulu codecs jsou na to wrappery. Lze tak nacitat a zapisovat primo
unicode. Je samozrejme potreba znat kodovani souboru.

    >>> import codecs
    >>> out = codecs.open('out.txt', 'w', 'latin2')
    >>> out.write(u'foo\n')
    >>> out.close()

Radek Kaňovský



Další informace o konferenci Python