[python] unicode

Petr Hlávka petrhlavka na gmail.com
Čtvrtek Říjen 27 15:55:36 CEST 2005


Zdravim,

castecne by mohlo fungovat u'\uFEFFAhoj'.encode('UTF-16'), nebo UTF-16BE pro
opacne poradi bajtu. Problem je ten, ze to nemusi byt presne, to co chcete.
Hodnoty v UTF-16 na mapovany na vetsi nez 16bitovy rozsah, toto se nedela v
kodovani UCS-2, ktere ale muj Python nepodporuje.

S pozdravem Petr Hlavka.

2005/10/27, Martin Blazik <martin.blazik na premiumsms.cz>:
>
> No neni, UTF-8 uklada kazdy znak do promenne delky (1 az 3 znaky
> myslim). Ja chci aby se kazdy znak prelozil presne na dva bajty
> (potrebuju aby z dat sla primo poznat delka retezce).
> Takze u'\uFEFFAhoj' => '\xff\xfe\x41\x00\x68\x00\x6f\x00\x6a\x00'
>
> lachtan
>
> geon napsal(a):
>
> > Martin Blazik napsal(a):
> >
> >> Cau,
> >> jakym zpusobem muzu prevest unicode string do bytove reprezentace
> >> (retezcove podoby) tak, abych data mohl ulozit do souboru (rekneme v
> >> notaci little endian)?
> >> Tu prevodni funkci si dokazu napsat sam na par radek, spis by me
> >> zajimalo, jestli uz neexistuje v pythonu nejaky standartni nastroj.
> >> Zkousel jsem najit nejaky default konvertor
> >> (
> http://python.org/doc/2.4.2/lib/standard-encodings.html#standard-encodings
> ),
> >> ale taky nic nebo ho jen nevidim :)
> >>
> >>
> >>
> > tutorial:
> >
> > To convert a Unicode string into an 8-bit string using a specific
> > encoding, Unicode objects provide an encode() method that takes one
> > argument, the name of the encoding. Lowercase names for encodings are
> > preferred.
> >
> >>>> u"äöü".encode('utf-8')
> >>>
> > '\xc3\xa4\xc3\xb6\xc3\xbc'
> >
> >
> > je to ono?
> >
> _______________________________________________
> Python mailing list
> Python na py.cz
> http://www.py.cz/mailman/listinfo/python
>
------------- dal¹í èást ---------------
HTML p?íloha byla odstran?na...
URL: http://www.py.cz/pipermail/python/attachments/20051027/e1a69774/attachment.htm


Další informace o konferenci Python