[python] unicode

ViNiL vinil na zagamma.cz
Pondělí Říjen 31 15:23:08 CET 2005


Petr Prikryl píše v Po 31. 10. 2005 v 14:31 +0100:
> Parametr sys.maxunicode uvádí maximální hodnotu
> kódu znaku, jakou umí Python vnitřně uložit. Neříká
> asi nic o kódování ve vnějším souboru.

Vzhledem k tomu, ze to byla reakce na poznamku o tom, jak jsou kde
zkompilovane Pythony, tak je to v poradku ;-)

> Dvoubajtové znaky budou v drtivé většině případů asi
> stačit -- viz dříve zmíněný odkaz:

Proc to stale opakovat do kola?
Ano, vetsine evropanu staci 2 bajty. Vetsine americanu staci 7 bitu.
Vetsine webovych surfaru staci stranky "optimalizovane" pro Internet
Explorer. A vetsine lidi staci heterosexualni manzelstvi.
Je to otazka jednoho kazdeho autora, kolik je do sveho dila
ochoten/schopen investovat prace "navic" a neomezovat okruh
(potencialnich) uzivatelu.

> Implementační problém s "čínštinou" nastane tedy jen v případě,
> kdy fyzicky spoléháme na to, že jeden znak zabírá v souboru
> přesně dva bajty. Bude to problém chybného předpokladu o počtu
> bajtů na znak v souboru, nikoliv problém samotného kódování
> Unicode.

Coz je u dotazu na zaruceni pevne sirky znaku vada dosti podstatna.

Taky bych opatrneji zachazel s terminem "kodovani Unicode."

Uf, tak si nejsem jist, jestli to melo byt zaverecne shrnuti nebo
zmateni ;-)))


-- 

ViNiL, ultimativní opravář komínů





Další informace o konferenci Python