[python] Problem s unicode.

Vaclav Hula ax na natur.cuni.cz
Pondělí Duben 14 11:18:08 CEST 2008


Jan Vrana napsal(a):
>> "šetření bajtíků stylem po nás potopa", jaká způsobilo problém třeba > 
>> roku 2000, a tatáž pitomost zamotala Unicode natolik, že ten bordel > 
>> je teď dost veliký. Takže pro asijské jazyky se převádějí znaky do
>> Unicode přes proces zvaný "han unification"
> [Honza Vrana]
> Pokud tomu dobre rozumim tak neslo ani o setreni bajtiku tech by snad 
> pri 31 bitech na znak mohlo byt dost ale o to ze nejaky "chytrak" v 
> ramci uklidu sjednotil znaky ktere se mu jevily podobne jako kdyby nam 
> nekdo sjednotil treba nase i s teckou a carkou.

No to trochu prehanis, sjednoceny byly graficky odlisne znaky se shodnym
vyznamem. Lepsi priklad mi prijde jako kdyby Nemci psali porad
svabachem, ale v unicode nebyl odlisny znak pro "A" a "svabachove A" -
protoze je to hlaska "a" a rozliseni se da delat fontem. Plus teda
spousta mene pouzivanych znaku v unicode chybi, zejmena starsi
nabozenske a poeticke texy maji v unicode smulu - ale i nektere stale
(byt mene) pouzivane znaky.

Navic maji mnozi z CJK pocit, ze na ne byla unifikace v unicode uvalena
systemem "o nas bez nas", ackoliv byli jejich zastupci v unicode
kosorciu aktivni od zacatku. Japonsky zastupce (zamestnanec tusim DECu,
tedy americke fimy a vyrazneho zastance unifikace) hlasoval pro
unifikaci, korejci a cinani proti. Cela politicka stranka tehle
zalezitosti je neprehledna a alespon trochu masla na hlave maji vsichni.

S pozdravem,
Ax


Další informace o konferenci Python