[python] Problem s unicode.

superman feed na centrum.cz
Čtvrtek Duben 10 19:03:49 CEST 2008


 >Pri cteni mne napada otazka jak tedy psat programy?

Prostě Unicode nevyřešilo co mělo řešit. Ale alespoň udělalo jednu věc, 
že osekalo počet nutných znakových sad, které potřebujete k tomu plně 
vyjádřit pro všechny znaky - když jako jednu vezmete Unicode, pak pár 
asijských znakových sad a plus pár drobotin, tak de facto s pěti až 
deseti znakovými sadami vystačíte.

Já osobně to řeším tak, že Unicode znaky mám 31 bitového a do horního 
prostoru si namapuji ty znaky, které se nevejdou do Unicode - ale 
předpokládá to svoje Unicode řešení. Pak mi můj "extended Unicode" 
string opravdu přenese vše.

Jinak UTF-8 technicky dokáže zobrazit myslím až 36 bitové znaky (pouze 
normou je to omezené dříve na 32, později na 21 bitů, ale to je jen 
papírové omezení, nikoli omezení UTF-8 algoritmu), takže UTF-8 uloží i 
mojí "extended Unicode" sadu a ještě má velké rezervy.

Miloslav Ponkrác



Další informace o konferenci Python