[python] utf-8 na ascii

garabik-news-2005-05 na kassiopeia.juls.savba.sk garabik-news-2005-05 na kassiopeia.juls.savba.sk
Pátek Srpen 5 10:01:50 CEST 2005


SIBAL Pavel <entexsoft na entexsoft.cz> wrote:
> Zdravim Vas
> Mam problem s prevodem textu v utf-8 (s diakritikou) na text bez diakritiky 
> (ascii).

na text bez diakritiky alebo na ascii? je to rozdiel, napriklad ak tam
bude nejaka azbuka alebo grectina....

> Chtel bych se zeptat, zda existuje nejake jednodussi (elegantnejsi) 
> reseni nez prepsat celou kodovaci tabulku necim takovym:
> ...
> line = string.replace (line, "\342\200\224", "--")

line = unicode(line, 'utf-8')
line = unicodedata.normalize('NFKD', line)
output = ''
for c in line:
    if not unicodedata.combining(c):
        output += c

pripadny prepis s pouzitim list comprehensions necham za domacu ulohu
:-)


-- 
 -----------------------------------------------------------
| Radovan Garabík http://kassiopeia.juls.savba.sk/~garabik/ |
| __..--^^^--..__    garabik @ kassiopeia.juls.savba.sk     |
 -----------------------------------------------------------
Antivirus alert: file .signature infected by signature virus.
Hi! I'm a signature virus! Copy me into your signature file to help me spread!



Další informace o konferenci Python