[python] [:lower:] apod.?

Alexandr Rosen alexandr.rosen na ff.cuni.cz
Středa Leden 30 18:38:39 CET 2008


> re.sub(r'\n(%s)' % re_lower, r'\1', x)

Diky!

> re_lower = ur'[%s]' % string.lowercase.decode('cp1250')

Taky dik!

Ale jestli muzu, mel bych jeste dva dotazy:

1. Jak udelat, aby v tom re_lower byly vsecky lowercase znaky z
UTF-8? Tedy nejen ty z cp1250 nebo iso-8859-2, ale i iso-8859-1,
iso-8859-5 (cyrilice), rectina, to by mozna uz stacilo... Spojit ty
stringy a vyhodit duplicity? Nebo by to slo nejak jednodusejs?

2. Jak udelat, abych vstupni soubor v utf-8 nacet opravdu jako utf8 string?



Další informace o konferenci Python