[python] detektor znakove sady

Martin Blazik martin.blazik na premiumsms.cz
Středa Srpen 1 16:35:20 CEST 2007


Ahoj,
hledam knihovnu, ktera by dokazala rozpoznat kodovani retezce. Podarilo 
se mi najit akorat
http://chardet.feedparser.org/
ale to na muj vkus nevykazuje dostatecne vysledky:

# psano v konozli v ISO-8859-2
 >>> s = 'příąerně ľlu»oučký kůň úpěl ďábelské ódy PŘÍ©ERĚ ®LU«OUČKÝ KŮŇ 
ÚPĚL ĎÁBELSKÉ ÓDY'
 >>> chardet.detect(s)
{'confidence': 0.40226801246065391, 'encoding': 'ISO-8859-8'}


Nemate nekdo nejaky tip?

lachtan



Daląí informace o konferenci Python