Unicode znaky
Dotaz
Jak řešíte když v programu potřebujete nějaké speciální znaky jako řeckou abecedu či znak pro nekonečno?
Odpověď
Musí se používat unicode řetězce. Ty se dají i v ascii zdrojáku zapsat pomocí náhradní sekvence. Před uvozovky nebo apostrofy se ale musí uvést malé u. Takže nekonečno se zapíše takto:
s = u'\u221e'
Přehled unicode znaků
Výstup na obrazovku
Pro zobrazování se musí použít GUI okénko, který umí zobrazovat Unicode. Pro vyzkoušení můžeš použít IDLE:
# -*- coding: utf-8 -*- s = u'Příšerně žluťoučký kůň úpěl ďábelské ódy až do \u221e' print s
Výstup do souboru
Pro zápis do souboru se musí konvertovat do správného kódování. Zkus tohle:
# -*- coding: utf-8 -*-
prolog = u'''<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>Pokus s Unicode</title>
</head>
'''
epilog = u'</html>'
s = u'Příšerně žluťoučký kůň úpěl ďábelské ódy až do \u221e'
f = open('pokus.html', 'w')
f.write(prolog.encode('utf-8'))
f.write(s.encode('utf-8'))
f.write(epilog.encode('utf-8'))
f.close()
Zdrojový soubor se musí uložit přes editor, který to umí uložit v kódování UTF-8.
Nebo změň první řádek ve zdrojáku na kódování, které umí zachytit češtinu a ulož to v tom kódování -- například pod Windows v kódování windows-1250 (v Pythonu cp1250):
# -*- coding: cp1250 -*-
prolog = u'''<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>Pokus s Unicode</title>
</head>
'''
epilog = u'</html>'
s = u'Příšerně žluťoučký kůň úpěl ďábelské ódy až do \u221e'
f = open('pokus.html', 'w')
f.write(prolog.encode('utf-8'))
f.write(s.encode('utf-8'))
f.write(epilog.encode('utf-8'))
f.close()
V obou případech to vygeneruje stejný soubor pokus.html. Prohlížeč by s nekonečnem neměl mít problém.