Pomocí modulu urllib
import urllib
fp = urllib.urlopen('http://www.py.cz')
data = fp.read()
fp.close()
# tisk a ulozeni
print data
s=file('pycz.html','w')
s.write(data)
s.close()
Pomocí modulu httplib
import httplib, os
www="www.py.cz"
souborNet="/HelpPage"
# stazeni z Netu
spojeni = httplib.HTTPConnection(www)
spojeni.request("GET", souborNet)
odpoved = spojeni.getresponse()
print "Odpoved od www: ", odpoved.status, odpoved.reason
data = odpoved.read() # do promenne data nacti cely soubor
spojeni.close()
# tisk a ulozeni
print data
souborLocal='HelpPage.html'
f=file(souborLocal,'w') # otevri soubor f pro BINARNI zapis
f.write(data)
f.close()
print "Soubor", souborLocal, "ulozen do", os.getcwd()
Více stránek pomocí httplib
Ukázka programu, který stáhne celou sérii článků z Programator.cz a uloží ji jako 1.html, 2.html atd. (úprava předchozího příkladu):
import httplib, os
www="casopis.programator.cz"
souborNetStart="/r-art.php?clanek="
spojeni = httplib.HTTPConnection(www)
for x in range(1,177):
# stazeni z Netu
souborNet = souborNetStart + str(x)
spojeni.request("GET", souborNet)
odpoved = spojeni.getresponse()
print "Odpoved od www: ", odpoved.status, odpoved.reason
data = odpoved.read() # do promenne data nacti cely soubor
# ulozeni na local
souborLocal= str(x) + ".html"
f=file(souborLocal,'w') # otevri soubor f pro zapis
f.write(data)
f.close()
print "Soubor", souborLocal, "ulozen do", os.getcwd()
spojeni.close()
print "Vse stazeno!!!"