[python] hash objektu, kontrola aktuálnosti dat v databázi

Martin Stiborský martin.stiborsky na gmail.com
Pondělí Červen 20 11:42:33 CEST 2011


Ahoj,
díky za moc zajímavé myšlenky.
K tomu co parsuju, jde o jídelníčky denní menu různých restaurací.
Každá restaurace publikuje denní obědové menu jinak, někteří v
neděli/pondělí vyvěsí kompletní menu pro celý týden, někteří jen pro
následující den, je to různé. Ať už to dělá každý jinak, vždycky můžou
menu pro následující/kterýkoli den změnit, což je pro mě problém,
pokud jsem si k sobě už uložil starou verzi, proto chci peridicky
kontrolovat jaký je stav.

Pro každou restauraci mám samostatný modul, kde je link na jídelníček
a metoda která umí z html vytahat data, která mě zajímají ( a další
obslužné metody).
Každé jídlo se uloží do objektu databázového modelu (je to celé
postavené na djangu) a zatím mám zapracovanou myšlenku hashe, tedy
onen objekt má popis jídla, cenu, gramáž, atd. Z tohoto se vytvoří
hash který se tam taky uloží. Při dalším checku se opět zparsuje, opět
se nasekají objekty a spočítají hashe, ale jestli se bude ten jeden
aktuální objekt updatovat nebo ne závisí na tom, jestli se hash změnil
nebo ne. Pokud je popis jídla, cena, nebo cokoli jiné, bude i hash
jiný a objekt se přepíše.

Na HTTP hlavičky jsem nepomyslel a je to dobrý nápad, díky za to,
vyzkouším, rozhodně se mi to líbí.

Chci do databáze zapisovat co nejmíň, celé to běží na Google App
engine, jsou tam různé kvóty na čtení/zápis z databáze a i když
nečekám nějaký obrovský provoz, chci to napsat slušně :)



-- 
S pozdravem
Martin Stiborský

Jabber: stibi na njs.netlab.cz


Další informace o konferenci Python