[python] table querying

Petr Messner petr.messner na gmail.com
Pondělí Březen 5 16:07:12 CET 2018


Pokud si CSV převedeš do JSONL, což je podle mě vhodnější formát pro data,
tak potom doporučuji utilitu jq, je to něco jako XPath pro JSON:
https://stedolan.github.io/jq/ A díky streamování můžeš i zpracovávat data,
která se ti nevejdou ani do paměti, a paralelizovat přes všechna CPU (nebo
si CPU vypůjčit z cloudu), kdyby náhodou někdy bylo potřeba.

Dne 5. března 2018 16:02 Petr Messner <petr.messner na gmail.com> napsal(a):

> No, je na to jeden takový super jazyk - Python :)
>
> I když teda existuje jazyk, ve kterém se nějaké adhoc datové transformační
> pipelines dělají ještě lépe - Javascript. Škoda, že Python list nemá metodu
> map, musí se to dělat minimálně přes list comprehensions, což je sice
> obecnější, ale o něco pomaleji se to píše.
>
> Pro old-schoolery potom grep, sed a awk.
>
>
> Dne 5. března 2018 14:31 Vláďa Macek <macek na sandbox.cz> napsal(a):
>
> Zdar,
>>
>> mějme tabulková data načtená třeba z CSV nebo Google Tabulku. Víte o
>> elegantním nástroji (modulu) pro Python implementujícím jednoduchý
>> dotazovací jazyk?
>>
>> Jako "dej mi všechny řádky, které mají ve sloupci B hodnotu V (příp.
>> regexp), ve sloupci C nemají hodnoty V1 ani V2" atd.
>>
>> Jde mi o etablovanou věc. Ne něco spíchnutého pro vlastní potřebu a hrdě
>> zveřejněného, aby si autor otestoval psaní setup.py. :-)
>>
>> Díky,
>>
>> V.
>>
>>
>> _______________________________________________
>> Python mailing list
>> python na py.cz
>> http://www.py.cz/mailman/listinfo/python
>>
>> Visit: http://www.py.cz
>>
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <http://www.py.cz/pipermail/python/attachments/20180305/b76e7ad0/attachment.html>


Další informace o konferenci Python