Plody data hackathonu

Říjen 19, 2014 · Posted in IT, reportáže · Comment 

Jak jsem psal předevčírem, na hackathonu bylo spoustu výzev. Stručně rekapituluji ty, na jejichž řešení jsem se podílel.


Ještě v pátek jsem se pustil zprovoznění API na službu Semantria. Prý že uděláme analýzu textů pro 1188. Semantria sice nepodporuje češtinu, ale to prý nevadí „proženeme to translatorem“ říkali týmoví kolegové. Fajn.

Výběr_004

Co vám vrátí Semantria na text: „In Lake Louise – a guided walk for the family with Great Divide Nature Tours rent a canoe on Lake Louise or Moraine Lake go for a hike to the Lake Agnes Tea House. In between Lake Louise and Banff – visit Marble Canyon or Johnson Canyon or both for family friendly short walks. In Banff a picnic at Johnson Lake rent a boat at Lake Minnewanka hike up Tunnel Mountain walk to the Bow Falls and the Fairmont Banff Springs Hotel visit the Banff Park Museum. The ‚must-do‘ in Banff is a visit to the Banff Gondola and some time spent on Banff Avenue – think candy shops and ice cream.“

Semantrii jsem rozchodil, ukázalo se však že 1188 žádná textová data nemá (chyba!). Využil jsem aspoň nástroj k analýze sentimentu (nálady, celkového vyznění, „pozitivnosti“) k analýze interních chatů botanik vs. zákazník ve FlowerChecker. Koukal jsem, jestli sentiment chatu neovlivní neovlivní věrnost klienta, nebo zda někteří botanici nevyvolávají dusno ;). Ale o tom jindy.

Po noci z pátku na sobotu mě přešla chuť na klikací nástroje a strukturovaná data, zapojil jsem se tedy do Energomonitoru. Ti měli jediný dataset — hodnoty spotřeby elektřiny v čase u několika bytů/domů. Rozhodl jsem se vizualizovat charakteristiku spotřeby. Podívejte se na graf průběhu. Peaky jsou časy, kdy běžel nějaký spotřebič se specifickou spotřebou. Takový tvar má dva relevantní parametry — výšku (příkon) a délku (trvání zapnutí).

Výběr_002

Modrá čára je okamžitá spotřeba měřená v devadesátivteřinových intervalech.

Asi už jsou na detekci přechodových funkcí různé vytuněné nástroje, které si poradí s šumém lépe než moje narychlo spíchnuté řešení , víceméně však fungovalo. Zelená křivka znázorňuje detekované tvary. Vlastně tak čistím signál od šumu.

Víc jsem si vyhrál s vizualizací charakteristiky. Je jí dvourozměrná heatmapa na zmíněných rozměrech výška (příkon) a délka (trvání zapnutí). Trochu jsem doufal, že se mi na ní objeví („vyklastrují“) skvrny znázorňující jednotlivé spotřebiče.

Výběr_003

Srovnání výsledné charakteristiky obyčejného bytu a rodinného domku s kotlem.

Něco tam vidět je. Útvar na pravém obrázku je nejspíš způsobený spotřebičem o vysokém příkonu, který spíná na dlouhou dobu. Byt má na horizontální ose podobnou kumulaci v daném příkonu, ale jev v krátkých intervalech (rychlovarná konvice?).

Charakteristkiku jiného bytu jsem zas rozanimoval cca po měsících.

bzn-1.csvKdyž se ve čtyři hodiny ráno pozorně a dlouze do vizualizace zadíváte, objeví se vám před očima příběh rodiny, která tam bydlí. Kdy si koupili novou pračku, jak přestává těsnit lednička, nebo jak jim v zimě vypadlo plynové topení a musel chvíli používat přímotop.

Jinak tu byla ještě hromada přednášek a plno možností si šáhnout na věci typu Azure ML, BigML apod. GoodData tu třeba poskytla celou svoji platformu na hraní.

Hrozně rád bych tu popsal jaký to je poslouchat přednášky bez bullshitů, zabřednout s Patrikem Zandlem do rozhovoru o energetice, nebo analytikům z IBM ve tři hodiny ráno povídat po šestém cideru o Žít Brno, ve čtyři se s nimi ještě zvednout a jít dodělat histogramy. Neumím to však tak pěkně vizualizovat.

Zajímavé datasety z Enterprise Data Hackathon

Říjen 17, 2014 · Posted in Nezařazené · Comment 

Poslední dobou se u mě kumulují dotazy co je vlastně náplní práce datového analytika. S si při odpovědi beru do úst svoji práci ve FlowerChecker, kde mám na starost strategická rozhodnutí (do čeho investovat čas a peníze). Jako podklady pak programuji různé transformace dat do grafů a tabulek o které se můžu opřít.

Teď však sedím ve vlaku po cestě na Enterprise Data Hackathon a koukám do karet jiným firmám,. Co teda řeší ostatní?

>> Celý článek

International Conference Plagiarism across Europe and Beyond 2015

Říjen 7, 2014 · Posted in PEF & Mendelu, plagiarism · Comment 

Mendel University in Brno is inviting you to an international conference

Plagiarism accross Europe and Beyond
10th – 12th June 2015
http://plagiarism.cz/

>> Celý článek

Na PEF Mendelu proběhlo během čtvrt roku 37 disciplinárních řízení

Červen 4, 2014 · Posted in PEF & Mendelu, plagiarism · Comment 

Opisování u zkoušek, taháky, kopírování seminárních prací. Za doby mého studia odcházel přistižený student většinou s Fkem. Učitelé však musí nově každé podezření na přestupek hlásit disciplinární komisi, která pak studenta studenta napomene či (podmínečně) vyloučí. Na každý týden provozu školy řeší hned tři případy. Nakouknul jsem do zápisu.

>> Celý článek

Poděkování

Květen 9, 2014 · Posted in flowerchecker, osobní · 1 Comment 

Kromě nás tří (já, Ondra a Thran), kteří na FlowerCheckeru pracujeme kdy se dá stojí za projektem ještě spoustu našich kamarádů, kteří nám nějakým způsobem pomáhají. Rád bych proto poděkoval

  • Honzovi za hromadu metodických rad ke strategii, řízení a všem PR, HR a business věcem
  • Brisovi a Simče za překlady do němčiny a francouzštiny
  • Kačí za za pokrytí interní webovky automatizovanými testy
  • Jonášovi za to, že nám bude pomáhat s backendem (ale ještě to neví)
  • Samovi a Martinovi za pomoc se zapojením studentů, což nám umožňuje vést experiment zaměřující se na detailní analýzu motivace našich botaniků a studium jejich zlepšování
  • Všem botanikům, kteří se na určování kytek podílí
  • Všem betatesterům z naší interní skuiny na Google Plus
  • Mým studemtům předmětu Inovace pro informatiky, že nás zahrnuli (validovanými) nápady kam s projektem dál pivotovat

Díky. Když se tak koukám na tu spustu práce, asi by to bez vás nešlo.

Nekomerční přesahy aplikace FlowerChecker

Duben 23, 2014 · Posted in flowerchecker, úvahy · Comment 

Uvědomil jsem si, že nás v týmu FlowerChekeru motivují především morálně vznešené ( = naivní) ideály a vize. Málo to však dáváme najevo, pak to vypadá pak že jsme obyčejná komerční struktura, které jde jen o to najít libovolnou díru na trhu. Opak je však pravdou. Takže o co nám vlastně jde?

Nejčastěji určované kytky

Nejčastěji určované kytky

>> Celý článek

Kdy vypnout autocommit?

Březen 4, 2014 · Posted in IT · Comment 

Ukázkový příklad kdy není efektivní provádět commit hned po spuštění SQL příkazu. Normálně bych to sem nepsal, ale když občas vidím, čeho jsou schopní studenti databází… nedělám si iluze.

>> Celý článek

Povedu vám diplomku, ale…

Únor 25, 2014 · Posted in PEF & Mendelu, úvahy · Comment 

V posledních měsících za mnou chodí čím dál víc studentů na konzultace ke svým projektům a diplomkám. Někteří chtějí poradit třeba s Twitter Streaming API, jiní si přímo říkají o data z některého z mých projektů. To je super! Mám radost, že si pro své závěrečné a semestrální práce nevybírají něco zajímavého :).

Ve své dávné kritice PEFky jsem zapomněl uvést důležitý bod. Slovy jedné ze studentek v komentářích — „neustálé problémy se sháněním vedoucích závěrečných prací„. Ústav statistiky měl dokonce na dveřích velkou explicitní ceduli. V systému bylo asi něco špatně.

Do doktorského studia jsem však nastoupil rozhodnutý žádnou práci nevést. Proč bych taky měl? Škola (ani student) mi za to nic nedá. Moc rád pomůžu ostatním s jejich projekty… kdybych neměl svoje vlastní, kterým se chci věnovat víc. Proč teda diplomky vůbec vedou ostatní?

>> Celý článek

Další stránka »

V sekci kontakty naleznete kontakty pro kontaktovani