Jak moc píšou jednotlivá média o našich politicích?

Média mají být hlídacím psem demokracie. Jsou toho však schopny, když je vlastní politici a oligarchové? Nevím. Myslím ale, že dokážeme vytvořit nástroje, které nám o médiích řeknou tvrdá data, na základě kterých dokážeme roli médií posoudit.

Posledních pár měsíců sleduji vybraná online média. Pokud se v nich objeví vybraná klíčová slova, udělám si čárku. Za každý týden pak spočítám, kolik článků médium vydalo a podílem pak dostanu číslo, kolik procent prostoru médium danému slovu věnovalo. Takhle třeba vypadá kauza biopaliv.

jak moc se píše o biopalivech?

jak moc se píše o biopalivech?

Je rozhodně předčasné říkat, například, že iDnes vlastněné Babišem píše o biopalivech méně, protože jde o nepříjemné téma pro jejich vlasníka. Chtěl bych ale podobné diskuze otvírat nad tvrdými daty, ne spekulovat. Potřebujeme víc dat, důkladnější vizualizace a nezávislého interpreta. Myslím, že toto je správný směr, kterým by se mohla nezávislá (datová) žurnalistika vydat.

Pojďme se podívat na dvě často skloňovaná jména.

Parlamentní listy se věnují jménu Babiš opravdu důkladně.

Parlamentní listy se věnují jménu Babiš opravdu důkladně.

 

Jméno Sobotka je zas poměrně utlumento na Novinkách

Jméno Sobotka je zas poměrně utlumento na Novinkách. Parlamentí listy tentorkát dotahuje Deník.cz

Co ty grafy znamenají?

Nebudu je interpretovat, ze dvou důvodů.

  1. Výsledky zatím nejsou kompletní. Aby byly data opravdu zajímavá  bude potřeba udělat pár analýz, napříkad.:
    • díky latentní sémantické analýze bude možné hledat nejen jedno konkrétní slovo, ale například volně formulovaný název kauzy, podobně jak to dělá např Google nebo Seznam když hledáte na webu
    • je možné integrovat tzv. „anaýzu sentimentu“, pomocí které pak algoritmus umí u vybraných slov odhadnout míru „naladění“ kontextu, do kterého je pojem zasazen. V neutrálním zpravodajství to sice moc fungovat nebude, ale na publicistických textech ano. Umět si odpovědět na to, jak „pozitivně“ píše iDnes o Agrofertu by bylo cool, ne?
    • Servery jako „Zvědavec“ nebo „Free Globe“ nejsou v grafech náhodou. Prý píšou  propagandu. Díky stylometrii můžeme odhalit, jaké texty píšou stejní lidi, kteří z nich nejsou rodilí mluvčí, nebo se naučit odhalovat výrazy typické pro propagandu. Nejen podle známých pravidel jako používání jmen, ale automaticky pomocí naučených neuronových sítí.
  2. Nejsem novinář, není to moje práce. Nesleduji krátkodobé kauzy. Můžu však říct, že jsem se hodně snažil, aby data odpovídala skutečnosti. A myslím, že jsou. Pokud vše půjde dobře, rád v budoucnu zveřejním výsledky i algoritmus, který data počítá (koneckonců, není na tom nic složitého).

Ćlánky jsem původně začal sledovat proto, abych se přesvědčil, že média velice často vydávají zpravodajství, které je doslovně shodné s tím, co vydává jejich konkurence. A pokud ano, kdo s textem přišel dřív. Je to text z četky, tiskovky nebo jej od sebe opsali? Úvahy, metodiku (a některé závěry) na toto téma budu prezentovat na konferenci  International Conference Plagiarism across Europe and Beyond 2015  v půlce června v Brně. příspěvek se jmenuje Results of similarity analysis of online news in Czech republicTeď však vidím sílu v nezávislém monitoringu „nezávislých“ médií, proto další vývoj neveřejného analytického systému zaměřuji hlavně tímto směrem.

Koukněte ještě na mediální povolební analýzy :).

 

 

 

2 komentáře to “Jak moc píšou jednotlivá média o našich politicích?”

  1. Orwen napsal:

    Kousek z kvalitní diskuze o nezávislosti českých médií http://respekt.ihned.cz/komentar/c1-63915960-konec-nezavislych-medii