Blog

Detekcija zajednica u Euroviziji

Tina Knezevic

Natjecanje za pjesmu Eurovizije vrlo je popularan događaj, kako unutar tako i izvan Europe, u kojem svaka zemlja sudionica šalje jednog predstavnika koji se potom natječe za pobjedu na Euroviziji. Glasački sustav se tijekom godina stalno mijenjao. Najopćenitije pravilo za glasanje je da postoje glasovi žirija i gledatelja iz svake zemlje i da zemlje ne mogu glasati za svoj nastup. Ranijih godina glasovi žirija i gledatelja bili su kombinirani i raspoređeni prema bodovnoj ljestvici (1-8, 10, 12 bodova). Od 2016. postoje dva skupa bodova, jedan od žirija, a drugi od gledatelja. To je učinjeno jer postoji uobičajena misao o glasovanju na Euroviziji, da “prijatelji daju prijateljima bodove”, a sama kvaliteta pjesme, izvedbe ili trud nisu toliko utjecajni na glasanje. Drugim riječima, ovdje je teza da zemlje koje dijele geopolitičke interese u prosjeku daju više bodova međusobno.

Stoga smo odlučili pogledati podatke i pomoću Neo4j graf baza podataka i integriranih algoritama za grafove i znanost o podacima vidjeti postoji li ikakva veza između zemalja i njihovog glasanja tako što smo dali algoritmu da odredi postoje li zajednice između njih.

Postavljanje podataka

Koristili smo tri skupa podataka, glasanje 1975-2015, telefonski glasovi 2016-2019 i glasovi žirija 2016-2019. Svi skupovi podataka dostupni su ovdje.

Skupovi podataka sadrže:

– zemlja koja je dala bodove x

– zemlja koja je primila bodove y

– udio (svi bodovi koje je zemlja x dala zemlji y / najveći mogući broj bodova koji je zemlja x mogla dati zemlji y)

Uvezli smo podatke u Neo4j bazu korištenjem integriranih LOAD CSV funkcija.

Detekcija zajednica

Kako bismo vidjeli postoji li veza između zemalja i njihovog glasanja, koristili smo algoritam za detekciju zajednica [1]. Algoritmi za detekciju zajednica koriste se za procjenu načina na koji su grupe čvorova grupirane ili particionirane, kao i njihovu sklonost jačanju ili razdvajanju.U ovom slučaju koristili smo Louvain algoritam uključen u Neo4j GDS biblioteku [2]. Louvain je algoritam koji je podijeljen u dvije ponavljajuće faze: optimizaciju modularnosti i združivanje zajednice. U prvoj fazi optimizira se modularnost dopuštajući samo lokalne promjene zajednica, a u drugoj fazi se pronađene zajednice agregiraju kako bi se izgradila nova mreža zajednica [3].

Nakon što smo implementirali Louvain algoritam na skupovima podataka dobili smo rezultate prikazane u nastavku. (Slika prikazuje vizualizaciju rezultata u skupu podataka 1975.-2015.)

Rezultati
Glasanje: 1975-2015 – Potkategorije iz međukoraka algoritma

Kako bismo bolje razumjeli rezultate, mapirali smo ih na kartu Europe. Kako Louvain algoritam ima više prolaza, Neo4j nam omogućuje da vidimo sve rezultate međukoraka ili zajednica koje su izračunate prije završnog koraka (kao što je prikazano na sljedećoj slici za skup podataka 1975.-2015.).

Glasanje: 1975-2015 – Završni rezultati

Završna faza algoritma sadrži maksimalno moguće grupirane zajednice. Nakon završne faze rezultat pokazuje da su do 2016. glasovi bili podijeljeni samo između tri skupine (istočna Europa, zapadna Europa i većina zemalja bivše Jugoslavije), iako je prethodni korak pokazao da postoji više grupa i da je moguće podijeliti istočnu i zapadnu Europu u tri manje podskupine.

Glasanje: 2016-2019 – Glasanje gledatelja i žirija

Ako prikažemo samo konačne rezultate za skupove podataka nakon 2015. godine, vidimo veću podjelu u glasanju gledatelja nego prije podjele glasova. Primjećujemo da su glasovi gledatelja uglavnom pod utjecajem geopolitičkih odnosa te da postoje 4 jake zajednice (sjeverna Europa, zemlje pretežno romanskih govornih jezika, većina zemalja bivše Jugoslavije i Austro-Ugarske te istočna Europa s pretežno slavenskim i euroazijskim zemljama).

Glasanje: 2016-2019 – Glasanje gledatelja
Glasanje: 2016-2019 – Glasanje žirija
Zaključak

Dakle, je li teza potvrđena? Podaci kažu da! Kao što je vidljivo iz rezultirajućih slika (karata Europe), postoji jaka indikacija da se zemlje koje su bliže geografski isto tako drže blizu pri davanju glasova, pogotovo u glasanju gledatelja.

Ako imate bilo kakvih pitanja oko tehničke implementacije ovog projekta, možete kontaktirati Tinu Knežević (mail, LinkedIn). Ako imate bilo kakvih pitanja oko znanosti o podacima ili želite raspravljati o Euroviziji, slobodno se obratite Domagoju Mariću (mail, LinkedIn).

Reference

[1] Neo4j docs, https://neo4j.com/docs/graph-data-science/current/algorithms/community/ (3/11/2021)

[2] Neo4j docs, https://neo4j.com/docs/graph-data-science/current/installation/ (3/11/2021)

[3] V. D. Blondel, J.-L. Guillaume, R. Lambiotte and E. Lefebvre, “Fast unfolding of communities in large networks,” J. Stat. Mech. (2008) P10008, p. 12, 2008.