Mikä maa voittaa jalkapallon MM-kisat analytiikan perusteella?

Suomalainen analytiikkaosaaja Avarea menestyi maailman suurimman analytiikkatalon SASin pohjoismaisessa hackathonissa luomalla ratkaisun, joka ennakoi jalkapallon maailmanmestaruuskisojen voittajan hyödyntämällä dataa useista eri lähteistä. Arvion mukaan kohta käynnistyvissä kisoissa voittoa ei juhlisi ainakaan yksikään Pohjoismaista.

Maailman suosituimman urheilutapahtuman mestarin tittelistä kamppailee 32 joukkuetta. Vaikka vain 732 pelaajalla on suora vaikutus turnauksen lopputulokseen, miljardit ihmiset jakavat netissä mielipiteitään voittajasta. Lisäksi ammattipelaajien menestyksestä kansallisissa ja kansainvälisissä liigoissa löytyy runsaasti avointa tietoa.

”Halusimme tehdä jotakin hauskaa yhdistämällä tietoja useista eri lähteistä ja päädyimme jalkapallon MM-kisojen voittajan ennakointiin. Otimme ennustuksemme lähtökohdaksi pelaajat. Joukkuevalintoja ei ollut tehty projektimme alkaessa, joten meidän täytyi ennustaa myös joukkueisiin valittavat pelaajat”, kertoo Avarea Oy:n liikkeenjohdon konsultti ja yksi Hack in SAS Viya -kilpailun tiimin jäsenistä, Thomas Lauronen.

Joukkueiden menestystä ennustettaessa käytetään usein lähtökohtana niiden aikaisempia pelisuorituksia. Tämä ei kuitenkaan ole riittävän luotettava tapa ennustaa seuraavan kohtaamisen lopputulosta.

”Osa maailmanmestaruuskilpailussa toisensa kohtaavista joukkueista ei ole koskaan ennen pelannut vastakkain. MM-kilpailujen konkarit Saksa ja Englanti ovat pelanneet vastatusten 32 kertaa 1930-luvun jälkeen. Sopiikin kysyä, ovatko aiempien pelien tulokset päteviä tämän vuoden tilanteen ennustamisessa”, miettii Lauronen.

Ennuste perustuu pelaajien ominaisuuksiin ja tuloksiin

Avarean tiimin ennustusmenetelmä pohjautuu eri maiden tunnettuja pelaajia koskeviin tietoihin. Apuna käytettiin niin jalkapalloliigojen tietoja kuin pelaajatilastojakin.

Koska ennusteen tekohetkellä ei ollut vielä tiedossa, ketkä maajoukkueissa pelaavat, piti Avarean tiimin myös ennustaa todennäköisin joukkueen kokoonpano. Ennusteessa hyödynnettiin pelaajatilastoja 12:n viime kuukauden ajalta ystävyys- ja karsintaotteluista.

”Loimme menetelmän, jossa avainkriteereinä olivat pelaajien kansallisuudet, lukuisat pelaajien ominaisuudet, valittujen pelaajien suhde liigojen ottelutuloksiin ja tiedot pelaajasiirroista 12:n viime kuukauden aikana. Onnistuimme muodostamaan melko hyvän mallin, jolla voi tarkastella joukkueita ja niiden jäsenten ominaisuuksia, kuten loukkaantumisalttiutta, lukuisista eri näkökulmista”, Lauronen sanoo.

Kotikenttäetu eliminoitiin mallista teknisesti. Jokainen peli pelattiin kaksi kertaa siten, että joukkue oli sekä koti- että vierasjoukkueena. Joukkueen maantieteellistä etäisyyttä pelipaikasta mallissa ei otettu huomioon.

10 000 koepeliä ja voittaja on selvillä

Voittajan selvittämiseksi vuoden 2018 maailmanmestaruuskilpailu pelattiin virtuaalisesti läpi 10 000 kertaa – puhtaasti hypoteettisissa pudotuspeleissä ei tapahtunut yhtäkään pelaajan loukkaantumista tai kannattajien tappelua.

Tulosten pohjalta Avarea ennustaa, että Espanjalla on suurin eli 19,53 prosentin mahdollisuus mestaruuteen. Toiseksi parhaat mahdollisuudet on Saksalla.

Pohjoismaiset joukkueet jäävät ennusteen mukaan kauas mitalitaistosta. Tanska pärjää Pohjoismaista parhaiten vaivaisella 0,41 prosentin voittomahdollisuudella, kun Ruotsin menestys jää 0,07 prosenttiin. Islannin mahdollisuus voittoon on nolla prosenttia.

Kun tarkastelee vedonlyöntisivustoja, voi havaita, että Avarean tekemä ennustus on linjassa vetojen kanssa.

”Ennustettavuus on monen tekijän summa. Me vertasimme 10 000 mestaruustaistoa. Oikea ottelu pelataan kuitenkin vain kerran, joten tv:n äärelle tai pelipaikalle kannattaa edelleen suunnata”, lupaa Lauronen.

Katso videoesittely ja tutustu Avarean tiimiin: https://www.sas.com/sas/events/nordic/nordic-hack-in-sas-viya/partners/avarea.html

Haaste: Luoda menetelmä, jolla ennustetaan eri maiden voittomahdollisuudet jalkapallon vuoden 2018 maailmanmestaruuskilpailuissa.
Ratkaisu: SAS in Viyassa kehitetty menetelmä, joka hyödyntää useita tietolähteitä kuten ottelutuloksia, sosiaalisen median kommentteja sekä pelaajatilastoja FIFA Football Managerin kaltaisista peleistä.
Lopputulos: Menetelmä,joka ennustaa jokaisen MM-kisoihin osallistuvan maan voittomahdollisuuden prosenteissa.