Tallinna Kalevi duubelnaiskonna peatreener Kätlin Hein on juba aastaid päevatööl tegelenud programmeerimisega. Et oma elus kaks suurt suunda ühendada, veetis ta sel talvel mitu kuud Barcelonas spordianalüütikat tudeerides.
„Olin varemgi Barcelona Innovation Hubi kaudu treenerite koolitusi vaadanud, aga seekord leidsin sealt ühe kursuse, mis toimus kohapeal. Spordianalüütika ehk andmeteadus spordis tähendab nii statistikat kui masinõpet ja on väga tehniline asi, aga läheb minu profiiliga hästi kokku. Olen varemgi mõelnud, et minu huvid võiksid ühel hetkel ristuda, ja leidsingi lõpuks selleks õige koolituse,“ räägib Hein Jalkale.
Kursust viisid ühiselt läbi Kataloonia tehnikaülikool (UPC) ja FC Barcelona, mis tähendas, et kuigi Hein ei olnud päris klubi juures, sai ta siiski klubis töötavate inimestega suhelda ja sealset elu tundma õppida. Kursus toimus küll õhtuõppe vormis, ent sellest hoolimata tuli Heinal viieks kuuks Katalooniasse kolida ning päevatööd distantsilt teha. Kokkuvõttes oli kõik aga ohverdusi väärt: eestlanna sai lähedalt näha, millisel tasemel Euroopa tippklubis spordianalüütikaga tegeletakse ja millises suunas see maailm liigub.
Käik on seda märgilisem, et Eesti klubide juures spordianalüütika osakonnad sisuliselt puuduvad, kuigi esimesed sammud selles vallas on tehtud: kes ei oleks siis tähele pannud, et tippklubide pallurid treenivad ja mängivad rinnahoidjat meenutava vestiga, mis nende liikumist, südametööd ja muud vajalikku jälgivad. Kuigi sarnaseid süsteeme kasutavad ka tipptiimid, on see nendele vaid üks osa vahenditest, mida analüütikaga tegelevad inimesed kasutada saavad.
„FC Barcelonas on näiteks kuueliikmeline spordianalüütika osakond, kus tüübid istuvadki ainult arvuti taga. Kui treener ütleb, et tahaks teada, miks on mingisuguses mängusituatsioonis meil liinide vahed liiga suured või liiga väikesed, siis nemad ei vaata seda mitte video pealt, vaid toimetavad ainult andmetega,“ selgitab Hein. „Igal mängul on üleval spetsiaalsed kaamerad, mille pealt saavad nad sekundis 25 korda andmed selle kohta, kus asub iga mängija ja kus asub pall. Seejärel kirjutavad nad oma koodi valmis, panevad selle andmete peal jooksma ja toovad välja, et selles olukorras juhtus nii, selles teises olukorras aga naa. Selle pealt saavad nad indikatsiooni: ahaa, vaatame videost järele, mis sel hetkel tegelikult väljaku peal toimus – sealt edasi läheb töö juba videoanalüütikule.“
Heina sõnul on see lihtsalt üks näide paljudest. „Kui veel kaugemalt alustada, siis võib spordianalüütika olla see, mis toimub platsi peal, näiteks taktikaline analüüs või füüsilise võimekuse analüüs, aga teine pool, mida spordianalüütikud saavad analüüsida, on see, milliseid mängijaid on mõistlik võistkonda tuua, sest ka seal on väga suur numbrimaailm. Meie keskendusime kursusel aga just sellele poolele, mis toimub platsi peal.“
Heina enda läbi viidud projekt käsitles kursusel just mängijate füüsilisi andmeid ja nende võimalikult lihtsal ja söödaval kujul presenteerimist. „Sellesama Eestiski kasutatava vesti või anduri pealt on võimalik kätte saada palju andmeid – liikumisega seotud andmed (näiteks distants, kiirus, kiirendus, kokkupõrgete arv) on nii-öelda väline koormus. Samal ajal on olemas ka sisemine koormus – see võib olla pulss või ka kui raskeks mängija ise treeningut või mängu peab ning seda küsitakse lihtsalt mängijalt pingutuse järel (RPE). Lihtsustatult öeldes tegime paaristööna mudeli, mis taandab kõik paarsada välise koormuse parameetrit üheks numbriks, mis eeldab, milline võiks nende pealt välja näha sisemine koormus, ja paneb selle visuaalsele skaalale.“
Kui kaks arvu jäävad skaalal samasse kanti, on mängija koormust talunud oodatult. Kui sisemine koormus on aga oluliselt suurem kui väline, viitab see suurenenud vigastusohule, haigusele või muule probleemile, vastupidine signaal aga vihjab sellele, et selle mängija koormust võiks suurendada. „Ühes teadustöös oli selline teoreetiline raamistik mängijate koormuse jälgimiseks välja pakutud. Üks FC Barcelona sporditeadur tahtis väga, et tema andmetega saaks ka sellist võrdust korraldada, ning aitasime seda teha. Ta jäi väga rahule!“ naeratab Hein.
Nagu mainitud, on Eestis jalgpalli kohta kätte saadavad andmed ja tippmängus kätte saadavad andmed aga sisuliselt kui Maa ja kosmos. Andurid annavad Eesti tiimidele võimaluse oma mängijaid monitoorida, aga kuna andmeid ei saada kätte näiteks palli ja vastasmängijate kohta, on taktikalise poole analüüsimine nende põhjal väga piiratud. Tippmängude kohta, kus kaamerad ja andurid kaardistavad pidevalt kõike väljakul toimuvat, saab luua aga keerukaid ja põnevaid tabeleid, graafikuid ja analüüse. Hein toob näiteks välja ühe mudeli, mis jagab väljaku väikesteks tsoonideks, ning näitab lihtsa värvikoodi abil ära, kumb võistkond mis ala valitses.
Jalgpallis pikk maa minna
Spordianalüütikast rääkides või selle vastu huvi tundes on hea stardipunkt tõestisündinud lool põhinev Bennett Milleri 2011. aasta mängufilm „Moneyball“ („Edu valem“), mis selgitab, kuidas Oakland Athleticsi tiim 20 aastat tagasi MLB pesapalliliigas hoolimata minimaalsest eelarvest uudse lähenemise ja spordianalüütika julge kaasamisega edu saavutas. Võrdlemisi lihtsakoelise dünaamikaga pesapall ongi moodsas spordianalüütikas olnud teerajajaks.
Väga olulisel kohal on analüütika ka näiteks NBA korvpalliliigas, kus viimase paarikümne aastaga on mängu olemus selle toel oluliselt muutunud: korvpallimängudes on minimaalseks jäänud keskpositsioonivisked ehk kauged kahepunktivisked, mis on asendatud enamate kolmepunktivisetega. Põhjus on lihtne: nende visete tabavusprotsent on analoogne, ent kolmese kaare tagant tehtud sops annab ühe punkti rohkem. Tänapäeval mängides viskaks näiteks Michael Jordan kolmepunktiviskeid ilmselt tunduvalt rohkem.
Spordianalüütika osas on jalgpalli puhul aga selliseid muudatusi sisse viia märgatavalt keerulisem, sest esiteks on igas valemis muutujaid väga palju, teiseks on mängu iseloom näiteks pesapalli ja korvpalliga võrreldes palju ebakorrapärasem. Pesapallikohtumine koosneb piltlikult öeldes portsust individuaalsetest sooritustest, igas korvpallimängus on aga märgatavalt rohkem lihtsasti mõõdetavat statistikat (punktid, pealevisked, lauapallid jne), mille põhjal mängijate ja meeskondade sooritust hinnata.
„Tippjalgpallis on tasapisi hakatud analüütikuid kuulama küll. Lugesin kuskilt, kuidas spordianalüütikud olid koos istunud ja jalgpalli vaadanud. Mängus oli keegi kaugelt peale löönud ja analüütikud olid omaette naernud: tõenäosus väravat saavutada on ju sellise löögiga niivõrd väike!“ muigab Hein. „Samas on jalgpallis nii palju variatiivsust. Numbreid ja arve ei saa võtta üks ühele, mistõttu ongi väga erinevaid viise, kuidas arve analüüsitakse.“
Kui pesapallis tuuakse teerajajana välja Oakland Athletics, siis jalgpallis on ühena esimestest väga analüütikapõhise käsitluse omaks võtnud Taani klubi Midtjylland ja Premier League’i klubi Brenford. Ei ole juhus, et mõlema klubi omanik on inglane Matthew Benham, endine pankur, kes teenis oma miljonid analüütikapõhise spordipanustajana ning lõi seejärel omaenda panustamisettevõtte.
Fännidele ja meediale on jalgpallis analüütilise poole pealt viimaste aastatega tuttavaks saanud xG ehk expected goals’i (eeldatavate väravate) mudel, mis arvutab iga sooritatud pealelöögi puhul löögi tüübi ja asukoha, lööja asendi ning kaitsjate-väravavahi paiknemise järgi tõenäosuse, et pall jõuab väravasse. Kohtumise jooksul liidetakse ühe võistkonna kogutud eeldatavad väravad ning mängu lõpus saab selle abil hinnata, kas lõpptulemus oli „õiglane“ ning kellel olid paremad võimalused. Meistrite liiga pöörases poolfinaali avakohtumises Manchester City ja Real Madridi vahel, mis lõppes City 4 : 3 võiduga, oli ühe xG mudeli põhjal mänguskoor näiteks 2,7 : 1,6 – see näitab, et City üheväravaline võit oli küll väravavõimaluste kvaliteedi mõttes aus tulemus, kuid mõlemad tiimid realiseerisid võimalusi keskmisest paremini, sest reaalne väravate arv ületas eeldatud väravate arvu.
FC Barcelona katsetab duubelmeeskonna ja naiskonnaga
Nii palju kui Hein FC Barcelona tegemisi lähedalt näha sai, kuulis ta, et spordianalüütikaga seotud projekte ja katsetusi ei viida läbi tihtipeale mitte esindusmeeskonna, vaid duubelmeeskonna ja esindusnaiskonnaga.
„Mulle räägiti, et kui nad üritavad mõnd uut asja arendada, siis on nii lihtsam, sest esindusmeeskonnal on peal tohutu tulemusesurve ja peatreeneril ei ole sageli aega selliste asjadega tegeleda. Analüütikutel tuleb üldse väga hästi läbi mõelda, mida ja kuidas oma andmetest treeneritele esitleda: arvutiinimesena tahaks võibolla väga kirjut pilti ja paljusid andmeid korraga näidata, aga treeneri mõtlemine on hoopis teistsugune. Ehk võiks see olla ka minu eelis, sest olen päris pikalt juba treenerina töötanud ja saan sellest mõttemaailmast aru.“
Naiste A-koondises 11 mängu kirja saanud Hein tunneb, et on valmis pakkuma oma andmeanalüüsioskusi ka mõnele Eesti võistkonnale, kes oma mängijaid anduritega varustab. „Esimene eesmärk oleks Eestis endale väljund leida – eelistatult mõne projekti näol. Oleks huvitav vaadata, mis meil praegu andmete mõttes olemas on ja mida saaks veel teha, ise õppida ja katsetada.“
Lugu ilmus juunikuu Jalkas
Tekst: Raul Ojassaar