Data skal få Norge til Europatoppen i fotball

Bedre bruk av data skal legge til rette for at fotballklubber, direktører og trenere kan ta strategisk gode beslutninger for å optimalisere både elite- og breddefotballen i Norge. Sammen med Europatoppen er målet at våre landslag og klubblag skal prestere bedre i Europa.

Publisert 18.10.2023
Forfatter: Guro Grønbakken

Hvordan kan vi bruke data for å sikre bedre utvikling av norske proffspillere? Hva gjør de klubbene som lykkes, og hvordan kan vi sikre at barn og unge spiller fotball lenger?

Dette skal dataingeniørene i NoA Ignite, Bendik Austnes og Nikolai Molvik, hjelpe Europatoppen med å svare på ved hjelp av strukturert data og innsikt. Sammen med Johannes Marthinussen, innsikts- og analyseleder i Europatoppen og Lars Johan Myklebust, produsent innsikt og analyse i Europatoppen, jobber de med å utvikle databruken i norsk toppfotball.

Europatoppen er et samarbeid mellom Norges Fotballforbund, Norsk Toppfotball og Toppfotball Kvinner. Sammen skal de gjennom benchmarking og analyse som metode bli i stand til å ta gode, strategiske beslutninger. Prosjektet skal være med på å legge til rette for at våre landslag og klubblag skal kunne prestere bedre i Europa.

"Det viktigste for oss er at vi hjelper de som skal bruke dataen, enten det er klubbene eller direktørene, å ta mer informerte beslutninger. For at vi skal oppnå det, er vi helt avhengige av å ha tilgang til masse data og at vi kan stole på denne dataen. Det må fungere uten noen feil."

Johannes Marthinussen, Innsikts- og analyseleder i Europatoppen

Databricks

Ved hjelp av Databricks, samler, behandler og analyserer de data fra eksempelvis interne masterdatasystemer og historiske data fra norske fotballklubber. Databricks er en dataplattform som kombinerer datavarehus (data warehouse) og data lakes i en ‘lakehouse’-arkitektur.

Innsikt skal sikre bedre spillerutvikling

– Benchmarking og analyse har vært noe av det viktigste for Europatoppen for å kunne ta strategisk gode beslutninger for norsk toppfotball basert på fakta. Databricks er den store motoren og hjertet i dette. Her samler og behandler vi all dataen vi trenger for å kunne gjøre gode analyser og benchmarking, forteller Johannes.

Prosjektet fokuserer blant annet på spillerutvikling i elitefotballen.

– For elitefotballen samler vi innsikt som eksempelvis hvilke klubber proffspillerne har spilt i, hvilke kontrakter de var på i de ulike klubbene, når de fikk proffkontrakt – fikk de det for tidlig eller for sent – og hva som påvirker det.

Dette gjør at vi på sikt kan bedre svare på når spillere er på riktig nivå for å få en proffkontrakt, for å sikre best mulig spillerutvikling, forteller Bendik.

Portrett av Benedik i trappa
Bendik Austnes, dataingeniør i NoA Ignite

Fra halvannen time til et halvt minutt

Dataen brukes også i dag blant annet av (Hangeland-utvalget) i forbindelse med ligaoppsettet. Dette er et utvalg som er nedsatt for å se på konkurransestrukturen og terminlister i eliteserien, førstedivisjon og cupen for herrer for årene 2024-2025. 

I tillegg jobbes det med å gjøre data dashboards tilgjengelig for alle toppklubbene på herre- og kvinnesiden. For A-landslagene har denne tilgangen på data forbedret arbeidsflyten for kampstatistikk- og analyse.

Tidligere måtte trenerne på landslagene sitte på fotball.no på søndagskvelder etter kamp og notere ned informasjon som eksempelvis spilletid per spiller. All denne manuelle jobben gjøres nå automatisk.

– Vi har forbedret arbeidsflyten fra kampen er ferdigspilt til treneren eller manageren får uttaket av statistikken. Fordi statistikken presenteres automatisk i en visuell framstilling, blir det både enkelt og raskt å gjennomføre analyse av kampen. Det var en oppgave som før kunne ta opptil halvannen time og som nå tar et halvt minutt, forteller Johannes.

Johannes og Lars Johan forteller at de for tiden jobber med å lage det samme oppsettet for U21 herrer og U23 kvinner slik at de også får tilgang til denne flyten av data.

Selve dataen fra kampene som spilles kommer fra GPS-vester som spillerne har på. GPS-dataen gjør det langt enklere å analysere prestasjonen til laget og enkeltspillerne. Dette inkluderer blant annet fysiske data om spilletid per spiller, antall sprinter og total distanse løpt i ulike soner.

"I tillegg til GPS-dataen får vi masse data fra WyScout, vi kjøper data fra andre, og noe blir lastet ned fra andre filer og lagt inn i data lake. Det er et virvar av data og vi er helt avhengig av å ha gode systemer for å koble denne dataen sammen for å se datasettene i kombinasjon med hverandre."

Johannes Marthinussen

Johannes, Lars Johan og Bendik jobber med både historisk og trendende data for å legge til rette for at bedre strategiske beslutninger kan tas for norsk toppfotball.

Det er blant annet spesifikke data om proffkontrakter, alderssammensetninger og spillerstaller. Ved hjelp av presentasjoner i Tableau og Power BI, kan eksempelvis Norsk Toppfotball få større innsikt i klubbene før de drar ut og møter dem, og dermed bruke denne dataen inn i praten med klubben.

– Det har blitt et helt nytt nivå på diskusjonene om klubbutvikling. Diskusjonene kan nå baseres på tall og fakta istedenfor synsing og personlige meninger. Det at de kan åpne et dashboard med data i klubbens styremøte og se de viktigste tallene i løpet av 10 sekunder er veldig verdifullt for mange.

Visuell ui oversiktfra databricks, graf som viser gjennomsnittlig spilletid i prosent i høyprestasjonsalder
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig spilletid i prosent i høyprestasjonsalder
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig spilletid i prosent for unge spillere (U21)
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig spilletid i prosent for unge spillere (U21)

Johannes, Lars Johan og Bendik jobber med både historisk og trendende data for å legge til rette for at bedre strategiske beslutninger kan tas for norsk toppfotball.

Det er blant annet spesifikke data om proffkontrakter, alderssammensetninger og spillerstaller. Ved hjelp av presentasjoner i Tableau og Power BI, kan eksempelvis Norsk Toppfotball få større innsikt i klubbene før de drar ut og møter dem, og dermed bruke denne dataen inn i praten med klubben.

– Det har blitt et helt nytt nivå på diskusjonene om klubbutvikling. Diskusjonene kan nå baseres på tall og fakta istedenfor synsing og personlige meninger. Det at de kan åpne et dashboard med data i klubbens styremøte og se de viktigste tallene i løpet av 10 sekunder er veldig verdifullt for mange.

— Vi må først få klubbene til å forstå verdien av data

Johannes og Lars Johan forteller at de ønsker å gi god innsikt og faktagrunnlag til alle som tar viktige beslutninger i norsk fotball. Dette inkluderer blant annet alle toppklubber på herre- og kvinnesiden, styrerom og sportssjefer. 

Noe av målet er å gi alle toppklubbene tilgang til løpende framstillinger av statistikk og analyse fra kampene som spilles.

– Håpet er at klubbene på sikt skal kunne hente verdi fra innsiktsarbeidet, og få dem til å ansette personer som kan jobbe dedikert med forvaltning av klubbdata og datadrevet innsikt. Databricks er plattformen som gjør dette teknisk mulig.

Visuell oversikt fra Databricks: graf som viser gjennomsnittlig spredning i poengfangst mellom topp og bunn
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig spredning i poengfangst mellom topp og bunn
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig prosentvis varighet i hver formasjon per lag
Visuell oversikt fra Databricks: graf som viser gjennomsnittlig prosentvis varighet i hver formasjon per lag

— Vi har hele veien løst problemer mens vi har gått

Johannes og Lars Johan skryter av samarbeidet med Bendik, Nikolai og NoA-huset:

– Samarbeidet med Bendik er veldig bra og har vært det siden første dag. Når vi fikk Nikolai på teamet i tillegg, så hadde vi plutselig en enorm kraft. Vi får hjelp til alt vi trenger, og vi behøver aldri bekymre oss for at ting ikke funker backend. Sammen får vi til alt og NoA-teamet er veldig gode på å finne løsninger.

De er også veldig fornøyde med retningen prosjektet har tatt, og at de landet på å bruke akkurat Databricks som teknologi for å samle all data.

"Jeg føler styrken er at vi har funnet noe som tilfredsstiller våre behov. Mange bruker den teknologien som er trendy akkurat nå kun fordi andre bruker den og fordi de vil være med på bølgen. Her har vi sett på hvilke problemer vi må løse og deretter funnet den teknologien som passer best for å løse dette."

Johannes Marthinussen

De forteller at det hele begynte som et samarbeid mellom Norges Fotballforbund, Eliteserien, Obos-serien og toppserien. Fordi alle satt på masse nyttig data, men ikke hadde kompetansen til å utnytte den, vokste ideen om å finne synergier og å samarbeide om å skape noe sammen.

Deretter dukket kanskje den største, og viktigste, problemstillingen opp: hvor skulle dataen bo og hvem kunne bygge opp et slikt miljø?

Dataen lå på mange ulike steder, og de manglet kompetansen innad i teamet. Valget falt på at Europatoppen skulle gå sammen med Norges fotballforbund (NFF) for å sikre at dataen kunne leve videre uansett hvordan utfallet av prosjektet ble. Kompetansen fant de i NoA. Her var det allerede etablert en god relasjon med teamet som har jobbet med masterdataforvaltning siden 2008.

– På denne måten kunne vi øke kompetansen med folk og ressurser så og si over natten. Vi hentet inn Bendik som på den tiden var en junior og som ikke tidligere hadde jobbet særlig mye med data lakehouse. Vi snakket sammen hver eneste dag og løste problemer mens vi tråkket opp veien. Bendik og resten av teamet var utrolig hjelpsomme, fant løsninger og svar på stadig nye utfordringer og spørsmål, og var alltid bare en telefon unna.

Prosjektet startet med å samle all data i SQL. Det tok ikke lang tid før de så behovet for en mer fleksibel løsning. De sendte utfordringen til Bendik – som tok den på strak arm og fant Databricks.

Siden introduksjonen av Databricks på prosjektet, har systemet vokst, og inneholder nå flere bestanddeler i en lakehouse arkitektur.

– Europatoppen hadde behov for behandling av både strukturerte data fra databaser og APIer, samt ustrukturerte data og dokumenter som de ønsket å administrere selv. Med Databricks kunne vi lage en mer fleksibel plattform som evner å behandle disse dataene under ett, forteller Bendik.

– Bendik er en veldig god og ærlig sparringspartner som ser på hvilken løsning som er best for oss, og som vil gi mest mulig verdi i et langsiktig perspektiv. Han kommer også med mange gode ideer. Vi skal revolusjonere fotballen når vi har fått alle disse ideene ut i livet, ler Johannes.

"Det er en veldig fin reise å se tilbake på, og vi har fått veldig stor tillit til det som skjer her på NoA-huset."

Johannes Marthinussen