Da qualche decennio, ed in particolar modo nell’ultimo quinquennio, anche negli sport più praticati, conosciuti e seguiti d’Europa, come il calcio, si fa riferimento alle statistiche per dare un valido supporto analitico a chi giudica e osserva un evento sportivo.
Nonostante si cerchi di evitare di rincorrere utopicamente l’interpretazione della realtà calcistica attraverso un solo numero (KPI), consultabile e di per sé trasparente, è bene evidenziare che, la ricerca di un modello ottimale, capace di prevedere con buoni esiti la performance sportiva di una squadra o di un singolo giocatore, è un obiettivo sempre più presente.
Allo stesso tempo va detto che, confrontando l’utilizzo che si fa delle statistiche in sport come il Basket, dove esistono modelli accurati relativi ad un singolo giocatore e piuttosto in voga in leghe dall’appeal mondiale come l’NBA, l’applicazione di questi strumenti nel mondo calcistico risulta un passo indietro.
E’ innegabile il fascino dell’idea che una singola statistica possa restituire il potenziale offensivo di una squadra, anche al di là dell’imponderabile: ovvero, al di là di periodi più o meno sfortunati o delle difficoltà poste dal calendario.
Uno dei modelli maggiormenti usati per anticipare il risultato di una partita, il modello xG (Expected Goals), utilizza le informazioni storiche di migliaia di tiri con caratteristiche simili per stimare la probabilità che il goal si verifichi su una scala compresa tra 0 e 1.
Per quanto accurati, i Goals attesi (gli xG) non sono privi di limiti criticabili e frustranti per chi vuole analizzare un evento complesso come una partita di calcio, con ventidue attori sul palcoscenico e un oggetto del contendere, il pallone, difficile da controllare con delle statistiche, seppur avanzate.
Il primo e principale problema è che gli xG tengono conto delle azioni che partecipano alla costruzione del tiro, ma ignorano completamente le posizioni relative ai 22 giocatori in campo al momento della conclusione. Ed è così perché, banalmente, la collocazione spazio-temporale dei giocatori non è prevedibile.

Perché gli xG sono importanti?
Questi ultimi sono importanti perché sono il più accurato predittore delle prestazioni future di squadre e giocatori. A livello di squadra, l’efficacia predittiva dei modelli di Expected Goals è maggiore rispetto ad altri indici, come la differenza reti effettiva e le semplici metriche di conteggio dei tiri, come il Total Shots Ratio (TSR). I modelli xG ci permettono di guardare oltre i risultati correnti per avere un’idea più precisa della qualità sottostante di squadre e giocatori.
Come sono stati sviluppati gli xG?
I gol sono gli eventi più importanti nel calcio, ma sono anche i meno frequenti. Nella maggior parte dei campionati, ci sono solo 2,5-3 gol a partita. Per questo si è rivolta maggiore attenzione ai tiri, che hanno una frequenza di 10 volte maggiore rispetto ai gol (circa 25 – 30 a partita).
Da ciò sono nate metriche come il Total Shots Ratio (TSR), che misura il dominio delle squadre in base alla loro quota di tiri nelle partite. Va detto però che non tutti i tiri sono uguali. Per questo si è creata la necessità di uno specifico metodo per misurare la qualità di un determinato tiro o di una serie di tiri, e così sono nati i modelli xG.
I modelli di Expected Goals, pur nei loro limiti, si sono rivelati uno strumento importante, specialmente per evidenziare i trend nelle fasi iniziali di una stagione.
Per ottimizzare questo strumento, sono state sviluppate diverse strategie.
Da un lato, si è cercato di aggiungere ingredienti al modello, dando maggiori informazioni all’algoritmo che calcola le probabilità di successo di un tiro. Ad esempio, si sono aggiunti dati in pasto all’algoritmo relativi alla catena dei passaggi che hanno generato il tiro e non solo informazioni relative all’assist vincente.
Dall’altro, si è tentato di creare un profilo del tiratore, inserendo dati sulla precisione di tiro tenuta nella stagione corrente o in quella passata.
Passando ad un’analisi storica, sappiamo che Charles Reep fu il primo a elaborare un modello statistico da applicare al calcio. Nella sua idea l’aumento della quantità di palle lunghe aumentava proporzionalmente la pericolosità offensiva di una squadra.

Il senso dei modelli
Ma perché si costruisce un modello? Perché, in definitiva, il calcio è uno sport estremamente complesso, il cui risultato dipende da un evento sporadico come il gol.
Il calcio è uno sport peculiare per struttura: non è uno sport di situazione e, se escludiamo i calci piazzati, le azioni si susseguono mentre il cronometro scorre continuamente. Bisogna anche considerare che lo sviluppo del gioco è fortemente influenzato dalla relazione che esiste tra un numero di giocatori più alto che in altri sport.
Insomma, si creano modelli della realtà proprio per ridurre la sua complessità. La riduzione a un numero finito di variabili comporta però delle scelte: ogni componente va pesata, inclusa o scartata. Bisogna sottolineare che dietro ogni scelta c’è un’idea personale su cosa ha più o meno significato nel gioco.
Il modello degli Expected Goals è quindi soggettivo per costruzione.
E ci conduce a porci dei quesiti: quanto è importante che il tiratore abbia calciato col suo piede preferito o con quello sbagliato? Che differenza fa che l’assist sia arrivato da un cross o da un filtrante?
Includere un fattore e ignorarne un altro è una scelta che, chi mette in piedi un modello, fa sulla base delle proprie conoscenze e delle sue percezioni sul gioco.
Ecco perché è importante scegliere bene delle statistiche da associare tra loro. È un atto che comporta una responsabilità verso il lettore: banalmente, scegliendo il dato che faceva più comodo allo scopo, avremmo potuto esaltare il centravanti o gettarlo nella polvere.
D’altronde, le statistiche sono tra noi per restarci e dobbiamo imparare a convivere con l’approccio analitico all’analisi sportiva, che sarà sempre più presente nel linguaggio dei media.
Di sicuro nasceranno nuovi strumenti e i vecchi si affineranno, permettendoci di confrontare tra loro le prestazioni del passato e fare previsioni su quelle del futuro. Ma dobbiamo anche diventare consapevoli, criticamente, che dietro ogni sistema di Indicatori di Performance c’è anche l’interpretazione di chi li presenta.
I numeri non mentono, le persone a volte si
C’è molta aspettativa riguardo ai “tracking data” che potrebbero aggiungere nuovi fattori e, di conseguenza, aumentare la precisione dei vari modelli, ma ancora non ci sono dati disponibili pubblicamente ed è comunque possibile che un eventuale perfezionamento sia solo marginale.
Nel frattempo, le statistiche sono sempre più utilizzate nei media, anche grazie all’interesse per giochi costruiti attorno a un aspetto predittivo (come il Fantacalcio o Football Manager).
Soprattutto per le nuove generazioni, sembra ormai radicata l’accettazione di una descrizione numerica dei giocatori e delle squadre.
Le statistiche sono sempre più numerose ed accettate, ma serve ancora tempo prima che si diffonda un tipo di analisi più ragionata, in grado di cogliere anche le sfumature. Ci vuole tempo, oltre a un certo livello di competenza, per saper leggere l’autentico significato nelle statistiche calcistiche: cose che spesso mancano nell’utilizzo che ne fanno i media.
Ma questo è un problema esistente anche all’interno dei club professionistici, dove gli analisti delle performance stanno introducendo le statistiche all’interno del loro lavoro, spesso senza davvero capire cosa sia davvero importante e cosa no.
Anche l’utilizzo dei grafici è aumentato nei media, ma, ad esempio, le mappe sulle posizioni medie, oppure le Heat-Map (tra le più diffuse), raramente sono capaci di dirci ciò che è davvero successo sul campo; e la loro popolarità ne ha causato anche un utilizzo a sproposito.
Nonostante ciò, non bisogna dimenticare che le mappe di tiro (con o senza i valori di xG) o anche i grafici che evidenziano alcuni passaggi specifici o le occasioni create, possono rivelare verità significative su una gara, una squadra o un giocatore.
In tutto ciò bisogna avere chiaro un principio: una statistica deve essere presentata solo se capace di aggiungere una chiave di lettura all’interpretazione di un evento. Se è in grado di rivelare verità nascoste, accessibili e rapide da comprendere.
C’è sicuramente del lavoro da fare sotto ogni punto di vista. Solo l’interazione di squadra tra esperti di visualizzazione, narratori e analisti può alzare il livello complessivo e permettere un utilizzo razionale e davvero utile dei dati.
In un esperimento del 1961, Bugelsky e Alampay mostrarono ad un gruppo di individui un’immagine ambigua, cioè aperta a diverse interpretazioni: un disegno che poteva rappresentare il volto di un uomo o un topo. Ne uscì fuori che gli osservatori vedevano cose diverse a seconda del loro set percettivo, cioè in base ad altre immagini che gli erano state sottoposte precedentemente.
Dobbiamo per forza di cose basarci sulla nostra capacità di osservazione: ma a volte è bene non fidarsi troppo.
Il prossimo passo, probabilmente, sarà una presa di coscienza da parte dello spettatore dei propri limiti e delle proprie responsabilità. Un’interpretazione resta tale, in fondo, anche se illustrata con un grafico o dei numeri. Ma è indubbio che una maggiore disponibilità di “materiale da interpretare” non possa che arricchire la conoscenza di un gioco che è al tempo stesso semplice, ma ricco di sfaccettature.
Uno sguardo verso l’esterno
L’idea che le Football Analytics abbiano interrotto il proprio processo di evoluzione dopo la diffusione dei vari modelli di Expected Goals è, almeno in parte, condivisibile. Gli xG sono stati un enorme passo in avanti rispetto ai modelli di tiro pubblici fino a quel momento, ma è altrettanto vero che non sono perfetti.
Da quando gli xG si sono affermati gli analisti hanno continuato a girarci intorno, senza sviluppare niente di altrettanto sensibile. In questo senso, credo che i tracking data – pubblici o privati – possano dare un ulteriore impulso ai modelli che la nostra piccola comunità sviluppa.
And esempio nell’NBA, la lega di basket americana, la tecnologia di tracking è ormai diventata persino di pubblico dominio. Ed il solo diffondersi di questo tipo di dati ha enormemente incrementato la conoscenza degli analisti NBA.
C’è stata una diffusione capillare di modelli come quello del “quantified shots quality” (qSQ) – simile al concetto di xG, ma che tiene conto della distanza dal difensore più vicino
Modelli che, sviluppati in maniera relativamente veloce, hanno permesso a tutti noi di comprendere meglio il gioco e di analizzare i giocatori, il coaching, la strategia e le necessità delle squadre in maniera più approfondita.
Aggiungere i tracking data aiuterebbe non solo a creare modelli di xG migliori e più accurati, ma anche a quantificare meglio il possesso, la pressione, la qualità dei passaggi e così via.
Altre implementazioni e studi in corso, vedono come le possibili scelte che un calciatore può prendere di volta in volta sono modellizzate con la tecnica delle reti neurali.
L’approccio proposto è estremamente complesso dal punto di vista matematico, ma la ricchezza delle informazioni spazio-temporali che è possibile ricavare sul gioco è impagabile. Ogni singolo giocatore, quando è in possesso del pallone, può essere valutato nella sua capacità di generare valore, a fronte del rischio che è in grado di sostenere.
Un alto esempio di soluzione che ha preso piede e di notevole importanza, è stata creata da Karun Singh, un Data Scientist che lavora per l’Arsenal Football Club. Quest’ultimo ha diviso il campo in 192 zone discrete, e in ciascuna di queste ha valutato quattro componenti: la probabilità che venga effettuato un passaggio; la probabilità che venga effettuato un tiro; la pericolosità creata eventualmente da un passaggio; infine, quella creata da un eventuale tiro.
Quindi, anche Karun include un modello di Expected Goals, e con la stessa tecnica valuta le altre componenti, restituendoci l’idea che modellando il comportamento di un calciatore professionista, zona per zona, dati gli eventi del passato, si può e si potrà fare un ulteriore passo in avanti importante in questo ambito.
Alla luce di quanto detto, possiamo affermare come sia applicabile in maniera efficace e fruttuosa la statistica al mondo dello sport e in particolar modo al calcio, anche in una prospettiva che porti ad un miglioramento nella gestione e crescita dei Club e ad una diffusione di strumenti per semplificare la comprensione del singolo gioco.
Nella convinzione che il sistema calcistico sia dotato di molte “inefficienze” da poter sfruttare, tali riflessioni mostrano come le modalità tradizionali di amministrazione delle società, adottate della maggior parte delle squadre, risultino spesso obsolete e decisamente migliorabili.
Dunque, l’utilizzo di dati statistici può portare solo un evidente e auspicabile giovamento, permettendo anche a piccole realtà di provare a competere e superare avversari con risorse molto maggiori
Autore: Andrea Di Giulio | DMBI Data Analyst
Foto di Lesly Juarez su Unsplash