This article also appeared in many news sources in a different version made together with Filippo Celata that became one of the most trending article on the web for several days. For a link to the newspaper article see here: La Repubblica, Il Messaggero, Fan Page, Roma Today, Il giornale, Roma Ricerca Roma and many others. For an English Version of the newspaper article see here . It also ended up in “I Fucking Love Maps” page)
Per vedere subito la mappa interattiva clicca qui
Seppure esistono delle statistiche a livello nazionale su quale squadra di calcio tifano gli Italiani, poco sappiamo sulla loro distribuzione a livello micro-territoriale. Il motivo è semplice: la gran parte di queste statistiche sono basate su sondaggi tradizionali che hanno un costo rilevante. Se volessimo sapere quali squadre tifano gli Italiani in ogni città o in ogni quartiere di tutte le città Italiane ciò richiederebbe un enorme esborso di denaro. Infatti, maggiore è il livello di dettaglio territoriale che richiediamo, maggiore il numero di interviste che dovremmo effettuare per avere un margine di confidenza statistico accettabile[1].
I big data, in particolare quelli provenienti dai social network possono offrire una soluzione a questo problema. Con un costo in denaro praticamente nullo e delle solide competenze di programmazione, possiamo ottenere statistiche altrimenti non disponibili o comunque poco accessibili.
Negli ultimi anni, alcune ricerche importanti nel campo della statistica demografica ed economica hanno proposto l’utilizzo dei big data per ovviare a questi limiti, con risultati molto importanti in termini di disponibilità e accessibilità del dato. Utilizzando i big data possiamo ricostruire la distribuzione spaziale del reddito per aree molto piccole, o possiamo stimare le presenze di immigrati in un paese (il cui dato ufficiale è spesso ritenuto inaffidabile). Nell’esercizio che segue mostreremo un esempio di come è possibile ottenere statistiche che altrimenti non sarebbero disponibili.
Ci occuperemo di un caso assai meno importante del reddito o dei flussi migratori, ma non per questo meno interessante (almeno a giudicare dagli interessi e passioni degli italiani): il tifo per le squadre di calcio! In particolare ci occuperemo del caso della Roma e della Lazio.
Seppure la Lazio è la squadra più antica della capitale, è ben noto che la tifoseria romanista è molto più numerosa. Varie statistiche più o meno affidabili affermano che a livello nazionale ci siano 3.3 romanisti per ogni tifoso laziale. Inoltre, si afferma che la presenza di tifosi laziali sia minore all’interno del Comune di Roma rispetto ai comuni limitrofi, e maggiore nelle zone di Roma Nord rispetto alle zone più popolari della città.
A parte le statistiche a livello nazionale (basate prevalentemente sui sondaggi), non esistono numeri che ci possono dare conferma sull’effettiva distribuzione dei tifosi all’interno e all’esterno del comune di Roma.
Per rispondere a questi dubbi, abbiamo effettuato un’analisi basata sugli interessi dei social network, utilizzando la piattaforma di advertising di facebook (che utilizza anche i dati provenienti da instagram).
Per ricostruire il nostro dato, non guardiamo semplicemente al numero di likes delle pagine ufficiali, bensì agli “interessi” così come stimati dagli algoritmi del social network che ricostruiscono i potenziali tifosi laziali e romanisti.
Questi indicatori sono generalmente ritenuti molto affidabili, e sono anche il principale motivo per cui oggi facebook è una delle società con il più alto valore azionario al mondo. Lo scopo primario di questi indicatori è quello di dare la possibilità ai professionisti del digital marketing di “targettizzare” determinate fasce della popolazione, in questo caso i tifosi di lazio e roma. Se ad esempio un e-commerce volesse promuovere con annunci pubblicitari una t-shirt della Roma, non vorrà ovviamente pagare per far vedere il suo annuncio ai tifosi della Lazio (che non acquisteranno mai quella t-shirt), utilizzando la funzionalità degli interessi potrà quindi restringere il campo di utenti che vedranno il suo annuncio ai soli tifosi della Roma.
Nonostante questo sia lo scopo primario per il quale questi indicatori sono stati creati, noi ne faremo un utilizzo assai diverso. Sfrutteremo la possibilità di accedere a questi indicatori tramite l’API (Application Programming Interface) della piattaforma, per ricostruirci delle stime della numerosità dei tifosi a livello micro-territoriale.
Il processo con cui abbiamo ricavato questi dati può essere facilmente comprensibile per chi ha degli elementi di conoscenza di programmazione di base, ed è stato anche usato in alcuni recenti studi accademici, vi rimandiamo a questi studi e alle istruzioni della piattaforma per chi fosse interessato.
Ma andiamo ai risultati della nostra analisi, dove sono e quanti sono i tifosi romanisti e laziali ?
Nel Comune di Roma il rapporto tra tifosi romanisti e laziali è di 2.9 a 1 , ovvero per ogni tifoso laziale ci sono 2.9 tifosi romanisti.
Mentre se estendiamo il raggio di osservazione a tutta la regione Lazio, il rapporto risulta minore: per ogni tifoso laziale ci sono 2.3 tifosi romanisti.
Se invece consideriamo solo l’area fuori dalla regione Lazio, il rapporto è ancora più piccolo (anche se i romanisti restano la maggioranza), infatti, per ogni tifoso laziale fuori dal comune di Roma, ci sono 1.7 tifosi romanisti.
Che cosa succede invece all’interno del Comune di Roma? In tutti i quartieri, la maggioranza dei tifosi è sempre romanista, ci sono però dei quartieri dove la presenza di tifosi laziali è minore o maggiore rispetto alla media.
A grande sorpresa le zone dove è maggiore la presenza di laziali rispetto alla media sono quelle nei dintorni di Ostia, Ciampino (fuori dal GRA), mentre all’interno del GRA i quartieri più laziali sono Bufalotta, Serpentara, San Basilio e Casal Boccone.
Non ci sono invece grandi sorprese per quanto riguarda i quartieri romanisti, infatti le zone di San Lorenzo e dintorni (Università, Verano, etc…) sono in cima alla classifica, e sono noti feudi romanisti. Mentre per quanto riguarda i territori più periferici, è Torre Angela (e Tor Bella Monaca) a risultare tra i quartieri con la maggiore concentrazione di tifosi romanisti.
I dati sui quartieri possono anche essere visualizzati e ispezionati con una mappa interattiva dove potete vedere qual è il rapporto tra laziali e romanisti nell’area dove abitate insieme ai quartieri di riferimento (i rombi misurano circa 0.75 km quadrati).
Per concludere, abbiamo mostrato come si possano utilizzare i big data per creare delle statistiche che altrimenti richiederebbero ingenti risorse di denaro in un semplice e divertente caso come il confronto tra tifosi di Lazio e Roma. L’esercizio può essere facilmente scalabile ad altre tifoserie ed altre zone geografiche, e ad altri indicatori fuori dal calcio o dallo sport in generale.
Gabriele Pinto – All rights reserved
Se siete interessati, avete domande o semplici curiosità non esitate a contattarmi.
gabriele.pinto@uniroma1.it
Mappa Interattiva
[1] Un’intervista telefonica o web (CAMI/CAWI) ha un costo che si aggira tra i 2€ ed i 10€ (a seconda della lunghezza e variabili campionarie). Per ricostruire un dato a livello nazionale, un campione accettabile può aggirarsi intorno alle 1000/2000 unità (per un costo di circa 5000 €). Se invece volessimo avere il dettaglio per città, ogni città avrebbe un costo di circa 5000€, quindi ipotizzando solo i comuni capoluogo, parleremo di una cifra che si aggira intorno ai 100.000€. Anche accettando un numero di interviste minore per città (ad es. 500), e con un prezzo per intervista di soli 2€, parleremo comunque di una cifra che oscilla tra i 20.000€ ed i 50.000€. Se invece volessimo un campione rappresentativo per quartieri, la cifra salirebbe vertiginosamente. Le cifre qui esposte sono da considerarsi comunque orientative.