The Brexit Twittersphere

1 Posted by - 4 luglio 2016 - Crowdsourcing, Digital Platforms, SNA

The #Brexit Twittersphere

I social media offrono una fonte di informazione senza precedenti sugli orientamenti dell’elettorato e potenzialmente sul discorso politico offrendo la allettante possibilità di attingere da dati UGC in enorme volume e varietà.

L’utilizzo della piattaforma Twitter nelle campagne politiche, ormai diffusasi dalle elezioni del presidente Obama è stato in gran parte sfruttato per fare delle previsioni di voto. Il ragionamento che segue intende verificare se fosse stato possibile trarre delle indicazioni circa l’esito del Brexit referendum in UK. L’analisi di 500.000 Tweets (Di Grazie et l., 2013) inviati negli USA durante la campagna elettorale relativa alle midterm elections del 2012 trovava una correlazione tra la percentuale dei candidati Repubblicani menzionati nei Tweet con il vote margin delle elezioni; molti altri sono gli studi, alcuni esaltano le potenzialità predittive, altri sono più cauti. Il punto è che considerate la vastità di Twitter, la veradicità talvolta dei contenuti, e la stretta relazione con la imprevedibilità e quotidianità degli eventi, bisognerebbe considerare ogni analisi a sé stante. Nel caso del referendum in UK, più che il contenuto del Tweet inviato dal singolo utente quale possibile indicatore di una qualche tendenza politica, è possibile concentrarsi sul messaggio inviato dai media (es. The Guardian) e dai principali influencers (es. Cameron, Farage). Tale aspetto potrebbe fornire alcune indicazioni circa l’utilizzo della piattaforma Twitter come estensione ramificata delle media-info tradizionali da parte dei media appunto (quotidiani, tv, etc) e da parte dei principali influencers (politici, partiti, ecc.) a favore del Leave o del Remain. Ciò può trovare conferma nel numero di RT (60%) molto più elevato rispetto al valore (25% su base mondiale) evidenziato da una ricerca della NorthWestern University (2014) che ha analizzato 37 miliardi di Tweet inviati in sette anni. Una ricerca precedente (Veronis, 2007) dimostrava che la semplice conta delle menzioni di candidati su quotidiani può essere un buon indicatore di previsione di vittoria delle elezioni. Può accadere ciò sui social in relazione ad un referendum?

In UK ci sono 15 M. di users attivi sulla piattaforma; il 29% dei quali controlla la timeline via smartphone più volte al giorno. La fascia di età prevalente è la 18-34. (wearesocial.uk)

Tweet & Result

Dalla analisi di un campione di Tweet  su Brexit collezionati ad una settimana del referendum in UK emergono i seguenti dati:

  • 25.000 Tweet
  • 18.865 utenti unici
  • 60% Re-Tweet
  • 68,8 % contiene un link http
  • 28% fa riferimento al THE SUN (e al suo schieramento a favore del Leave).
  • il 5% menziona Cameron
  • il 2.5% menziona Farage

Tweet&Results

 

Nel 60 % dei casi esaminati (cluster in rosso) i Tweet che contengono il termine Leave and not Remain prevalgono, seppur con intensità diverse, e il risultato del referendum ha visto il prevalere, anche in questo caso con intensità diverse, del Leave. Caso emblematico Boston, cittadina del Linconshire, in cui si è registrata la più alta percentuale a favore del Leave. Non si può però trovare equivalenza, cluster in arancio, a favore del Remain; solo il 3% di casi analizzati trova corrispondenza tra Remain Tweet e Remain risultato post referendum. Il 31% dei casi trova una relazione inversa tra i tweet (Leave) e il risultato del voto (Remain); in modo analogo il 6% dei casi analizzati riscontra la vittoria del Remain e Tweet a favore del Leave.

Information retrival

Dall’ analisi testuale dei 25.000 Tweet  emergono alcuni aspetti interessanti:

  1. I termini più frequenti ordinati secondo la funzione di peso tf.idf pongono l’attenzione ovviamente sul Referendum e il suo oggetto in primis, ma i termini leave e voteleave hanno un peso leggermente superiore al remain e al strongerin.  I due leader politici più menzionati sono Cameron e Farage; sono presenti tre termini chiave della discussione social (rispetto a questo campione di dati):  pensions,markets, immigration.

grafico_testo

  1. Il network delle co-occurences costruito sulla matrice semantica mette in evidenza ciò di cui si è parlato sul social. Il grafo possiede una “densità” rilevante ma non elevata, elemento da considerare nella giusta misura, a metà tra la prevedibilità del tema principe del discorso, Brexit, e la veradicità di Twitter.

Tweet_brexit_network

 

In rosso i termini  a favore del Leave e in celeste quelli a favore del Remain; in blu leader/figure/partiti; in giallo news e newspaper.

 

  • Tweet più RT:

RT

  • Esempio di Tweet inviato dall’utente più attivo:

RT_user_attivo

 

Conclusione

Si potrebbe correlare un po’ di tutto con l’esito del referendum, o meglio molti aspetti potrebbero trovare relazione con la distribuzione dei risultati per L.A come dimostrato dalla mappa di seguito che mette in relazione la percentuale di popolazione in sovrappeso e obesa con la percentuale dei risultati a favore del Leave o del Remain; ciò che conta dunque non è la spasmodica ricerca della previsione dall’analisi dei Tweet con i risultati del voto quanto le indicazioni di tendenza che da questa tipologia di analisi possono derivare. Esistono dei limiti certo, a partire dalla rappresentatività del campione così come l’arco temporale a cui fanno riferimento i dati, ma anche potenzialità enormi  (pensiamo all’analisi spazio-temporale di massive quantità di dati riferite all’argomento) in termini di analisi di orientamento e di sovrapposizione tra il discorso social e il voto reale (nel 60% dei casi esiste corrispondenza tra Tweet Leave e voto Leave) che può essere analizzato anche a scale differenti, macro-regionali e intra-urbane.

www.fooddeserts.org/