USER GENERATED DATA COMMONS: SPAZI DIGITALI ED ESPERIENZE URBANE ATTRAVERSO L’UTILIZZO DI OPEN GEODATA E DI VOLUNTEREED GEOGRAPHIC INFORMATION

1 Posted by - 1 gennaio 2017 - crowdsourcing, geosocial, opendata

1 – VOLUNTEREED GEOGRAPHIC INFORMATION: I DATI GENERATI DAGLI UTENTI.

La Voluntereed Geographic Information (VGI) può essere considerata come un insieme particolare del più ampio fenomeno dei “contenuti creati dagli utenti” (User-Generated Contents) (UGC) (Goodchild, 2007, pp. 211-221). Tale informazione geografica generata dagli utenti si differenzia dall’informazione geografica convenzionale, cioè quella prodotta da esperti, per: le fonti, le tecnologie per acquisirla, i metodi e le tecniche per lavorarci e i processi sociali che mediano la sua creazione e il suo impatto (Elwood, 2008, pp. 173- 183; Elwood, Goodchild e Sui, 2012, pp. 571-590). In passato, infatti, il dato e l’informazione geografica erano prodotti, archiviati e gestiti da fonti istituzionali, generalmente istituti cartografici nazionali, di matrice civile o, spesso, militare. Uno dei più noti progetti nel campo della VGI è OpenStreetMap (OSM) (Neis et al., 2011). Definito come “a knowledge collective that creates Open Geodata as its main objective” (Saveri et all, 2004)può essere considerato una sorta di Wikipedia della cartografia che punta a creare e a rendere disponibili dati cartografici aperti e mappe a contenuto libero del mondo, in cui sono gli utenti stessi, OpenStreetMappers, a creare e condividere le informazioni geografiche che vengono salvate in database e liberamente disponibili a tutti via World Wide Web (Neis et al., 2011). A tal proposito è interessante osservare le statistiche presenti sul sito (www.openstreetmap.org) le quali registrano a Febbraio 2016 più di 2 milioni di users e più di 5 miliardi di uploaded GPS point. Si può osservare come il risultato di una query di ricerca di dati OSM sulla città di Firenze rimandi ad una quantità di informazioni vettoriali notevole: 101.728 punti, 12.403 linee, 8.209 poligoni.

Open_Street_Map

La produzione di VGI è assicurata dagli utenti del Web che possono essere considerati dei “sensori” (Goodchild, 2007) con la capacità di registrare ciò che osservano, creare e disseminare tipologie di informazioni in rete a scale differenti, che in passato era molto difficile raccogliere (Capineri e Rondinone, 2011, pp. 555-573). Se pensiamo al dibattito culturale e scientifico sui dati ottenuti attraverso l’utilizzo del noto sito di microblogging Twitter, le potenzialità di indagine vanno dall’analisi del sentimento pubblico rispetto ad epidemie dell’influenza H1N1 (Polgreen et al., 2008) alla previsione del risultato delle elezioni politiche (O’Connor et al., 2010),  dall’apprezzamento di nuovi prodotti (Bandari et al., 2010) alla gestione del dopo-catastrofe (Zook et al. 2010) (Calvino, Romano, Teobaldi, 2013.). Sempre più quindi l’attenzione ricade sulle tracce che l’utente lascia più o meno consapevolmente sul Web definendo ed analizzando quella che viene chiamata la digital footprint (Garfinkel et al., 2009; Elwood et al., 2012).

Palinsesto_Social copia

Questa nuova disponibilità di informazione geografica è considerataa valuable source of knowledge about the physical environment and social phenomena” (Lia L., Goodchild M. & Bo Xub, 2013) ed offre da un lato la possibilità di analizzare dinamiche sociali altrimenti difficilmente analizzabili con fonti di informazione tradizionali che richiedono tempi lunghi e costi elevati per la raccolta di informazioni; dall’altro, presenta limiti tecnici sia per quel che riguarda le condizioni di accessibilità, sia per quel che riguarda le possibilità di ri-utilizzo del dato da parte di tutti i cittadini. Se pensiamo ai contenuti geo-taggati che possono essere raccolti attraverso l’utilizzo dei social media, il processo di interrogazione (query), storage e elaborazione del dato finale, richiede skills e competenze tecnico-informatiche relativamente avanzate (dalla conoscenza delle Application Program Interface – API,  ai linguaggi di programmazione (es. python), alla gestione di enormi dump di dati in database, alle query SQL e NoSQL).

2 – GEODATA COMMONS: UNA ANALISI DI TWITTER, INSTAGRAM, FLICKR E WIKIPEDIA.

 L’esperimento qui proposto (ROMANO A., User Generated Data Commons: spazi digitali e rappresentazioni urbane attraverso l’utilizzo di Open GeoData e di Voluntereed Geographic Information (VGI)”,  in Aa.Vv. (2016) Commons/Comune: geografie, luoghi, spazi, città. Società di studi geografici. Memorie geografiche, nuova serie, Vol. 14. Isbn: 978-88-908926-2-2) si riferisce all’analisi di un anno di dati geo-taggati all’interno dei limiti amministrativi della città di Firenze provenienti da alcuni dei principali e più diffusi social media in Italia, quali Twitter, Instagram, Flickr e l’enciclopedia collaborativa online Wikipedia. In particolare sono stati analizzati 4 dataset geografici, ossia contenti informazioni territoriali georiferibili (latitudine e longitudine) collezionati grazie alla interrogazione delle API dei quattro social media in oggetto di analisi. Per quel che riguarda Wikipedia, sono stati collezionati tutti i GeoWiki presenti sul portale, ossia le pagine di Wikipedia georeferenziate ed in lingua italiana relative all’area del comune di Firenze. L’interpretazione dei dati, in questa prima parte dell’ analisi è da intendersi come puramente descrittiva della distribuzione geografica dei dati. In questa sede non sono stati approfonditi gli aspetti legati all’analisi dei contenuti testuali presenti nei dati collezionati (es. sentiment analysis, analisi semantica).

I dataset esaminati sono i seguenti:

  1. 361 Tweet collezionati tramite l’utilizzo delle streaming API di Twitter;
  2. 728 foto di Instagram collezionate tramite l’utilizzo delle API di Instagram dal Laboratorio Urban Gis Lab. dell’Università di Cagliari;
  3. 271 foto di Flickr collezionate tramite l’utilizzo delle API di Flickr;
  4. 520 GeoWiki relativi al comune di Firenze.

Complessivamente sono stati raccolti 1.097.880 dati geo-taggati a Firenze.

Il risultato della sperimentazione evidenzia una geografia della partecipazione social soprattutto nel centro storico della città (Quartiere 1),  in cui si concentra il 73% del totale dei dati geo-taggati analizzati (740.924), un valore pari a 67.000 dati per km2, Emergono infatti le centralità urbane ma allo stesso modo è possibile tentare di scoprire nuovi luoghi (aree verdi, punti panoramici) di partecipazione sociale nel tentativo di ri-immaginare la dimensione urbana attraverso la lettura della distribuzione di city users ad una scala molto dettagliata.

Firenze_Social_web_version-1024x724 copia

In conclusione (per me).

Lo sviluppo del cosiddetto Web 2.0 e la fitta proliferazione di applicazioni social se da un lato hanno dato vita a reti sociali (social network) sempre più numerose, dall’altro hanno contribuito a creare una quantità enorme di informazioni e di flussi di dati fino a poco tempo fa impensabili per volume, varietà e velocità. Ciò che in pochi anni si è sviluppato in tale contesto, non è soltanto la nascita e la diffusione di applicazioni social innovative ma è anche la contestuale opportunità e profittabilità di analisi di questa proliferazione di informazioni la cui lettura permette analisi, ad esempio della città, sempre più dettagliate. La sperimentazione qui proposta ha tentato di evidenziare la presenza di layers di informazioni geografiche digitali fortemente legati agli spazi fisici urbani i quali, in modo analogo alle informazioni geografiche dei dati aperti della pubblica amministrazione, contribuiscono, da un lato alla interpretazione del territorio e le sue dinamiche, e dall’altro, in modo innovativo, alla definizione di aree urbane definite dalla partecipazione sociale. E’ certamente necessario approfondire gli aspetti legati alla qualità, accuratezza e validazione del dato VGI, ma al contempo è oggi fondamentale interrogarsi sui potenziali benefits derivanti dall’estrazione di nuova conoscenza derivante dalla combinazione di Open GeoData e VGI. Certamente l’informazione istituzionale si avvale di metodi standardizzati per la modalità di creazione del dato, mentre le informazioni generate dagli utenti possono essere inesatte o incomplete in quanto create da utenti non-esperti (Flanagin e Metzger, 2000, pp. 515-540; 2007, pp. 319-342), ma gli elementi descrittivi qui contenuti concorrono a qualificarne nuove possibili applicazioni di analisi.