Tool e algoritmi per sfruttare i dati

3 Aprile 2015 • Digitale, Più recenti • by

Larry Birnbaum ama raccontare storie giornalistiche a partire dai dati: “ci sono molti dati disponibili e molte possibili storie da raccontare, ma non è facile trovarle”, ha spiegato alla conferenza Big Data for Media organizzata da Inma la scorsa settimana presso la sede londinese di Google. “Il mio approccio”, ha spiegato Birnbaum, “è quello di partire con una domanda”.

Larry Birnbaum alla conferenza Big Data for Media

Larry Birnbaum alla conferenza Big Data for Media

Durante il suo intervento “Finding and Telling Stories at Internet Scale”, Birnbaum ha parlato di una serie di strumenti disponibili per sfruttare i dati liberi, progettati da studenti in giornalismo e informatica del Knight Lab della Northwestern University, dove Birnbaum è Professore di Computer Science e giornalismo e co-founder del Lab.

Schermata 2015-04-03 alle 10.15.13Il primo, TweetCast Your Vote, è uno strumento di engagement che può prevedere come un utente voterà alle elezioni a partire dai suoi tweet. Digitando un nome, il software cercherà alcune parole utilizzate nel feed di Twitter della persona in esame.

LocalRx, invece, è un altro esempio, basato ancora una volta sui tweet ma funzionante solo negli Usa e a Barcellona, che “dice quante tra le persone che seguono la tua attività commerciale ne stanno anche twittando, una cosa che può aiutare i proprietari di imprese a creare un profilo dei loro clienti”, ha spiegato Birnbaum a Londra.

Schermata 2015-04-03 alle 10.13.31Un terzo esempio, invece, NewsRx, aggrega storie giornalistiche sulla base dei tweet. Per esempio, se un utente twitta regolarmente di cibo, l’app consiglierà a questa persona articoli relativi all’alimentazione, al food o recensioni di ristoranti. BookRx, invece, consiglia libri sulla base del proprio feed di Twitter.

Birnbaum ha spiegato come questi strumenti garantiscano accesso a dati liberi perché sono basati su Twitter, una piattaforma aperta: “se sei il New York Times o il London Times hai molto accesso a dati sui tuoi lettori. Testate più piccole non hanno la stessa opportunità”, ha spiegato, “usando questi strumenti, puoi scoprire molto su cosa interessa ai tuoi lettori, tutto quello che serve è il loro nome utente di Twitter”.

Schermata 2015-04-03 alle 10.17.02Questi strumenti sono stati relativamente semplici da ideare, ha spiegato Birnbaum alla platea di Big Data for Media: “ci sono volute solo 50 linee di codice per creare alcuni di questi tool. La prima versione di NewsRx, ad esempio, è stata costruita da quattro studenti in dieci settimane”, ha specificato il Professore, che ha aggiunto “un altro sistema è Local Angle, che aiuta alle notizie locali più interessanti a trovare un loro posto nel coverage nazionale. Funziona con un news feed, vi trova dei nomi, le location associate con questi nominativi e trova storie interessanti nelle loro aree geografiche”, ha spiegato Birnbaum.

Birnbaum collabora anche come Chief Scientific Advisor con Narrative Science, un’azienda americana che costruisce software che può scrivere articoli in automatico partendo dai dati. Per Birnbaum, una delle sfide maggiori per questo genere di software è scrivere il linguaggio dell’algoritmo affinché possa descrivere i dati in un modo accattivante. “La questione critica”, ha aggiunto, “è stabilire cosa dire e come, noi usiamo un generatore di lingua: I cliché sono ottimi perché le persone li capiscono”.

Secondo Birnbaum, il giornalismo fatto dagli algoritmi difficilmente prenderà il posto di quello fatto dagli umani, “molto di quello che facciamo non è giornalismo tradizionalmente inteso”, ha spiegato a Big Data for Media, riconoscendo che molti aspetti di questo settore sono ancora incerti. Rispondendo a una domanda sui problemi legali che potrebbero sorgere quando un algoritmo dovesse descrivere un’azienda in modo negativo perché i dati statistici dicono questo, ad esempio, Birnbaum ha spiegato che questa è una delle questioni che devono ancora essere risolte.

Articolo tradotto dall’originale inglese, pubblicato originariamente sul blog dell’Inma

 

Tags:, , , , , , , , , , , , ,