Immaginate una macchina in grado di sintetizzare frasi e costruzioni grammaticali sottoforma di sequenze di dati talmente sofisticati da riuscire a realizzare interi articoli, a richiesta, seguendo degli input. Sulla carta potrebbe sembrare il proclama distopico di qualche tecnocrate luddista pronto ad ammonirci sulle potenzialità malvagie della tecnologia, vicina al sostituirsi all’uomo anche nei processi cognitivi. Ai lettori più accaniti, invece, un’idea simile potrà ricordare la trama di uno dei racconti più celebri di Roald Dahl, The Great Automatic Grammatizator, novella in cui un uomo scopre, nemmeno fosse Noam Chomsky, come le strutture grammaticali e sintattiche siano costanti e come tali sintetizzabili in cifre, codici e algoritmi pronti a ricodificarsi in romanzi, automaticamente, tramite un’elaborata macchina di sua invenzione.
Se è vero come è vero che spesso la realtà supera la fantasia, potete andare su Twitter e diventare follower di una start-up di Chicago nata in seno alla Northwestern University Schools of Engineering and Journalism che si chiama Narrative Science e che ha recentemente lanciato un software capace di sintetizzare dati di varia natura e rielaborarli sottoforma di contenuti editoriali e articoli. E la cosa più stupefacente, e potenzialmente spaventosa, di questa trovata è la qualità degli scritti:
“WISCONSIN appears to be in the driver’s seat en route to a win, as it leads 51-10 after the third quarter. Wisconsin added to its lead when Russell Wilson found Jacob Pedersen for an eight-yard touchdown to make the score 44-3 … . ”
La cronaca di questa partita di baseball studentesco forse non suonerà immaginifica come un articolo di Gianni Brera o romanzesca come il report di una partita fatto da Osvaldo Soriano, ma sfidiamo anche i più attenti lettori di pagine sportive di quotidiani locali a trovare sensibili differenze tra questo testo e un qualsiasi reportage da un campo di provincia su carta stampata. Quello che Narrative Science è riuscito a far funzionare è un programma più avanzato di quanto si fosse precedentemente mai visto quanto a generatori automatici di testi, capace di realizzare periodi sintattici complessi e con uno stile discreto. Prima di Narrative Science questo tipo di esperimenti aveva sempre portato a testi poco credibili, meccanici e seriali, affetti quasi dalla sindrome di Google Translator: il software poteva, in un qualche modo pensare e strutturare, ma mai avrebbe potuto immaginare. Oren Etzioni dell’Università di Washington studia e lavora da una vita a una Machine Reading in grado di leggere il WWW. Ha commentato il varo di Narrative Science con favore, giudicando buona e interessante la qualità del testo generato, “come se fosse stato scritto da un essere umano”. La sofisticatezza dei risultati solleva questioni su quali siano le possibilità di una tecnologia di questo tipo e quale possa essere la sua reale implementazione nell’uso comune della scrittura. Il sito di Narrative Science mette in evidenza quelli che sono i campi in cui la start-up punta a lavorare fornendo un servizio low-cost ed efficiente: report sportivi e finanziari, analisi per agenzie immobiliari, commento di dati per elezioni e sondaggi, sommari di campagne pubblicitarie, analisi di conto vendite, bilanci e ricerche di mercato. Tipi di testi in cui da un semplice input sarebbe facile estrarre contenuti in un qualche modo critici, grazie al software. Allo stato delle cose Narrative Science ha una ventina di clienti, tra i quali la Big Ten Network, una società in cui è coinvolta anche la Fox Networks, che ha utilizzato Narrative Science per brevi resoconti di partite sportive pubblicati sul loro sito web a uno o due minuti di distanza dal fischio finale del match. Le prospettive, però, sembrano più ampie: il software sarebbe in grado di comprendere e interpretare dati da diverse prospettive, comprendendo il significato di espressioni e concetti come “tocco del giocatore”, “avanti e indietro” e “risultati della squadra” e conseguentemente utilizzare le informazioni secondo questi criteri, sviluppandoli narrativamente e gerarchicamente, decidendo cosa debba essere posto nel titolo e cosa, invece, rappresenti una informazione di secondo piano.
Kris Hammond, uno dei fondatori di Narrative Science, insegna sia informatica che giornalismo alla Northwestern University e non ha mancato di mettere in evidenza quanto questo software possa avvicinare le due discipline, fornendo punti di incontro e connessioni. Insieme alla sua convinzione non ha nascosto il suo ottimismo, dando per concreta la possibilità che da qui a cinque anni una macchina possa vincere il Premio Pulitzer. Il New York Times si è al contrario detto scettico, facendo notare come il premio non sarebbe consegnato alla macchina, bensì ai suoi ideatori che, allo stato delle cose, devono ancora rappresentare la categoria degli esseri umani. Per quanto i risultati e le prospettive di crescita di Narrative Science siano sorprendenti, è difficile pensare che un articolo giornalistico che esuli dalle categoria elencate dalla stessa società come loro core business, possa essere affidato a una macchina. Immaginare analisi della situazione politica di un paese, commenti alle manovre in fatto di economia messe in atto da un governo, recensioni di libri o reportage di guerra realizzati da macchine e algoritmi è ancora e saldamente letteratura cyberpunk. Spaventa però che il NYT, proprio nel pezzo di commento a Narrative Science, si è premurato di specificare come l’articolo fosse stato scritto da un essere umano: nell’attesa che il computer che sto usando per scrivere questo pezzo decida che non sono più fondamentale, vi consiglio di dare visione all’elenco di generatori automatici di testi di prima generazione redatta dal Wired italiano: ce n’è per tutti i gusti: dalle poesie dell’ex-ministro della Repubblica Sandro Bondi ai saggi sul Postmodernismo. Nel mezzo: nomi di mobili Ikea e, appunto, acronimi per cyborg.
Tags:Narrative Science, Road Dahl, The Great Automatic Grammatizator