Google presenta Meena: un nuovo agente conversazionale più umano
Cos’è Meena
Meena è un modello di conversazione neurale end-to-end che impara a rispondere in modo sensibile a un determinato contesto di conversazione.
È stata presentata da Google alla Cornell University durante il “Towards a Human-like Open-Domain Chatbot” come un modello di conversazione neurale che può condurre conversazioni molto precise e sensibili.
Meena ha 2,6 miliardi di parametri ed è allenato con 341 GB di testo, filtrato da conversazioni pubbliche dei social media. Rispetto a un modello generativo all’avanguardia, OpenAI GPT-2 , Meena ha una capacità del modello 1,7 volte maggiore ed è stato addestrato su 8,5 volte più dati.
I risultati di Meena relativi alla SSA (Sensibleness and Specificity Average), la nuova metrica di valutazione umana dedicata per i chatbot di dominio aperto, sono sorprendenti: Meena è in grado di realizzare una conversazione molto simile a quella di un essere umano.
Una chat tra Meena (a sinistra ) e una persona (a destra ).
Come funziona Meena
Meena è fondata su un Trasformer sequence-to sequence (seq2seq), cioè ha un singolo blocco di encoder Transformer evoluto e 13 blocchi di decoder Transformer evoluto, come illustrato di seguito.
Esempio di Meena che codifica un contesto di conversazione di 7 turni e genera una risposta, “The Next Generation”.
L’encoder è responsabile dell’elaborazione del contesto della conversazione per aiutare Meena a comprendere ciò che è già stato detto nella conversazione. Il decodificatore utilizza quindi tali informazioni per formulare una risposta effettiva. Attraverso la messa a punto degli iperparametri, Google ha scoperto che un decodificatore più potente era la chiave per una migliore qualità della conversazione.
Un possibile sviluppo degli agenti conversazionali
Gli attuali agenti conversazionali, cioè gli ormai famosi chatbot, tendono ad essere altamente specializzati: funzionano bene finché durante l’interazione non ci si allontana dalla tematica sulla quale vengono allenati. Lo scopo finale di un chatbot, infatti, non è quello di coinvolgere l’utente parlando del più e del meno, ma di fornire informazioni utili relative ad un determinato topic.
I principali difetti degli agenti conversazionali riguardano le risposte in contrasto con affermazioni precedenti, la mancanza di cultura generale e le risposte non specifiche in base al contesto attivo.
Ad esempio, se l’utente afferma “Adoro il tennis” e l’agente risponde “È fantastico“, tale risposta è generica e potrebbe essere utilizzata in qualunque contesto.
Ma se l’agente rispondesse “Anch’io! Non ne ho mai abbastanza di Federer!“, in questo caso la risposta sarebbe contestualizzata e darebbe un effetto estremamente diverso alla conversazione.
Meena, il chatbot che può parlare di tutto
La ricerca di Google vuole accelerare il settore: per gestire in maniera migliore una vasta gamma di topic di conversazione, Google sta esplorando un approccio complementare, sviluppando un chatbot non specializzato ma che possa comunque parlare praticamente di tutto ciò che un utente desidera.
Oltre a rappresentare un difficile problema a livello di sviluppo e contemporaneamente una sfida stimolante, un simile agente conversazionale potrebbe portare a molte interessanti applicazioni, come ad esempio una maggiore umanizzazione delle interazioni con il computer, il miglioramento della pratica delle lingue straniere e la creazione di personaggi interattivi di film e videogiochi.
Il tutto per rendere i chatbot più “umani”.
Ricerche e sfide future sugli agenti conversazionali
L’obiettivo di Google è di continuare a ridurre la perplessità, ovvero l’incertezza nel prevedere la parola successiva in una conversazione, dei modelli di conversazione neurale attraverso miglioramenti negli algoritmi, nelle architetture, nei dati e nel calcolo.
Al momento l’attenzione è stata focalizzata esclusivamente sulla sensibilità e sulla specificità di Meena, altri attributi come la personalità e la fattualità sono stati messi in secondo piano e verranno presi in considerazione nei lavori successivi.
Grande attenzione, infine, alla privacy e all’imparzialità, due fattori estremamente importanti che hanno fatto sì che finora il modello non sia stato reso pubblico, ma potrebbe essere reso disponibile nei prossimi mesi.