Voice Technology: presente e futuro, con Giorgio Taverniti

Ascolta “Ep. 28 – Voice Technology: presente e futuro, con Giorgio Taverniti.” su Spreaker.

“La voice non è il futuro. È già”

Questo è il titolo che Giorgio Taverniti ha dato alla prefazione di Voice Technology, il mio libro. Giorgio è il community manager di Connect.gt, è uno dei massimi esperti italiani per quanto riguarda SEO e digital marketing, è imprenditore e divulgatore digitale.. ed è stata proprio la voice technology a farci incontrare.

Voice Technology: presente e futuro, con Giorgio Taverniti

Nell’episodio partiamo proprio dal significato della prefazione, per arrivare a toccare diversi concetti molto attuali, ad esempio la spinta dei big della tecnologia verso il mondo della salute, la ricerca vocale nel web, i deepfake che riproducono le voci delle persone (e non solo) e i social audio, da Clubhouse a Telegram per arrivare all’importanza delle community.

Nel finale Giorgio ci racconta una sua esperienza personale relativa agli smart speaker, con alcune riflessioni molto interessanti.

 

Ascolta il podcast

Voice Technology: presente e futuro, con Giorgio Taverniti - Apple Podcasts - Voice Technology Podcast - Episodio 28

Voice Technology: presente e futuro, con Giorgio Taverniti - Google Podcasts - Voice Technology Podcast - Episodio 28

Voice Technology: presente e futuro, con Giorgio Taverniti - Spotify - Voice Technology Podcast - Episodio 28

I punti salienti

00:26 Cosa c’è nel futuro della Voice Technology?
00:49 Presentazione di Giorgio Taverniti
01:25 “La voice non è il futuro, è già”.. cosa significa?
02:27 Big della Tecnologia + AI + voice technology + salute
05:10 La ricerca vocale e la voce nel mondo del web
07:24 Deepfake e riproduzione delle voci, MateDub, doppiaggio
12:11 Social Audio: presente e futuro
14:56 Esperienze sulla voice technology (marketing e disabilità)
20:15 Take Away

 

Voice Technology: intervista a Giorgio Taverniti

Hai intitolato la prefazione del mio libro “La voice non è il futuro. È già“. Ci racconti cosa significa?

È sempre bello poter fare una prefazione di un libro come il tuo che racconta il presente, e racconta anche il futuro! Con questa frase volevo semplicemente far capire che in realtà la voice technology è già il presente perché è già utilizzata tutti i giorni dalle persone e dai brand! Lo era già quando il tuo libro è uscito, ed ora lo è ancora di più. Quindi..

chi si immagina un mondo futuristico in realtà è già indietro!

 

I big della tecnologia investono in Voice Technology e in intelligenza artificiale dedicata alla conversazione. Ma con una grande attenzione al mondo della salute. Google, ad esempio ha creato un laboratorio per l’analisi del sonno per il nuovo Nest Hub.. Microsoft ha acquisito Nuance, anche per il loro know-how nel settore healthcare.

 

Cosa ne pensi della formula.. Big della Tecnologia + AI + voice technology + salute?

La salute è uno dei mercati più grossi in assoluto già ora, e per il digitale e lo sarà sempre di più. Quindi si tratta di un business che non si possono lasciare sfuggire. In alcune nazioni ci sono già dei test molto interessanti con abbonamenti legati, ad esempio, a un braccialetto che viene utilizzato per monitorare tutto quello che fai. Sembra qualcosa di strano, ma se ci pensiamo, chi non darebbe un dispositivo di questo tipo ad un genitore anziano per la misurazione di determinati parametri!? Si tratta di un fenomeno che rientra nell’aspetto del monitoraggio della salute e anche nella prevenzione.

Io però sollevo alcune “problematiche” su questo argomento, nel senso che non ritengo corretto che siano i big della tecnologia a fare questo percorso, anche se allo stesso tempo è ovvio che sia chi può investire maggiormente a portarci più velocemente nel futuro. Mi chiedo qual è il prezzo per il fatto di “voler arrivare velocemente nel futuro“, rispetto ai dati che mettiamo in gioco. Oggi siamo molto più consapevoli di questo.. l’ultimo “leak” dei dati di Facebook, ad esempio, sta portando le persone a comprendere molti aspetti dell’argomento. Da diverso tempo diciamo che c’è bisogno bisogno di regolamentazione, come sta avvenendo, ad esempio, per i contenuti per bambini sia su YouTube, sia sugli altri ambienti sociali.

Però..

salute e intelligenza artificiale vanno controllate da vicino, perché non ci possiamo permettere il Far West su ambiti così delicati.

Con Giorgio Taverniti, parliamo di Voice Technology

Con Giorgio Taverniti, parliamo di Voice Technology

 

La ricerca vocale nel mondo del web. Tutte le piattaforme ormai introducono la dettatura delle ricerche, o l’assistente digitale. Cosa ne pensi e dove andremo?

Si tratta di un argomento molto interessante, perché è un po’ come la Formula 1: le case automobilistiche partecipano, e successivamente portano l’innovazione nella produzione. Oggi noi usiamo tanti elementi che derivano dalla Formula 1.

Dal mio punto di vista l’applicazione più bella ed interessante riguarda tutto il “ramo” dell’accessibilità. Alcune piattaforme mettono già i sottotitoli in automatico con la possibilità di traduzione in real-time. Secondo me avremo un boost importante verso il multitasking e verso la direzione di rendere i contenuti sempre più accessibili.
Prima i big della tecnologia hanno bisogno sicuramente di dimostrare quanto sono “buoni e bravi” nel creare soluzioni per noi, e questo è uno degli aspetti che ci porterà velocemente in un mondo più accessibile, non solo per aiutare persone che non hanno la facoltà di ascoltare, ma anche da un punto dell’accessibilità dell’informazione (es. traducendo in automatico da una lingua all’altra).
Oggi i meccanismi sono ancora molto molto indietro ma è normale all’inizio.. piano piano l’intelligenza artificiale migliora ed “impara” a fare cose che forse oggi non possiamo nemmeno immaginare.

 

Se infatti anche pensiamo al “salto” che abbiamo fatto da due anni a questa parte nel mondo della qualità delle voci digitali, sembra di tornare a un’altra epoca. A questo proposito, non so se hai sentito parlare del progetto MateDub.. lo sta per lanciare Marco Trombetti, l’attuale CEO di Translated. Si tratta de “il primo strumento per fare doppiaggio utilizzando voci prodotte da una intelligenza artificiale allenata ascoltando i migliori doppiatori“.

 

Cosa ne pensi dei deepfake? Avremo dei marketplace di voci che potremo scegliere ed utilizzare?

Avremo un token digitale per ogni identità, e questo diventerà proprio un trend fortissimo.

Con la blockchain questo è sicuramente possibile.

Il Deepfake, è la riproduzione audio e video (o anche solo audio) di un’altra persona.. Tu hai fatto vedere degli esempi di alcuni telegiornali in korea, in cui un deepkake che riproduce fedelmente una giornalista annuncia le notizie flash. Io credo che questo sia un fenomeno da regolamentare, e lo dico da quando ho scoperto che esiste, appena ho visto il primo test. Il motivo è che mina la credibilità. Ecco perché dicevo che andremo verso un token di riconoscimento della singola persona, che andrà a “firmare” i contenuti certificando che l’autore è umano.

Per fare un esempio.. per accedere a SPID tu devi essere una persona fisica, non può un’intelligenza artificiale crearsene uno.

L’argomento del doppiaggio è molto interessante. Ho visto che hai postato un Einstein oggi, nel quale è stata ricreata anche la voce a partire dalle registrazioni originali. Immagina se avessimo le registrazioni di Dante Alighieri! Sarebbe bellissimo avere Dante che ti racconta la Divina Commedia.
Secondo me anche qui ci vuole molta chiarezza. Io vorrei un futuro in cui è chiaro chi sta producendo un determinato contenuto.

La discussione su Connect.gt si intitola “Deepfake: il futuro della creazione di contenuti?“, e parla proprio del caso delle notizie flash del telegiornale date dal deepfake della giornalista. Secondo me su questo ambito è davvero molto interessante perché ti permette di produrre contenuti di qualità velocemente.

Credo che sia assolutamente da sperimentare.. è importante, secondo me, che ci siano dei bollini, come quelli dei film per adulti, che dice “contenuto prodotto dall’intelligenza artificiale“.

 

Social Audio, podcast, e in generale l’esplosione del consumo dei contenuti audio. Qual è la tua visione del presente e del futuro?

Sicuramente è qualcosa che ci aspettavamo.. ovvero che l’audio fosse il futuro. 4 o 5 anni fa era già qualcosa di abbastanza ovvio, quindi non guardiamo con troppo stupore i nuovi ambienti sociali totalmente audio come Clubhouse. Da un punto di vista di “percezione“, conosciamo i sensi che abbiamo a disposizione, quindi non ci voleva un genio per capire quale sarebbe stato il futuro.. il genio però è necessario per realizzare qualcosa che sia di qualità!
In questo momento non vedo molto bene Clubhouse.. li vedo molto lenti nello sviluppare novità, e quello che hanno creato è super banale e non utile, o comunque un “contentino” per gli utenti. Secondo me venderanno, e se non lo faranno non credo che resteranno leader in questo mercato. A meno che non cambino totalmente marcia.

In Italia è calato davvero di tanto. Praticamente le stanze sono semideserta a parte qualcuna. Ci sarà il boost con Android ma poi succederà la stessa cosa.
Il problema, dal mio punto di vista, è che

il social audio è un ambiente sociale molto stancante, quindi io sono più per ambienti sociali che hanno ANCHE la componente audio, ad esempio Telegram.

Tuttavia, il futuro sarà delle community, non dell’ambiente sociale. Perché tu non cerchi una persona per l’ambiente in cui trasmette, ma per quello che dice! E’ quello che fa la differenza.. Discord, ad esempio è fortissimo.

 

Ci racconti, se ne hai qualche tua esperienza legata alla voice technology? E magari qualche proiezione per il futuro?

Ho un po’ di esperienze sia personali, sia ovviamente di marketing. Quelle di marketing sono abbastanza semplici. Insieme a te, ad esempio abbiamo fatto l’applicazione vocale per il Web Marketing Festival, per esperienza, per vedere come funziona, ed è stato interessante capire cosa cercano le persone attraverso la voce.
Credo che sia veramente un settore troppo importante e troppo sottovalutato, nel senso che tutto quello che riguarda il mercato, e tutto quello che riguarda i chatbot e le conversazioni, sono veramente qualcosa che può portare il customer care ad un livello incredibile! Sia per una questione di assistenza alle persone, sia per una questione di arricchimento dei dati delle persone.

Dal punto di vista personale, invece ho una bellissima esperienza perché ho un fratello disabile. Un Natale passato, volevo fargli un regalo, e mia madre mi ha detto: “perché non compri Alexa?“. Io ero già sconvolto dal fatto che lei conoscesse Alexa.. poi scoprii che c’era la pubblicità in TV (io non l’avevo vista). Io comprai Google Home, perché era più semplice per me collegarlo a YouTube e anche a Chromecast. Quindi sono arrivato a casa e ho montato tutto. Ho insegnato a mia madre a usare Google, ad esempio per vedere qualcosa in TV, e ho iniziato a giocare perché Google Home gioca, e ho giocato con col mio fratello.

L’assistente vocale nella disabilità è molto interessante. Oggi la Voice Technology viene utilizzata, viene commentata, viene comunicata per la disabilità come un aiuto. C’è la forma mentis secondo cui una persona può fare delle cose in maniera più veloce (e questo va benissimo!),

però c’è uno step che ancora in pochi hanno compreso che non è l’aiuto.. la Voice Technology migliora le capacità umane.

Quindi mi immagino che un assistente vocale da regalare a tutte le strutture educative per i disabili possa essere un “compagno di apprendimento“, non solo un facilitatore.

 

Contenuti di approfondimento

 

Acquista il libro e pubblica una recensione!