Applicazioni vocali: cosa sono e come guidano gli utenti in un’esperienza conversazionale
Quando un utente pone una domanda a un assistente vocale comincia un’esperienza conversazionale che ha lo scopo di fornire le informazioni richieste (per esempio “che tempo farà domani?”) o di compiere un’azione (ad esempio, impostare un promemoria sul calendario per un compleanno).
Le applicazioni vocali sono la tecnologia che permette questo percorso, processando il comando e restituendo un output pertinente.
Il dispositivo di voice assistant fa da tramite tra l’utente e le applicazioni: quando una persona si rivolge a Google Assistant o ad Alexa, per esempio, utilizza un’interfaccia che è sia fisica (uno smart speaker o lo smartphone); sia virtuale, ovvero il sistema di Voice User Interface (VUI) che permette di riconoscere la wake word, (per esempio “Ehi Google”), che attiva l’assistente.
A sua volta, il voice assistant, in base alla richiesta che viene fatta, apre un’applicazione vocale in grado di processare e individuare la risposta da dare.
Vediamo nel dettaglio come funziona un’applicazione vocale e quali sono le sue caratteristiche
Come funzionano le applicazioni vocali
Le applicazioni vocali sono la tecnologia che elabora la risposta a una richiesta di un utente, tramite una piattaforma di Natural Language Processing (NLP) e Natural Language Understanding (NLU). Di cosa si tratta? Di un software che è in grado, grazie ad un addestramento con un training specifico, di decifrare una domanda o una richiesta e di estrarre dal database l’informazione o l’azione più pertinente. Un esempio, provando a dire all’assistente Google: “Ehi Google! Cerca scarpe da corsa in offerta”: in questo caso l’assistente potrebbe proporre tra i risultati alcuni modelli su siti di retail online, o indicare quali outlet per lo sport sono in zona.
Per progettare applicazioni vocali in grado di rispondere correttamente, è necessario conoscere i meccanismi della lingua parlata, le sue varianti di utilizzo e le espressioni linguistiche che si usano più comunemente, in modo che le persone possano vivere un’esperienza conversazionale appagante e naturale. Questa fase richiede una profonda conoscenza della modalità di conversazione e del linguaggio umano.
Com’è fatta una richiesta vocale
Un comando vocale, cioè la richiesta che un utente rivolge a un voice assistant, si compone di tre principali elementi: intento, espressione e parametri.
Vediamoli nel dettaglio.
Intento
L’intento è lo scopo che ha in mente l’utente quando avanza una richiesta a un voice assistant. Tanto più la domanda è precisa e dettagliata, tanto più efficacemente il dispositivo risponderà al suo interlocutore.
L’interazione che scaturisce da una query vocale può quindi essere di:
- alta utility, ha un effetto immediato che soddisfa la persona. Per esempio, quando un utente chiede che venga compiuta un’azione, come “metti un po’ di musica”, o “paga la spesa”, una funzionalità recente di cui abbiamo parlato nell’articolo su Voice Match e la possibilità di acquistare con la voce.
- bassa utility, si tratta di richieste che risultano difficili da comprendere per il voice assistant in quanto generiche, come “Ehi Google! Dimmi qualcosa su Berlino”. Una domanda come questa potrebbe significare: “Voglio visitare quella città”, ma anche “Vorrei conoscere la storia della capitale della Germania”, oppure altro.
Nel caso in un’interazione di bassa utility l’intenzione dell’utente non è chiara e può essere necessario fare uno step ulteriore: l’assistente può quindi chiedere all’utente maggiori dettagli sulla sua query, per arrivare a un’esperienza conversazione proficua.
Espressione
Con espressione si intendono le possibili varianti linguistiche che gli utenti potrebbero utilizzare nel momento in cui intraprendono una ricerca vocale.
Esistono diversi modi per chiedere una stessa cosa: in fase di sviluppo bisogna considerare più opzioni e prevedere numerose varianti. Per esempio, per ordinare un hamburger a domicilio, un utente potrebbe pronunciare una tra le seguenti frasi, tutte differenti ma con lo stesso scopo: “Voglio un hamburger”, “Ordina un hamburger”, “Ordinare Hamburger da asporto”, e così via.
Parametri
I parametri sono funzionali alla corretta elaborazione dell’output da parte dell’agente conversazionale e, a seconda di come viene configurato e delle caratteristiche di un servizio, possono essere opzionali o determinanti.
Ad esempio, un negozio che ha filiali in diverse province e che studia offerte ad hoc per ogni luogo, attivando un servizio di assistenza vocale dovrà necessariamente inserire la specifica sulla città tra le risposte da dare a un utente in cerca di sconti.
Riconoscimento degli intenti
Un’esperienza conversazionale efficace, in definitiva, deve essere in grado di associare correttamente un intento a un’espressione, per dare una risposta soddisfacente a un utente. Questa capacità si ottiene attraverso delle fasi di training e di machine learning in fase di sviluppo: più casistiche vengono previste, migliore sarà la performance della tecnologia vocale.
Ma questa fase di “educazione” dell’interfaccia conversazionale prosegue anche dopo la pubblicazione dell’applicazione vocale. Infatti, grazie a un sistema di tracciamento delle risposte degli utenti, è possibile affinare l’interazione attraverso l’analisi delle criticità emerse dai dati raccolti.
Gli ambiti di utilizzo delle applicazioni vocali
Dal settore automobilistico a quello bancario, fino all’assistenza nei laboratori scientifici, l’interazione con i voice assistant è una fonte inesauribile di dati e permette di analizzare le abitudini e di registrare le preferenze degli utenti, per avvicinarsi sempre di più ai loro reali bisogni, con una modalità semplice e naturale: la voce.
I voice assistant possono essere un reale supporto per i consumatori e un efficace touchpoint per i brand che investono in questa tecnologia. Per le aziende questa è l’opportunità di offrire contenuti accessibili, fidelizzare i consumatori o raggiungerne di nuovi.
Importanti player, come la catena statunitense Walmart, hanno lanciato voice assistant che supportano, in questo caso, i propri dipendenti nella ricerca di informazioni su prodotti, prezzi, fornitori, per ottimizzare i processi di lavoro e migliorare la qualità della vita professionale delle persone.
Una voice strategy permette ai brand di aumentare il valore non solo dei propri servizi, ma anche la propria brand awareness e l’attrazione dei talenti.
Ti abbiamo incuriosito? Trova la voce del tuo brand con noi!