Insegnare a Google a capire le persone con la sindrome di Down

Gli assistenti vocali stanno dimostrando sempre più la loro utilità nell’utilizzo quotidiano di milione di persone, ma ad oggi i dispositivi fanno ancora fatica a riconoscere gli accenti più marcati. Il problema è ancora più evidente quando gli utenti con schemi vocali unici, come le persone con sindrome di Down, cercano di utilizzare uno smart speaker.

Secondo le statistiche del CDC (Centers for Disease Control and Prevention) la sindrome di Down continua ad essere il disturbo cromosomico più comune. Ogni anno, circa 6.000 bambini nascono con la sindrome di Down, che è circa 1 su ogni 700 nati. Tra il 1979 e il 2003, il numero di bambini nati con sindrome di Down è aumentato di circa il 30%.

Grazie ai progressi della scienza medica, le persone con sindrome di Down possono ad oggi condurre una vita relativamente normale e molto più sana rispetto al passato, ma i loro modelli di linguaggio rimangono comunque influenzati dalla malattia.

Per superare questa difficoltà Google ha lanciato il progetto Understood, in collaborazione con la Canadian Down Syndrome Society (CDSS).

Che cos’è il progetto Understood?

Il progetto Understood nasce da una partnership tra la CDSS e il progetto Euphonia di Google. Euphonia è un’iniziativa di ricerca che mira a rendere la tecnologia vocale più accessibile.

L’obiettivo è di raccogliere campioni vocali dalla comunità adulta della sindrome di Down per creare un database che possa aiutare la tecnologia di Google a comprendere meglio le persone con sindrome di Down quando interagiscono con un assistente vocale.

Come si può leggere nel sito ufficiale del progetto,

le macchine apprendono attraverso i dati. Più dati ottengono, più sono precise. Per insegnare la tecnologia vocale, i dati di cui abbiamo bisogno sono registrazioni vocali. La Canadian Down Syndrome Society sta collaborando con Google per fornire loro le voci di cui hanno bisogno per comprendere meglio le persone con sindrome di Down. Più campioni vocali sono condivisi dalla comunità della sindrome di Down, più ci avviciniamo a un mondo in cui ogni persona viene compresa”.

Perché la CDSS sta collaborando con Google nel progetto Understood?

Google ha dimostrato con il Progetto Euphonia la sua volontà di rendere la tecnologia vocale più accessibile per le persone con una pronuncia non standard. Tuttavia, una delle sfide più impegnative che ha affrontato è stata quella di reclutare un numero sufficiente di persone per partecipare al processo di raccolta dei dati.

La CDSS ha visto il progetto come una grande opportunità per collaborare e offrire un aiuto concreto agli individui all’interno della comunità della sindrome di Down. Tra la competenza tecnologica di Google e le connessioni della CDSS, questa partnership lavora per approfondire la ricerca del Progetto Euphonia. Inoltre, la CDSS sta lavorando per garantire che gli individui con sindrome di Down siano ben rappresentati nel futuro della tecnologia vocale.

Come funziona la raccolta delle voci nel progetto Understood

Se si è persone con la sindrome di Down e si desidera donare la propria voce al database di Google, basta aprire il sito del progetto e seguire pochi semplici passaggi, illustrati nell’iconografica di seguito e sotto descritti:

  1. Cliccare su “Dona la tua voce” per compilare il form dedicato
  2. Ricevere un email di login da Google
  3. Iniziare a registrare frasi
  4. Condividere su Facebook e coinvolgere altre persone con la sindrome di Down
  5. Ogni voce aggiunta aiuterà Google

La tecnologia vocale a servizio di tutti

Le interfacce vocali sono state prodotte in milioni di unità e si trovano attualmente disponibili su differenti device, a partire dai più comuni smartphone per arrivare agli assistenti integrati nelle automobili e negli home device.
L’utilizzo della voce per comunicare in modo rapido ed efficace con gli smart speaker offre numerose possibilità di miglioramento della vita di tutti i giorni: con poche parole è possibile infatti aggiungere degli ingredienti alla lista della spesa, ricevere informazioni sul meteo, seguire una ricetta passo passo, acquistare biglietti del teatro e così via.

Allo stato attuale, le persone con disabilità fanno più fatica ad utilizzare la tecnologia vocale, anche se potrebbero essere quelle maggiormente aiutate nella semplificazione di alcune azioni quotidiane. Questo accade perché i sistemi sono stati finora allenati su delle voci “standard”, ma le voci di alcune persone differiscono – in maniera leggera o più marcata – nella pronuncia.

Il riconoscimento automatico del parlato (Automatic Speech Recognition, ASR) può essere quindi migliorato per permettere a chi parla in modo non standard di interagire ugualmente con gli smart device e di aumentare così la propria indipendenza.

Quando la tecnologia vocale capirà del tutto le persone con la sindrome di Down?

Nonostante Google sia cosciente del fatto che l’attuale tecnologia di riconoscimento vocale possa essere frustrante da usare per le persone che hanno difficoltà a essere comprese, il progetto Euphonia si trova ancora nelle prime fasi di un arco di ricerca potenzialmente lungo.

La speranza è che la ricerca porti a dei miglioramenti nella comprensione del parlato non standard il più presto possibile, ma realisticamente potrebbe servire ancora qualche anno per raggiungere l’obiettivo.

È importante, quindi, collaborare il più possibile in questi progetti: più campioni vocali verranno raccolti, più lo sviluppo della ricerca sarà veloce.