Projeto Euphonia do Google: o que é e como pode ajudar pessoas com fala atípica

Índice:

Anonim

A maioria das pessoas associa a Lei dos Americanos com Deficiências com alterações físicas e de infraestrutura que precisam ser feitas em edifícios ou outros locais, mas conforme a definição de deficiência está se ampliando, as pessoas estão percebendo que "acessível" também se aplica a coisas como sites e reconhecimento de voz.

Nesse caso, o gigante da tecnologia Google está se esforçando para melhorar seu software de reconhecimento de voz com o Projeto Euphonia. O Projeto Euphonia é uma iniciativa para gravar amostras de voz de voluntários e analisá-las para que pessoas com ELA, distúrbios neurológicos e outras dificuldades de fala possam utilizar seus dispositivos inteligentes com a facilidade de um indivíduo "típico".

Por que eu me ofereci

Uma corda vocal esquerda paralisada e língua assimétrica devido a um tumor cerebral resultou na minha doença da fala, disartria. Minha fala arrastada e voz fraca tornam difícil para amigos e familiares me entenderem ou me ouvirem, especialmente em um espaço lotado. Isso me tornou um candidato principal para o Projeto Euphonia, então me ofereci assim que li a respeito. Gravando amostras em um site rudimentar, reiterei 4.500 frases de "Como faço para chegar a Mountain View, Califórnia?" Até "Tocar músicas de Cardi B".

Além de atender aos critérios do Projeto Euphonia, me ofereci porque fui apresentado ao programa de reconhecimento de voz Dragon Naturally Speaking em 1997 - e ele falhou espetacularmente. Ao longo dos anos, tentei programas análogos no Laboratório de Tecnologia Assistiva do Hospital Infantil de Boston, bem como versões atualizadas de Dragão, e embora este software tenha feito grandes avanços, ele ainda luta para identificar minha voz.

Isso é problemático por duas razões: eu sou um escritor com falta de habilidades motoras finas, então eu digito com uma mão, ou lentamente com duas, se estou cansado. Com três livros de poemas autopublicados, um livro de memórias e uma coleção de histórias não publicadas ligadas ao meu nome, estremeço ao pensar o quanto mais eu poderia ter produzido se digitar não fosse uma tarefa fisicamente árdua.

O outro motivo pelo qual o reconhecimento de voz inferior cria uma barreira para mim é a proliferação de produtos habilitados para voz em residências e telefones. Apenas usando minha história, se eu pudesse acessar computadores e dispositivos inteligentes da maneira que deveriam ser usados, isso me daria mais tempo livre, me permitiria realizar tarefas totalmente e potencialmente transformar a maneira como vivo.

Projeto Euphonia: Como funciona?

Então, como funciona a Euphonia? Depois de baixar um aplicativo protótipo com um modelo de reconhecimento de fala personalizado para o meu telefone, coloquei o telefone ao lado do meu laptop e ditei nele; ao fazer isso, observei tudo o que disse aparecer no meu Google Doc no meu laptop. Fiz isso por alguns meses, gravando frases de um romance que estava escrevendo e corrigindo quaisquer imprecisões para o Google usando o aplicativo.

Depois de mais vários meses sem gravar frases, terminei o primeiro rascunho de um romance - 20.000 palavras - usando o aplicativo. Isso não quer dizer que seja perfeito; para cada hora que escrevo, tenho que voltar e passar uma hora fazendo pequenas correções. Mas eu não me importo porque o Euphonia está em um estágio beta e em vez de digitar lentamente 100 palavras por dia, estou gerando 500 palavras por dia.

Depois, há o fato de que Euphonia não foi projetada para processamento de texto - é mais para comandos declarativos - e meu estilo de escrita é o que eles chamam de 'calça' (voe pelo assento de suas calças), então eu tenho muitas pausas porque eu não sei como uma frase vai terminar - você sabe, como Michael Scott. No entanto, quando sei o que quero dizer, como em mensagens de texto, e-mails ou dando instruções ao meu assistente, é de longe o reconhecimento de voz mais preciso que já usei.

Quando instituições como o Google dão voz aos deficientes no projeto da arquitetura do futuro, deixando-os permanecerem eles mesmos, em vez de tentar convertê-los em algo "normal", isso me dá esperança de que, na era da IA, o humanismo prevalecerá.

Se você gostaria de visitar o site do Projeto Euphonia, ou tem uma deficiência de fala e deseja contribuir com uma amostra de voz, você pode acessar este link: https://sites.research.google/euphonia/about/