Minha Visão

Como uma nova IA traduz a atividade cerebral em fala com 97% de precisão

Como uma nova IA traduz a atividade cerebral em fala com 97% de precisão 1
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


A idéia de uma máquina capaz de decodificar seus pensamentos pode parecer assustadora, mas para milhares de pessoaseople quem perdeu a capacidade de falar devido a doença ou incapacidade, isso pode mudar o jogo. Mesmo para pessoas físicas, poder digitar um e-mail apenas pensando ou enviandoing comandos para o seu assistente digital telepaticamente podem ser extremamente úteis.

Essa visão pode ter chegado um passo mais perto depois que pesquisadores da Universidade da Califórnia, em San Francisco, demonstraram que podiam traduzir sinais cerebrais em frases completas com taxas de erro tão baixas quanto três por cento, abaixo do limite para a transcrição profissional de fala.

Embora tenhamos sido capazes de decodificar partes da fala dos sinais do cérebro por cerca de uma década, até agora a maioria das soluções ainda está longe de traduzir consistentemente frases inteligíveis. No ano passado, os pesquisadores usaram um nova abordagem que alcançaram alguns dos melhores resultados até agora usando sinais cerebrais para animar um trato vocal simulado, mas apenas 70% das palavras eram inteligíveis.

A chave para o melhor desempenho alcançado pelos autores do novo artigo em Nature Neuroscience foi a percepção de que havia fortes paralelos entre a tradução de sinais cerebrais em texto e a tradução automática entre idiomas usando redes neurais, que agora são altamente precisas para muitos idiomas.

Embora a maioria dos esforços para decodificar sinais cerebrais tenha se concentrado na identificação da atividade neural que corresponde a fonemas específicos – os diferentes pedaços de som que compõem as palavras – os pesquisadores decidiram imitar a tradução automática, onde a frase inteira é traduzida de uma só vez. Isso provou uma abordagem poderosa; como certas palavras têm sempre mais chances de aparecer próximas umas das outras, o sistema pode confiar no contexto para preencher quaisquer lacunas.

A equipe usou a mesma abordagem codificador-decodificador comumente usada para tradução automática, na qual uma rede neural analisazé o sinal de entrada – normalmente texto, mas, neste caso, sinais cerebrais – para criar uma representação dos dados e, em seguida, uma segunda rede neural converte isso no idioma de destino.

Eles treinaram seu sistema usando a atividade cerebral registrada em 4 mulheres com eletrodos implantados no cérebro para monitorar convulsões ao ler um conjunto de 50 frases, incluindo 250 palavras únicas. Isso permitiu à primeira rede descobrir qual atividade neural se correlacionava com a qualich partes do discurso.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Nos testes, confiou apenas nos sinais neurais e conseguiu atingir taxas de erro abaixo de oito por cento em dois dos quatro sujeitos, o que corresponde aos tipos de precisão alcançados pelos transcritores profissionais.

Inevitavelmente, existem advertências. Em primeiro lugar, o sistema conseguiu decodificar apenas 30 a 50 frases específicas usando um vocabulário limitado de 250 palavras. Também requer que as pessoas tenham eletrodos implantados no cérebros, que atualmente é permitido apenas para um limiteed número de razões médicas altamente específicas. No entanto, existem vários sinais de que essa direção é promissora.

Uma preocupação era que, como o sistema estava sendo testado em frases incluídas em seus dados de treinamento, isto pode estar simplesmente aprendendo a corresponder sentenças específicas a assinaturas neurais específicas. Isso sugeriria que não estava realmente aprendendo as partes constituintes da fala, o que tornaria mais difícil a generalização para sentenças desconhecidas.

Porém, quando os pesquisadores adicionaram outro conjunto de gravações aos dados de treinamento que não foram incluídos nos testes, reduziu significativamente as taxas de erro, sugerindo que o sistema está aprendendo informações de sub-frases gostar palavras.

Eles também descobriram que o pré-treinamento do sistema nos dados do voluntário que alcançou a maior precisão antes do treinamento nos dados de um dos piores desempenhos reduziu significativamente as taxas de erro. Isso sugere que, em aplicações práticas, grande parte do treinamento poderia ser realizado antes que o sistema fosse entregue ao usuário final, e eles precisariam apenas ajustá-lo de acordo com as peculiaridades de seus sinais cerebrais.

É provável que o vocabulário desse sistema melhore consideravelmente à medida que as pessoas desenvolvem essa abordagem – mas mesmo uma paleta limitada de 250 palavras pode ser incrivelmente útil para um paraplégico e provavelmente pode ser adaptada a um conjunto específico de comandos para o controle telepático de outros dispositivos.

Agora, a bola está de volta aos tribunais das empresas que correm para desenvolver o primeiro interfaces neurais práticas.

Crédito da imagem: Dung Tran por Pixabay

READ  Assista uma Impressora 3D Cuspir Toda uma Casa de Dois Andares
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *