7 min para ler
CESAR .
2023-08-14T21:23:53
Tecnologia
Lenovo: Acessibilidade para deficiência auditiva com P&D e IA
![pexels-shvets-production-7516363](/_next/image?url=https%3A%2F%2Fwww.cesar.org.br%2Fpainel%2Fwp-content%2Fuploads%2F2024%2F02%2Fpexels-shvets-production-7516363-1-scaled.jpg&w=1920&q=75)
Você já teve uma dúvida enquanto fazia compras, pedia comida, realizava transações bancárias ou visitava o médico? Mas, mesmo assim, não conseguiu encontrar alguém para ajudá-lo ou uma maneira de se ajudar em seu idioma nativo?
Infelizmente, situações como essa são comuns para mais de 430 milhões de pessoas surdas e/ou com deficiência auditiva em todo o mundo. Essa realidade é repleta de dificuldades diárias de acessibilidade e barreiras linguísticas em espaços públicos.
Atualmente, o Brasil, onde mais de 2,3 milhões de pessoas têm deficiência auditiva profunda, possui dois idiomas de sinais distintos, além de vários dialetos regionais. Essa pluralidade aumenta os obstáculos que muitos brasileiros enfrentam ao precisar se comunicar com outras pessoas usando tanto a Língua Brasileira de Sinais (Libras) quanto a Língua Gestual Portuguesa (LGP).
Buscando resolver essa questão, a empresa Lenovo fez parceria com o CESAR com o objetivo de criar uma ferramenta para melhorar a acessibilidade de pessoas com deficiência auditiva. Continue a leitura e confira como essa colaboração elaborou um projeto de inclusão digital.
O desafio da Lenovo: tecnologia para todos, sem exceção
Foi durante uma discussão interna da equipe da Lenovo, em 2019, que uma desenvolvedora de software fluente em Libras e voluntária intérprete em seu tempo livre destacou muitos desses problemas de acessibilidade e desafiou a empresa a fazer mais ações tecnológicas para melhorar a independência e a qualidade de vida da comunidade surda.
“A Lenovo promete tecnologia mais inteligente para todos, mas como podemos incluir também as pessoas surdas? Todos significa todos”, lembra Hildebrando Lima, diretor de P&D da Lenovo no Brasil, reforçando que a declaração da desenvolvedora chamou sua atenção.
Inspirada por essa pergunta, a Lenovo começou a pensar em desenvolver uma solução: uma ferramenta de chat para tradução em tempo real do português para a Língua Brasileira de Sinais.
A ideia é que a solução possibilite que pessoas com deficiência auditiva realizem sinais para a câmera de um dispositivo, enquanto um algoritmo realiza a tradução simultânea para outra pessoa do outro lado, convertendo-a em texto na língua portuguesa.
O início do projeto de inclusão e acessibilidade da Lenovo + CESAR
Com o desenho da solução em mente, a Lenovo observou que alcançar a visão ideal de captura de vídeo em tempo real e tradução simultânea entre idiomas não era uma tarefa fácil. As questões eram várias, principalmente devido ao grande número de variáveis envolvidas, incluindo os gestos individuais para cada palavra e a sintaxe de cada frase.
Compreendendo esse cenário, a Lenovo recorreu à equipe de IA (Inteligência Artificial) do CESAR para começar a estudar o problema, capturar dados e estabelecer as bases para o desenvolvimento futuro do produto. Segundo Lima:
“Há vários obstáculos envolvidos apenas na captura de vídeo — incluindo a cor da pele da pessoa, a cor de fundo, a iluminação, a roupa, a velocidade dos gestos do sinalizador e as posições das mãos em relação ao corpo — para citar apenas alguns. Além disso, nem todas as câmeras possuem o mesmo nível de percepção de profundidade.
Sabíamos que o CESAR tinha uma equipe de IA excelente com a experiência e o poder de processamento necessários para capturar e analisar essas imagens em tempo real. Esse foi o início da nossa jornada juntos, quase cinco anos atrás”.
Desde então, a Lenovo e o CESAR criaram um conjunto de dados de milhares de vídeos de Língua Brasileira de Sinais e desenvolveram uma nova tecnologia patenteada para ensinar IA a identificar visualmente e contextualizar gestos individuais.
A tecnologia também pode ser utilizada para ensinar a linguagem de sinais a pessoas ouvintes
, visto que é possível usar imagens computacionais para rastrear a precisão dos gestos em relação ao banco de dados personalizado em construção.
Assim, em vez de tentar traduzir sinal por sinal, a Inteligência Artificial e o banco de dados em desenvolvimento estão aprendendo a reconhecer posições das mãos. Nesse modo, extrapola dados das curvas das mãos e, principalmente, dos pontos de articulação digital dos ossos do sinalizador.
Uma vez que o algoritmo pode reconhecer e processar esses movimentos e gestos rapidamente e com precisão, é possível reconhecer o fluxo de uma frase e traduzi-la para texto. De acordo com Willian Grillo, designer de interação do CESAR:
“Eu acho que, no CESAR, nós somos especialistas em aprender. Nesse projeto, aprendemos muito a explorar um problema que é quase inacessível: se você olha de longe, começa a se assustar. A gente aprendeu a quebrar o problema, de uma forma que a gente consegue entendê-lo, resolver e entregar valor ao longo de todo o trajeto.
O importante é gerar passos intermediários e aprender com experimentação em ciclos cada vez menores, tanto sobre o público quanto sobre a tecnologia. É importante vislumbrar o próximo passo, não o topo da montanha”.
Quais serão os próximos passos da solução do mundo Lenovo?
Até agora, todos os testes e treinamento de algoritmo relacionados foram realizados dentro da Lenovo e do CESAR, e vários colaboradores com deficiência auditiva de ambas as equipes contribuíram para o projeto, como treinadores, testadores e participantes de grupos focais.
Por motivos de privacidade, as identidades de todos os voluntários envolvidos no treinamento do sistema de IA são mantidas anônimas. Apenas os pontos digitais de gestualização são armazenados como pontos de referência no banco de dados resultante.
O próximo passo é escalar o projeto além dos testes internos. Bilhões de pontos de dados adicionais serão necessários para atingir o objetivo desejado de lançar uma interface de tradução de língua de sinais em tempo real.
No entanto, o CESAR e a Lenovo conseguiram criar a arquitetura necessária para um modelo de tradução ao vivo que funcionará não apenas com a Língua Brasileira de Sinais. Mas, no futuro, poderá ser estendido para outras línguas de sinais ao redor do mundo.
Na busca por uma escala mais rápida e desenvolvimento de um produto mínimo viável (MVP), a Lenovo está adaptando essas novas soluções de tradução para verticais específicas, incluindo bancos e varejo, visando implementá-las no mundo real em 2024.
Por ora, a limitação do trabalho a contextos específicos é intencional, devido ao objetivo de facilitar para a IA se tornar fluente e proporcionar uma boa experiência ao usuário.
Para a Lenovo, a parceria com o CESAR nesse projeto de desenvolvimento de software de longo prazo não se trata apenas de aprimorar seus próprios produtos — trata-se de viver a missão da líder global em tecnologia e ter um impacto maior na promoção da inclusão em todo o mundo.
“O propósito desse projeto vai além do case de negócio. Quando dizemos ‘Tecnologia mais inteligente para todos’ na Lenovo, não pode ser apenas um slogan. Isso faz parte da nossa missão, e era algo que sabíamos que precisávamos fazer em benefício da comunidade de pessoas com deficiência auditiva, não importando o quê.”, complementa Hidelbrando Lima.
O Centro de Inovação CESAR, em Recife, é uma das instituições mais renomadas da América Latina em pesquisa, design e inovação sob demanda. Há mais de 26 anos, o CESAR tem sido um grande parceiro para empresas globais que buscam co-desenvolver inovações revolucionárias que elevem sua competitividade e produtividade.
Se a sua organização precisa de suporte especializado em pesquisa, design e inovação, entre em contato com o CESAR. Temos uma equipe formada por desenvolvedores, designers, pesquisadores e gerentes de projetos de inovação que poderá transformar o seu desafio em uma solução tangível e escalável.