Tecnologias de fala e a variação de pronúncia do russo no contexto de VoiceInteraction
DOI:
https://doi.org/10.26334/2183-9077/rapln10ano2023a8Palavras-chave:
reconhecimento automático de fala, fonética, pausas preenchidas, língua russa, variedadesResumo
O presente artigo tem como objetivo descrever o trabalho realizado na VoiceInteraction, empresa especializada no desenvolvimento de soluções de processamento de fala, com especial destaque para a transcrição automática, que recorre a um Reconhecedor Automático de Fala (ASR) híbrido. O objetivo principal centrou-se no estudo das características fonéticas da língua russa, tendo em conta quatro tarefas principais: descrição do inventário fonético-fonológico; validação das transcrições de noticiários; validação de um léxico previamente criado; e integração de pausas preenchidas no ASR. O presente trabalho contribuiu para o projeto Artificial Intelligence and Advanced Data Analysis for Authority Agencies (AIDA), financiado pela Comissão Europeia no âmbito do programa Horizonte 2020, transcrevendo os dados em língua russa.
Downloads
Downloads
Publicado
Como Citar
Edição
Secção
Licença
Direitos de Autor (c) 2023 Anna Havras, Carlos Mendes, Gueorgui Hristovsky, Sérgio Paulo, Helena Moniz
Este trabalho encontra-se publicado com a Licença Internacional Creative Commons Atribuição-NãoComercial-CompartilhaIgual 4.0.
Os autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação. Os artigos estão simultaneamente licenciados sob a Creative Commons Attribution License que permite a partilha do trabalho com reconhecimento da sua autoria e da publicação inicial nesta revista.
Os autores têm autorização para disponibilizar a versão do texto publicada na RAPL em repositórios institucionais ou outras plataformas de distribuição de trabalhos académicos (p.ex. ResearchGate).