Modelos de pré-processamento para tecnologias da fala

O impacto do normalizador e do grafema-fone nos sistemas híbridos

Autores

DOI:

https://doi.org/10.26334/2183-9077/rapln10ano2023a6

Palavras-chave:

tecnologias de fala, normalizador, grafema-fone, conhecimento linguístico, modelos

Resumo

Este artigo descreve os métodos de pré-processamento linguístico em sistemas híbridos fornecidos por uma empresa internacional de Inteligência Artificial (IA), a Defined.ai. A startup concentra-se em fornecer dados, modelos e ferramentas de IA de alta qualidade. O objetivo principal deste trabalho é aprimorar e avançar a qualidade dos modelos de pré-processamento aplicando conhecimento linguístico. Assim, focamo-nos em dois modelos linguísticos introdutórios numa arquitetura de fala: o Normalizador e o Grafema-para-fone (G2P). Para isso, foram realizadas duas iniciativas em colaboração com a equipa de Machine Learning da Defined.ai. O primeiro projeto concentra-se em expandir e melhorar um modelo de Normalizador para o Português Europeu. O segundo projeto cobre a criação de modelos G2P para duas línguas – Sueco e Russo. Os resultados mostram que ter uma abordagem baseada em regras para o Normalizador e G2P aumenta a sua precisão e o seu desempenho, representando uma vantagem significativa na melhoria das ferramentas e das arquiteturas de fala da empresa. Além disso, com os resultados obtidos no primeiro projeto, melhoramos o normalizador em termos de facilidade de uso, aumentado cada regra com conhecimento linguístico. Dessa forma, a nossa pesquisa demonstra o valor do conhecimento linguístico em modelos de pré-processamento.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2023-10-22

Como Citar

Carriço, B., Shulby, C., & Moniz, H. (2023). Modelos de pré-processamento para tecnologias da fala : O impacto do normalizador e do grafema-fone nos sistemas híbridos. Revista Da Associação Portuguesa De Linguística, (10), 92–114. https://doi.org/10.26334/2183-9077/rapln10ano2023a6