Extração de estruturas-alvo em corpora de aprendentes
Consultas CQL para a exploração do COPLE2
DOI:
https://doi.org/10.26334/2183-9077/rapln10ano2023a2Palavras-chave:
Corpus de aprendentes, estruturas-alvo, PLE, L2Resumo
Os corpora de língua estrangeira (LE) ou língua segunda (L2) são conjuntos de produções de falantes não nativos, aprendentes de uma dada língua, que naturalmente incluem os erros e os acertos produzidos. Estes corpora servem diferentes objetivos de investigação, tais como estudos sobre aquisição de LE e L2, fenómenos de interferência linguística ou análise e diagnóstico de níveis de proficiência de LE/L2. No contexto da investigação destes tópicos, a definição do nível de proficiência do aprendente é muitas vezes relevante e esta é feita, tipicamente, através da análise da presença ou ausência de erros nas produções dos aprendentes, tendo como base mapeamentos entre erros e acertos típicos ou expectáveis para um dado nível de proficiência. No entanto, contrariamente ao erro do aprendente – que é explicitamente marcado no corpus e cuja tipologia e metodologia de análise constitui por si um subtópico de investigação –, os acertos, e em particular as estruturas-alvo (estruturas bem formadas expectáveis em produções de aprendentes de um dado nível de proficiência), não são facilmente identificáveis nos corpora. O trabalho que aqui se apresenta visa, assim, colmatar essa lacuna no COPLE2 – Corpus de Português Língua Estrangeira/Segunda através da utilização de expressões de pesquisa em CQL – Corpus Query Language. Tendo por base estruturas-alvo pré-identificadas e a informação disponibilizada no COPLE2, tal como a etiquetagem morfossintática e os diferentes níveis de informação e anotação (produção do aprendente, correção do professor, forma normalizada, lema, etc.), são propostas expressões de pesquisa em CQL que permitem facilmente a qualquer utilizador a extração imediata de exemplos de estruturas-alvo por nível. A construção das expressões de pesquisa implica a definição e a testagem das melhores estratégicas e exige a sistematização de regras linguísticas e de padrões de ocorrência dos fenómenos em causa, mas também a definição de formas de contornar as limitações inerentes à anotação do corpus, por um lado, e à linguagem de pesquisa, por outro.
Downloads
Downloads
Publicado
Como Citar
Edição
Secção
Licença
Direitos de Autor (c) 2023 Raquel Amaro, Alexandre Carreira, Alice Vieira, Cláudia Castro, Esmeralda Leong

Este trabalho encontra-se publicado com a Licença Internacional Creative Commons Atribuição-NãoComercial-CompartilhaIgual 4.0.
Os autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação. Os artigos estão simultaneamente licenciados sob a Creative Commons Attribution License que permite a partilha do trabalho com reconhecimento da sua autoria e da publicação inicial nesta revista.
Os autores têm autorização para disponibilizar a versão do texto publicada na RAPL em repositórios institucionais ou outras plataformas de distribuição de trabalhos académicos (p.ex. ResearchGate).