Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/65891
Tipo: Artigo de Evento
Título: Building the first English-Brazilian Portuguese: corpus for automatic post-editing
Autor(es): Felipe de Almeida Costa
Thiago Castro Ferreira
Adriana Silvina Pagano
Wagner Meira Junior
Resumo: This paper introduces the first corpus for Automatic Post-Editing of English and a low-resource language, Brazilian Portuguese. The source English texts were extracted from the WebNLG corpus and automatically translated into Portuguese using a state-of-the-art industrial neural machine translator. Post-edits were then obtained in an experiment with native speakers of Brazilian Portuguese. To assess the quality of the corpus, we performed error analysis and computed complexity indicators measuring how difficult the APE task would be. We report preliminary results of Phrase-Based and Neural Machine Translation Models on this new corpus. Data and code publicly available in our repository.
Assunto: Linguística de corpus
Tradução mecânica
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: FALE - FACULDADE DE LETRAS
Tipo de Acesso: Acesso Aberto
Identificador DOI: https://doi.org/10.18653/v1/2020.coling-main.533
URI: http://hdl.handle.net/1843/65891
Data do documento: Dez-2020
metadata.dc.relation.ispartof: International Conference on Computational Linguistics
Aparece nas coleções:Artigo de Evento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Building the first English-Brazilian Portuguese corpus for automatic post-editing.pdf161.91 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.