ACL Papier

Lingua Custodia contribue, pour la troisème fois, à la conférence WMT21 sur la Traduction Automatique.

Le 11 novembre 2021, Melissa Ailem, chercheuse au sein du Lab, a présenté un papier de recherche lors de la conférence WMT21.

Ce papier décrit les derniers travaux de recherche de Lingua Custodia sur la traduction automatique.

La conférence WMT est un évènement majeur qui rassemble chaque année les principaux acteurs internationaux de la Traduction Automatique, tant au niveau académique qu’au niveau industriel.

wmt2021 poster
Poster

Abstrait

This paper describes Lingua Custodia’s submission to the WMT21 shared task on machine translation using terminologies. We consider three directions, namely English to French, Russian, and Chinese. We rely on a Transformer-based architecture as a building block, and we explore a method which introduces two main changes to the standard procedure to handle terminologies. The first one consists in augmenting the training data in such a way as to encourage the model to learn a copy behavior when it encounters terminology constraint terms. The second change is constraint token masking, whose purpose is to ease copy behavior learning and to improve model generalization. Empirical results show that our method satisfies most terminology constraints while maintaining high translation quality.

Lire le papier de recherche.

Enjoy this blog? Please spread the word :)

Twitter
LinkedIn