Bilingual Synchronization: Restoring Translational Relationships with Editing Operations [PDF en anglais]

Documents de recherche SYSTRAN

La traduction automatique (MT) est généralement considérée comme un processus unique qui génère l'équivalent linguistique en langue cible de textes en langue sources, et ce à partir de zéro.

Nous considérons ici un paramétrage plus général qui suppose une séquence cible initiale, qui doit être transformée en une traduction valide de la source, rétablissant ainsi le parallélisme entre la source et la cible.

Pour cette tâche de synchronisation bilingue, nous considérons plusieurs architectures (à la fois autorégressives et non autorégressives) et régimes d'entraînements, et expérimentons de multiples paramètres pratiques tels que une MT interactive simulée, une traduction avec mémoire de traduction et un nettoyage de cette mémoire de traduction.

Nos résultats suggèrent qu' un seul système générique basé sur l'édition, une fois affiné, peut se comparer avec, voire surpasser, les systèmes dédiés spécialement entrainés pour ces tâches.

En savoir plus

 

Jitao Xu, Josep Crego, François Yvon

Conférence 2022 sur les méthodes empiriques de traitement du langage naturel (EMNLP 2022), Cécembre 2022, Abou Dabi, Émirats Arabes Unis

Auteur
Josep Crego, responsable du laboratoire
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN