La traduction automatique (MT) est généralement considérée comme un processus unique qui génère l'équivalent linguistique en langue cible de textes en langue sources, et ce à partir de zéro.
Nous considérons ici un paramétrage plus général qui suppose une séquence cible initiale, qui doit être transformée en une traduction valide de la source, rétablissant ainsi le parallélisme entre la source et la cible.
Pour cette tâche de synchronisation bilingue, nous considérons plusieurs architectures (à la fois autorégressives et non autorégressives) et régimes d'entraînements, et expérimentons de multiples paramètres pratiques tels que une MT interactive simulée, une traduction avec mémoire de traduction et un nettoyage de cette mémoire de traduction.
Nos résultats suggèrent qu' un seul système générique basé sur l'édition, une fois affiné, peut se comparer avec, voire surpasser, les systèmes dédiés spécialement entrainés pour ces tâches.
Conférence 2022 sur les méthodes empiriques de traitement du langage naturel (EMNLP 2022), Cécembre 2022, Abou Dabi, Émirats Arabes Unis