Comment la machine apprend à traduire dans votre langue ?

travail collaboratif de traduction automatique

La traduction automatique a pris une part prépondérante dans le secteur de la traduction, et notamment pour les entreprises avec des exigences fortes en termes de volumes et de délais. Si la traduction automatique est devenue si importante, c'est grâce à ce que l'on appelle le machine learning et les réseaux neuronaux.

Ces technologies développées il y a peu ont permis des progrès extraordinaires dans les outils de traduction automatique. La traduction automatique est plus précise, plus fiable et plus adaptée au secteur concerné. Le machine learning est un sous-domaine de l’intelligence artificielle et vient de l’idée que l’ordinateur peut non seulement traiter de la data, mais aussi utiliser cette data pour apprendre et se perfectionner sur divers sujets.

L'importance de l'apprentissage de la machine

La traduction automatique, si elle était jusqu’à présent basée sur un système de règles et de statistiques, est devenue de plus en plus performante grâce au machine learning.

L’un des meilleurs exemples du machine learning appliqué à la traduction automatique est la traduction neuronale. La traduction automatique neuronale est aujourd’hui une technologie de pointe qui utilise le machine Learning, mais aussi la big data et l’Intelligence Artificielle. Cela permet de traduire et/ou localiser en prenant en compte le contexte des termes et de les relier, etc,. de façon instantanée.

Un mot > un contexte > une traduction
Le même mot > Un autre contexte > Une autre traduction

Pour que cela fonctionne, il faut fournir de la donnée à la machine :

1. La data fournie par l'outil

Cette data, qui se présente sous forme de fichiers avec une langue source et une langue cible, peut s’acheter ou être disponible en open source. Elle sera notamment traitée par des linguistes pour corriger les erreurs potentielles ou adapter le fichier aux besoins de l’entreprise. Cette intervention humaine est capitale, car plus la data est « propre » et relue par des humains plus elle sera utilisable par la machine.

2. La data fournie par l'entreprise

La donnée peut être fournie par l’entreprise elle-même, notamment avec ses mémoires de traduction. Les mémoires de traduction sont un stock de traductions passées et validées en interne (lexicologie spécifique, tone of voice, etc).

Les capacités incroyables de la traduction automatique

1. Apprendre de la data

Le processus de traduction a donc lieu via un réseau de neurones qui a la capacité de relier les phrases au contexte au lieu d’analyser les mots un par un. L’outil va pouvoir traduire automatiquement et au fur et à mesure la langue source, en tenant compte du contexte des phrases de la langue source et des règles d’utilisation de la langue cible déterminées par l’entreprise. Ce contexte sera établi grâce à toute la data existante. Le réseau neuronal s’enrichit donc de ce grand volume de données d’entraînement et optimise perpétuellement les traductions à partir des données qui le nourrisse.

La machine apprend pendant la phase d'entrainement et quand elle traduit c'est sur la base de cet apprentissage, qui peut être régulièrement mis à jour.
Par ailleurs, pendant la traduction, peuvent intervenir en effet l'ajout de dictionnaires et la nouvelle fonctionnalité Neural Fuzzy Adatation (NFA) qui va également aller puiser le contexte dans la mémoire de traduction. Le contenu est alors traduit presque instantanément avec une grande précision grâce aux systèmes neuronaux et à l'intelligence artificielle.

2. Améliorer la précision linguistique avec un dictionnaire

Les outils de traduction automatique utilisent donc ces moteurs d'apprentissage pour apprendre, mais ils peuvent aussi apprendre à utiliser le dictionnaire.
Ce n'est pas un usage informatique mais un usage réel comme un humain : l'ordinateur va ouvrir le dictionnaire, trouver la correspondance en éliminant et/ou en sélectionnant le bon terme et traduire phrase par phrase ou document par document dans le contexte qui correspond parfaitement aux données sources.
La traduction automatique est donc pertinente pour chaque entreprise et s'améliore au fur et à mesure de son utilisation.

3. Affiner encore plus en utilisant les mémoires de traduction

Il est possible d'affiner encore plus la traduction en utilisant les ressources internes de l'entreprise. Les sigles, acronymes et vocabulaire du métier utilisés au quotidien peuvent être utilisés afin de personnaliser les traductions.

La traduction est donc la plus proche possible de la langue d'origine, en utilisant votre tone of voice et la lexicologie spécifique à votre métier.

Auteur
Alexandre, spécialiste des technologies de traduction
Temps
Lecture : 3 min.
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN