Comment une machine peut-elle apprendre à traduire dans votre langage ?

La traduction automatique est devenue une part capitale dans le domaine de la traduction, notamment pour les entreprises dont les besoins en délais et en volumes sont très importants. Or, si la traduction automatique a pris tellement d’ampleur, c’est aussi grâce à la capacité de ce que l’on appelle le machine learning et la traduction neuronale.
Ces technologies développées il y a peu, ont vu une application prépondérante dans la traduction automatique et ont permis des progrès extraordinaires dans lesdits outils de traduction automatique. La traduction automatique est plus précise, plus fiable et adaptée au secteur concerné.

Or, si la traduction automatique a pris tellement d’ampleur, c’est aussi grâce à la capacité de ce que l’on appelle le machine learning et la traduction neuronale.
These recently developed technologies have been used extensively in machine translation and have led to extraordinary advances in machine translation tools.
Machine learning is a subfield of artificial intelligence and comes from the idea that the computer can not only process data, but also use that data to learn and improve on various subjects.

Le machine learning, un apprentissage constant pour la traduction neuronale

La traduction automatique, si elle était jusqu’à présent basée sur un système de règles et de statistiques, est devenue de plus en plus performante quand les solutions de traduction ont pu utiliser ces technologies.

L’un des plus beaux exemples du machine learning appliqué à la traduction automatique est la traduction neuronale. La traduction automatique neuronale est aujourd’hui une technologie de pointe qui utilise le machine Learning, mais aussi la big data et l’Intelligence Artificielle afin de traduire et/ou localiser en prenant en compte le contexte des termes, de les relier, etc. et ceci de façon instantanée.

Un mot > un contexte > une traduction
Le même mot > Un autre contexte > Une autre traduction

Pour que cela fonctionne il faut fournir de la donnée à la machine :

1. La data fournie par l'outil

Cette data, qui se présente sous forme de fichiers avec une langue source et une langue cible peut s’acheter ou être disponible en open source.
Elle sera notamment traitée par des linguistes pour corriger les erreurs potentielles ou adapter le fichier aux besoins de l’entreprises. Cette intervention humaine est capitale, car plus la data est « propre » et relue par des humains plus elle sera utilisable par la machine.

2. La data fournie par l'entreprise

La donnée peut être fournie par l’entreprise cliente, notamment avec ses mémoires de traduction.
Les mémoires de traduction sont un stock de traductions passées, validées en interne par l’entreprise (lexicologie spécifique, tone of voice, etc).

Les capacités incroyables de la traduction automatique

1. Apprendre de la data

Le processus de traduction a donc lieu via un réseau de neurones qui a la capacité de relier les phrases au contexte au lieu d’analyser les mots un par un.
L’outil va pouvoir traduire automatiquement et au fur et à mesure la langue source, en tenant compte du contexte des phrases de la langue source et des règles d’utilisation de la langue cible déterminées par l’entreprise. Ce contexte sera établi grâce à toute cette data.
Le réseau neuronal s’enrichit donc de ce grand volume de données d’entraînement et optimise perpétuellement les traductions à partir des données qui le nourrisse.

La machine apprend pendant la phase d'entrainement et quand elle traduit c'est sur la base de cet apprentissage, qui peut être régulièrement mis à jour.
Par ailleurs, pendant la traduction, peuvent intervenir en effet l'ajout de dictionnaires et la nouvelle fonctionnalité Neural Fuzzy Adatation (NFA) qui va également aller puiser le contexte dans la mémoire de traduction. Le contenu est alors traduit presqu'instantanément avec une précision jamais atteinte grâce aux systèmes neuronaux et à l'intelligence artificielle.

2. Améliorer la précision linguistique avec un dictionnaire

La traduction automatique utilise donc ces moteurs d’entrainement pour apprendre, mais elle peut aussi apprendre à utiliser le dictionnaire.
Ce n’est pas une utilisation informatique mais une véritable utilisation tel un « humain » : l’ordinateur va ouvrir le dictionnaire, trouver la correspondance en éliminant et/ou en sélectionnant le bon terme et traduire phrase par phrase ou document par document dans le contexte qui correspond parfaitement à la donnée source.
La traduction automatique est donc pertinente pour chaque entreprise, et se perfectionne au fur et à mesure de l’utilisation.

3. Affiner encore en utilisant les mémoires de traduction

Il est possible d’encore affiner la traduction en utilisant les ressources internes de votre entreprise. Les sigles, acronymes et vocabulaire du métier que vous utilisez au quotidien peuvent être utilisés afin de personnaliser les traductions.

La traduction est donc la plus proche possible de la langue d'origine, en utilisant votre tone of voice et la lexicologie spécifique à votre métier.

Auteur
Alexandre, Translation technology specialist
Temps
Lecture : 3 min.
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN