Comment une machine peut-elle apprendre à traduire dans votre langage ?

La traduction automatique a pris une part prépondérante dans le secteur de la traduction, et notamment pour les entreprises avec des exigences fortes en termes de volumes et de délais. Si la traduction automatique est devenue si importante, c'est grâce à ce que l'ion appelle le machine learning et les réseaux neuronaux.

Ces technologies développées il y a peu, ont vu une application prépondérante dans la traduction automatique et ont permis des progrès extraordinaires dans lesdits outils de traduction automatique. La traduction automatique est plus précise, plus fiable et adaptée au secteur concerné.
Le machine learning est un sous-domaine de l’intelligence artificielle et vient de l’idée que l’ordinateur peut non seulement traiter de la data, mais aussi utiliser cette data pour apprendre et se perfectionner sur divers sujets.

Le machine learning, un apprentissage constant pour la traduction neuronale

La traduction automatique, si elle était jusqu’à présent basée sur un système de règles et de statistiques, est devenue de plus en plus performante quand les solutions de traduction ont pu utiliser ces technologies.

L’un des plus beaux exemples du machine learning appliqué à la traduction automatique est la traduction neuronale. La traduction automatique neuronale est aujourd’hui une technologie de pointe qui utilise le machine Learning, mais aussi la big data et l’Intelligence Artificielle afin de traduire et/ou localiser en prenant en compte le contexte des termes, de les relier, etc. et ceci de façon instantanée.

Un mot > un contexte > une traduction
Le même mot > Un autre contexte > Une autre traduction

Pour que cela fonctionne il faut fournir de la donnée à la machine :

1. La data fournie par l'outil

Cette data, qui se présente sous forme de fichiers avec une langue source et une langue cible peut s’acheter ou être disponible en open source.
Elle sera notamment traitée par des linguistes pour corriger les erreurs potentielles ou adapter le fichier aux besoins de l’entreprises. Cette intervention humaine est capitale, car plus la data est « propre » et relue par des humains plus elle sera utilisable par la machine.

2. La data fournie par l'entreprise

La donnée peut être fournie par l’entreprise cliente, notamment avec ses mémoires de traduction.
Les mémoires de traduction sont un stock de traductions passées, validées en interne par l’entreprise (lexicologie spécifique, tone of voice, etc).

Les capacités incroyables de la traduction automatique

1. Apprendre de la data

Le processus de traduction a donc lieu via un réseau de neurones qui a la capacité de relier les phrases au contexte au lieu d’analyser les mots un par un.
L’outil va pouvoir traduire automatiquement et au fur et à mesure la langue source, en tenant compte du contexte des phrases de la langue source et des règles d’utilisation de la langue cible déterminées par l’entreprise. Ce contexte sera établi grâce à toute cette data.
Le réseau neuronal s’enrichit donc de ce grand volume de données d’entraînement et optimise perpétuellement les traductions à partir des données qui le nourrisse.

La machine apprend pendant la phase d'entrainement et quand elle traduit c'est sur la base de cet apprentissage, qui peut être régulièrement mis à jour.
Par ailleurs, pendant la traduction, peuvent intervenir en effet l'ajout de dictionnaires et la nouvelle fonctionnalité Neural Fuzzy Adatation (NFA) qui va également aller puiser le contexte dans la mémoire de traduction. Le contenu est alors traduit presqu'instantanément avec une précision jamais atteinte grâce aux systèmes neuronaux et à l'intelligence artificielle.

2. Améliorer la précision linguistique avec un dictionnaire

Machine translation therefore uses these training engines to learn, but it can also learn to use the dictionary.
It is not a computer use but a real use like a ?human?: the computer will open the dictionary, find the match by eliminating and/or selecting the right term and translate sentence by sentence or document by document in the context that perfectly matches the source data.
Machine translation is therefore relevant to any business, and is being improved as it is used.

3. Affiner encore en utilisant les mémoires de traduction

Il est possible d’encore affiner la traduction en utilisant les ressources internes de votre entreprise. Les sigles, acronymes et vocabulaire du métier que vous utilisez au quotidien peuvent être utilisés afin de personnaliser les traductions.

La traduction est donc la plus proche possible de la langue d'origine, en utilisant votre tone of voice et la lexicologie spécifique à votre métier.

Auteur
Alexandre, spécialiste des technologies de traduction
Temps
Lecture : 3 min.