ChatGPT & SYSTRAN : La qualité de la traduction

ChatGPT-Qualité-Traduction

Langues rares

Les langues rares seront moins bien traités par ChatGPT.

-             Les modèles de langue sont généralement pilotés sur de grandes quantités de données textuelles pour apprendre les structures et les règles de chaque langue, mais si les données sont limitées, alors cela peut limiter la qualité de la traduction.

-             Les langues rares peuvent avoir des structures grammaticales et des règles syntaxiques très différentes des langues plus courantes, ce qui peut rendre difficile la formation d'un modèle de traduction automatique précis pour ces langues, sauf à utiliser un linguiste qui peut retravailler les traductions.

-             Enfin, il peut y avoir des défis techniques liés à la disponibilité des ressources informatiques et à la capacité de stocker de grandes quantités de données, ce qui peut rendre difficile la création de modèles de traduction automatique pour des langues moins courantes.

SYSTRAN a un catalogue de plus de 150 langues

Les ingénieurs linguistes trouvent des corpus de données ou utilisent celles d’entreprises rendant le modèle fiable. Ils corrigent les données et l’intervention humaine est capitale pour la qualité de traduction de ces langues. L’intervention des linguistes permet une traduction rapide et de grande qualité.

La qualité de traduction est supérieure avec la personnalisation

ChatGPT peut être personnalisé pour répondre aux besoins spécifiques d'une entreprise ou d'une organisation. Cette personnalisation se fait par le biais de l'apprentissage automatique, en entraînant le modèle de ChatGPT avec des données spécifiques à l'entreprise.

Cependant, la personnalisation de ChatGPT pour une entreprise nécessite des compétences en science des données et en traitement du langage naturel.

La taille et le nombre de paramètres de ces modèles sont énormes et la formation de ces modèles est très coûteuse et hors de portée pour de nombreuses entreprises en termes de :

  • Ressources informatiques nécessaires à l'analyse, à la collecte, à la formation et à l'hébergement des données
  • Charge de travail pour les annotations et l'évaluation

SYSTRAN a une méthode de personnalisation unique

Le logiciel apprend comment traduire dans le contexte précis de chaque client. La personnalisation aux domaines métiers des clients repose sur la création de ressources propres à chaque client : dictionnaires, mémoires de traduction, modèles de langue, modèles de traduction qui améliorent la qualité de traduction.

La personnalisation est faite en autonomie par le client, sans besoin de compétences techniques mais avec l’aide du support le cas échéant. Un outil comme model studio permet à l’entreprise de partir de sa mémoire de traduction ou de ses données bilingues. L’entreprise télécharge son jeu de données en toute autonomie et en quelques secondes. Il n’est pas nécessaire d’avoir de grandes mémoires de traduction pour avoir un impact positif sur la qualité de la traduction.

Auteur
Caroline - Linguiste
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN