Glossaire de la traduction automatique ultime

glossaire de traduction automatique

Ces dernières années, la traduction automatique est devenue de plus en plus courante grâce aux progrès de l'intelligence artificielle (IA). La traduction automatique, souvent abrégée MT, fait référence à un ensemble d'outils numériques que vous pouvez utiliser pour traduire du texte d'une langue à une autre. Dans ce glossaire de traduction automatique, nous allons explorer des termes importants utilisés dans la traduction automatique, tels que la localisation, l'internationalisation, les dictionnaires de normalisation, etc.

Traduction

La traduction fait référence à la conversion de mots ou de texte d'une langue à une autre. La traduction peut être faite manuellement par des humains ou par un logiciel informatique, appelé traduction automatique. Avec l'explosion des informations à traduire pour le marketing, la formation, le service client, la collaboration et plus encore, un nombre croissant d'entreprises ont commencé à se tourner vers la traduction automatique (MT) pour traduire du texte d'une langue à l'autre.

La localisation

Au-delà de la traduction, la localisation fait référence à l'ensemble du processus d'adaptation de contenu ou de produits à un créneau, un marché ou un emplacement spécifique.

La localisation implique la traduction, ainsi que l'adaptation d'autres aspects du contenu ou des produits, tels que :
- Modification de la mise en forme des numéros de téléphone, adresses, dates, etc.
- Modification de la conception, des couleurs et des graphismes afin que le texte traduit puisse être lu et vu clairement
- Modification du contenu en fonction des sensibilités et des préférences locales
- Conversion des devises et des mesures en unités locales
- Couvrir les réglementations et exigences légales locales si nécessaire

La localisation de votre contenu et de vos produits est essentielle pour attirer votre public cible, car elle fournit l'apparence et l'impression qu'il attend, et limite la surprise ou la confusion. Selon un rapport publié en 2020 par Common Sense Advisory, 65 pour cent des consommateurs ont déclaré préférer acheter exclusivement des produits contenant des informations dans leur langue maternelle. Un autre rapport de cette entreprise a révélé que 40 % des consommateurs n'achèteront pas si l'information est dans une autre langue.

La localisation vous aidera non seulement à attirer un public plus large, mais aussi à augmenter vos ventes, à renforcer votre crédibilité et à fidéliser davantage vos clients existants.

Quels Matériaux devez-vous localiser ?

Pour attirer des gens de différents pays vers vos produits et services, vous devez localiser plus que votre site Web. Vous devez également localiser :
? Télévision, presse écrite, radio, publicités sur les médias sociaux et autres supports marketing
? Interfaces utilisateur
? Matériaux de service
? Manuels et matériels de garantie du produit
? Manuels des produits
? Guides de démarrage rapide
? Aide en ligne et chat

Système de gestion des traductions

Un autre terme que vous rencontrerez régulièrement dans le domaine de la traduction automatique est « système de gestion de la traduction ». (TMS). Un système de gestion des traductions, également appelé logiciel de gestion des traductions, est un logiciel créé pour aider à gérer et automatiser la traduction et la localisation des ressources.

Vous devez utiliser ce système lorsque vous avez besoin de traduire une grande quantité de contenu. Plus vous produisez de traductions, plus il est difficile de gérer toutes les langues et dialectes impliqués dans votre projet. Un système de gestion de la traduction vous aidera à gérer tous ces éléments de manière efficace et collaborative.

Dans un système de gestion des traductions, une grande partie de la traduction initiale se produit automatiquement à l'aide de MT et de la recherche de correspondances dans les mémoires de traduction. Après cela, les traducteurs humains révisent et révisent souvent le contenu traduit et le corrigent si nécessaire. Au-delà de la traduction du texte, ce système vous aidera également à contextualiser le contenu traduit afin de maintenir votre identité et votre vision de marque.

Un TMS n'aide pas seulement à la traduction. Il se concentre également sur les aspects du processus liés à la gestion de projet, tels que la planification, la coordination avec les parties prenantes, la recherche des ressources humaines de post-édition (traducteurs indépendants et prestataires de services linguistiques), l'estimation des coûts et leur paiement sur la base de critères définis, l'exécution d'évaluations de la qualité et le respect des délais.

Parfois, un outil de traduction assistée par ordinateur (TAO) peut être considéré comme un TMS en fonction de sa capacité à vous aider, vous et le traducteur individuel, ainsi qu'à effectuer le travail de traduction.

Consultez la liste des partenaires du système de gestion des traductions SYSTRAN ici.

Internationalisation

L'internationalisation peut sembler semblable à la localisation, mais les deux concepts sont assez distincts. Alors que la localisation se concentre sur la façon dont les utilisateurs finaux consomment du contenu dans une langue à la fois, l'internationalisation implique l'ingénierie et le développement d'une application ou d'un produit pour prendre en charge plusieurs langues, afin de le rendre prêt à l'international.

L'internationalisation joue un rôle essentiel dans le succès du marketing international, c'est-à-dire des entreprises mondiales. Il exige que les développeurs tiennent compte de la localisation dans chaque langue ou région cible au sein de l'architecture de l'application dès le début, ce qui permet un processus plus fluide par la suite.

Voici quelques-unes des meilleures pratiques en matière d'internationalisation :
? Soutien aux références culturelles, locales et régionales
? Présentation et tri des listes
? Gestion des noms d'emplacement et des noms personnels
? S'assurer que le texte peut être écrit de plusieurs façons, comme de gauche à droite, de droite à gauche et verticalement
? Séparation des éléments de l'interface utilisateur du code source du contenu

Il y a plusieurs ambiguïtés et défis associés à quelque chose qui semble simple, comme un nom de société qui ressemble beaucoup à un fruit comestible. Par exemple, dans le chat, les courriels, l'audio et d'autres conversations enregistrées d'événements sportifs, « Monsieur Amical » pourrait être désigné par son nom de famille : « Amical ». Et s'il est boxeur, on sait peut-être qu'il n'est pas si amical ? Amical n'est pas amical. Dans les titres anglais, cela deviendra plus confus si nous capitalisons la plupart de ce texte : Friendly was not Friendly. Quand le traduire en ?Amistoso ? ou ?Amicalmente ?? Quand devriez-vous le garder comme « convivial » ?

L'astuce, en particulier dans le domaine de l'internationalisation, consiste à créer un meilleur contenu source. Débarrassez-vous des ambiguïtés, de l'argot et du familiarisme, ou améliorez-le à la volée pendant la traduction avec des « normalisations », pour qu'il fonctionne mieux pour d'autres régions et d'autres langues. Débarrassez-vous des abréviations et des acronymes, fournissez des détails, un contexte important et appelez-le « Monsieur Amical ». C'est toujours le señor Friendly qui a gagné le match.

Mondialisation

La mondialisation est un concept plus large que l'internationalisation et la localisation, bien que ces trois termes soient centrés sur les échanges internationaux d'idées et le commerce.

Plus précisément, la mondialisation se rapporte à tout ce qui rapproche les cultures, les personnes et les économies de différents pays. Cela peut inclure un large éventail d'activités, du marketing à la conception de produits, en passant par la création d'applications.

Netflix est un exemple de réussite de la mondialisation. Ce service de diffusion en continu populaire est offert dans plus de 190 pays et adapte les offres de contenu aux marchés individuels avec des sous-titres et une programmation dans les langues locales.

Les entreprises s'engagent dans la mondialisation chaque fois qu'elles veulent se développer dans différentes cultures. La mondialisation de votre entreprise présente de nombreux avantages et, en 2021, il est plus facile que jamais de se mondialiser. Avec les médias sociaux, Internet et de puissants outils de traduction automatique, étendre votre portée à l'échelle mondiale peut augmenter vos revenus et offrir plus d'occasions d'explorer des niches de produits avec moins de concurrence.

Quelques années avant la révolution neuronale de la MT, les articles de la base de connaissances (KB) figuraient parmi les premiers utilisateurs de la MT. Si vous jouiez à un jeu vidéo global ? avec des versions pour la Russie, la Chine, la France ou le Brésil ? et que vous aviez des questions pour l'équipe de support, recevoir des réponses dans votre langue maternelle serait extrêmement gratifiant. Il en va de même pour d'autres produits tels que les guides d'utilisation des logiciels multimédias. En fin de compte, la question de savoir si les phrases étaient linguistiquement parfaites importait moins que si l'article pouvait résoudre le problème.

Aujourd'hui, MT alimente la plupart des ressources d'auto-assistance en ligne. Même documentation pour OpenNMT, le cadre neuronal MT, a été traduit par la machine elle-même.

Mémoire de traduction

Les mémoires de traduction font référence aux bases de données contenant des phrases appariées qui ont déjà été traduites. C'est un souvenir de la façon dont une phrase a été traduite dans le passé, et elle sert un but spécifique lorsqu'elle est enregistrée dans une TM.

Les logiciels de traduction, tels que SYSTRAN, créent et utilisent des TM pour suggérer des correspondances similaires et identiques lors de la traduction de nouveaux documents. En utilisant des TM, le logiciel peut ignorer des segments de texte précédemment traduits. L'utilisation des TM vous aidera à améliorer la vitesse, la qualité, la cohérence et l'efficacité de vos traductions.

Les TM sont également utilisées depuis longtemps par les outils de TAO. Tout ce qui ne correspond pas exactement à une recherche de TM serait traduit par un humain. Aujourd'hui, MT comble d'abord ces lacunes, puis la validation humaine s'enclenche pour la révision finale et la post-édition.

De plus en plus, les TM servent également à une nouvelle fonction de formation ou de spécialisation du moteur MT. Même avant la MT neuronale, la Approche SMT (Statistical MT) (Moteur Moses) a utilisé des « moteurs » de traduction qui ont été formés à partir de contenu bilingue aligné trouvé dans une TM de millions de phrases.

Post-édition

La post-édition fait référence à un traducteur humain qui révise ou édite du texte déjà traduit par un logiciel de traduction automatique, également appelé post-édition de la traduction automatique, ou MTPE.

Vous aurez peut-être besoin de post-édition si vous voulez que vos traductions automatiques paraissent plus humaines et plus précises ou différentes sur le plan stylistique. Parfois, les traductions automatiques sont trop rigides, techniques et n'ont pas le ton approprié pour le marché cible. Dans un tel cas, vous devrez peut-être investir dans un post-éditeur humain pour parcourir les traductions automatiques et apporter des modifications si nécessaire. Il peut également s'agir de choisir un mode informel plutôt qu'un mode formel. Ou une capitalisation différente. Anglais britannique contre anglais américain et autres différences culturelles ou régionales.

Alors que les traducteurs humains faisaient autrefois les frais du travail de traduction, les développements actuels dans la traduction automatique, tels que la traduction automatique neutre (NMT), ont renforcé le rôle des traducteurs humains et leur ont permis de se concentrer sur des éléments qui nécessitent une touche humaine.

Exemple : Un moteur MT neuronal correctement entraîné peut avoir été spécialisé et connaître l'expression française de ?Mais ce n'est pas vrai !? peut être traduit comme ?Mais ce n'est pas vrai !? dans un certain nombre de cas, mais on avait appris à préférer : ?Mais ce n'est pas vrai !? Mais lorsque vous traduisez pour un public des États du Sud des États-Unis, il est utile d'avoir un rédacteur en chef humain de la région qui le transforme en ?Mais c'est pas vrai !?

Correspondances exactes et approximatives

Les traducteurs automatiques ne trouvent pas toujours une correspondance exacte pour le mot que vous voulez traduire, même avec l'aide de TM.

Les correspondances floues se produisent lorsque les mémoires de traduction suggèrent des correspondances pré-traduites similaires mais non équivalentes au mot que vous traduisez. En d'autres termes, ils sont « flous » parce qu'ils ne correspondent pas exactement au mot ou à l'expression.

Ils sont déclenchés par :
? Quelques mots (environ cinq) dans une phrase qui diffèrent des correspondances exactes
? Ordres de mots différents
? Ponctuation unique ou inattendue
? Modifications apportées aux balises de phrases, telles que les nouvelles polices, l'italique, les liens, les caractères gras, etc.

Les allumettes floues se déclinent principalement en deux types :

1. Correspondances floues élevées : Seule une petite partie du texte et/ou de la mise en forme est modifiée et nécessite une modification minimale pour être corrigée
2. Correspondances floues basses : présente plusieurs différences critiques entre la phrase source entrante à traduire et les phrases dans la TM. Même la correspondance la plus proche nécessitera des modifications pour que la sortie finale soit considérée comme correctement traduite.

Bien que les correspondances floues semblent peu pratiques, elles peuvent aider votre équipe de traduction à estimer le temps dont elle aura besoin pour traduire vos projets manuellement.

Autres utilisations des allumettes floues
Une nouvelle technologie est apparue récemment qui combine des correspondances floues trouvées dans une recherche de MT avec la capacité d'un moteur de MT neuronal à effectuer une formation de spécialisation à la volée non-rappelante. Cette technique d'adaptation floue neuronale (NFA) permet aux correspondances floues d'apporter une contribution significative dans la façon dont le moteur NMT détermine la meilleure traduction possible. Il ajoute des candidats plus importants pour les terminologies et les expressions. Cela ajoute du contexte qui peut améliorer considérablement les traductions. La combinaison des allumettes floues imparfaites et du puissant moteur NMT fait une solution parfaitement fonctionnelle.

Traduction de texte multilingue

La traduction de texte multilingue implique la traduction d'un seul document qui contient du texte dans plusieurs langues, et non dans une seule.

Pour traduire de tels textes, vous avez besoin de solutions logicielles capables de détecter les différentes langues du document et de traduire chacune d'elles avec précision et efficacité.

Exemples de textes nécessitant une traduction multilingue :
? Un fil de discussion ou un journal de messagerie électronique contenant des messages de personnes qui écrivent ou parlent d'autres langues
? Un document contenant plusieurs langues qui doivent toutes se retrouver en anglais
? Un document qui contient à la fois du contenu étranger et du contenu déjà traduit, ce dernier ne devant pas être retraduit.
? Un discours où certaines phrases sont en latin, klingon, swahili, etc. qui ne devraient pas être touchées.
? Des enregistrements audio, tels que des dépositions dans des affaires judiciaires ou des enquêtes judiciaires, avec des parties parlant différentes langues avec leurs interprètes.

La traduction de texte multilingue est de plus en plus courante dans le monde des affaires, car elle élimine les redondances associées à l'exécution d'un même fil de document ou d'e-mail via un service de traduction à plusieurs reprises pour y traiter différentes langues.

Dictionnaire/Glossaire utilisateur

Également connu sous le nom de glossaire, les entreprises utilisent un dictionnaire utilisateur veiller à ce que chaque terme défini soit utilisé et traduit de manière cohérente et correcte.

Créés en collaboration entre la société cliente et un prestataire de services linguistiques (LSP), les dictionnaires utilisateur contiennent une terminologie spécialisée avec des traductions approuvées dans toutes les langues cibles. Il peut également inclure des termes de marque, des acronymes et des noms.

Les dictionnaires utilisateur sont particulièrement utiles pour les entreprises de niche ou les industries hautement techniques comme la loi ou la fabrication de dispositifs médicaux. Sans dictionnaires, il est très difficile de s'assurer que tous les termes et expressions sont traduits et utilisés correctement, à moins que le moteur de traduction n'ait été spécialement formé (spécialisé) à ces terminologies.

Bien que les dictionnaires utilisateur ou les fonctions de glossaire soient assez communs parmi les fournisseurs MT aujourd'hui, ils ne sont pas universels, en particulier sur les outils gratuits ou payants de base. Discutez avec le fournisseur de votre choix des fonctionnalités spécifiques de son dictionnaire utilisateur et de la façon dont il s'intègre à une mémoire de traduction.

Localisation continue/automatisée
Contrairement à une configuration basée sur le travail, la localisation continue signifie que votre logiciel traduira constamment le nouveau contenu ajouté à votre produit. La localisation continue est un bon choix pour les produits numériques tels que les applications, les sites Web, les jeux et les logiciels qui se mettent à jour fréquemment. Comme ils ne sont jamais « finis », vous aurez toujours du nouveau contenu à traduire.

L'adoption de cette forme de localisation éliminera les étapes manuelles et répétitives du processus et permettra aux utilisateurs finaux d'accéder au produit beaucoup plus rapidement. Il simplifie les aspects de gestion de projet.

En outre, la localisation continue peut vous aider à créer des versions plus rapides qui se produisent plusieurs fois par jour, car elle vous permet d'éviter les interruptions.

Fournisseurs de services linguistiques

Les fournisseurs de services linguistiques (FSL) se spécialisent dans le coaching social, la langue, la localisation, l'interprétation et les solutions de traduction. Il peut s'agir d'agences, de particuliers ou d'entreprises.

Les services qu'ils offrent comprennent :
? Localisation
? Traduction
? Transcréation
? Évaluation
? Rédaction
? Copier l'édition
? Transcription
? Formation aux outils CAT
? Traduction de documents médicaux
?Évaluation du segment traduit
? Révision
? Correction
? Interprétation

Si votre projet contient plusieurs langues, dispose d'un contenu spécialisé tel que la documentation technique, brevets, ou code logiciel, vous avez la possibilité de faire appel à un fournisseur de services linguistiques complet pour répondre à tous ces besoins.

Toutefois, avant d'embaucher un fournisseur de services linguistiques, assurez-vous qu'il correspond bien à vos besoins en termes de services offerts, de langues cibles et de spécialités.

Avec les petites entreprises, vous pouvez obtenir des services et des spécialités plus personnalisés, tandis que les grands prestataires de services linguistiques sont généralement en mesure de prendre en charge de gros volumes de traductions dans plusieurs langues cibles.

Dans notre monde de plus en plus interconnecté, de nombreuses entreprises de logiciels et de technologies font désormais partie intégrante des écosystèmes LSP, en particulier à mesure que les solutions MT, ainsi que les outils CAT et IA, deviennent des solutions clés en main.

Dictionnaires de normalisation

Les dictionnaires de normalisation (ND) sont un autre type de dictionnaire ou de glossaire que les traducteurs automatiques utilisent pour assurer la cohérence et la qualité des traductions. Elles sont utiles pour les différences régionales de ponctuation, d'orthographe et d'abréviations en expansion.

Ils sont également utiles pour corriger les fautes d'orthographe et d'orthographe courantes ou d'autres problèmes, tels que l'OCR à partir d'images numérisées de faible qualité avec une compression élevée et avec perte et d'autres formes de bruit. Lors de la transcription audio à partir d'un enregistrement bruité, il peut fournir une valeur en tant qu'étape de prétraitement pendant la traduction.

Il existe deux types de ND: la normalisation source et la normalisation cible.

Normalisation de la source

La normalisation de la source est appliquée à un fichier source avant le début de la traduction. Il est utilisé pour :
? Normaliser la terminologie dans le texte source. Par exemple, vous pouvez définir que ?neighbor ? doit être normalisé en ?neighbor.?
? Développez les abréviations. Cela peut être utile si vous travaillez avec des chats et des e-mails. Par exemple, ? r u ? peut être développé dans ? are you ? avant la traduction afin qu'il soit traité correctement par le traducteur automatique.
? Correction des erreurs typographiques
? Transformer les mots en majuscules en versions minuscules s'ils sont plus significatifs
? Ajuster le texte OCR (exemple : Espagnol : avión (avion) peut avoir été faussement reconnu comme avi6n)
? Désambiguïsez un acronyme qui a plusieurs significations, surtout s'ils se transforment en d'autres acronymes. Par exemple : UPS peut représenter United Parcel Services, mais s'il s'agissait d'une alimentation sans coupure, la traduction en allemand peut ne pas toujours produire l'USV attendu à la place de UPS.

Il s'agit essentiellement d'une forme de prétraitement.

Normalisation de la cible

La normalisation cible adapte la sortie de traduction aux besoins de l'utilisateur pour des raisons de cohérence. Il sert également à remplacer les séquences créées par le logiciel par des séquences définies par l'utilisateur. C'est une forme de post-traitement, après la traduction, avant que vous puissiez la voir.

En voici quelques exemples :

? Expression qui est trop longue après la traduction et qui doit être raccourcie ou abrégée pour mieux s'adapter à un espace étroit sur un formulaire.
? Si vous voulez masquer (anonymiser) des noms spécifiques et les remplacer par ?xxxxxxx. ? Cela peut s'appliquer à plusieurs éléments que vous souhaitez peut-être masquer.
? Choisissez une autre signification en fonction du public cible. Par exemple, traduisez un verbe comme ?to help ? en espagnol comme ?ayudar ? en général, mais comme ?sopportunar ? dans les traductions des communications d'un département de support technique.
? Transformer une expression informelle en un équivalent formel, comme tourner ? you have ? en allemand de ?du hast ? à?Sie haben. ? Idéalement, le moteur NMT formé le fera lui-même, mais quand il aura besoin d'aide supplémentaire, le dictionnaire de normalisation cible peut être utile.

Les dictionnaires de normalisation sont appliqués avant et après la traduction, de sorte que vous pouvez utiliser la catégorie de codage ?sequence ? sans fractionner l'analyse des phrases. SYSTRAN propose des dictionnaires de normalisation dans le cadre de notre solution, mais de nombreux fournisseurs de traduction n'intègrent pas cet outil de pré-traitement ou de post-traitement incroyablement utile dans leur package standard.

Scores UEBL vs évaluation humaine

Première recommandation : une alternative rentable aux évaluations humaines de la traduction automatique dans un Rapport IBM de juillet 2002, BLEU signifie « Bilingual Evaluation Understudy ».

L'UEBL mesure le degré de différence entre les traductions humaines et les traductions automatiques à l'aide d'un algorithme simple. L'algorithme commence par comparer des segments ou des phrases individuelles avant d'attribuer à l'ensemble du texte un score BLEU moyen.

Plus la traduction automatique est proche de la référence de traduction humaine, plus le score est élevé. Une échelle de zéro à un est généralement utilisée, avec une signification identique à la traduction humaine et zéro signalant que la traduction automatique ne correspond pas à la traduction humaine.

Bien que l'UEBL puisse être utile dans de nombreuses situations, il peut s'agir d'une façon à courte vue d'évaluer les traductions automatiques pour les raisons suivantes :
? BLEU peut ?t évaluer si une erreur a un impact sur le sens d'une phrase. Il se contente de comparer avec une référence donnée et s'il voit une différence, petite ou grande, le score est affecté. Pour nous, humains, cependant, cela ne fait aucune différence si quelque chose est traduit par ? c'est génial, ? ou ? c'est parfait, ? ou même ? je l'aime vraiment ! ?
? Une phrase correctement traduite peut toujours recevoir une note faible.

Même si vous ne devriez pas utiliser les scores BLEU pour déterminer si vos traductions ont besoin d'être améliorées, vous pouvez les utiliser pour une analyse comparative efficace et des évaluations rapides. Ne l'utilisez pas comme une mesure absolue. Utilisez-le plutôt comme une indication d'une tendance ou d'une mesure d'amélioration relative ? par exemple, lorsque vous travaillez à la personnalisation d'un système de traduction avec vos glossaires et vos normalisations ou que vous spécialisez un nouveau moteur formé.

Les scores BLEU, comme d'autres métriques de notation pour les évaluations de qualité automatiques, ont de la valeur dans un cas d'utilisation relatif. En d'autres termes, l'UEBL ne peut répondre qu'à des questions telles que : « Le système actuel est-il meilleur que le précédent ? » Seuls les humains peuvent analyser les détails manuellement.

Conclusion

Le jargon de traduction automatique peut être complexe et intimidant. De la localisation à la globalisation en passant par les scores BLEU, la traduction automatique nécessite du dévouement et de la patience pour comprendre et mettre en œuvre. Cependant, cela en vaut la peine à long terme. Les logiciels de traduction automatique vous donneront plus de temps et d'énergie à consacrer aux tâches qui nécessitent une attention humaine en simplifiant et en automatisant les tâches répétitives.

Si vous cherchez un logiciel de traduction automatique puissant à intégrer dans votre flux de travail, consultez SYSTRAN. Avec SYSTRAN, vous pouvez traduire dans plus de 55 langues et 140 combinaisons en utilisant des modèles de traduction spécifiques à l'industrie. Vous pouvez également personnaliser votre traduction en important des mémoires de traduction, des dictionnaires, etc.

Démarrez votre Essai gratuit de 14 jours de SYSTRAN Translate PRO aujourd'hui. Pour en savoir plus, contactez-nous ici.

Auteur
Caroline - Linguiste
Temps
Lecture : 15 min.
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN