[Article en anglais] NMT Scaling: 4 Ways to Create a Translation Powerhouse

La découverte électronique peut être un processus long et intimidant, même dans les meilleurs moments. Dans le monde globalisé des données d'aujourd'hui, cependant, vous devez non seulement vous soucier de la quantité d'informations, mais aussi de la langue dans laquelle le contenu est rédigé. C'est ici Traduction automatique neuronale vient briser la barrière de la langue. Aussi rapide que soit la technologie NMT, il y a de fortes chances que vous ayez rêvé de rendre vos systèmes encore plus efficaces. Comment vous assurez-vous qu'un travail peut être effectué, même dans les délais les plus ambitieux?

La réponse, c'est la mise à l'échelle. C'est facile à dire, et heureusement avec un peu de savoir-faire, il peut être tout aussi facile à exécuter. Lors de l'utilisation Des logiciels NMT comme SYSTRAN?s, il existe plusieurs options pour améliorer les vitesses de traduction. Nous allons vous présenter et vous expliquer les options ici afin que vous puissiez décider quelle méthode fonctionne le mieux pour votre organisation.

Vitesses NMT sans mise à l'échelle

Tout d'abord, pourquoi voudriez-vous mettre à l’échelle vos opérations NMT? En fonction de la langue et du matériel que vous utilisez, NMT peut généralement traduire 2 000 caractères par seconde si vous utilisez huit cœurs de votre processeur pour la tâche (huit cœurs étant le minimum recommandé pour des vitesses de traduction acceptables). Ça veut dire que tu peux traduire Dicken ? s Un conte de deux villes en un peu plus d'une minute ? pas mal pour la plupart des travaux de traduction. Cependant, que se passe-t-il lorsque plusieurs utilisateurs essaient de traduire des documents en même temps, partageant les mêmes ressources informatiques ? Et si votre calendrier nécessite un délai d'exécution rapide que votre taux de traduction actuel ne peut pas prendre en charge ?

C'est pourquoi la mise à l'échelle peut être si bénéfique pour votre organisation. Les solutions évolutives peuvent être aussi simples que l'allocation de processeurs plus efficaces ou l'utilisation mise en cache. Vous pouvez également utiliser des options matérielles plus complexes, telles que l'installation d'un plus grand nombre de cœurs, de serveurs ou le passage aux processeurs graphiques.

Distribution efficace des processeurs

Nous sommes tous d'accord pour dire que les ordinateurs sont intelligents. Cependant, nous avons tous entendu ou vécu des histoires frustrantes d'ordinateurs qui se comportent de façon très peu intelligente. Après tout, la plupart des ordinateurs ne sont programmés que pour faire exactement ce que vous leur dites de faire sans déviation.

C'est souvent le cas avec allocation des ressources. N'oubliez pas que les moteurs de traduction nécessitent généralement huit cœurs pour fonctionner efficacement. Si vous traduisez plusieurs langues en même temps avec un processeur à 24 cœurs, vous pouvez demander à votre ordinateur d'allouer huit cœurs à la traduction du chinois mandarin, huit cœurs à la traduction de l'allemand et huit autres à la traduction de l'espagnol.

À première vue, cela semble logique. Vous avez le nombre recommandé de cœurs travaillant chacun sur une langue différente afin que les trois langues puissent être traduites simultanément. Mais, que se passe-t-il si vous n'avez qu'un ou deux documents espagnols et plus de 200 courriels chinois mandarins ? Les huit processeurs dédiés à l'espagnol termineront leur travail rapidement, puis resteront les bras croisés pendant que les huit processeurs chinois mandarins se frayent lentement un chemin à travers leur montagne de données.

Ça a l'air inefficace et illogique, non ? Ce n'est pas la faute de l'ordinateur ? on lui a dit de dédier huit processeurs à chaque langue, donc c'est ce qu'il a fait. De nombreux systèmes peuvent ne pas équilibrer intelligemment les charges de travail sur tous les processeurs disponibles. Peu importe la quantité ou le peu de données à traiter, l'ordinateur utilisera toujours les mêmes huit cœurs pour traduire le chinois mandarin, même si les autres cœurs sont inutilisés. 

Allocation dynamique des processeurs Je peux résoudre ce problème. Vous pouvez demander à votre ordinateur d'utiliser des processeurs inactifs afin que, si votre charge de travail actuelle est dans une seule langue, il utilise les 24 processeurs pour traiter les documents au lieu des huit d'origine. Une fois qu'une deuxième langue est ajoutée, il peut s'ajuster pour dédier 12 processeurs à chacun et ainsi de suite. Selon la charge de travail, vous pouvez doubler ou même tripler la vitesse de traduction pour répondre à vos besoins.

Heureusement, la réaffectation efficace des processeurs est facile à réaliser. N'importe quel expert en informatique devrait être en mesure de configurer votre système pour améliorer les vitesses de traduction de manière dynamique en fonction de la charge de travail.

Si vous n'avez pas d'expert en informatique, vous n'êtes pas en manque de chance. SYSTRAN peut également gérer l'allocation de ressources pour vous. Nous pouvons fournir des solutions hébergées par nous ou derrière votre propre réseau. Il existe différentes stratégies de déploiement que nous pouvons adapter aux besoins de votre organisation.

Mise en cache

Une autre façon facile d'améliorer les vitesses est de mise en cache des données. Lorsque vous consultez un grand nombre de documents, vous risquez de rencontrer des montagnes de texte répétitif. Par exemple, les courriels commencent et se terminent souvent par les mêmes phrases cordiales à chaque fois. Une entreprise peut apposer la même clause de non-responsabilité sur tous ses documents. Les documents d'une personne peuvent utiliser les mêmes mots et phrases que ceux utilisés dans son vocabulaire. 

La mise en cache stocke les résultats de traduction de sorte que, lorsque la même phrase apparaît, le logiciel n'ait pas à passer par tout le travail de traduction d'une seconde fois parce qu'il se souvient ? la traduction d'avant.

La mise en cache peut souvent faire que la traduction soit jusqu'à dix fois plus rapide. Il vous suffit simplement d'avoir la mémoire et le stockage disponibles pour avoir un cache suffisamment grand. Avec SYSTRAN, vous pouvez personnaliser la durée de mise en cache des données et la quantité de stockage à utiliser en fonction de vos ressources et besoins.

Ajout de ressources supplémentaires

Une fois que votre système est configuré pour fonctionner efficacement, vous pouvez toujours faire évoluer vos capacités de traduction pour augmenter la vitesse. À ce stade, il est temps de se pencher sur ajout de cœurs ou de serveurs.

L'idée de base est simple : plus vous avez affecté de cœurs à une tâche, plus l'opération se déroulera rapidement. Il existe certaines différences entre l'ajout de cœurs supplémentaires à un processeur existant et l'utilisation d'un nouveau serveur. 

Non seulement les serveurs multiples ont tendance à fonctionner plus rapidement qu'un serveur avec un grand nombre de cœurs, mais ils offrent également un niveau de redondance. Les tests qui comparent un processeur à 64 cœurs à deux serveurs à 32 cœurs révèlent généralement que l'option à deux serveurs s'exécute plus rapidement en raison des processus de gestion de surcharge.

Il y a une autre raison pour laquelle vous pouvez avoir besoin de plusieurs serveurs plutôt que d'une seule résilience. Un système à serveur unique crée un point de défaillance unique. Si vous devez arrêter le serveur pour des raisons de maintenance ou pour toute autre raison, la traduction s'arrête complètement. Ce n'est pas un problème si vous avez plusieurs serveurs. La traduction peut ralentir si vous devez mettre un serveur hors service, mais vous avez toujours un serveur secondaire, de sorte que le travail ne s'arrêtera pas.

L'inconvénient d'avoir plus de serveurs est la complexité. L'ajout de matériel augmente la taille de votre réseau, les serveurs occupent de l'espace et nécessitent une gestion informatique et une attention accrues au lieu d'ajouter simplement des cœurs à votre système actuel.

Utilisation des GPU

Une dernière façon d'augmenter considérablement vos vitesses NMT est d'utiliser Unités de traitement graphique (GPU) par opposition aux CPU traditionnels. Les processeurs graphiques peuvent souvent fonctionner cinq à six fois plus vite que leurs homologues. C'est plus de 10 000 caractères par seconde. Pour mettre cela en contexte, on pourrait traduire tout cela Seigneur des Anneaux trilogie, les trois livres, en moins d'une minute.

Oui, les processeurs graphiques sont puissants et rapides, mais ils consomment également beaucoup d'énergie et de mémoire. En outre, ils coûtent souvent plus cher que les processeurs classiques, vous devez donc examiner attentivement les ressources dont vous disposez si vous envisagez de passer à un Système GPU pour NMT.

Conclusion

La technologie évolue constamment, s'améliore, devient plus rapide. Les données évoluent également à un rythme similaire. L'e-discovery ne fera que s'amplifier à mesure que le temps passe, ce qui oblige les entreprises à traiter et à traduire plus rapidement davantage de données. La stagnation est un anathème pour toute entreprise ? la réussite ? alors que la technologie et les données évoluent, les entreprises doivent s'adapter. Ces techniques de mise à l'échelle vous aideront à garder une longueur d'avance, en effectuant des NMT à l'échelle dont vous avez besoin sans limites. 

Auteur
Alan, expert en technologies de traduction
Temps
Lecture : 5 min.
S'inscrire à la newsletter
Retrouvez toute l'actu et les dernières technos. Un magazine conçu par SYSTRAN