Specialized AI-Based Translation Technology 101

The minds behind SYSTRAN sit down for an interview regarding the complexities and the capacities of specialized neural machine translation engines.

Participants: Peter Zoldan, Senior Data Engineer -Software Engineer Linguistic Program, Svetlana Zyrianova, Linguistic Program, Petra Bayrami, Jr. Software Engineer – Linguistic Program, Natalia Segal, R&D Engineer.

How much data is required to create a specialized engine?

The more bilingual data, the better the quality. For broad domains such as news, millions of bilingual sentences will be required. However, if the domain is narrow, such as technical support documents for certain products, then even a small set of sentences of 50,000, noticeably improves the quality. 

The amount of data required will depend on how broad or narrow the domain is you are specializing the engine into.

Continue reading

Voyage en traduction automatique

Une femme et sa fille en voyage en montagne observent le paysage. La traduction automatique est un voyage au quotidien.

« Mais enfin, papa, tu ne vas pas aller là ! La traduction automatique, ça marche pas ! c’est pourri …», ainsi s’exprime la fille de l’auteur, 19 ans. Trait générationnel, elle est spontanée, directe.
L’auteur se gratte le front, légèrement ébranlé. Dans la main, il tient sa proposition d’embauche chez le leader mondial de la « machine translation ».

« Mais pourquoi dis-tu ça ? » Continue reading