Samsung Research et Samsung R&D Institute Poland (SRPOL) ont participé à l’atelier sur la traduction automatique (WMT). WMT est l’un des plus grands événements de recherche en traduction automatique au monde, pour comparer la qualité de leurs outils de traduction. Des équipes du monde entier ont participé aux huit compétitions de tâches de traduction automatique. Trouver des moyens nouveaux et innovants de comprendre le langage humain à l’aide de machines et de programmes informatiques.

Samsung Global Newsroom

Tâche de traduction biomédicale

L’équipe du laboratoire de langues du Samsung Research Global AI Center a participé à la tâche de traduction biomédicale. La tâche visait à évaluer les systèmes de traduction de phrases du domaine biomédical. Le groupe a remporté le premier prix pour avoir réussi à interpréter deux paires de langues: de l’anglais vers l’espagnol et de l’espagnol vers l’anglais. Ils ont obtenu les scores les plus élevés dans les deux paires de langues. Cela démontre leur capacité à traduire avec précision et fluidité des phrases entre les deux langues. Pour y parvenir, l’équipe a incorporé une traduction terminologique à contraintes souples. Il donne des indices sous forme de phrases source sur les contraintes terminologiques de la langue cible.

A lire également : 8 compétences techniques à l’épreuve du temps qui ne peuvent être remplacées par des robots et l’automatisation

Améliorer les performances de la traduction spécifique à un domaine

Dans le cas d’une traduction spécifique à un domaine, l’un des facteurs les plus importants qui déterminent sa qualité est la traduction terminologique. Cela peut être un défi par rapport aux termes généraux. Parce que normalement les termes techniques sont moins utilisés et donc plus difficiles à apprendre. Pour résoudre ce problème, le laboratoire de langues du Samsung Research Global AI Center a développé une traduction terminologique à contraintes souples qui fournit des conseils sous la forme de contraintes de langue cible. Avec les phrases sources qui y sont entrées. Cela garantit que les terminologies spécifiques au domaine se reflètent dans les résultats de traduction dans la mesure du possible.

Actuellement, Samsung Research recherche des services de traduction de brevets (coréen-anglais) sur son service en ligne appelé SR Translate. Le but ici est de fournir des traductions précises et fiables aux utilisateurs. Comme ils ont besoin de traductions rapidement sans avoir de problèmes liés à l’exactitude ou à la pertinence. Les problèmes surviennent en raison de terminologies incorrectes utilisées lors de la traduction d’une langue dans une autre. Grâce à cette technologie, ils espèrent pouvoir améliorer l’expérience utilisateur lorsqu’ils traitent avec des langues spécifiques à un domaine. Par exemple, les brevets et autres documents juridiques, etc. en garantissant l’utilisation correcte de toutes les terminologies pertinentes lors de ces types de travaux de traduction

L’incorporation de traducteurs terminologiques à contraintes souples s’est déjà avérée très utile depuis son introduction. Il s’est avéré utile en améliorant la précision lorsqu’il s’agit d’effectuer des tâches complexes impliquant plusieurs langues à la fois. De manière significative, ceux liés à des domaines spécialisés tels que les brevets, les documents juridiques, etc. Cela devrait également aider à réduire le temps passé à vérifier manuellement le contenu traduit pour détecter toute erreur ou anomalie. Ainsi, l’ensemble du processus est beaucoup plus fluide qu’auparavant. Néanmoins, l’utilisation de technologies avancées telles que celles-ci peut s’avérer bénéfique non seulement pour les entreprises. Mais aussi les utilisateurs finaux qui dépendent d’informations précises délivrées dans un délai raisonnable.

Concentration sur l’amélioration de la qualité des corpus

Lors de concours, tels que l’International Workshop on Spoken Language Translation (IWSLT), les équipes reçoivent généralement un nombre limité de corpus. Corpora est une collection de textes structurés, à analyser pour leur modèle de traduction. L’équipe SRPOL a attribué son succès à l’amélioration de la qualité de ces corpus. À l’aide de processus tels que le prétraitement et le filtrage des données. En plus d’optimiser l’architecture de leur modèle et le processus de formation de l’IA.

L’équipe de traduction automatique de SRPOL a créé un classificateur utilisant un cadre d’apprentissage automatique utilisant le corpus amélioré. Le framework s’appelle BERT (Représentations d’encodeurs bidirectionnels à partir de transformateurs). Ce classificateur a réussi à catégoriser des millions de phrases du corpus dans différents domaines. Il permet à SRPOL de créer des modèles de traduction générale, médicale et juridique.

SRPOL a connu un grand succès dans le domaine de la traduction automatique, remportant les défis de l’IWSLT pendant quatre années consécutives. Cela montre que l’objectif d’atteindre un niveau humain de compréhension du langage est à notre portée. Alors que la traduction automatique et la compréhension des langues deviennent de plus en plus courantes, Samsung restera à l’avant-garde de cette technologie pour développer les outils permettant de surmonter les barrières linguistiques et d’améliorer notre vie quotidienne.

Lisez également : Profitez d’une navigation continue avec Samsung entre Galaxy Smartphones et la série de livres Galaxy

By Maxwell Gaven

J'ai travaillé dans l'informatique pendant 7 ans. C'est amusant d'observer le changement constant dans le secteur informatique. L'informatique est mon travail, mon passe-temps et ma vie.