Traduire automatiquement les articles scientifiques dans sa langue maternelle, pour mieux comprendre, c’est possible avec ce nouvel outil de traduction automatique MersenneTranslate.
Cet outil a été développé avec le soutien du Ministère de la Culture et du Ministère de l’Enseignement Supérieur et de la Recherche, et en partenariat avec l’Académie des sciences.
L’objectif, est en effet de permettre à des contributeurs·trices volontaires de lancer la traduction et post-éditer, dans la langue de leur choix, d’articles scientifiques publiés, via un outil de traduction automatique des traductions générer des traduction articles publiés, grâce à la post-édition de traduction automatique.
Favoriser la diffusion multilingue des articles scientifiques
L’objectif principal de cet outil, déterminé par l’Académie des sciences, était de de permettre à chaque auteur·trice de rédiger son article dans sa langue maternelle, sans que cela ne fasse obstacle à sa diffusion internationale puisqu’il pourra être traduit aisément.
En effet, quelle que soit sa langue d’origine, un article pourra être traduit dans des langues diverses et variées (pour l’instant, uniquement des langues basées sur l’alphabet latin), pour le confort de lecture.
Et surtout, un article rédigé dans une langue de qualité génère une traduction de qualité idoine.
Comment ça fonctionne ?
Pour traduire un article, un.e contributeur·trice suit les étapes suivantes :
1- Sélectionne l’article à traduire et la langue cible.
2- Lance la pré-traduction de l’article, via l’outil MateCat (outil de traduction assistée par ordinateur).
3- Post-édite la pré-traduction, générée par une solution de traduction générative (vérifie, corrige et améliore).
Il·elle traduit les métadonnées si leur traduction n’a pas été fournie par l’auteur·trice.
4- Soumet la traduction à l’équipe éditoriale de la revue dont est issu l’article original.
5- Si la traduction est acceptée, elle est publiée sous licence CC BY 4.0, en version HTML et PDF, sur le site de la revue. Le nom du·des contributeur·s et/ou contributrice·s sera affiché comme auteur·trice.
Outils utilisés
La solution MersenneTranslate s’appuie sur MateCat, un logiciel libre de Traduction assistée par ordinateur (TAO). Celui-ci propose des traductions automatiques via le moteur de traduction ModernMT qui va puiser indifféremment dans différents outils de traduction en ligne (Deepl, Google Translate…) pour générer une traduction contextualisée, c’est à dire, qui tient compte de l’intégralité du texte de l’article.
Une version 2 améliorée en préparation
Une version 2 de la solution MersenneTranslate est en préparation. Il s’agit en effet d’améiorer le fonctionnement pour une meilleure efficacité Actuellement, l’outil de traduction s’applique uniquement sur des articles publiés des Comptes Rendus de l’Académie des sciences, qui disposent du plein texte, soit Géoscience, Chimie et Biologies :
- Améliorations de l’affichage des traductions avec plus d’indications
- Ajout d’une dimension collaborative, notamment pour permettre l’intervention de l’auteur·trice du texte original
- Généralisation à toutes les revues Mersenne
- Support de nouvelles langues de traduction
Différences/Avantages avec les solutions des navigateurs web
Il est vrai que chaque navigateur web dispose aujourd’hui de son propre outil de traduction des pages, et donc du HTML. Le résultat est produit rapidement et est assez probant la plupart du temps.
Le projet MersenneTranslate s’appuie sur ces traductions automatiques mais implique l’intervention d’un·e contributeur·trice qui s’avère être systématiquement un·e scientifique, pour améliorer le texte. C’est une dimension essentielle, qui vient ajouter de la valeur, de la qualité et surtout de l’exactitude au contenu.
Rappel du contexte du projet
Voir La présentation du projet.