Search
Generic filters
Filtrer par type
Articles
Services
Publications
Filtrer par Catégories
Actualités
Boite à outils

Projet de traduction semi-automatique d’articles scientifiques avec l’Académie des sciences

Le centre Mersenne et l’Académie des sciences ont de nouveau uni leurs forces autour d’un projet de traduction semi-automatique, soutenu par le Ministère de l’Enseignement Supérieur et de la Recherche ainsi que par le Ministère de la Culture, et qui allie production de corpus de traduction et développement d’un outil de traduction semi-automatique d’articles scientifiques.

Contexte du projet

  • Une idée de l’Académie des Sciences

Ce projet a vu le jour sur une idée de l’Académie des Sciences qui a pour mission d’améliorer la diffusion du français scientifique. À ce titre, et même si la plupart des manuscrits soumis dans les Comptes Rendus de l’Académie des sciences sont rédigés en anglais, l’idée est de permettre à tout auteur de choisir de rédiger en français. De ce fait, les deux langues cohabitent parfois au sein d’un même volume annuel ou numéro spécial.Il s’agit aussi de satisfaire les attentes du second Plan pour la science ouverte : favoriser le multilinguisme et la circulation des savoirs scientifiques par la traduction des publications des chercheurs français.

  • L’expertise du Centre Mersenne
  • Un financement de deux Ministères :
    • Le Ministère de l’Enseignement supérieur et de la Recherche, pour lequel le projet avait pour objectif était de produire un corpus bilingue d’articles, aux formats HTML et PDF, pouvant à terme être utilisé comme jeux de données -> corpus anglais – français dans les disciplines de la Chimie, des Géosciences et de la Biologie.
    • Le ministère français de la Culture : qui souhaitait encourager la diffusion multilingue des articles scientifiques.

Objectifs du projet

  • Promouvoir la langue scientifique française (Statuts, art. 2 alinéa 5, l’Académie des Sciences est attentive au maintien du rôle et de la qualité de la langue scientifique française).
  • Répondre aux attentes du 2ème plan pour la science ouverte : favoriser le multilinguisme et la circulation des connaissances scientifiques en traduisant les publications des chercheurs français. Et notamment, encourager la rédaction d’articles dans la langue native des auteurs et la diffusion multilingue des articles publiés.

Financements du projet

Le projet d’une durée d’un an, initié à la fin 2021 et qui s’est implémenté de mai 2022 à mais 2023, a été financé par deux Ministères à hauteur de 96 000 euros

Deux personnes ont été recrutées dans ce cadre :

  • Une développeuse pour développer l’outil
  • Un traducteur pour traduire une sélection d’articles dans anglais vers français et français vers anglais.

État des lieux en mai 2023

  • Un corpus bilingue (anglais – français) de 25 articles a été transmis au Ministère de l’Enseignement supérieur et de la Recherche,
  • Un outil de traduction semi-automatique a été développé à l’usage de l’Académie des sciences dans un premier temps.