Article

Faire entrer la science africaine dans le dictionnaire

De nombreux termes techniques n’ont pas d’équivalent dans les langues africaines, privant de culture scientifique une partie de la population. Des chercheurs et des experts de tout le continent ont décidé d’y remédier en s’employant à enrichir le lexique de plusieurs langues.
© Francesc Roig

Nick Dall
Journaliste au Cap, en Afrique du Sud, il a coécrit deux ouvrages sur l’histoire de l’Afrique du Sud : Rogues’ Gallery et Spoilt Ballots.

Pour le journaliste scientifique sud-africain Sibusiso Biyela, il aurait dû être facile de rédiger un article sur la découverte d’un nouveau dinosaure dans sa langue maternelle, le zoulou. Mais lorsqu’il s’est attelé à la rédaction de l’article, comme il le raconte dans un podcast de la revue scientifique britannique Nature, il a constaté qu’il « n’avait pas les mots pour des termes scientifiques aussi courants que “fossile” ou même “dinosaure” ». Biyela se souvient de son découragement.

Tout autre journaliste aurait pu choisir la solution de facilité en « zoulouïsant » ces mots par un ajout du préfixe « i », mais Biyela n’était pas convaincu par cette approche. Il a fini par traduire dinosaure en isilwane sasemandulo, c’est-à-dire « animal ancien ». Pour ce qui est des « fossiles », il a choisi une approche encore plus littérale en traduisant par amathambo amadala atholakala emhlabathini, c’est-à-dire « vieux os trouvés dans le sol ».

Ne pas avoir les mots pour aborder certains sujets est un problème récurrent pour les Africains

L’histoire n’a rien d’exceptionnel. Ne pas avoir les mots pour aborder certains sujets est un problème auquel les Africains sont confrontés quotidiennement. Sur le plan linguistique, le continent, qui compte environ 2 000 langues autochtones, a été pour ainsi dire ignoré par la science et de nombreuses autres sphères.

Construire ensemble

En 2019, un groupe de chercheurs issus de tout le continent a formé Masakhane (en zoulou : « Nous construisons ensemble »). Cet organisme à but non lucratif est « axé sur le développement de technologies linguistiques pour les langues africaines », explique sa cofondatrice Jade Abbott, experte en traitement automatique des langues. Au départ, le groupe était principalement composé d’experts en apprentissage automatique, puis il s’est élargi à des linguistes, des ingénieurs, des politologues et des professionnels de la communication comme Biyela. Dispersés dans plus de 40 pays, ces experts ont pris l’habitude de travailler en ligne, la pandémie de Covid-19 ne les a donc pas pris au dépourvu.

Au départ, Masakhane visait à développer des outils de traduction automatique pour un grand nombre de langues africaines. Nous sommes nombreux à considérer comme acquis des outils tels que Google Translate et à supposer que toute page web peut être automatiquement traduite dans notre langue maternelle. Mais à ce jour, seuls les locuteurs d’une poignée des plus de 2 000 langues africaines ont accès à ce luxe.

Le manque de données en langues africaines est un frein pour la création d’outils de traduction automatique

Il est relativement aisé de créer des outils de traduction automatique, à condition d’avoir accès à des données qui font cruellement défaut à la grande majorité des langues africaines. C’est pourquoi l’équipe de Masakhane s’est attachée à montrer que le fait de « travailler de manière participative, avec des femmes et des hommes qui comprennent les outils et les langues, permet d’obtenir de meilleures données », explique Jade Abbott.

Un article publié en 2020, cosigné par 50 membres de Masakhane présents dans des dizaines de pays, a remporté le Wikimedia Foundation Research Award (prix de la recherche de la fondation Wikimedia). S’appuyant sur la situation de 48 des langues les plus parlées d’Afrique, il fournit une feuille de route pour établir « des critères pour plus de 30 langues en matière de traduction automatique », tout en permettant à des personnes « sans formation universitaire d’apporter une contribution scientifique sans équivalent ».

Igbo, swahili ou yoruba

Après cette première phase, Masakhane a entrepris de mettre la théorie en pratique. Son translation tool (outil de traduction) présente actuellement des prototypes pour six langues africaines (l’igbo, le lingala, le shona, le swahili, le tshiluba et le yoruba). Jade Abbott estime toutefois qu’il s’agit là de la première étape d’un effort de longue haleine. L’équipe étudiera également la meilleure façon de rendre cet outil disponible, car toutes les personnes impliquées veulent « s’assurer qu’il améliore la vie des communautés en Afrique et n’alimente pas les profits des grandes plateformes numériques ».

Les membres de Masakhane ont rédigé plus de 200 articles universitaires et l’organisation a approuvé sept autres projets d’envergure. L’un d’eux, Decolonise Science (Décoloniser la science), est une collaboration entre AfricaArXiv, un portail africain regroupant des ressources en accès libre, et ScienceLink, une plateforme scientifique en accès libre basée aux Pays-Bas, dans laquelle Biyela, le journaliste zoulou, est fortement impliqué.

Lorsque le projet a été lancé en 2021, l’objectif était de traduire environ 200 articles scientifiques dans six langues africaines. Mais l’équipe a reculé devant l’ampleur de la tâche. Parvenir à un tel objectif supposait la création de centaines de nouveaux termes (dinosaure, fossile, etc.) pour chaque article. Selon un objectif plus réaliste, le groupe traduira les synthèses de 180 articles (des textes déjà sélectionnés au terme d’un travail approfondi prenant en compte le domaine, l’impact et la diversité géographique et sexuelle de la recherche) dans les six langues, tout en créant cinq nouveaux termes pour chaque article.

Si la notion de « décolonisation » évoque un processus consistant à démolir l’existant, il s’agit plutôt pour Masakhane de construire. « Pour de nombreux locuteurs de langues autochtones, explique Biyela, il est possible de parler de sport, de politique et d’autres sujets dans sa langue maternelle, mais lorsqu’on aborde des sujets scientifiques ou technologiques, on doit changer de code. » « Cela donne l’impression que la science est un élément étranger qui envahit la conversation », déplore-t-il. Cette situation n’est pas sans conséquence, dans le domaine de la santé notamment. Face à des personnes qui hésitent à se faire vacciner, par exemple, « vous ne pouvez pas vraiment expliquer ce qu’est l’ARN messager ou l’immunologie dans votre langue maternelle ». À cette aune on mesure bien que l’enjeu du travail effectué par Masakhane va bien au-delà de la dimension linguistique.

Traduction : d’un monde à l’autre
UNESCO
avril-juin 2022
UNESCO
0000381067
Subscribe Courier

Abonnez-vous