Google a annoncé l’arrivée de 110 nouvelles langues sur Google Translate, dont le tamazight, langue parlée dans toute l’Afrique du Nord, notamment en Algérie.
« Nous utilisons l’IA pour ajouter 110 nouvelles langues à Google Translate, dont le cantonais, le Nko et le tamazight », est-il annoncé dans le blog de Google jeudi 27 juin 2024. Google Translate prend en charge le tamazight écrit en alphabet latin et en tifinagh.
« Le tamazight (amazigh) est une langue berbère parlée dans toute l’Afrique du Nord. Bien qu’il existe de nombreux dialectes, la forme écrite est généralement compréhensible pour tous. Elle est écrite en alphabet latin et en tifinagh, tous deux pris en charge par Google Translate », a précisé Google.
En Algérie, le tamazight est parlé dans plusieurs régions. On peut citer notamment la Kabylie pour le kabyle, les Aures pour le chaoui, le Mzab pour le mzabi et le Tassili du Hoggar et le Tassili N Ajjer pour le tamachaq ou le touareg.
Le tamazight a été constitutionnalisé depuis 2016 en Algérie en tant que langue nationale et officielle (Consitution de 2016 et Constitution de 2020). La langue est enseignée dans l’éducation nationale et à l’université, bien que des efforts restent à faire pour sa généralisation.
Le tamazight est également parlé au Maroc dans la région du Rif, notamment. il est également parlé en Libye et dans l’oasis de Siwa en Egypte. Maintenant, il suffit de se rendre sur Google Translate (traduction) et tester soi-même la traduction de et vers le tamazight.
Voici quelques exemples de traductions :
Parmi les autres langues nouvellement prises en charge par l’outil de traduction de Google, il y a l’afar, une langue tonale parlée à Djibouti, en Érythrée et en Éthiopie. Le cantonais est depuis longtemps l’une des langues les plus demandées par Google Traduction. Étant donné que le cantonais et le mandarin se superposent souvent à l’écrit, il est difficile de trouver des données et de former des modèles.
Le mannois est la langue celtique de l’île de Man. Elle a failli disparaître avec la mort de son dernier locuteur natif en 1974. Mais grâce à un mouvement de renaissance à l’échelle de l’île, elle compte aujourd’hui des milliers de locuteurs.
Le Nko est une forme standardisée des langues mandingues d’Afrique de l’Ouest qui unifie de nombreux dialectes en une langue commune. Son alphabet unique a été inventé en 1949 et il dispose aujourd’hui d’une communauté de recherche active qui développe des ressources et des technologies pour lui.
Le pendjabi (Shahmukhi) est la variété du pendjabi écrite en écriture perso-arabe (Shahmukhi) et est la langue la plus parlée au Pakistan.
Le tok pisin est une langue créole basée sur l’anglais et la langue véhiculaire de la Papouasie-Nouvelle-Guinée. Si vous parlez anglais, essayez de traduire en tok pisin : vous pourrez peut-être en déchiffrer le sens !
Assistance en traduction pour plus d’un demi-milliard de personnes
« Google Translate élimine les barrières linguistiques pour aider les gens à se connecter et à mieux comprendre le monde qui les entoure. Nous appliquons toujours les dernières technologies pour que davantage de personnes puissent accéder à cet outil : en 2022, nous avons ajouté 24 nouvelles langues en utilisant la traduction automatique Zero-Shot, où un modèle d’apprentissage automatique apprend à traduire dans une autre langue sans jamais voir d’exemple. Et nous avons annoncé l’Initiative 1 000 langues, un engagement à créer des modèles d’IA qui prendront en charge les 1 000 langues les plus parlées dans le monde », indique la même source.
Et de souligner : « Désormais, nous utilisons l’IA pour élargir la variété de langues que nous prenons en charge. Grâce à notre grand modèle linguistique PaLM 2, nous déployons 110 nouvelles langues dans Google Translate, notre plus grande extension jamais réalisée. »
« Du cantonais au qʼeqchiʼ, ces nouvelles langues représentent plus de 614 millions de locuteurs, ouvrant ainsi la voie aux traductions pour environ 8 % de la population mondiale », explique Google.
Et d’ajouter : « Certaines sont des langues majeures dans le monde, avec plus de 100 millions de locuteurs. D’autres sont parlées par de petites communautés autochtones, et quelques-unes n’ont presque aucun locuteur natif mais font des efforts de revitalisation actifs. Environ un quart des nouvelles langues proviennent d’Afrique, ce qui représente notre plus grande expansion de langues africaines à ce jour, notamment le fon, le kikongo, le luo, le ga, le swati, le venda et le wolof. »