Depuis un mois, les internautes sourds disposent sur gouvernement.fr de pages d’information avec interprétation en Langue des Signes Française. Non pas avec des interprètes humains mais au moyen d’un personnage en images de synthèse, l’avatar Anaé (pour Assistant numérique d’accessibilité de l’État) créé par la société Kéia, qui effectue la traduction de deux pages d’information sur le coronavirus Covid-19 : l’une concernant la vaccination, l’autre le passe vaccinal. Un encadré en bas de page « Traduction LSF » ouvre l’application puis on choisit, dans un déroulant sous l’avatar, la partie de la page que l’on veut traduire en langue des signes. On remarque toutefois que le texte de la page diffère de celui qui est restitué par Anaé, dont l’interprétation est sous-titrée. Elle (Anaé est une femme) interprète également une vidéo mais pas le contenu des tableaux. Donc pas de traduction en temps réel mais une vidéo enregistrée et modifiée en fonction de l’évolution du contenu.

Créer un corpus de mot-signes

« On s’est demandé comment créer une traduction automatique vers la LSF en se disant qu’il n’y avait pas de raison que ça ne marche pas » explique le fondateur de Kéia, David Ohana, fils et petit-fils de parents sourds. Il maîtrise la langue des signes, connaît les difficultés des Sourds et s’est lancé, il y a trois ans, dans l’expérimentation d’un procédé en partant de zéro. S’il existe maintenant des moteurs de traduction performants entre langues écrites, la banque de données français écrit-mots signes en LSF restait à créer. « La difficulté est qu’on n’a pas accès à des montagnes de données pour créer des corpus apprenants, poursuit David Ohana. On travaille avec des Sourds bilingues pour traduire en vidéo des phrases, c’est très coûteux, et les tournures de phrases sont très différentes d’un locuteur à l’autre. Une fois qu’il a suffisamment d’exemple, l’avatar est capable de syntaxer [respecter la grammaire de la LSF et ne pas restituer du français signé NDLR]. On est allés voir des groupes différents, pour traduire des parties de la langue française, par exemple le vocabulaire de l’assurance pour la Macif. » L’avatar Kéia assure en effet la traduction d’une page dédiée au remplissage d’un constat amiable au terme d’une année de travail. L’éditeur Inclood l’emploie également pour sa collection enfants Arthur et Zazou. « On monte des équipes de traducteurs pour créer le corpus, reprend David Ohana. Notre ambition n’est pas de remplacer l’interprète mais de traduire des infos dites froides ou chaudes. » Pour traduire une phrase, l’avatar a besoin d’une cinquantaine d’exemples, Kéia a déjà stocké 50.000 phrases.

Anaé interprète une partie de la section point de situation

C’est le Service d’Information du Gouvernement (SIG) qui pilote le déploiement d’Anaé sur le site du Premier ministre. « Il ouvre un côté automatique de développement de la LSF sur de nombreux canaux et répond à la quantité de contenus à traduire, justifie le SIG. Dès que le corpus de mots est suffisamment construit, l’automatisation est possible. Plus l’avatar se nourrit, plus il est performant. » Toutefois, il faut encore passer par la traduction manuelle pour le prototypage et faire acquérir à l’avatar mots techniques et sigles. Cela nécessite des séances de capture de mouvement, ces segments intégrant ainsi l’intelligence artificielle. « C’est ce qui s’est passé avec la page Covid, ajoute le SIG, et c’est là où le challenge est assez réussi en maintenant un flux assez rapide d’actualisation après modification du texte de la page. » Il estime qu’un contenu court est modifiable dans la journée, et c’est Kéia qui la réalise. Anaé équipera probablement d’autres sites gouvernementaux mais rien n’est actuellement défini. « C’est toute la question d’une version béta, on voulait sortir une réalisation fonctionnelle, conclut le SIG. On discute avec plusieurs ministères mais la première chose est de s’assurer de la qualité et de disposer d’un flux de production. Après se posera le choix de la thématique qui nécessitera un nouveau corpus de mots. Tout notre enjeu est de placer l’avatar sur les pages les plus intéressantes. »

Anaé fille de Jade ?

L’avatar Anaé est le second expérimenté en France après Jade, présenté en janvier 2008 et déployé éphémèrement par la SNCF : Jade devait restituer en LSF sur des écrans vidéos les informations diffusées par haut-parleur. Le procédé était différent, reposant sur des séquences d’images de synthèse préenregistrées. « Jade se greffait sur la génération automatique de messages qui utilise un système à trous, allant vers la voix ou la LSF, explique l’un de ses artisans de l’époque, François Lefebvre-Albaret. Le mot « animation » est piégeux. On utilisait des petits bouts déjà prêts, des vidéos concaténées avec des numéros recomposés à la volée, il fallait traiter la difficulté de la syntaxe spatiale de la LSF. » Si le système s’est avéré stable et fiable malgré un mode de production de la base de données assez lourd, il n’a pas survécu à la déconfiture, en septembre 2015, de la société coopérative Websourd qui le développait. De son côté, la SNCF n’a pas été en mesure de déployer les panneaux vidéos nécessaires, et Jade a totalement disparu, de même que le savoir-faire.

« Jade était issue d’un transfert de technologie du Limsi [Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur] ajoute François Lefebvre-Albaret. Aujourd’hui, avec les réseaux de neurones, on pourrait passer rapidement de l’humain à l’avatar. » Il rappelle toutefois que la banque de mots-signes ne prend pas en compte la spatialité, et que le manque d’expressivité des avatars est une critique récurrente : « A Websourd, on avait travaillé sur l’expression corporelle, les Sourds étaient satisfaits. Pour moi, l’avenir est d’avoir plusieurs traducteurs face caméra et un programme qui change l’apparence pour avoir un avatar réaliste. »

Qu’en pensent les usagers ?

« C’est une belle avancée qu’il faut saluer, estime une professeure sourde. L’avatar permet une neutralité bienvenue. Pour ma part, j’ai visionné plusieurs thèmes traduits en LSF. Côté forme, l’avatar ressort bien, sur fond blanc. Il serait peut-être intéressant d’éclaircir un peu sa carnation pour mieux appréhender l’emplacement, l’orientation et le mouvement de ses mains, composantes grammaticales de la langue. Par exemple, le signe « vaccin » s’avère d’emblée très mal visible sur le pull bleu. L’ expression du visage est une composante grammaticale essentielle de la LSF mais elle est inexistante sur cet avatar. C’est la principale amélioration à apporter, si tant est que cela soit possible. L’avatar reste figé, il manque les mouvements des épaules, du buste et de la tête. Sur le fond, la LSF de cet avatar reste très basique, elle manque d’iconicité. Elle aurait besoin d’être améliorée au niveau des images visuelles données par le message en question, qui défile en sous-titrage, propice à la comparaison. »

Avatar conçu par Kéia pour les livres Arthur et Zazou

« Quel progrès technique ! s’exclame un lecteur-testeur. Depuis les premiers essais, quelle avancée ! Il faut poursuivre et améliorer la technique pour se rapprocher de l’interprète LSF humain. Mes deux remarques portent sur le manque de fluidité et l’absence d’expression du visage. Le manque de fluidité entraîne une fatigue à suivre le discours, l’absence d’expression du visage est très problématique en rapport à la compréhension du message. Pour conclure : bravo mais doit mieux faire ! »

Pour sa part, la Fédération Nationale des Sourds de France (FNSF) n’est pas opposée aux avatars signants : « Bien au contraire, nous encourageons toutes les innovations permettant une accessibilité plus large mais à condition que la traduction/interprétation soit correcte, compréhensible et de qualité. En effet, du fait du manque criant d’interprètes/traducteurs en France, cet outil numérique peut être utile pour accompagner des dessins animés, spots publicitaires ou autres annonces. Néanmoins, la FNSF met en garde sur le fait que la traduction automatique ne doit pas être utilisée pour faire de l’interprétation ni de la traduction de textes longs, de réunions, ou de conférences. Pour l’avatar des sites institutionnels, la FNSF salue l’initiative mais constate que cet outil n’est pas suffisamment au point : la traduction n’est pas tout à fait compréhensible, pas assez fluide et contient des imperfections. Il est certainement trop tôt pour le recours des avatars dans les sites institutionnels. C’est à perfectionner. » Le Gouvernement l’entendra-t-il ?

Laurent Lejard, mars 2022.

Partagez !