Quels usages de l’IA pour l’audiodescription et le sous-titrage des œuvres ?
Une étude publiée par le CNC en avril 2024, s’intéresse aux usages actuels et potentiels de l’intelligence artificielle (IA) dans les domaines du cinéma, de l’audiovisuel et du jeu vidéo.
Cette étude a été menée par le CNC et BearingPoint, une société de conseil et d’expertise sur les technologies émergentes. Elle met en lumière des cas d’usages de l’IA afin d’accompagner les filières dans la compréhension des opportunités, risques et enjeux associés à ces évolutions technologiques.
En effet, depuis quelques années, les nouvelles applications de l’IA générative bousculent notre vision de ce dont est capable une machine et possèdent un potentiel de transformation inédit : modèles de génération d’images depuis 2021 (DALL-E), puis de génération textuelle en novembre 2022 (ChatGPT) et plus récemment, de génération de vidéos réalistes à partir d’un simple texte (Sora). Ces outils sont développés par la société OpenAI. D’autres sociétés se sont spécialisées ou fondées autour du développement de ces technologies.
Présentation vidéo de l’étude (YouTube, 58 minutes)
Le rapport complet à télécharger (pdf, 10 Mo)
Parmi les usages et impacts de l’IA présentés dans le rapport, nous nous sommes plus particulièrement intéressés aux axes qui concernent les métiers de l’audiodescription et du sous-titrage.
Si l’étude énonce qu’une accessibilité plus large des œuvres cinématographiques et audiovisuelles est possible grâce à l’assistance de l’IA, elle nuance néanmoins cet usage en précisant que certaines productions nécessitent un niveau de qualité élevé, auquel les outils IA ne sont pas toujours en mesure de répondre : « Les outils actuels de traduction ou d’audiodescription, s’ils font gagner un temps significatif, ne peuvent remplacer le travail d’interprétation du texte ou des images d’origine ».
Certains métiers sont plus susceptibles de voir leurs processus et outils de travail évoluer significativement. Ceux de l’audiodescription et du sous-titrage en font partie. En effet, Les risques d’impact sur l’emploi sont forts pour ces métiers, sachant que ces derniers sont appréhendés comme ayant une dominante technique.
Parmi une soixantaine de cas d’usage, une fiche est consacrée au sujet de l’automatisation de l’audiodescription.
Des solutions ont été développées dans ce domaine, et permettent aussi bien de décrire une image ou une vidéo, que de générer des voix. De plus, des plateformes comme Sibylia proposent de nombreuses solutions d’automatisation de l’audiodescription d’une vidéo.
L’étude souligne que la technologie d’audiodescription manque « de nuance lorsqu’il s’agit de comprendre les intentions derrière un geste ou une expression de visage, et nécessite encore pour les œuvres cinématographiques et audiovisuelles l’interprétation de professionnels ». Dans le même temps, il est constaté qu’« elle apporterait un gain de temps important et offrirait alors l’opportunité d’augmenter le nombre d’œuvres accessibles en audiodescription ».
Le rapport fait également état de l’automatisation du sous-titrage (p.69). Cependant, la question de l’usage de l’IA pour le sous-titrage adapté à destination des personnes sourdes et malentendantes n’est pas abordé.
Les résultats de cette étude composent une photographie de la période décembre 2023 – janvier 2024. Les technologies évoluant rapidement, il nous paraît essentiel d’accompagner ces mutations, afin de veiller à la préservation de métiers de cinéma qui œuvrent en faveur de la qualité de l’accessibilité pour les publics en situation de handicap.
À la suite d’une réunion avec des responsables du CNC, Retour d’image entend constituer un groupe de travail afin d’établir des préconisations et perspectives d’accompagnement pour garantir la qualité des versions audiodécrites et sous-titrées d’œuvres cinématographiques.