Vers la production automatique de sous-titres adaptés à l'affichage - Traitement du Langage Parlé Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Vers la production automatique de sous-titres adaptés à l'affichage

François Buet
François Yvon

Résumé

Une façon de réaliser un sous-titrage automatique monolingue est d’associer un système de reconnaissance de parole avec un modèle de traduction de la transcription vers les sous-titres. La tâche de « traduction » est délicate dans la mesure où elle doit opérer une simplification et une compression du texte, respecter des normes liées à l’affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficulté supplémentaire est la relative rareté des corpus mettant en parallèle transcription automatique et sous-titres sont relativement rares. Nous décrivons ici un nouveau corpus en cours de constitution et nous expérimentons l’utilisation de méthodes de contrôle plus ou moins direct de la longueur des phrases engendrées, afin d’améliorer leur qualité du point de vue linguistique et normatif.
Fichier principal
Vignette du fichier
31.pdf (564.17 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03265891 , version 1 (23-06-2021)

Identifiants

  • HAL Id : hal-03265891 , version 1

Citer

François Buet, François Yvon. Vers la production automatique de sous-titres adaptés à l'affichage. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.91-104. ⟨hal-03265891⟩
183 Consultations
186 Téléchargements

Partager

Gmail Facebook X LinkedIn More