Skip to Main content Skip to Navigation
Conference papers

Vers la production automatique de sous-titres adaptés à l'affichage

François Buet 1 François yvon 1 
1 TLP - Traitement du Langage Parlé
LISN - Laboratoire Interdisciplinaire des Sciences du Numérique, STL - Sciences et Technologies des Langues
Résumé : Une façon de réaliser un sous-titrage automatique monolingue est d’associer un système de reconnaissance de parole avec un modèle de traduction de la transcription vers les sous-titres. La tâche de « traduction » est délicate dans la mesure où elle doit opérer une simplification et une compression du texte, respecter des normes liées à l’affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficulté supplémentaire est la relative rareté des corpus mettant en parallèle transcription automatique et sous-titres sont relativement rares. Nous décrivons ici un nouveau corpus en cours de constitution et nous expérimentons l’utilisation de méthodes de contrôle plus ou moins direct de la longueur des phrases engendrées, afin d’améliorer leur qualité du point de vue linguistique et normatif.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03265891
Contributor : Yannick Parmentier Connect in order to contact the contributor
Submitted on : Wednesday, June 23, 2021 - 11:43:54 PM
Last modification on : Sunday, June 26, 2022 - 3:10:00 AM
Long-term archiving on: : Friday, September 24, 2021 - 7:11:59 PM

File

31.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03265891, version 1

Citation

François Buet, François yvon. Vers la production automatique de sous-titres adaptés à l'affichage. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.91-104. ⟨hal-03265891⟩

Share

Metrics

Record views

119

Files downloads

88