Segmentation en mots faiblement supervisée pour la documentation automatique des langues - Traitement du Langage Parlé Accéder directement au contenu
Autre Publication Scientifique Année : 2021

Segmentation en mots faiblement supervisée pour la documentation automatique des langues

Shu Okabe
François Yvon
Laurent Besacier

Résumé

La documentation automatique des langues vise à outiller les linguistes de terrain pour faciliter l’annotation des données linguistiques. Les travaux récents se sont concentrés sur des méthodes non-supervisées. Toutefois, comme le souligne Bird (2020), des ressources auxiliaires, par exemple des listes de mots ou des textes annotés, sont souvent disponibles grâce aux efforts passés et présents de locuteurs natifs et de linguistes. L’idée de cette étude est de mobiliser ces ressources dans les algorithmes de segmentation en mots pour améliorer leurs performances.
Fichier principal
Vignette du fichier
LIFT_2021_paper.pdf (94.23 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03477475 , version 1 (13-12-2021)

Identifiants

  • HAL Id : hal-03477475 , version 1

Citer

Shu Okabe, François Yvon, Laurent Besacier. Segmentation en mots faiblement supervisée pour la documentation automatique des langues. 2021. ⟨hal-03477475⟩
107 Consultations
58 Téléchargements

Partager

Gmail Facebook X LinkedIn More