Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela

Résumé

La simplification de textes est une tâche complexe du traitement automatique des langues. Depuis quelques années, des corpus parallèles de textes originaux et simplifiés sont proposés, permettant d'apprendre différents types d'opérations de simplification à partir de corpus. Dans le but de pouvoir développer et évaluer des systèmes de simplification automatique de textes, cet article s’intéresse au corpus Newsela, un corpus parallèle de textes en langue anglaise avec quatre niveaux de simplification. Nous présentons en détail ce corpus et étudions les différentes transformations caractérisant le passage d’un niveau de simplification à l’autre sur un sous-ensemble de textes, en nous intéressant plus particulièrement aux transformations syntaxiques.
Fichier principal
Vignette du fichier
189.pdf (561.64 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02786194 , version 1 (07-06-2020)
hal-02786194 , version 2 (17-06-2020)
hal-02786194 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02786194 , version 3

Citer

Rita Hijazi. Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.137-150. ⟨hal-02786194v3⟩
183 Consultations
76 Téléchargements

Partager

Gmail Facebook X LinkedIn More