Simplification automatique de textes médicaux

La simplification automatique de textes est un domaine du TAL, dans lequel il s'agit d'appliquer des transformations sur les phrases d'un texte pour les rendre plus lisibles, tout en conservant leur sens intact. Cela est pratiqué aussi bien à destination des humains que pour faciliter les tâches nécessitant l'analyse automatique de textes [3].

La simplification, dont l'objectif est de faciliter des traitements d'analyse automatique, peut faire partie de différentes applications. Ainsi, la première application à l'avoir exploitée cherchait à simplifier les structures de phrases avant de procéder à leur analyse syntaxique automatique [3]. Dans d'autres contextes, la simplification peut être utilisée pour adapter certains genres de textes à des outils, qui n'ont pas été entraînés pour les traiter spécifiquement, comme par exemple l'analyse d'un texte biomédical effectuée avec des outils entraînés sur des textes journalistiques [6].

Dans le domaine médical, la simplification peut également servir à faciliter l'éducation thérapeutique des patients [2] ou l'accès à l'information par les enfants [5]. En effet, des études ont montré qu'une meilleure compréhension des informations de santé par les patients et leurs familles mène à une meilleure adhésion au traitement et à un processus de soins plus réussi [4,1].

L'objectif du travail de stage consiste en la création, le test et l'évaluation de ressources et/ou de méthodes en vue de la simplification automatique de textes médicaux. La question de recherche précise pourra être définie en accord avec le ou la stagiaire.

Le ou la stagiaire sera amené(e) à utiliser des outils existants et à développer ses propres programmes pour effectuer les traitements adaptés.

Compétences demandées :

  • connaissances en TAL et informatique
  • aptitude à installer et tester de nouveaux outils informatiques
  • habitude de Linux
  • lecture et analyse de la littérature scientifique, en français et en anglais
  • autonomie

Le stage est rémunéré selon les règles en vigueur.

  • Niveau: Master, ingénieur
  • Durée: 6 mois
  • Lieu: Lille

Pour présenter une candidature: envoyer un CV, la lettre de motivation, le relevé de notes et les contacts de deux référents à Rémi Cardon (remi.cardon@univ-lille.fr) et Natalia Grabar (natalia.grabar@univ-lille.fr) et

REFERENCES:

  1. ND Berkman, SL Sheridan, KE Donahue, DJ Halpern, and K Crotty. Low health literacy and health outcomes : An updated systematic review. Annals of Internal Medicine, 155(2) : 97–107, 2011.
  2. Frédérique Brin-Henry. Éducation thérapeutique du patient et orthophonie. In Communiquer malgré l’aphasie. S. Médical, 2014.
  3. R. Chandrasekar, Christine Doran, and B. Srinivas. Motivations and methods for text simplification. In Proceedings of the 16th Conference on Computational Linguistics - Volume 2, COLING ’96, pages 1041–1044, Stroudsburg, PA, USA, 1996. Association for Computational Linguistics.
  4. T. Davis and M. Wolf. Health literacy : implications for family medicine. Fam Med, 36 :595–598, 2004.
  5. J. De Belder and M.-F. Moens. Text simplification for children. In Workshop on accessible search systems of SIGIR, pages 1–8, 2010.
  6. Siddhartha Jonnalagadda, Luis Tari, Jörg Hakenberg, Chitta Baral, and Graciela Gonzalez. Towards effective sentence simplification for automatic processing of biomedical text. In Proceedings of Human Language Technologies : The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, Companion Volume : Short Papers, pages 177–180. Association for Computational Linguistics, 2009.