Thèse: Simplification de textes médicaux

Laboratoires d’accueil : La thèse aura lieu au sein du laboratoire STL à Lille.

Financement : projet ANR CLEAR (Communication, Literacy, Education, Accessibility, Readability), ANR-17-CE19-0016

Début de la thèse : janvier 2018

Contexte

Le domaine médical fait partie de notre vie. Par exemple, au moins la moitié de la population française utilise l'internet pour trouver des réponses aux questions liées à la santé [1] alors que dans 92 % ces recherches concernent les maladies. Cependant, même si les informations de santé sont disponibles de plus en plus librement, cela ne garantit pas leur compréhension correcte [2-3]. En effet, la langue médicale utilise des termes techniques et spécialisés, qui restent non compréhensibles pour les utilisateurs non experts, comme par exemple les patients ou leurs familles. La compréhension des informations de santé est donc très compromise, alors que cela est crucial pour un processus de santé réussi, le bien-être des patients, une communication réussie entre les patients et le personnel médical, et le développement de relations de confiance entre eux [3-5].

Objectif

L'objectif principal de cette thèse consiste à proposer des méthodes pour la simplification de textes médicaux spécialisés et de dépasser différents défis et écueils existants. Ainsi, les travaux de thèse devront proposer, développer et tester des méthodes et outils TAL destinés aux traitements de textes médicaux spécialisés en français afin d'en produire une version simplifiée et plus aisée à comprendre par un non spécialiste.

Les travaux actuels en simplification ne s'intéressent pas forcément aux documents médicaux et le plus souvent la simplification est effectuée au niveau des mots isolés, où le candidat à substitution montre des fréquences d'emploi plus élevées. Or, dans les textes médicaux, il est rare d'avoir des correspondances mot à mot. Par exemple, le terme desmorrhexie signifie rupture de ligaments alors que le terme otite signifie inflammation de l'oreille. Il est donc nécessaire d'établir des règles et modèles linguistiques pour effectuer la simplification tout en gardant la sémantique des textes simplifiés et en contrôlant leur grammaticalité.

D'autres objectifs sont associés à ce travail de thèse, comme par exemple l'évaluation du niveau de lisibilité des textes d'origine et simplifiés, l'acquisition de ressources nécessaires pour effectuer la simplification et les substitutions lexicales, l'évaluation des différents résultats produits. Notons aussi que les méthodes proposées doivent être suffisamment robustes pour traiter des données hétérogènes, dont les patients peuvent avoir besoin dans différents cas. Finalement, un autre objectif consiste de travailler dans un contexte multidisciplinaire et mettant en jeu une expertise multiple de différents intervenants : le corps médical et associatif dans les phases de définition de besoins et d’évaluation, les linguistes lors du travail avec la langue, et bien sûr les chercheurs en TAL pour les interactions quotidiennes lors de la réalisation des tâches du travail.

Profil et candidature

Le candidat devra être titulaire d'un master en informatique ou en TAL, ou d'un titre équivalent. Il devra avoir suivi des cours en fouille de données et/ou traitement automatique des langues. Le travail de thèse s'effectuera dans le cadre d'un contrat à durée déterminée de 3 ans.

Les candidatures sont à envoyer par e-mail à natalia.grabar@univ-lille3.fr
Elles devront comporter un CV, le relevé de notes du master, une lettre de motivation et le nom et les coordonnées d'un professeur pouvant vous recommander.
N’hésitez pas à nous contacter pour plus d’informations.

Références

  1. www.tns-sofres.com/etudes-et-points-de-vue/les-francais-et-linternet-sante
  2. AMA. Health literacy: report of the council on scientific affairs. Ad hoc committee on health literacy for the council on scientific affairs, American Medical Association. JAMA, 281(6):552–7, 1999
  3. A. McCray. Promoting health literacy. J of Am Med Infor Ass, 12:152–163, 2005
  4. R. Jucks and R. Bromme. Choice of words in doctor-patient communication: an analysis of healthrelated internet sites. Health Commun, 21(3):267–77, 2007
  5. T. Tran, H. Chekroud, P. Thiery, and A. Julienne. Internet et soins : un tiers invisible dans la relation médecine/patient ? Ethica Clinica, 53:34–43, 2009