J'ai effectué une thèse d'Informatique Médicale à l'Université Paris
6/CHU Pitié-Salpêtrière sous la direction de Pierre Zweigenbaum.
Accès au manuscrit (pdf)
La thèse a été soutenue le 08/12/2004 avec la mention Très honorable
Composition du jury :
Résumé
Notre travail s'articule autour de la variation
terminologique et en particulier autour de la variation
morphologique des termes.
En premier temps, nous effectuons l'acquisition de
données morphologiques à partir des données
terminologiques structurées. Notre méthode donne des
résultats d'une précision élevée (au-dessus des 90 %) et
d'un rappel assez important.
En deuxième temps, nous effectuons deux expériences afin
d'évaluer les ressources morphologiques acquises~: une
application proche de la recherche d'information et la
structuration des termes. À côté d'autres
normalisations, les ressources morphologiques (paires de
mots reliés morphologiquement et les règles de
désuffixation de traitement des pluriels réguliers)
apportent un gain faible mais non négligeable. De
manière générale, différents types de normalisations
donnent des résultats complémentaires et les ressources
spécifiques du domaine sont plus utiles que les
ressources de la langue générale.
Mots clés :
Terminologie, variation terminologique, morphologie,
médecine, acquisition de ressources morphologiques,
productivité morphologique, appariement de termes,
structuration de terminologies.