Resources

Rated lexicon with French medical words
UA-target: parallel and aligned corpus with Ukrainian language as target
French morphologically related medical words


Rated lexicon with French medical words

Source work:
Natalia Grabar, Thierry Hamon.
A Large Rated Lexicon with French Medical Words.
LREC 2016
pdf

Download the dataset
The dataset contains three text tabular files, containing each the output of one annotator.
In the file of A1, more fields are informed, such as in the example below.

Example:
+|dépressif|dépressif|Adj|12233|D F

Fields:
  • Category assigned by each of the annotators:
    • + I can understand
    • - I cannot understand
    • / I am not sure
  • form
  • lemma
  • part-of-speech (POS), the most frequent POS
  • number
  • the most frequent SNOMED categories


UA-target: parallel and aligned corpus with Ukrainian language as target

(source languages: French, English, Polish)

Source work:
Natalia Grabar, Thierry Hamon
Creation of a multilingual aligned corpus with Ukrainian as the target language and its exploitation
COLINS 2017
21 April 2017, Kharkiv, Ukraine
pdf

Download the whole dataset
The dataset contains 122 UTF8 text files. Paired files are aligned at the sentence level.

Global description:

  • total number of characters: 17,743,950
  • total number of words: 2,116,694
  • total number of sentences: 156,740
  • source languages: French, English, Polish
  • target language: Ukrainian



French morphologically related medical words

Source work:
Natalia Grabar, Pierre Zweigenbaum.
A general method for sifting linguistic knowledge from structured terminologies.
AMIA 2000: 310-4.
PMID 11079895
pdf


Morphological resources for French medical language
Ressources morphologiques pour le français médical

lemme-tag-fr-4.4.liste (2389 lignes)
Contenu: paires de mots liés morphologiquement, lemmes, dérivation, composition, étiquetage syntaxique, règles de formation, certains accents manquants:

  • canal/SBC|canalaire/ADJ|/SBC|aire/ADJ
  • urine/SBC|urinaire/ADJ|e/SBC|aire/ADJ
  • sinus/SBC|sinusal/ADJ|/SBC|al/ADJ
  • irradier/V|irradiation/SBC|er/V|ation/SBC
  • neurocytome/SBC|neuroblastome/SBC|ocytome/SBC|oblastome/SBC
  • psammome/SBC|psammomateux/ADJ|ome/SBC|omateux/ADJ
  • liquide/ADJ|liquide/SBC|/ADJ|/SBC

lemme-deriv-fr.2.liste (462 lignes)
Contenu: paires de mots liés morphologiquement, lemmes, dérivation, composition:

  • abdomen|abdominal
  • abrasion|abrasé
  • acanthose|acanthosique
  • adhérence|adhérent
  • agrégation|agrégé
  • aine|inguinal
  • aisselle|axillaire
  • amnios|amniotique
  • amphophilie|amphophile
  • amygdale|amygdalien

forme-deriv-fr-4.2.liste (2418 lignes)
Contenu: paires de mots liés morphologiquement, formes, dérivation, composition, certains accents manquants:

  • coronaire|coronarien
  • dorsum|dorsal
  • épithélium|épithélial
  • hypertendu|hypertension
  • distendu|distension
  • sarcomateux|sarcomateuse
  • hospitalise|hospitalisation

forme-deriv-fr-4.4.liste (2418 lignes)
Contenu: paires de mots liés morphologiquement, formes, dérivation, composition, règles de formation, certains accents manquants:

  • coronaire|coronarien|aire|arien
  • irradiant|irradiation|ant|ation
  • cranium|cranien|um|en
  • ameliorer|amelioration|er|ation
  • membrane|membranaire|e|aire
  • sclerose|sclerosant|e|ant
  • branche|branchial|e|ial

forme-flex-deriv-fr.4.liste (5826 lignes)
Contenu: paires de mots liés morphologiquement, formes, flexion, dérivation, composition, règles de formation, certains accents manquants:

  • cholera|cholerae||e
  • rhabditida|rhabditidae||e
  • influenza|influenzae||e
  • arizona|arizonae||e
  • grec|grece||e
  • lourd|lourde||e
  • cord|corde||e
  • acid|acide||e
  • froid|froide||e
  • grand|grande||e

forme-flex-deriv-fr-4.2.liste (4517 lignes)
Contenu: paires de mots liés morphologiquement, formes, flexion, dérivation, composition, règles de formation, certains accents manquants:

  • abandon|abandonne
  • abdominal|abdominale
  • abdominal|abdominales
  • atrophie|atrophique
  • cicatrice|cicatriciel
  • cicatricielle|cicatricielles
  • abrasé|abrasion
  • absent|absence

forme-flex-fr.2.liste (3470 lignes)
Contenu: paires de mots liés morphologiquement, formes, flexion, certains accents manquants:

  • adoptif|adoptive
  • ancien|ancienne
  • ancien|anciens
  • canin|canine
  • capillaire|capillaires
  • caverneux|caverneuse
  • dural|durale

famille-forme-flex-deriv-fr.liste (1678 familles)
Contenu: familles de mots liés morphologiquement, formes, flexion, dérivation, composition:

  • abdom|abdomen|abdominal|abdominale|abdominales|abdominaux|abdomino
  • abeille|abeille|abeilles
  • aberra|aberrante|aberration
  • abondant|abondante|abondants
  • abras|abrasion|abrasé
  • absen|absence|absent
  • absorbé|absorbée|absorbées|absorbés
  • acantholy|acantholyse|acantholyses|acantholytique
  • acantho|acanthomateux|acanthome|acanthose|acanthosique
  • acanth|acanthocyte|acanthrocyte

famille-lemme-tag-fr.liste (1078 familles)
Contenu: familles de mots liés morphologiquement, lemmes, dérivation, composition :

  • abdom|abdomen/SBC|abdomino/PFX|abdominal/ADJ
  • aberra|aberrant/ADJ|aberration/SBC
  • abras|abrasé/ADJ|abrasion/SBC
  • absen|absent/ADJ|absence/SBC
  • acantholy|acantholyse/SBC|acantholytique/ADJ
  • acantho|acanthome/SBC|acanthose/SBC|acanthosique/ADJ|acanthomateux/ADJ
  • acanth|acanthocyte/SBC|acanthrocyte/SBC
  • acari|acarien/SBC|acariase/SBC
  • achromi|achromie/SBC|achromique/ADJ
  • acid|acide/ADJ|acide/SBC|acido/PFX|acidité/SBC|acidose/SBC|acidurie/SBC|acidémie/SBC|acidophile/ADJ|acidocétose/SBC