Stage: Extraction d'informations pour enrichir les guides touristiques

http://natalia.grabar.free.fr/stage2016t.html


De plus en plus de gens voyagent et sont consommateurs d'informations touristiques. Cependant, les intérêts touristiques varient en fonction des personnes et des régions. Ils peuvent par exemple concerner la découverte de villes ou de paysages, la dégustation de nouveaux plats culinaires, la visite des vestiges historiques, les pèlerinages, la visite des lieux liés à des personnalités ou événements, des objets ou événements endémiques, etc. Des informations associées sont aussi appréciées (hôtels, parkings, campings, auberges, chemins de randonnées, restaurants, marchés...)

Cela offre une large palette d'informations à proposer aux touristes afin de les aider dans l'élaboration des voyages.

L'objectif de ce stage consiste à traiter les informations provenant de différentes sources afin d'enrichir les guides existants. Plus particulièrement, le cadre du stage est lié à la Via Francigena, qui est un des itinéraires les plus fréquentés. De plus, il passe par plusieurs pays Européens, dont la France et bénéficie d'une communauté de randonneurs et touristes très active. Entre autre, l’Association Via Francigena coordonne les efforts de plusieurs contributeurs.

Pour la réalisation du stage, des méthodes de Traitement Automatique de la Langue et de fouille de textes seront utilisées.

Plus spécifiquement, il s'agit des objectifs suivants:

  • travailler avec des corpus de textes de différents types et provenant de différentes sources
  • exploiter et améliorer les annotations des textes avec différents niveaux de spécificité
  • exploiter, adapter ou développer des méthodes pour l'extraction d'informations
  • faire le lien avec les guides existants
  • évaluer les méthodes et résultats

Le stagiaire sera amené à utiliser des outils TAL existants et à développer ses propres programmes pour mieux analyser les données.

Prérequis:

  • connaissances en TAL et en linguistique
  • manipulation et test des outils de TAL
  • habitude de Linux
  • capacité de travailler en équipe et individuellement
  • lecture et analyse de la littérature scientifique

L'encadrement sera assuré par des chercheurs de différentes disciplines (TAL, STIC, humanités numériques).

Le stage est rémunéré.

Selon les résultats du stage, une poursuite en thèse pourrait être envisagée.

  • Niveau: Master 2
  • Durée: 6 mois
  • Lieu: Lille, Paris (éventuellement)

Pour présenter une candidature: envoyer un CV, la lettre de motivation, le relevé de notes et les contacts de deux référents à natalia.grabar@univ-lille3.fr