Formations technologiques > Fiche pédagogique

CID4001 : Analyse textuelle, ressources et outils

Enseignant(s) Stéphane Marchand
Niveau Masters 1 et 2
Heures et crédits 12 heures · 3 crédits
Semestre Septembre - décembre 2017
Salle F23 (Descartes)
Objectif Initiation aux techniques de récupération, d'exploitation et d'analyse de textes dans le domaine des Lettres et Sciences humaines.
Prérequis Maîtrise de base d'un logiciel de traitement de texte.
Contenu Le cours permet d'apprendre à récupérer des textes (ressources en ligne, numérisation de documents), à les préparer (formats de fichiers, encodage des caractères, notion de balisage) et à utiliser des outils d'analyse (index lexicaux, concordances, cooccurrences) et de recherche (expressions régulières, lemmatisation). Le cours s'appuiera notamment sur le logiciel TXM. Il inclut également une présentation de la base Frantext.
Lectures - Muller, Charles. "La statistique lexicale". In: Langue française, n° 2, 1969. Disponible sur Internet: [http://www.persee.fr/doc/lfr_0023-8368_1969_num_2_1_5419]
Technologies Expressions régulières, TXM, Frantext
Méthodes d'enseignement Alternance de phases de cours, de travaux dirigés et de travaux personnels.
Méthodes d'évaluation Travaux personnels.
Planning

6 séances :

  • Mardi 7 novembre 2017, 16h-18h
  • Mardi 14 novembre 2017, 16h-18h
  • Mardi 21 novembre 2017, 16h-18h
  • Mardi 28 novembre 2017, 16h-18h
  • Mardi 5 décembre 2017, 16h-18h
  • Mardi 12 décembre 2017, 16h-18h
Unité C2i2e Unité 3