Formations technologiques > Fiche pédagogique

CID4004 : Analyse textuelle, ressources et outils

Enseignant(s) Stéphane Marchand
Niveau Masters 1 et 2
Heures et crédits 12 heures · 3 crédits
Semestre Janvier - avril 2018
Salle F24 (Descartes)
Objectif Initiation aux techniques de récupération, d'exploitation et d'analyse de textes dans le domaine des Lettres et Sciences humaines.
Prérequis Maîtrise de base d'un logiciel de traitement de texte.
Contenu Le cours permet d'apprendre à récupérer des textes (ressources en ligne, numérisation de documents), à les préparer (formats de fichiers, encodage des caractères, notion de balisage) et à utiliser des outils d'analyse (index lexicaux, concordances, cooccurrences) et de recherche (expressions régulières, lemmatisation). Le cours s'appuiera notamment sur le logiciel TXM. Il inclut également une présentation de la base Frantext.
Lectures - Muller, Charles. "La statistique lexicale". In: Langue française, n° 2, 1969. Disponible sur Internet: [http://www.persee.fr/doc/lfr_0023-8368_1969_num_2_1_5419]
Technologies Expressions régulières, TXM, Frantext
Méthodes d'enseignement Alternance de phases de cours, de travaux dirigés et de travaux personnels.
Méthodes d'évaluation Travaux personnels.
Planning

6 séances :

  • Jeudi 22 mars 2018, 8h-10h
  • Jeudi 29 mars 2018, 8h-10h
  • Jeudi 5 avril 2018, 8h-10h
  • Jeudi 12 avril 2018, 8h-10h
  • Jeudi 26 avril 2018, 8h-10h
  • Jeudi 3 mai 2018, 8h-10h
Unité C2i2e Unité 3