Formations technologiques > Fiche pédagogique

CID4002 : Analyse textuelle, ressources et outils

Enseignant(s) Stéphane Marchand
Niveau Masters 1 et 2
Heures et crédits 12 heures · 3 crédits
Semestre Janvier - avril 2018
Salle F24 (Descartes)
Objectif Initiation aux techniques de récupération, d'exploitation et d'analyse de textes dans le domaine des Lettres et Sciences humaines.
Prérequis Maîtrise de base d'un logiciel de traitement de texte.
Contenu Le cours permet d'apprendre à récupérer des textes (ressources en ligne, numérisation de documents), à les préparer (formats de fichiers, encodage des caractères, notion de balisage) et à utiliser des outils d'analyse (index lexicaux, concordances, cooccurrences) et de recherche (expressions régulières, lemmatisation). Le cours s'appuiera notamment sur le logiciel TXM. Il inclut également une présentation de la base Frantext.
Lectures - Muller, Charles. "La statistique lexicale". In: Langue française, n° 2, 1969. Disponible sur Internet: [http://www.persee.fr/doc/lfr_0023-8368_1969_num_2_1_5419]
Technologies Expressions régulières, TXM, Frantext
Méthodes d'enseignement Alternance de phases de cours, de travaux dirigés et de travaux personnels.
Méthodes d'évaluation Travaux personnels.
Planning

6 séances :

  • Lundi 29 janvier 2018, 10h-12h
  • Lundi 5 février 2018, 10h-12h
  • Lundi 12 février 2018, 10h-12h
  • Lundi 26 février 2018, 10h-12h
  • Lundi 5 mars 2018, 10h-12h
  • Lundi 12 mars 2018, 10h-12h
Unité C2i2e Unité 3