Frantext 5, recherches grammaticales (base catégorisée)

Charles Bernet, Gisèle Kahn (ENS de Lyon)

Accès <http://www.frantext.fr> puis lien Frantext catégorisé.

1. Présentation

2. Une onomatopée : "faire lanlaire"

3. Un substantif : "un arbre de Noël"

4. Un nom propre avec déterminant : "la grande Catherine"

5. Accumulation d'adjectifs

6. Type de phrase : "Tu viens, oui ou non ?"

7. Passé surcomposé : "Quand j'ai eu fini"

8. Type de phrase : "Il s'est vu remettre un colis"

9. Type de phrase : "C'est à lui que je parle"

10. Type de phrase : "Qu'est-ce que vous faites comme métier ?"

11. "N'est-ce pas"

1. Présentation

Pour une présentation de la base catégorisée et de la notion d'entité grammaticale, consulter l'article Frantext 4, entités grammaticales (base catégorisée). Les catégories affectées aux entités correspondent grosso modo aux parties du discours de la grammaire traditionnelle, revues et corrigées :

Liste des codes grammaticaux

Code

Catégorie grammaticale

A

adjectif (sauf cas Aca, APr, APs)

Aca

adjectif cardinal

APr

adjectif/participe présent

APs

adjectif/participe passé

Adv

adverbe

Avn

partie d'une négation (par ex. cas de ne / n', ou pas / point / guère… si associés à ne ou n')

Cc

conjonction de coordination

Cs

conjonction de subordination

D

déterminant (sauf cas Dca, Dg)

Dca

cardinal ayant le rôle d'un déterminant (ex. deux pigeons s'aimaient)

Dg

amalgamés (au/aux/du/des)

E

exclamatif

Ep

présentatif (voici, voilà, …)

Ger

gérondif (en lié à un participe présent)

Inf

infinitif

Inj

interjection

Int

interrogatif

Np

nom propre

Nu

numéral cardinal

Ono

onomatopée

P

pronom (sauf cas Per, X)

Per

pronom personnel

Pp

préposition

Pr

participe présent sauf cas APr, Ger

Ps

participe passé (sauf cas APs)

S

substantif

V

verbe (sauf participes et infinitif)

R

mot inconnu du logiciel

X

mot non traité (que/qu', où, sinon)

Ce sont ces mêmes codes qu'il convient d'utiliser pour la formulation des requêtes.

2. Une onomatopée : "faire lanlaire"

&cfaire &e(g=Ono)

Pour formuler une requête grammaticale, on utilise g= suivi de la catégorie recherchée, en respectant la graphie indiquée. Comme dans la base générale, &c suivi d'un verbe à l'infinitif donne toutes les formes du verbe en question. On cherche ici le verbe faire suivi d'une onomatopée. Il se trouve que dans les textes du XIXe siècle, la plus fréquente est lanlaire, dans l'expression se faire lanlaire :

Dans le premier exemple, on constate que la base n'a pas retenu pouf parmi les onomatopées. On peut, par curiosité, voir les catégories qui ont été affectées aux diverses unités du texte par la commande Montrer les codes grammaticaux. Dans la citation en question, le mot pouf a été étiqueté comme substantif.

&cfaire &e(g=Ono) &q(0,2) &e(g=Ono)

Cette formule permet d'obtenir des exemples de réitération de la même onomatopée ou l'utilisation successive de deux onomatopées différentes. L'utilisation de la syntaxe &q(0,2) est la même que celle qui sert pour l'interrogation de la base générale. Elle permet d'avoir un élément (une virgule en l'occurrence) entre les deux onomatopées :

3. Un substantif : "un arbre de Noël"

&e(g=S) de noël

On obtient une grande variété d'occurrences, à commencer par toutes les expressions chronologiques : le jour de Noël, le soir de Noël, la veille de Noël, le lendemain de Noël, la semaine de Noël, les vacances de Noël, etc. Le corpus gagne à être réduit.

Noter que si l'on veut faire une requête comportant un nom propre, celui-ci doit s'écrire en minuscules.

4. Un nom propre avec déterminant : "la grande Catherine"

&e(g=D Dg Dca) &e(g=A) &e(g=Np c!=dieu)

Dans la syntaxe retenue, pour avoir le choix entre différentes possibilités, il suffit de séparer par un espace les indications grammaticales. Dans cet exemple, le déterminant sera, soit un Dg (dit amalgamé, au/aux/du/des), soit un cardinal (Dca), soit n'importe quel autre déterminant (D), suivi d'un adjectif suivi d'un nom propre à l'exclusion de dieu (pour exclure "le bon Dieu"). Il faut limiter le corpus, pour éviter une accumulation trop forte d'occurrences. On a retenu un seul auteur pour les exemples qui suivent :

5. Accumulation d'adjectifs

&e(g=A) &e(g=S) &e(g=A), &e(g=A) &?et

L'objectif est ici de voir (à partir d'exemples variés) si l'on peut établir des règles concernant la répartition des adjectifs avant et après le substantif lorsqu'il y en a trois voire quatre et plus qui se succèdent. Le nombre de syllabes des adjectifs utilisés a-t-il une influence sur la répartition en question ? Pour mémoire, le &? placé devant une unité indique que celle-ci est facultative. On peut limiter la recherche à des textes du début du XXe siècle. Les exemples de la littérature où l'on voit s'accumuler les adjectifs sont en effet très nombreux et certains auteurs excellent dans le genre :

Variante : on peut demander la présence d'adverbes tout au long de la séquence, par la syntaxe :

&?&e(g=Adv) &e(g=A) &e(g=S) &?&e(g=Adv) &e(g=A), &?&e(g=Adv) &e(g=A) &?et

6. Type de phrase : "Tu viens, oui ou non ?"

&e(g=V), (oui|non|oui ou non) ?

Ce type de recherche permet de vérifier jusqu'à quel point on peut trouver, dans des textes écrits, des phrases à caractère interrogatif avec demande de confirmation en oui ou non, propres à la langue parlée. Dans cette requête, les signes de ponctuation (virgule et point d'interrogation) ont leur valeur réelle. On obtient 70 occurrences de ce type de phrase dans l'ensemble des textes du XXe siècle, dans des dialogues comme attendu, avec une dizaine de oui ou non et une prédilection pour la demande de confirmation en non ; mais les contextes, les verbes utilisés notamment, mériteraient d'être étudiés de près :

7. Passé surcomposé : "Quand j'ai eu fini"

&cavoir (eu|eue|eus|eues) &e(g=Ps)

Le passé surcomposé est-il facilement utilisé à l'écrit ? Et s'il l'est, dans quel contexte et avec quel type de verbe ? On trouve comme prévu des verbes comme finir ou terminer mais pas uniquement, et ce, du début du XIXe à la fin du XXe :

8. Type de phrase : "Il s'est vu remettre un colis"

(je|tu|il|elle|on|nous|vous|ils|elles) &q(0,2) &cêtre vu &e(g=Inf)

Quels sont les verbes qui sont employés dans ce type de construction ? En première analyse, il doit s'agir de verbes à valeur passive, mais la chose reste à vérifier.

Variante. Si on veut avoir un participe passé à la place de l'infinitif, on écrit, en pensant dans ce cas aux diverses formes possibles de vu :

(je|tu|il|elle|on|nous|vous|ils|elles) &q(0,2) &cêtre (vu|vue|vus|vues) &e(g=APs)

On obtient des exemples du type :

9. Type de phrase : "C'est à lui que je parle"

c'est &e(g=Pp) &e(g=Per) &q(0,2) (que|qu')

Les extractions, dites également constructions clivées, se construisent toujours de la même façon, avec c'est en tête de phrase, suivi du sujet ou de n'importe quel complément du verbe, suivi de qui ou de que, suivi du verbe. La formulation ci-dessus permet de rechercher des énoncés comportant un pronom personnel complément introduit par une préposition, suivi éventuellement d'un élément quelconque, suivi de que ou qu' :

Et si l'on cherche à voir la pérennité de l'usage du XVIIe siècle, avec conservation de la préposition à la fois dans l'élément extrait et devant la construction du verbe, comme dans :

…on écrira : c'est &e(g=Pp) &e(g=Per) &q(0,2) à qui

10. Type de phrase : "Qu'est-ce que vous faites comme métier ?"

qu'est-ce (que|qu') &e(g=Per) &e(g=V) comme &e(g=S)

Peu d'exemples (21 dans les textes du XXe siècle), dans des emplois soit exclamatifs, soit interrogatifs. L'expression semble assez récente (pas d'exemple avant le XXe siècle) :

11. "N'est-ce pas"

n'est-ce pas, &?&e(g=D) &e(g=S Np) (?|!|,|.|;)

On choisit des textes des vingt premières années du XXe siècle, et ce qui est visé, ce sont des demandes de confirmation s'adressant à x. On prévoit toutes les ponctuations possibles, même si toutes ne se réalisent pas :

 

[Article mis à jour par Frédéric Weiss. Les données quantitatives correspondent à l'état de la base en octobre 2015.]