Études de statistiques linguistiques

*
Ouvrage
Auteur.e.s
Jean David et Robert Martin (dirs)
Numéro
3
Editeur
Université de Metz
Résumé

Présentation

Diverses, les contributions rassemblées ici le sont par leur objet : à propos d'un perfectionnement capital de la formule de Waring/Herdan qui intègre au calcul du lexique d'un auteur l'estimation de son lexique virtuel pour une situation donnée de discours, Charles Muller s'interroge sur le fondement même des modèles statistiques ; Colette Dolphin, mathématisant en quelque sorte l'analyse distributionnelle des co-occurrences, ouvre à l'étude probabiliste le domaine des aires sémantiques ; c'est d'un problème d'attribution que traite Monique Debièvre ; et Jean-Claude Lejosne s'intéresse à l'équilibre entre formes de verbes "forts" et formes de verbes "faibles" dans les dialectes germaniques ; Colette Charpentier, elle, propose au chercheur une bibliographie de la statistique linguistique dans les pays anglo-saxons.

Par delà cette diversité, les quatre premières études présentent cependant une convergence qui vérifie une prévision de Charles Muller dans la préface de Statistique et Linguistique : "A travers les variations stylistiques, idolectiques ou idiomatiques, on entrevoit [?] des réalités plus profondes, celles de la langue, voire du langage humain en général".

De ce point de vue, l'étude de Charles Muller, qui rend accessible au calcul la "face cachée du lexique", c'est-à-dire l'effectif des mots qui pourraient apparaître dans le texte pour une situation donnée, montre le chemin parcouru depuis les humbles décomptes d'observables rudimentairement classés. Mais la dissymétrie des probabilités de co-occurrence, qui est un des résultats du travail de Colette Dolphin, représente aussi une avancée de la statistique linguistique vers les zones profondes des structures de prédication. Monique Debièvre apporte, elle, une contribution nouvelle à la linguistique textuelle en faisant apparaître par le calcul une "unité structurelle du texte oral" indépendante de la cohérence sémantique et Jean-Claude Lejosne donne un nouvel appui à la théorie de la redondance caractéristique des langues naturelles. Dans ces quatre études, la statistique linguistique confirme sa lente et prudente progression du plan du discours à celui de la langue et du langage.

Dans la préface de Statistique et Linguistique, Charles Muller regrettait aussi que les données et les inventaires abondants qui enrichissent la statistique linguistique soient "encore peu coordonnés et mal recensés". La contribution de Colette Charpentier répond à un besoin d'information, pour une aire linguistique limitée certes, mais que nul ne dirait marginale. Signalant des matériaux accessibles, des projets et des résultats, elle rend possible de nouvelles confrontations qui peuvent engendrer peut-être de nouvelles convergences.

Table des matières

  • Ch. MULLER : Observation, prévision et modèles statistiques
  • C. DOLPHIN : Évaluation probabiliste des co-occurrences
  • M. DEBIEVRE : Essai d'application des méthodes de la statistique linguistique au problème posé par l'attribution du texte de la version française du Roman de Tristan
  • J.-C. LEJOSNE : Contribution à l'étude de l'opposition "verbes forts - verbes faibles" dans quelques dialectes germaniques
  • C.-M. CHARPENTIER : La statistique linguistique pratiquée dans les pays anglo-saxons. Éléments de bibliographie
Collection
Recherches linguistiques
Date de parution
Nombre de pages
119
Langue(s)
français