analyse du discours

Zellig S. HarrisMme Françoise Dubois-Charlier

Analyse du discoursIn: Langages, 4e année, n°13, 1969. pp. 8-45.

Citer ce document / Cite this document :

Harris Zellig S., Dubois-Charlier Françoise. Analyse du discours. In: Langages, 4e année, n°13, 1969. pp. 8-45.

doi : 10.3406/lgge.1969.2507

http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507

http://www.persee.fr/web/revues/home/prescript/author/auteur_lgge_375

http://www.persee.fr/web/revues/home/prescript/author/auteur_lgge_72

http://dx.doi.org/10.3406/lgge.1969.2507

http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507

RésuméL'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement.Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'unephrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire,membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classed'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plusétroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classesd'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par desclasses qui le composent, aux autres segments du texte. On examine alors la succession des segmentspour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des schémasd'occurrence de classes.Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention del'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris lesjunctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de cesopérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapportsd'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texteen question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales desdifférents morphèmes du texte.L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type detexte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décritque le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours nousapprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications,exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dontles systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse dudiscours donne aussi des renseignements sur des fragments de discours plus longs que la phrase;ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sontpas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), maisle sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.

ZELLIG S. HARRIS Université de Pennsylvanie

ANALYSE DU DISCOURS *

Cet article présente une méthode d'analyse de l'énoncé suivi (écrit ou oral) que nous appellerons discours 1. C'est une méthode formelle qui ne se fonde que sur l'occurrence des morphèmes en tant qu'éléments iso- lables; elle ne dépend pas de la connaissance que le linguiste qui analyse peut avoir du sens spécifique de chaque morphème, et elle ne nous apprend rien de nouveau sur le sens particulier de chacun des morphèmes qui figurent dans le discours en question. Mais ceci ne signifie nullement que nous ne puissions pas découvrir autre chose que la manière dont la grammaire de la langue s'illustre dans ce discours. Car, bien que nous usions de procédures formelles, proches de celles de la linguistique descriptive, nous pouvons obtenir sur le texte étudié des renseignements que cette dernière ne fournissait pas.

Cette information supplémentaire provient d'un fait fondamental : l'analyse de l'occurrence des éléments dans le texte n'est faite qu'en fonction de ce texte particulier; c'est-à-dire en fonction des autres éléments de ce même texte et non en fonction de ce qui existe ailleurs dans la langue. En conséquence, nous repérons les corrélations spécifiques des morphèmes du texte tels qu'ils se présentent dans ce texte et, ce faisant, nous découvrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que nous ne sachions pas exactement ce que le texte dit, mais nous pouvons déterminer comment il le dit — ce que sont les schemes de récurrence des principaux morphèmes qui le forment.

* Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous remercions M. Z. Harris et la Société de Linguistique d'Amérique qui nous ont autorisés à le publier en français.

1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aidé dans la mise au point de la méthode et dans l'analyse de divers textes : Fred Lukoff, Noam Chomsky et A. F. Brown. Les recherches antérieures dans la perspective de cette méthode avaient été présentées par Lukoff dans Preliminary analysis of the linguistic structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse détaillée d'un texte-échantillon a paru dans « Discourse analysis : a sample text » de Z. Harris, Language, vol. 28, n° 4, 1952, p. 474.

9

On peut déterminer des schemes définis pour des textes donnés, pour des individus, des styles ou des thèmes donnés. Dans certains cas on peut tirer des conclusions formelles du scheme spécifique de distribution des morphèmes dans un texte. Et il est souvent possible de mettre en évidence des différences de structure régulières entre les discours tenus par des personnes différentes, ou dans des styles ou sur des thèmes différents.

Préliminaires

1. — Le problème.

On peut envisager l'analyse du discours à partir de deux types de problèmes qui, en fait, sont liés. Le premier concerne le prolongement de la linguistique descriptive au-delà des limites d'une seule phrase à la fois. Le second concerne les rapports entre la « culture » et la langue (c'est-à-dire entre le comportement non-verbal et le comportement verbal).

Le premier problème se pose parce que la linguistique descriptive s'arrête généralement aux limites de la phrase. Ceci ne résulte pas d'une décision a priori, car les techniques linguistiques ont été élaborées pour permettre d'étudier tout énoncé, quelle qu'en soit la longueur; mais il se trouve que, dans toutes les langues, presque tous les résultats obtenus concernent un type d'énoncé relativement court qu'on peut appeler phrase. Autrement dit, quand on établit une interdépendance dans l'occurrence de deux éléments A et B, il se trouve presque toujours que ces deux éléments sont considérés comme se présentant dans une même phrase. On peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom ou après certains verbes (dans la même phrase) : the dark clouds, the future seems bright, mais il est rare que nous puissions établir des interdépendances qui dépassent les limites de la phrase, par exemple si le verbe principal d'une phrase a tel suffixe de temps, le verbe principal de la phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire que, si une phrase est; de la forme NV, la suivante sera de la forme N. Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de la forme NV, que quelques-unes sont de la forme N, etc., et que ces structures figurent dans diverses séquences.

C'est ainsi que la linguistique descriptive, partie pour décrire les occurrences d'éléments dans tout énoncé quelle qu'en soit la longueur, les décrit finalement surtout en fonction des autres éléments de la même phrase. On ne s'est pas trop inquiété de cette limitation, parce qu'elle n'a pas empêché l'élaboration de grammaires adéquates : la grammaire expose la structure des phrases; le locuteur construit chaque phrase particulière conformément à cette structure et produit sa propre séquence de phrases.

L'autre problème, celui des rapports entre le comportement (ou

10

situation sociale) et la langue, a toujours été considéré comme extralinguistique. La linguistique descriptive ne se préoccupe pas du sens des morphèmes et, bien qu'on puisse essayer de tourner la difficulté en parlant, non de sens, mais de la situation sociale et intersubjective dans laquelle l'énoncé est produit, la linguistique descriptive n'est pas armée pour tenir compte de la situation sociale : elle peut seulement définir l'occurrence d'un élément linguistique en fonction de l'occurrence d'autres éléments linguistiques. Les études menées sur les rapports entre la « culture » et la langue n'ont donc pas pu bénéficier des travaux distributionnels récents. Ainsi, elles font l'inventaire des sens exprimés dans la langue en étudiant le stock lexical; ou elles tirent des conclusions du fait que, dans une certaine langue, un certain groupe de sens s'exprime par le même morphème; ou elles discutent des nuances de sens et d'emploi d'un mot en le rapprochant d'autres (par exemple en stylistique). Elles ont aussi souligné certains points comme le fait qu'il faut considérer le sens global des syntagmes et non la somme des sens des morphèmes qui les constituent : ainsi « How are you? » est une formule de politesse plutôt qu'une question sur la santé de l'interlocuteur. Cet exemple illustre bien la corrélation entre le discours et la situation sociale. De même on a étudié des caractéristiques de la personnalité dans l'énoncé en rapprochant les traits linguistiques récurrents d'un individu avec des traits récurrents de son comportement et de sa sensibilité 2.

2. — Distribution a l'intérieur du discours.

L'analyse distributionnelle ou combinatoire à l'intérieur d'un discours considéré comme un tout spécifique se révèle pertinente pour l'étude de ces deux problèmes.

D'une part, elle nous permet de dépasser la limitation à la phrase de la linguistique descriptive. Alors que nous ne pouvons pas définir la distribution des phrases (ou plus généralement une quelconque relation entre les phrases) dans un ensemble arbitraire de phrases prises dans une. langue donnée, nous pouvons obtenir des résultats précis sur certaines relations dépassant les limites de la phrase si nous ne considérons que les phrases d'un seul discours suivi, c'est-à-dire celles qui ont été prononcées ou écrites les unes à la suite des autres par une ou plusieurs personnes dans une seule situation. Cette limitation de l'analyse au discours suivi n'en diminue pas l'utilité, puisque toutes les occurrences de la langue ont une cohérence interne. La langue ne se présente pas en mots ou phrases

2. Nous considérons que les corrélations entre personnalité et langue ne sont pas simplement liées aux corrélations entre culture et langue, mais qu'elles en sont un cas particulier. La raison d'être de ce point de vue est que la plupart des caractéristiques individuelles d'un énoncé (à distinguer des caractéristiques phonétiques) sont en corrélation avec les particularités de personnalité qui proviennent de l'expérience de l'individu dans des situations interpersonnelles conditionnées socialement.

11

indépendantes, mais en discours suivi, que ce soit un énoncé réduit à un mot ou un ouvrage de dix volumes, un monologue ou une discussion politique. Les ensembles arbitraires de phrases ne présentent en fait aucun intérêt, si ce n'est pour vérifier la description grammaticale; et il n'y a rien d'étonnant à ce que nous ne puissions pas trouver d'interdépendance entre des phrases ainsi assemblées. La succession des phrases dans un discours suivi constitue, au contraire, un domaine privilégié pour les méthodes de la linguistique descriptive, puisque celles-ci ont pour objet la distribution relative des éléments à l'intérieur d'un énoncé suivi quelle que soit sa longueur.

D'autre part, l'analyse distributionnelle à l'intérieur d'un seul discours, considéré individuellement, fournit des renseignements sur certaines corrélations entre la langue et d'autres formes de comportement. La raison en est que chaque discours suivi est produit dans une situation précise — qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de quelqu'un qui se met de temps en temps à son bureau pendant un certain nombre de mois pour écrire un type défini de livres dans une certaine tradition, littéraire ou scientifique. Cette co-occurrence de la situation et du discours ne signifie pas, bien entendu, que les discours produits dans des situations semblables doivent nécessairement avoir certaines caractéristiques , formelles en commun, ni que les discours produits dans des situations différentes doivent présenter certaines différences formelles; elle ne fait qu'expliquer ou permettre l'existence de ces corrélations formelles.

Il reste à prouver, à partir de données de fait, que ces corrélations formelles existent bien en effet, que les discours d'un individu, d'un groupe social, ou relevant d'un style particulier, ou portant sur un certain thème, , présentent non seulement des significations propres (dans leur choix des morphèmes), mais aussi des traits formels caractéristiques. Nous ne parlerons pas ici du choix particulier des morphèmes, mais on peut étudier les caractéristiques formelles de ces discours par des méthodes distributionnelles appliquées à l'intérieur de chaque texte; et le fait de leur corrélation avec un certain type de situation donne un statut de signification! à l'occurrence de ces caractéristiques formelles.

3. — Combinaison, avec la grammaire.

On voit donc que la méthode présentée ici vient d'une application des méthodes distributionnelles de la linguistique à un discours à la fois, considéré comme un tout' spécifique. On peut s'en servir directement sur un texte, sans faire appel pour son étude à aucune connaissance linguistique autre que les limites des morphèmes; ceci est possible parce que l'analyse distributionnelle est une méthode élémentaire, qui consiste simplement à établir l'occurrence relative des éléments qui, dans le cas parti-

12

culier, sont des morphèmes. Pour montrer la validité de la méthode, ou pour pouvoir éventuellement l'appliquer à un matériau non-linguistique, il convient de n'utiliser aucune autre connaissance préalable que les limites des éléments.

Si cependant nous nous intéressons non seulement à la méthode, mais encore à ses résultats, si nous voulons l'utiliser pour découvrir tout ce qu'il est possible de trouver sur un texte particulier, il est utile de la combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser que les règles de la grammaire de la langue en question qui sont vraies pour toute phrase ayant une forme donnée. Par exemple, à partir de toute phrase française de la forme Nj V N2 (Ainsi le chasseur tue le lion), on peut obtenir une phrase où l'ordre des syntagmes nominaux est inverse N2 — Nx (le lion — le chasseur) en changeant la forme verbale 3, le lion est tué par le chasseur. Le recours à ce genre d'informations grammaticales, dans l'analyse d'un texte, se justifie par le fait que, puisque cette règle s'applique à toute phrase française de la forme N2 V N2, elle doit donc aussi être applicable à toute phrase de la forme N-|_ V N2 du texte qui nous intéresse, à la seule condition, naturellement, que ce soit du français. Et ce recours à la grammaire permet dans bien des cas de pousser plus loin l'application de la méthode d'analyse du discours.

Nous verrons ceci plus en détail à la section 7.3.; mais il faut signaler ici que cet usage de l'information grammaticale ne remplace pas le travail qui pourrait être effectué par la méthode d'analyse du discours et n'affecte en rien l'autonomie de cette méthode, il ne sert qu'à transformer certaines phrases du texte en phrases grammaticalement équivalentes (cf. ci-dessus la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aisée l'application de la méthode d'analyse du discours, ou pour la rendre possible dans certains passages du texte où elle ne l'était pas auparavant. Et nous verrons qu'il ne s'agit pas de décider arbitrairement quand et comment appliquer ces transformations grammaticales, mais que c'est la structure même du texte qui les détermine.

On peut pousser plus avant encore l'application de la méthode d'analyse du discours dans des textes particuliers si on utilise, non seulement les résultats ordinaires de la grammaire, mais si on introduit également dans la linguistique descriptive l'étude des distributions spécifiques des morphèmes individuels; dans certains cas, en effet, comme on le verra à la section 7.3., on aimerait pouvoir avoir des renseignements non plus sur toute une classe de morphèmes (comme la transformation de tout V en V*), mais sur un certain membre de cette classe, sur une restriction d'occurrence qui est vraie pour ce morphème-là, mais non pour les autres; on n'a pas toujours à l'heure actuelle de tels renseignements, mais il est pos-

3. Dans ce cas de transformation du verbe correspondant à une inversion du sujet (N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale « forme conjointe de la première » et on l'écrira V*. La forme conjointe d'un verbe actif est donc le passif et vice versa.

13

sible de les obtenir par des méthodes qui, fondamentalement, sont celles de la linguistique descriptive.

Enfin, on peut quelquefois pousser plus avant l'application de l'analyse du discours dans des textes particuliers en tirant des renseignements non seulement de la grammaire de la langue mais aussi d'une analyse descriptive de l'ensemble, écrit ou parlé, dont le texte fait partie : on peut considérer cette masse plus vaste de matériau comme le dialecte dans lequel a été écrit ou dit le texte en question, et on peut dire, comme précédemment, que toute conclusion distributionnelle vraie pour toutes les phrases d'une forme donnée dans ce dialecte est vraie aussi de toute phrase de cette forme dans le texte en question.

La méthode

4. — Nature de la méthode.

Nous avons soulevé deux questions : celle des rapports distributionnels entre les phrases, et celle de la corrélation entre la langue et la situation sociale. Nous avons suggéré qu'on peut obtenir des renseignements concernant ces deux problèmes grâce à l'analyse formelle d'un discours pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser? Pour en décider, considérons ce que permet le matériau.

Puisque le matériau consiste simplement en une séquence de formes linguistiques disposées en phrases successives, toute analyse formelle se limite à localiser des éléments linguistiques à l'intérieur de ces phrases, c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de l'extérieur des informations nouvelles, nous ne pouvons pas étudier la nature ou la composition de ces éléments, où leur corrélation avec des caractéristiques non-linguistiques.

Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus importants que les autres, comme mais, ou je, ou communisme, qui nous conduiraient à nous intéresser au simple fait de leur absence ou de leur présence dans notre texte. Toute analyse qui tendrait à découvrir la présence ou l'absence dans un texte de certains mots particuliers choisis par le linguiste, serait une recherche sur le contenu du texte, qui reposerait finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur le sens dans notre analyse, les seuls morphèmes — ou les seules classes — que nous puissions traiter séparément sont ceux qui présentent des particularités de distribution établies grammaticalement.

Puisque nous ne nous intéressons donc pas, en général, à tel ou tel élément choisi à l'avance, mais bien aux éléments qui figurent dans le texte, il est évident que nous ne voulons pas simplement affirmer tauto-

14

logiquement qu'ils figurent; nous chercherons à établir empiriquement comment ils figurent, — lesquels se trouvent toujours à côté de quels autres, ou dans le même environnement que quels autres, etc., — c'est- à-dire l'occurrence relative de ces éléments les uns par rapport aux autres» En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour élaborer la grammaire d'une langue (qui établit; les. rapports distributionnels entre les .éléments), que de celle que l'on (utilise pour en j élaborer le

• dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se préoccuper de, leurs .positions).

Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous aurons établi sur la distribution.de chaque élément ne peut être valable que dans les limites de cette séquence de phrases — que ce soit un paragraphe ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des renseignements concernant la distribution d'un élément hors du texte considéré ; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que lorsque la distribution de cet élément dans le texte a été complètement établie.

5. — Aperçu général de la méthode.

Il résulte de tout ce qui précède que notre méthode devra établir les occurrences d'éléments et en particulier les occurrences relatives de tous les éléments d'un discours dans les limites de ce seul discours.

5.1. Éléments dans des environnements identiques.

Pour satisfaire à cette nécessité, nous pourrions. formuler de façon détaillée la distribution de chacun des éléments dans le discours — de même qu'en linguistique descriptive nous pourrions établir des formules individuelles rendant compte de tous les environnements (c'est-à-dire de la distribution) de chaque élément dans les différentes phrases d'une langue. Mais ces formules individuelles sont de dimension impossible pour toute une langue et, même pour un seul texte, elles sont difficiles à manier. De plus, dans les deux cas, elles ne constituent pas une base satisfaisante pour procéder à une analyse comparée et pour en déduire des conclusions générales. C'est pourquoi, dans l'analyse du discours, comme en linguistique descriptive, on regroupe les éléments qui ont des distributions semblables en une classe et, à partir de là, on parle de la distribution de la classe considérée comme un tout plutôt que de celle de chacun des éléments pris séparément.

Quand deux éléments ont des distributions identiques, cette opération de regroupement ne présente aucune difficulté. En linguistique descriptive, cependant, c'est rarement le cas, car peu de mots ont des distributions

15

identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fréquemment dans un texte répétitif, où deux mots peuvent être toujours employés dans des phrases parallèles identiques — comme par exemple dans les légendes à style en écho, dans les proverbes, dans les slogans, ou dans les rapports scientifiques « secs », mais précis.

5.2. Éléments à environnements équivalents.

Il est plus fréquent que deux éléments se présentent dans des environnements qui sont presque identiques, sans l'être tout à fait; nous pourrons peut-être alors les regrouper en une seule classe distributionnelle en dressant une chaîne d'équivalences qui lie les deux environnements presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre après la classe des noms N, en dépit du fait qu'un certain A (courageuse par exemple) peut ne jamais figurer après un certain N (table par exemple). C'est ce qu'on fait en analyse du discours quand on dit que deux parties de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes même en un autre endroit où elles n'ont pas le même environnement.

Supposons par exemple que le texte contienne les quatre phrases suivantes :

Ici les feuilles tombent vers le milieu de l'automne Ici les feuilles tombent vers la fin du mois d'octobre Les premiers froids arrivent après le milieu de l'automne Nous commençons à chauffer après la fin du mois d'octobre.

Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre sont équivalents parce qu'ils se présentent dans le même environnement (Ici les feuilles tombent vers) et que cette équivalence passe dans les phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers froids arrivent et Nous commençons à chauffer se présentent dans des environnements équivalents (le mot en supplément après est identique dans les deux environnements). L'élaboration de ces chaînes, qui font passer l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur environnement est vraiment identique, à une autre paire de phrases où il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon tout devient équivalent à tout et l'analyse s'effondre. On a le même problème quand on établit les classes en linguistique descriptive. Nous verrons plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse du discours.

De façon plus générale, si nous avons dans notre texte les séquences

4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le reste, mais qui contient Jim à la place de Bill.

5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de ces chaînes.

16

AM et AN, nous dirons que M est équivalent à N, ou que M et N se présentent dans un même environnement A, ou que M et N se présentent tous deux comme l'environnement d'un même élément (ou séquence d'éléments) A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré), puisque B et C se trouvent dans des environnements M et N, dont nous avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environnements B et C équivalents au second degré, et ainsi de suite. A titre d'exemple, continuons notre fragment de texte par la phrase suivante : Nous avons toujours des tas d'ennuis quand nous commençons à chauffer, mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte) à mais il faut bien être prêt.

Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils signifient la même chose; on utilise le signe = pour l'unique raison que le rapport entre B et C satisfait aux exigences techniques du rapport communément symbolisé par ce signe; quand nous posons B = C, cela signifie seulement que ce rapport est une étape dans une chaîne d'équivalences : d'une part B et C se rencontrent dans des environnements équivalents (M et N); d'autre part deux environnements (K et L), quels qu'ils soient, dans lesquels se trouvent B et G seront considérés équivalents.

Il ne sert à rien de soulever des questions comme « Est-il vrai que B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est une méthode d'analyse, les seules questions pertinentes sont de savoir si la méthode est utilisable et si elle conduit à des résultats intéressants et valables. On jugera si la méthode est utilisable en se fondant sur ses opérations, sans se préoccuper de ses résultats, que nous n'avons pas encore vus. Quant aux résultats, nous en étudierons l'intérêt aux paragraphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le « droit » de poser K = L, puisque tout ce que nous signifions par K = L est qu'on trouve BK et CL et que B = C; la justification viendra du fait qu'en regroupant toutes les équivalences, on trouve quelque chose sur la structure du texte.

5.3. Classes d'équivalences.

Après avoir établi quelles sont les séquences qui se rencontrent dans des environnements équivalents, nous pouvons les regrouper en une seule classe d'équivalence. Nous avons les formules A = B (tous deux se rencontrent devant N) et B = C, nous considérerons donc A, B et C comme membres d'une même classe d'équivalence. De même, M, N, K, L sont tous membres d'une autre même classe d'équivalence. Reprenons notre exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après

17

(To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il y a encore une troisième classe d'équivalence E' composée de nous avons toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a visiblement un rapport entre E' et E puisque tous deux se rencontrent avec les deux derniers membres de T. Mais E se trouve après T, tandis que E' se trouve avant T.

En fonction de ces classes, on peut écrire les cinq phrases du fragment de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE, E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe, mais on peut dire que, quand l'ordre de E et T est inversé (quand E se réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E' pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le précéder, ils deviennent des membres réguliers de E. Par exemple, on pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis mais les premiers froids arrivent si brusquement qu'il faut bien être prêt. Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours beaucoup d'ennuis est un membre deE en vertu de son occurrence après T; appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques on fait appel pour établir cette équivalence. De même il faut montrer que le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt (E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand. Si on peut établir ces deux équivalences, on peut remplacer les deux syntagmes E' par les syntagmes modifiés qu'on obtient quand on les met en position E. Nous obtenons par conséquent deux membres de plus dans E, et la classe E' n'existe plus.

On peut ainsi dresser des classes d'équivalence (comme E) de toutes les séquences qui ont des environnements équivalents, à l'intérieur du texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant ou après). Les éléments (ou séquences d'éléments) qui appartiennent à la même classe d'équivalence sont dits équivalents les uns aux autres, ou substituts les uns des autres : nous verrons plus loin (paragraphe 10) que, par certains côtés (en particulier dans les extensions du texte), on peut les considérer comme interchangeables ou substituables; dans ce cas la classe d'équivalence peut aussi s'appeler une classe de substitution.

11 est à remarquer que l'opération consistant à grouper dans une même classe d'équivalence des formes non identiques, ne repose pas sur le fait que leurs petites différences de sens sont considérées comme négligeables, mais sur le fait qu'on les trouve dans des environnements équivalents, ce qui signifie qu'on les trouve soit dans des environnements identiques (le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux dans l'environnement les feuilles tombent vers), soit dans des environne-

18

ments qui sont aux extrémités d'une chaîne d'équivalences garantie (Les premiers froids arrivent et Nous commençons à chauffer se trouvent dans les environnments équivalents après le milieu de l'automne et après la fin du mois d'octobre). Notre méthode est donc essentiellement celle de la linguistique descriptive et non celle de la sémantique.

5.4. Ordres de phrase.

Nous en arrivons maintenant à une opération que n'emploie pas la linguistique descriptive, à savoir la représentation de l'ordre des occurrences successives des membres d'une classe. En linguistique descriptive, le seul ordre considéré est la position relative des différentes parties d'une séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant que le premier précède le second dans la chaîne du syntagme nominal. Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties de la phrase, par exemple les ordres différents de E et E' par rapport à T.

L'ordre des phrases successives ou d'une certaine classe de mots dans différentes phrases (par exemple la relation entre des sujets successifs) n'intéresse généralement pas la linguistique descriptive, car les formules distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'intérieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de tout un discours, le problème existe. Si nous considérions chaque phrase séparément, en ne la rapprochant des autres que pour comparer des structures, nous pourrions dire (comme en linguistique descriptive) que chacune des phrases de notre fragment de texte consiste en TE. Mais, puisque nous considérons le texte comme un tout, nous ne pouvons dire qu'il consiste simplement en 6 fois TE : les membres de E et de T sont différents dans les diverses phrases; et leurs différences preuvent être particulières à ce texte, ou à un groupe de texte semblables.

Nous pouvons représenter structurellement notre fragment de texte par un tableau à double entrée, l'axe horizontal représentant la matière qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe vertical (ici divisé en 2 parties) représentant les phrases successives.

Ti Ex T3 E2

Dans ce tableau à double entrée, les différents symboles dans la rangée horizontale représentent les différentes parties d'une seule phrase ou sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans la phrase (sauf dans la mesure où l'ordre a été modifié par des transformations explicites comme pour le passage de E' à E). Les colonnes verticales indiquent les différents membres d'une classe d'équivalence, dans l'ordre d'apparition des phrases où ils figurent.

Le fait que l'ordre des symboles d'une rangée puisse être différent de l'ordre des éléments dans la phrase correspondante tient à ce que nos

19

connaissances linguistiques de la structure de phrase nous permettent de traiter les éléments indépendamment de leur ordre. C'est ce que nous faisons quand nous ne tenons pas compte dans nos symboles d'un ordre automatique et qui réapparaîtrait dès la retraduction de nos symboles en langue, — par exemple nous incluons mais... dans E4 même s'il en est nécessairement séparé dans la phrase réelle (puisque mais se trouve généralement au début d'une structure de phrase, quelle que soit la partie de la phrase à laquelle il se rapporte). C'est ce que nous faisons également quand nous remplaçons un certain ordre non automatique à valeur morphologique par les morphèmes qui sont grammaticalement équivalents à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par le chasseur) ou quand, dans notre fragment de texte, nous remplaçons E' avant T par E après T.

Contrairement au traitement cavalier de l'ordre horizontal, nous ne pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons là aucune connaissance linguistique a priori qui nous dise quels agencements de phrase sont automatiques (s'il y en a) et par conséquent à ne pas représenter, ni quels agencements peuvent être remplacés par des agencements différents, mais équivalents. Une étude plus approfondie des séquences de phrases dans la langue nous donnera peut-être un jour des indications à ce sujet; elle établira peut-être, par exemple et pour prendre un cas très simple, que des séquences de phrases de la forme P parce que Q sont équivalentes à des séquences de la forme Q donc P, ou que P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude approfondie d'un certain texte ou de plusieurs textes d'un certain type montrera peut-être que certaines séquences de phrases tout entières sont interchangeables ou équivalentes; et, grâce à ces données, nous pourrons peut-être simplifier l'axe vertical du tableau à double entrée, en trouvant par exemple des schemes verticaux qui reviennent périodiquement. En attendant, l'axe vertical reste une reproduction exacte de l'ordre des phrases ou sous-phrases du texte.

5.5. Résumé.

Nous pouvons maintenant avoir un aperçu général de la méthode. On dira que des éléments (parties de texte — morphèmes ou séquences de morphèmes) sont équivalents entre eux s'ils se présentent dans l'environnement d'autres éléments identiques ou équivalents. Tout ensemble d'éléments équivalents entre eux s'appelle une classe d'équivalence.

6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette équivalence en trouvant que la distribution de chaque phrase est équivalente à celle des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles que nous savons déjà faire partie du système.

20

Chaque phrase successive du texte est alors représentée par une séquence de classes d'équivalence, celles auxquelles ses différentes parties appartiennent. Nous obtenons ainsi pour tout le texte un tableau à double entrée, l'axe horizontal représentant les classes d'équivalence contenues par une seule phrase, l'axe vertical représentant les phrases successives. Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.), mais des schemes d'occurrence des classes d'équivalences dans tout le texte.

Si les différentes phrases contiennent des classes entièrement différentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le cas. Il y a, dans presque tous les textes, des passages où certaines classes d'équivalence se répètent, dans les phrases successives, en un scheme caractéristique. Le tableau permet d'étudier ce scheme et on peut en tirer divers types d'information sur le texte, certaines analyses structurelles du texte et certaines exégèses sur le texte. Pour les classes d'équivalence, qui ont été établies distributionnellement, le tableau en montre la distribution. Pour le texte dans sa totalité, le tableau montre certaines caractéristiques de structure.

6. — Mode opératoire.

Nous allons maintenant montrer la procédure en détail, en appliquant la méthode à un texte spécifique, d'un type très courant aujourd'hui 7.

Millions Can't Be Wrong

Millions of consumer bottles of X- have been sold since its introduction a few years ago. And four out of five people in a nation wide survey say they prefer X- to any hair tonic they've used. Four out of five people in a nation wide survey can't be wrong. You too and your whole family will prefer X- to any hair tonic you've used! Every year we sell more bottles of X- to satisfied customers. You too will be satisfied!

6.1. Détermination des classes d'équivalence.

La première étape dans l'analyse du discours consiste à décider quels éléments doivent être considérés comme équivalents, donc placés dans la même colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit pas simplement de trouver ceux des éléments qui ont des environne-

7. Ceci est le texte authentique d'un slogan, que nous avons trouvé sur une carte, qui selon toute vraisemblance, était accrochée à une bouteille de lotion capillaire. Un très grand nombre de slogans ont été analysés, car ils offrent un matériau clair et répétitif qui est relativement facile à manier, au stade où nous en sommes arrivés dans l'analyse du discours. On a aussi analysé de nombreux autres types de textes — des fragments de livres scolaires, de conversations, d'essais littéraires, etc., qui feront l'objet d'une prochaine publication.

21

ments identiques, car 1° il peut y avoir plusieurs façons de couper une phrase en parties équivalentes; et 2° il nous faut déterminer dans quelle direction chercher les chaînes d'équivalence qui sont moins évidentes.

Le point de départ le plus simple est d'examiner les mots du texte qui sont le plus souvent répétés : presque tous les textes contiennent des mots très souvent répétés 8, qui sont souvent les mots-clés du texte. On peut en toute certitude mettre dans une seule colonne, c'est-à-dire dans une seule classe d'équivalence, les diverses occurrences de chacun de ces mots. Et on peut mettre dans une seule autre classe d'équivalence les mots voisins du mot-clé puisqu'ils se présentent dans des environnements identiques. Dans notre texte, il n'y a pas apparemment de mots-clés; mais nous pouvons partir de la séquence répétée can't be wrong, identique et donc naturellement équivalente : Millions est alors équivalent (pour ce texte) à Four out of five people in a nation wide survey, puisque tous deux se trouvent devant can't be wrong.

Cette première étape pourrait aussi, bien entendu, être effectuée pour des mots répétés tels que of. Mais si nous devions regrouper tous les environnements du mot of, nous ne pourrions pas utiliser la classe d'équivalence qui en résulterait pour construire une chaîne d'autres équivalences, car on ne trouverait rien d'autre dans leur environnement. Tandis que la classe contenant millions et four out of five, que nous obtenons à partir des répétitions de can't be wrong, se révélera, dans les paragraphes suivants, liée à d'autres parties de ce texte.

En utilisant ainsi les répétitions, nous en venons à construire des chaînes d'équivalence : nous nous demandons quels autres environnements se présentent pour millions et four out of five... Pour millions nous avons un autre environnement, à savoir of consumer bottles, etc., mais nous verrons plus tard (paragraphe 9) que cet environnement s'oppose aux environnements de four out of five; nous laisserons donc provisoirement de côté la séquence of consumer bottles, etc. Quant à Four out of five in a nation wide survey, nous le trouvons dans un autre environnement say they prefer X- to any hair tonic they 've used.

Nous suivons cette chaîne d'équivalence en cherchant un autre environnement dans lequel say they prefer X- se trouve; il y a bien une autre occurrence de cette séquence, mais elle se différencie de la première par you à la place de they. A première vue, il paraît donc impossible de considérer ces deux séquences comme équivalentes, puisque notre méthode ne donne aucune technique d'approximation, aucun moyen d'estimer une différence plus ou moins grande, qui puisse nous permettre de

8. Ceci est même vrai, bien qu'à un moindre degré, dans des textes écrits par ceux qui respectent les consignes scolaires concernant l'emploi des synonymes pour éviter les répétitions. Dans ce cas, on trouvera souvent les synonymes dans les mêmes environnements que le mot originel à ne pas répéter. Au contraire, quand un auteur a intentionnellement utilisé un mot différent pour exposer une nuance particulière de sens que ce mot exprime, il y aura souvent une différence correspondante entre les environnements du synonyme et du mot originel.

22

dire que ces deux séquences sont assez semblables pour être considérées comme équivalentes. En fait, puisque nous n'opérons pas sur le sens des morphèmes, le remplacement de they par you pourrait constituer une différence importante (comme ce serait le cas si tout le texte traitait de la distinction entre you et they). Telles quelles, ces deux séquences ne seraient donc pas rapprochées par notre méthode; tout ce que cette méthode pourrait faire, serait de trier les parties identiques et les parties différentes. En fait il se trouve cependant qu'un examen un peu plus approfondi montre que ces deux séquences sont contextuellement identiques — c'est-à-dire identiques quant à leur environnement pertinent ou contexte. On verra cela au paragraphe 7.1.

Dans l'élaboration des chaînes d'équivalence, il importe de se conformer rigoureusement aux exigences formelles de la méthode, ceci constitue la première garantie; si nous ne faisons jamais d'approximations, si nous ne négligeons jamais une « petite » différence dans l'environnement, nous serons assurés que deux membres quelconques d'une même classe d'équivalence ont au moins un environnement en commun. Si nous voulons mettre dans une même classe deux éléments alors qu'aucun environnement de l'un n'est identique à un environnement de l'autre, il nous faudra ajouter à la méthode un postulat explicite, qui rendra égaux deux environnements ou neutralisera leur différence.

Il faut enfin examiner, quand on se demande s'il faut inclure ou non deux éléments dans une même classe d'équivalence, comment fonctionnerait, dans l'analyse du texte, la classe qui résulterait de cette inclusion, c'est-à-dire le genre de tableau à double entrée que l'on obtiendrait en utilisant cette classe : ce facteur doit jouer un rôle, car il y a souvent plusieurs chaînes d'équivalence possibles qui satisfont à la méthode. Il ne s'agit pas de considérer des critères externes, comme la longueur de la chaîne par exemple; il s'agit plutôt de chercher une distribution systématique des classes, c'est-à-dire d'essayer d'établir en termes de ces classes un certain fait structurel sur le texte. Autrement dit, nous essayons de dresser des classes telles qu'elles aient une distribution intéressante pour notre texte. On pourrait penser que c'est une garantie plutôt circulaire pour la construction des chaînes d'équivalence; mais cela signifie simplement que toutes les fois que nous devons décider s'il faut pousser plus loin une chaîne d'équivalence, nous étudions comment le nouveau jalon s'inscrira dans notre texte analysé, tel qu'il se présentera une fois représenté en fonction de cette nouvelle classe. On utilise aussi ce genre de considération en linguistique descriptive quand on doit décider, par exemple, jusqu'où aller dans la subdivision d'une séquence phonologique en morphèmes 9.

9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans dire que cet emploi vague de la prévision est une formulation préliminaire. Des analyses poussées montreront ce que l'on peut attendre des différents types de chaînes d'équivalence, et permettront ainsi une formulation plus précise des garanties.

23

On pourrait demander de quel droit nous mettons deux mots dans une même classe d'équivalence pour l'unique raison qu'ils se présentent tous deux dans le même environnement. Ce à quoi nous répondrons que la classe d'équivalence indique seulement ce que font distributionnellement ses membres dans le texte : si, dans ce texte, deux mots ne se présentent que dans des environnements identiques ou équivalents, alors, dans ce texte, il n'y a pas de différence dans leur distribution (à part leur ordre dans la colonne, qui est préservé). Nous ne nions pas qu'il puisse y avoir des différences de sens ou de distribution en dehors de ce texte.

Nous avons jusqu'ici reconnu deux classes d'équivalence. L'une, que nous appellerons P, contient pour l'instant :

Millions Four out of five people in a nation wide survey

l'autre, que nous appellerons W, contient pour l'instant : Can't be wrong sag they prefer X- to any hair tonic they've used.

6.2. Segmentation.

Dès que nous voyons à peu près quelles classes d'équivalence nou& voudrions expérimenter dans notre texte, nous le divisons en segments successifs de manière à avoir, dans chaque segment, des occurrences semblables des mêmes classes d'équivalences. Si nous avons jusqu'ici les classes P et W et si nous avons quelques successions de la forme PW, nous essayons de les diviser en segments contenant chacun exactement un P et un W. Par exemple, le titre du slogan est représenté par PW. La première phrase après le titre paraît contenir un P (le mot Millions), mais le reste de la phrase n'est pas égal à W et ne le contient pas; on laisse donc la phrase non analysée, et même son P est-il douteux.

L'appartenance d'un élément à une classe particulière dépend toujours de l'appartenance de son environnement. Les éléments ne se définissent qu'en fonction de leur environnement. Ainsi donc, il se pourrait que le Millions de cette phrase ne soit pas le même mot que le Millions du titre. En linguistique descriptive, deux segments identiques du point de vue phonologique ne constituent un même morphème que s'ils figurent dans la même classe de morphèmes : il faudrait probablement considérer sun (soleil) et son (fils) comme le « même » morphème, au même titre que table (de bois) et table (de logarithmes); s'ils figurent dans des classes de morphèmes différentes, comme par exemple sea (mer) et see (voir), ils ne sont certainement pas le même morphème; et si nous voulons ne pas faire disparaître le rapport entre (a) table (une table) et (to) table (tabuler) nous devons distinguer des morphèmes classés et des morphèmes non classés, et dire que le morphème non classé table figure à la fois dans la classe N et dans la classe V. De la même façon, si nous rencontrons Millions deux fois, nous essayons de le considérer comme un « même » mor-

24

phème répété (donc de la même classe), et de considérer ainsi ses deux environnements comme équivalents. Mais il se peut que nous découvrions ensuite qu'on obtient une meilleure analyse du texte en ne considérant pas ces deux environnements comme équivalents (parce que le premier environnement est équivalent à une certaine séquence A dans le texte, tandis que le second est équivalent à une autre séquence B, qui n'est pas équivalente à A). Ainsi donc il se peut que nous ayons à considérer les deux occurrences de millions comme appartenant à deux classes différentes. Nous verrons à la section 9 que c'est bien le cas ici.

ReVenons-en à notre segmentation. La deuxième phrase du texte est PW, et la troisième PW. Nous essayons donc de segmenter notre texte en tranches successives contenant chacune exactement PW et pas plus. Ces tranches seront alors les rangées successives de notre tableau à double entrée. Il s'agira souvent d'une phrase entière, mais pas nécessairement : les différentes sections d'une phrase composée, chacune ayant sa propre structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent aussi constituer des tranches. Mais toute autre portion de la phrase peut aussi constituer une de ces tranches. Par exemple, si nous avions dans notre slogan la phrase : Millions of people — four out of five — can't be wrong when they say they prefer X, qui, telle qu'elle est là, paraît consister en PPWW, nous essaierions de la réduire à deux segments PW. Ces segmentations, moins évidentes, demandent la plus grande attention, car nous voulons non seulement que les occurrences de P et W soient les mêmes dans chaque segment, mais aussi que le rapport entre P et W soit le même. Quand, dans une suite de phrases, chaque phrase tout entière se réduit à PW,le rapport entre P et W dans chaque segment est le même; la linguistique descriptive nous apprend que c'est le rapport entre sujet et prédicat. Nous n'avons pas besoin d'utiliser ce renseignement spécifique pour analyser notre texte en PW successifs, mais nous tenons pour acquis que, quel que soit le rapport entre P et W dans un segment, il est le même dans tous les autres segments. Sans quoi il serait faux de dire, en face d'un tableau à double entrée, comme les TE successifs du paragraphe 5.4., que les segments successifs sont identiques pour ce qui est de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques permettant de vérifier que le rapport entre les classes d'équivalence de chaque rangée est le même.

6.3. Séries de segments semblables.

On ne réussira généralement pas à diviser tout un texte en segments contenant les mêmes classes d'équivalence (dans le même rapport les unes par rapport aux autres). Il peut y avoir ici et là des phrases qui tout simplement ne contiennent pas ces classes : elles peuvent se révéler être des phrases d'introduction ou des ramifications d'une autre série de classes d'équivalence. Et le texte peut être constitué de morceaux successifs, sortes de sous-textes à l'intérieur du texte principal, comme des

25

paragraphes ou des chapitres contenant chacun ses propres classes d'équivalence différentes de celles des autres morceaux.

En cherchant les segments qui contiennent les mêmes classes, on découvrira les limites de cette appartenance à une même classe, c'est- à-dire les endroits où l'on obtient des fragments du texte contenant des classes différentes. En règle générale un texte ne se réduira donc pas à une seule série de rangées identiques (chaque rangée, comme TE, représentant un fragment contenant les mêmes classes d'équivalence), mais à une succession de séries de rangées identiques à l'intérieur de chaque série avec, ici et là, des rangées individuelles et différentes.

Ayant obtenu ce résultat, nous comparons alors les différentes séries et rangées individuelles, pour voir leurs ressemblances et leurs différences en ce qui concerne l'agencement de leurs classes, que les classes spécifiques soient différentes ou non. Nous essayons de découvrir des schemes dans l'occurrence de ces ressemblances au cours de la succession des séries et des rangées individuelles. Par exemple, supposons un texte de la forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS FBV MS. Si nous utilisons des crochets pour représenter une série de fragments de la même forme en laissant momentanément BV de côté, nous pouvons alors représenter le texte par AB [TE] A'B' [EP] AB KD [LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD [LM] K'D' [MS] sont structurellement identiques : tous deux sont de la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z; notre texte consiste en deux occurrences de cette structure, plus une deuxième apparition du w de la première occurrence (c'est-à-dire le AB) entre les deux structures (ou avant la seconde structure), et plus un FBV unique avant la fin de la dernière structure.

7. — Techniques auxiliaires.

Il faut affiner et compléter la procédure centrale, que nous venons de voir, à l'aide de plusieurs techniques auxiliaires.

7.1. Occurrence indépendante.

La distribution des classes d'équivalences (leur scheme d'occurrence) et la segmentation en fragments qui les contiennent, dépendent de ce que nous reconnaissons être une occurrence d'un élément. A première vue, cela peut paraître tout simple : dans la suite Say they prefer X- to any hair tonic they've used before, nous trouvons évidemment say une fois, they deux fois, etc., En y regardant de plus près cependant nous voyons que toutes les occurrences des éléments ne sont pas indépendantes : certains éléments ne se trouvent, dans un environnement donné, qu'en présence d'un autre élément. Cette situation est connue en linguistique descriptive; par exemple le 5- de he walks n'est pas pris comme élément indépendant, mais comme une co-occurrence automatique de he, par

26

comparaison avec / walk, you walk 10; et dans des formes comme both he and I, la présence de both entraîne toujours celle de and, si bien qu'on peut considérer both ... and comme un seul élément — et non comme deux éléments. De la même façon, si dans un texte nous trouvons des éléments identiques (répétés) ou différents, dont l'un n'apparaît que si l'autre est présent, nous concluons que ces occurrences ne sont pas indépendantes l'une de l'autre et nous indiquons leur occurrence combinée comme un seul élément dans notre représentation du texte.

Pour they prefer X- to any hair tonic they've used nous ne pouvons le comparer qu'à you too and your whole family will prefer X- to any hair tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le mot qui précède 've; nous pouvons donc dire que le mot qui précède 've n'est pas indépendant ou, plutôt, que le choix de l'un des deux membres du groupe they /you dépend de celui des deux mots de ce groupe qui se trouve devant prefer. Si le signe Q représente la répétition du membre du groupe they /you qui se trouve dans ce qui précède prefer, on a : U X \J I \J X XX

they prefer X- to any hair tonic Q've used You... will prefer X- to any hair tonic Q've used.

Maintenant que nous avons réduit ces énoncés à leurs éléments indépendants, nous constatons que leurs dernières parties sont devenues identiques; par conséquent les premières parties des deux phrases se trouvent dans des environnements identiques, elles sont donc équivalentes; puisque la première appartenait à la classe P, la seconde you too... appartient aussi à P u.

Ceci était un type d'occurrence liée; il y en a bien d'autres sortes qu'il faut étudier; et les enseignements tirés de cette étude sont utiles à la fois pour l'analyse du discours et pour une linguistique descriptive plus détaillée.

Les pronoms en offrent un exemple important. Si le slogan avait dit you... will prefer it, au lieu de you... will prefer X-, nous commencerions par considérer it comme un nouvel élément, à placer dans une nouvelle classe d'équivalence. Mais, en fait, l'occurrence de it dépend de l'occurrence de X- : si le X précédent avait contenu le morphème de pluriel (X-s), le pronom dans cette phrase aurait été them. D'autres mots du groupe de it, comme he ou you, ne peuvent figurer tant que X- apparaît dans la phrase précédente. Il en est de même pour des mots comme

10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on peut également considérer que walks, goes, etc., sont des variantes de walk, go, etc. après he et les noms singuliers.

11. Avant d'en venir là, il faut effectuer un certain nombre d'autres opérations pour réduire Four out of fives... say they prefer... à deux séquences PW : Four... say... et they prefer..., la phrase You... will prefer... étant une troisième séquence PW. Sinon, les mots say they resteraient, puisque la séquence P (équivalente à millions) est seulement Four out of five people in a nation wide survey, et puisque la séquence W corrigée (identique au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf. paragraphe 9).

27

this /these, who /which, qui dépendent eux aussi de mots particuliers apparaissant à un autre endroit du texte. Sans faire appel à aucune connaissance sur la signification de ces pronoms ou sur leur « référence » aux noms qui les précèdent, nous pouvons conclure, d'après leur distribution dans le texte, que ce ne sont pas des éléments indépendants : ils contiennent une partie (discontinue) de l'occurrence du morphème auquel ils sont correliés.

On rencontre un autre type d'occurrence liée dans des expressions réciproques comme each other et together qui introduisent dans la langue certaines des fonctions remplies par les variables dans les expressions mathématiques — mais avec ce manque de netteté et cette complexité qui sont caractéristiques de la langue. La phrase Foster and Lorch saw each other at the same moment est normale; mais enlevez and Lorch, et tous les anglophones remplaceront immédiatement each other par autre chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each other sans contenir soit l'expression and Z, soit un morphème de pluriel dans le nom correspondant. Et aussi bien nous trouverons la phrase Electrons and positrons attract each other, mais nous ne trouverons pas — dans un livre de physique tout au moins — la même phrase avec omission de and positrons, sauf s'il y a aussi d'autres modifications telles que le remplacement de attract par repel.

On peut remarquer que les éléments dépendants ont particulièrement tendance à appartenir, dans leurs différentes occurrences, à des classes d'équivalence différentes, puisque chaque occurrence appartient à la classe de l'élément, quel qu'il soit, qui lui est correlié. Si le texte disait : You will prefer X-, You will prefer it, The survey showed, It showed, la première occurrence de it appartiendrait à la classe de X-, la seconde à la classe de survey.

Dans tous ces cas, on peut éliminer les rapports spéciaux d'occurrence liée entre des éléments particuliers, en faisant simplement de l'élément dépendant une partie de l'élément auquel il est correlié (dont son occurrence dépend). Il est bien entendu que, quand nous parlons de dépendance, l'application que nous en faisons est restreinte au texte particulier considéré. Il se peut que l'interdépendance entre les pronoms, ou les mots réciproques, et un quelconque nom voisin se maintienne dans tous les textes où ces mots apparaissent; mais l'interdépendance entre les deux occurrences de they ou de you dans notre texte est spécifique à ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any hair tonic you've used; mais dans ce texte particulier, nous n'avons pas cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le second pronom doit être, en considérant le premier.

7.2. Subdivisions des phrases.

La présence d'éléments dépendants nous conduit à considérer différemment la subdivision des phrases.

28

Quand les parties dépendantes d'un élément sont dispersées sur toute une zone, nous devons généralement considérer toute cette zone comme constituant un seul fragment comportant cet élément. Dans they prefer X- to any hair tonic they've used par exemple, nous avons montré que les deux occurrences de they sont interdépendantes dans ce texte; nous pouvons donc décomposer cet énoncé en they (se présentant dans les deux positions) plus... prefer X- to any hair tonic... 've used; de même pour la phrase avec you (également dans les deux positions). Il s'agit là d'un traitement plus général que celui du paragraphe 7.1., qui donnait un statut privilégié à la première occurrence de they et de you en en faisant dépendre la seconde occurrence, et qui fondait l'identité des deux phrases dans leur dernière partie sur le fait que toutes deux renfermaient le même type de dépendance (Q). Ce nouveau traitement élimine la dépendance en considérant que l'unique they ou you figure dans les deux positions, et établit sans conditions l'identité des secondes parties des phrases. Le résultat de ce nouveau traitement est que, puisque le they à double position s'étend sur presque toute la longueur de la seconde partie, toute cette seconde partie doit être enfermée dans le même fragment que they. L'unification des deux occurrences de they nous empêche donc de faire là deux segments; sinon nous aurions pu avoir deux segments : they prefer... et soit they've used soit Q've used.

D'un autre côté, il y a des cas où la dépendance nous conduit à distinguer plus de segments que nous ne le ferions autrement. Prenons par exemple la phrase Casals, who is self-exiled from Spain, stopped performing after the fascist victory. Si nous étudions le texte dans lequel est enchâssé cet énoncé, nous trouvons que le who est dépendant de Casais, tout comme le second they est dépendant du premier : le texte contient And the same Casals who... mais plus loin The records which... Nous pouvons donc dire que le who « contient » Casals, c'est-à-dire qu'il en est soit la continuation, soit la répétition. Mais laquelle des deux est-il? S'il en est la continuation, nous n'avons qu'un segment, la première partie (C) étant Casals who, la seconde (S) étant is self exiled... stopped... S'il en est la répétition, nous avons deux segments, l'un enchâssé dans l'autre : le premier est constitué de Casais (C de nouveau), plus stopped performing (Sx), le second de who (considéré comme équivalent de Casals) plus is self-exiled (S2). Nous n'opterions pour la seconde solution que si nous pouvions montrer, en fonction du texte, que is self-exited... et stopped performing... sont deux éléments distincts (et non simplement deux parties d'un même long élément) — si, par exemple, nous trouvions dans le texte deux autres phrases : The press failed to say why he stopped performing, etc. But he has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient Casals. Mais si la phrase originelle est Casals who S, notre analyse donne CS, tandis que si (à la lumière des deux dernières phrases) nous considérons la phrase originelle comme étant Casals who S2SV notre analyse donne CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le résultat

29

étant que S2 et Sx sont équivalents puisqu'ils apparaissent tous deux après C. La seule différence qu'il y a entre le fait déconsidérer un élément dépendant comme une continuation et le fait de le considérer comme une répétition réside dans le nombre de segments — un ou deux — en lequel nous pouvons alors décomposer le tout.

Nous venons de voir que, quand une phrase contient un élément A, qui est dépendant de B, nous pouvons soit considérer toute la phrase comme un seul segment dans lequel A est simplement une continuation de B, soit la considérer comme deux segments, l'un contenant B et l'autre contenant A dans la même classe que B. En règle générale, on optera plutôt pour cette seconde solution si le reste de la phrase peut se diviser en deux parties comparables, l'une allant avec A et l'autre avec B.

Des choix de ce type peuvent se présenter même là où il n'y a pas de formes dépendantes. Par exemple, dans notre second texte, nous avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees for the fall of Franco; nous souhaitons mettre self-exiled dans la même classe que is self-exiled..., puisqu'ils comportent les mêmes morphèmes (à condition de pouvoir montrer d'après le texte lui-même que self-exiled est équivalent à self-exiled from Spain); ceci nous donne la structure de phrase particulière S2 C S3, par comparaison avec les phrases CS précédentes. Si maintenant par un heureux hasard le texte contenait également la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce qui est trop demander en fait de répétition), nous serions à même de faire l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2, S2CS3, CS3; les séquences S1} S2 et S3 sont toutes membres d'une même classe d'équivalence S, puisqu'elles apparaissent toutes après C. La difficulté vient de cet étrange objet qu'est S2CS3. Disons maintenant que toute phrase XjAX2 peut être « transformée » en A is Xj : AX2 12; ceci signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y trouve aussi; dans ce cas, nous considérons XXAX2 comme équivalent à A is Xx : AX2. Notre étrange objet S2CS3 disparaît alors : nous le remplaçons par C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le même texte.

On peut continuer dans cette voie jusqu'à des transformations qui ne sont pas déjà justifiées par le texte, pourvu qu'elles ne soient pas en contradiction avec lui. Par exemple, nous trouvons dans le texte les phrases The memorable concerts were recorded in Pardes... The concerts were recorded first on tape. Nous pouvons écrire ceci MNRX : NR2 (l'équivalence de Rx et R2 est supposée démontrée à un autre endroit du texte), et nous transformerions la première phrase en N is M : NRr Nous ne prétendons pas par là que notre transformation N is M (The concerts were memorable) figure vraiment dans le texte, ou qu'il n'y ait pas de différence stylistique ou autre entre The memorable concerts were recorded in Prades et The

12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou d'un segment. (On l'utilise de préférence au point qui risquerait d'être confondu avec le point marquant les fins de phrase dans le texte de l'auteur.)

30

concerts were memorable : The concerts (ou They) were recorded in Prades. Tout ce que cette transformation signifie, c'est qu'on considère MNRj^ comme équivalent de N is M : NRj, parce qu'on trouve bien S2GS3 comme équivalent de C is S2 : CS3, en ce sens que tous deux figurent dans le texte modifié.

D'une part nous avons éliminé de notre agencement en tableau la structure de segment spéciale MNRX ou S2CS3 — spéciale parce que les autres segments sont tous de la forme NR ou CS. D'autre part, nous avons découvert que M (ou plutôt is M) est membre de la classe R. Mais surtout nous avons établi qu'une phrase peut être représentée par deux segments même si elle ne contient pas deux ensembles des classes d'équivalence voulues. C'est ce qui arrive quand nous pouvons démontrer qu'une seule classe dans la phrase a ailleurs un rapport indépendant avec deux autres classes ou éléments. Cette classe est donc répétée une fois dans chaque segment; et chaque segment marque individuellement le rapport de cette classe avec l'une des deux autres 13.

Ces difficultés dans la division en segments viennent des rapports que les classes d'équivalence entretiennent les unes avec les autres. Une phrase n'est pas simplement l'occurrence simultanée de différents morphèmes ou séquences; ceux-ci sont généralement liés, les uns aux autres, par un rapport spécifique, qui peut s'exprimer par un ou plusieurs morphèmes d'ordre : You wrote Paul et Paul wrote you ne diffèrent que par l'ordre des morphèmes. Si nous trouvons dans notre texte plusieurs segments de la forme CS, cela signifie que C est dans un rapport particulier avec S — celui de se présenter avec S, et devant lui. Puisque nous n'opérons pas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais nous prenons soin de représenter le même ordre de morphèmes dans la phrase par le même ordre de classes dans le segment. Quand maintenant nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre les deux phrases. Il faut donc réorganiser ce S2CS3 inconnu, pour qu'il contienne les mêmes classes dans le même ordre que d'autres segments — et, bien entendu, nous devons montrer que la forme remaniée est équivalente, pour ce texte, à la forme originale. Dans la plupart des cas, la seule façon d'y arriver est de diviser la phrase inconnue, au moyen de transformations comme celles que nous avons vues plus haut, en deux ou plusieurs segments, de façon à ce que les segments obtenus aient une forme qui se rencontre dans le texte.

De cette manière, nous obtenons un grand nombre de segments de structure semblable, même dans un texte dont les phrases sont très différentes les unes des autres.

13. Nous avons considéré ici le cas important de la séquence adjectif + nom + verbe, dans laquelle le nom a des rapports indépendants avec l'adjectif et avec le verbe. On peut représenter l'adjectif, aussi bien que le verbe, comme prédicat du nom. Nous reviendrons sur cette question au paragraphe 7.3.

31

7.3. Transformations grammaticales.

Nous avons vu jusqu'ici comment on peut étudier la structure d'un texte sans faire appel à aucune information qui ne soit pas fournie par le texte lui-même : la procédure directe consiste à dresser des classes d'équivalence et à découvrir des schemes de combinaison de ces classes dans les segments successifs du texte (c'est-à-dire à trouver des combinaisons semblables ou partiellement semblables). On obtient souvent cependant beaucoup de petites classes et de segments qui ne sont pas semblables, parce que les phrases sont si différentes les unes des autres; quand c'est le cas, on s'aperçoit qu'en comparant les phrases du texte on peut parfois montrer qu'une partie d'une phrase est équivalente (pour ce texte) à une partie différente d'une autre phrase et, par conséquent, qu'elle contient les mêmes classes. Ceci dépend du nombre de répétitions que contient le texte.

Passons maintenant à la possibilité de pousser plus loin dans la même direction en faisant appel à une information extérieure au texte; celle-ci sera de la même nature que celle que nous avons cherché à établir à l'intérieur du texte, c'est-à-dire qu'elle conservera l'équivalence de parties de phrases (au sens où MNR est équivalent à N is M : NR); elle reviendra à la même opération fondamentale, c'est-à-dire à la comparaison de phrases différentes. Et elle tendra au même but : montrer que deux phrases, différentes par ailleurs, contiennent la même combinaison de classes d'équivalence, même si elles contiennent des combinaisons différentes de morphèmes. La seule nouveauté, c'est qu'au lieu de comparer deux phrases du texte, nous comparerons une phrase du texte à des phrases qui ne sont pas dans le texte.

On pourrait penser qu'il s'agit là d'une différence capitale et s'interroger sur la validité de l'application à notre texte d'une équivalence ainsi établie. Nous avons déjà répondu à cette objection au paragraphe 3 : si nous pouvons montrer que deux séquences sont équivalentes dans toutes les phrases anglaises où elles figurent, alors elles sont équivalentes dans tout texte écrit en anglais. Si dans toute phrase anglaise contenant XAY, le XAY est équivalent à A is X : AY, alors si nous trouvons S2CS3 dans notre texte anglais nous pouvons dire que S2CS3 équivalent à C is S2 : CS3.

Mais qu'est-ce que Y équivalence? Deux éléments sont équivalents s'ils se trouvent dans le même environnement à l'intérieur de la phrase. Deux phrases d'un texte sont équivalentes simplement si elles se trouvent toutes deux dans ce texte (sauf si on découvre des détails de structure assez fins pour montrer que deux phrases ne sont équivalentes que si elles figurent dans des positions structurelles semblables dans ce texte). De même, deux phrases d'une langue sont équivalentes si elles se rencontrent toutes deux dans cette langue. En particulier, on dira que des phrases de la forme A sont équivalentes à des phrases de la forme B si, pour chaque phrase A, on peut trouver une phrase B contenant les mêmes morphèmes,

32

mises à part les différences dues à la différence de forme entre A et B : par exemple, I^VNa est équivalent à N2 is V-en by Nx parce que pour toute phrase comme Casals pldys the cello, on peut trouver une phrase The cello is played by Casals.

Nous ne soutenons nullement que deux phrases équivalentes signifient nécessairement la même chose, ni qu'elles soient pareilles du point de vue stylistique. Mais par contre nous soutenons que toutes les phrases ne sont pas ainsi équivalentes : la relation d'équivalence n'est pas sans intérêt, comme elle le serait si elle existait pour toutes les phrases. Par exemple, NjVN,} n'est pas équivalent à Nx is V-en by N2, parce que cette dernière forme se trouve pour certains N± et certains N2 (I saw you et / was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas Casals is played by the cello) u. Nous affirmons de plus que l'application de cette équivalence grammaticale provenant de l'extérieur nous permettra de découvrir dans notre texte des segments semblables supplémentaires que nous ne pourrions pas trouver par la simple comparaison des phrases du texte. Ainsi, on peut démontrer que dans divers environnements who, he, etc., sont grammaticalement équivalents aux noms qui les précèdent, et que Nx who Vx V2 est équivalent à NjVg : N^; dans Casais, who is self -exiled... stopped performing..., il y a deux segments CSX : G is S2; nous aboutirions à ce résultat (sans avoir à nous préoccuper de savoir si Casals who constitue une occurrence prolongée de C, ou deux occurrences répétées), même s'il n'y avait pas d'autre occurrence de who dans le texte, c'est-à-dire même si l'analyse était impossible à partir du seul texte. L'équivalence grammaticale nous est particulièrement utile si nous avons par exemple un grand nombre de segments contenant tous Casais, entremêlés avec beaucoup d'autres contenant he, et si nous ne pouvons trouver aucun environnement contextuel commun pour démontrer que Casais et he sont équivalents. Dès que nous acceptons cette équivalence grammaticale, nous pouvons montrer que tous les environnements de Casais sont équivalents à ceux de he; et ceci peut à son tour nous permettre de découvrir d'autres équivalences à partir du texte.

On peut explorer plus systématiquement l'équivalence grammaticale en introduisant une technique de variation expérimentale. Supposons que nous ayons une phrase d'une forme donnée A et que nous voulions une forme B; nous essayons de modifier A, le changement consistant uniquement en la différence formelle qui existe entre A et B, pour voir ce qui se passe alors en A. Supposons par exemple que nous ayons The memorable concerts were recorded... qui est de la forme MNR, et que nous voulions rendre la forme de cette phrase comparable à celle de segments précédents commençant par N; à cette fin, nous cherchons une variante

14. Il est vrai qu'on pourrait soutenir que cette dernière phrase est encore grammaticale. Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres d'une classe morphologique. Par conséquent, l'exigence que la phrase B contienne les mêmes morphèmes que la phrase A sort de la grammaire, au sens courant de ce terme.

33

de cette phrase qui commence par The concerts; on peut essayer de l'obtenir en plaçant un informateur dans une situation sociale authentique productrice de parole (et non un exposé linguistique sur la parole), dans laquelle il énoncerait une phrase commençant par The concerts et contenant les mots memorable et recorded 15. Ou bien on peut y arriver par le travail fastidieux de l'observation, en cherchant une phrase qui commence par The concerts et contienne memorable et recorded. Par l'une ou l'autre de ces deux méthodes, nous pourrions obtenir The concerts were memorable and were recorded, ou quelque chose d'approchant 16, qui montrerait que quand M (ou tout autre adjectif) passe de l'autre côté de N (le nom qui le suit), on insère is; MN est équivalent à N is M. Nous découvrons ainsi que, quand MNR passe à une forme qui commence par N, un is apparaît entre N et le M qui le suit.

Cette technique consistant à faire varier la forme grammaticale d'une phrase, tout en gardant constants ses morphèmes ne peut pas s'appliquer à l'intérieur d'un texte; car là, tout ce que nous pouvons faire, c'est étudier le matériau qui nous est donné. Mais on peut l'utiliser pour la langue, hors du texte, car nous avons le droit, en tant que locuteurs, de créer une situation sociale qui pourrait amener un autre locuteur à prononcer telle phrase plutôt que telle autre parmi toutes les phrases dont il dispose. Cette technique est particulièrement utile avec une langue comme l'anglais, où tant de morphèmes figurent dans diverses classes grammaticales.

Le paragraphe précédent montre la précaution essentielle que nous devons prendre quand nous appliquons l'équivalence grammaticale pour étoffer les classes d'équivalence contextuelle : nous ne nous posons pas simplement la question : Quelles formes de phrase sont équivalentes à MNR? Il peut y en avoir beaucoup. La question que nous nous posons est : Puisque N... est une forme commune dans ce texte, et puisque nous y trouvons aussi MNR, peut-on remplacer cette dernière forme par une phrase équivalente de la forme N...? Le sens du changement à opérer n'est pas arbitraire mais vient entièrement du texte. Comme précédemment, cela revient à diviser les phrases en des segments aussi semblables que possible. Tout ce que nous nous demandons, c'est s'il existe une équivalence grammaticale qui relie MNR à la forme N...; la réponse est oui, pourvu qu'un is figure dans la forme N...; ce qui à son tour fait de is M

15. Pour donner un exemple très simple, on peut lire en compagnie de l'informateur la phrase du texte The memorable concerts were recorded, puis s'arrêter et lui dire de façon hésitante et interrogative « That is to say, the concerts » (c'est-à-dire, les concerts...) et attendre qu'il donne la suite.

16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts et qui contiennent les deux autres mots, par exemple The concerts were not memorable, but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la forme voulue NMR (ou plutôt dans une sous-classe des phrases NMR) sera une forme du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opère le changement pour obtenir cette forme.

34

un équivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de donner à toutes les phrases n'importe quelle forme choisie arbitrairement; la méthode permet simplement de décrire les formes moins fréquentes du texte (MNR) en fonction des formes fréquentes (N...).

Pour l'analyse purement contextuelle, nous n'avons besoin de connaître que les limites des morphèmes. Pour utiliser les équivalences grammaticales, nous devons également connaître la classe morphophonologique à laquelle chaque morphème de notre texte appartient, puisque les règles grammaticales concernent des classes plutôt que des morphèmes individuels. Dans le cas considéré, la règle grammaticale est : adjectif + noin est équivalent à nom + is + adjectif; pour pouvoir l'appliquer à notre séquence MN, nous devons savoir que le M est un adjectif et que le N est un nom.

On a constaté empiriquement que le nombre d'équivalences grammaticales auxquelles on fait appel à chaque fois pour réduire des phrases d'un texte en des segments semblables, est relativement peu élevé. C'est pourquoi, même si on n'est pas linguiste, on peut apprendre beaucoup sur le texte en utilisant (en plus de la méthode d'analyse interne du texte) une liste préétablie des principales équivalences grammaticales pour la langue en question. Voici quelques-unes des équivalences qui sont fréquemment utilisées (nous ne donnons aucune preuve de leur validité, et seulement quelques indications très approximatives des environnements de phrase où elles s'appliquent) 17.

1) Si nous trouvons XCY, alors X = Y (X est équivalent à Y). Le C est une conjonction comme and, but, or, ou bien, dans certaines circonstances spéciales, un syntagme comme as well as, rather than, A-er than. X et Y doivent être dans la même classe grammaticale. Par exemple, dans I phoned him but he was out, X et Y sont tous deux de la forme NV; dans I saw it but went on, Y est seulement constitué par le syntagme verbal went on, X ne peut donc inclure que le syntagme verbal saw it (et non toute la séquence I saw if). Il s'ensuit que N^CN^ est équivalent à deux segments N^ : N2V2 et NV^V-j = NVX : NV2.

2) La séquence Nx is N2 indique que Nj_ = N2. La classe de is comprend remains et d'autres verbes.

3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2; exemple : The pressure P increases est équivalent à The pressure increases et P increases.

4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive to-morrow est équivalent à I telegraphed : we'll arrive to-morrow.

17. A = adjectif. N = nom, V = verbe, P = préposition. Les indices indiquent des morphèmes particuliers, sans tenir compte de leurs classes.

35

5) NjVK^ = NgV*^, V et V* étant respectivement actif et passif ou vice versa.

6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty est équivalent à une certaine forme comme (they seek) certainty as a goat. Quand on inverse deux noms la modification des prépositions est bien plus grande que la modification correspondante des verbes : dans le cas des verbes, elle s'effectue simplement par l'addition ou le retrait du morphème de passif et du mot by; dans le cas des prépositions, il faut remplacer une forme par une forme entièrement différente. Les paires de prépositions équivalentes ne sont pas fixes : entre certains noms, le substitut de of peut être as; entre d'autres noms, il peut être with. Néanmoins il est possible de trouver des structures dans lesquelles les noms de la séquence N2 P N2 sont inversés.

7) Nj P N2 = Ag N1$ autrement dit, le morphème du second nom apparaît sous une forme adjectivale avant le premier nom; exemple : training in médecine et medical training.

8) Des pronoms comme he, et certains mots commençant par wh- et th-, répètent un nom déjà énoncé. Quand ils sont précédés de plusieurs noms, quel nom répètent-ils? Cela dépend des détails de l'environnement grammatical; c'est généralement le nom qui les précède immédiatement, ou le dernier nom figurant dans un environnement grammatical comparable. Par exemple, who = the man dans The man who phoned left no name (N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to my roommate, who told him to call again (N^Ng who V2 = N^Ng : N2 V2). Il y a de nombreux procédés pour déterminer quel est le nom qu'un pronom répète, et quel verbe va avec chaque nom. Dans the man who phoned, on ne peut pas insérer un sujet avant phoned, il faut donc prendre who comme sujet. Dans The man I phoned was out, nous réduisons d'abord en / phoned : The man was out; ensuite, puisqu'on ne peut pas insérer un complément d'objet après phoned dans la phrase originelle, nous faisons de the man le complément d'objet 18 de phoned et nous obtenons l'équivalent : / phoned the man : The man was out (

9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing est équivalent à They escaped : They saved nothing.

10) NiClNLj VX = IS^VM, : NgVNj. Ici X représente une classe d'expressions réciproques comme each other; par exemple : The Giants and the Dodgers each beat the other twice est équivalent à The Giants beat the Dodgers twice : The D. beat the G. twice. L'équivalence est quelque peu différente pour les différents groupes de formes X.

18. La seule façon d'exprimer l'exclusion d'un complément d'objet uniquement en fonction de l'occurrence des éléments est de dire que l'objet figure déjà. Ce ne peut être I puisque / est le sujet de phoned, ce doit donc être l'autre N, the man.

36

11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du paragraphe 7.2. De même NVANj = NVNj who is A = NVNX : Nt is A; exemple : They read the interdicted books = They read the books which were interdicted — They read the books : The bocks were interdicted.

12) NjVKjPNg = NjVNa : N^VPNg; c'est-à-dire qu'on peut remplacer un double complément d'objet par deux compléments d'objet distincts dans deux segments qui répètent le sujet et le verbe; exemple : / bought it for you = I bought it : I bought for you.

Ces équivalences grammaticales conservent les morphèmes et leurs rapports grammaticaux, mais sous une autre forme grammaticale. On ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport sujet-objet avec le verbe; mais on peut avoir N2V*NX comme équivalent de NjVNa parce que là le verbe aussi est modifié de façon à ce que soit préservé son rapport grammatical avec les noms inversés. II est absolument essentiel de préserver les rapports grammaticaux, car ces rapports existent toujours entre les morphèmes d'une phrase. Autrement dit, il y a des restrictions de commutabilité d'ordre et d'intonation entre les différents morphèmes (ou classes de morphèmes) d'une phrase et, quand nous passons d'une phrase à une phrase équivalente, nous voulons pouvoir retrouver les mêmes restrictions quand nous reviendrons à la phrase de base — puisque cette phrase de base, comme toute phrase, se définit par les restrictions qui lient ses différentes parties. Par conséquent, quand nous divisons une phrase en différents segments pour dresser un tableau, nous ne voulons pas que deux combinaisons des mêmes classes d'équivalence (par exemple les deux premières combinaisons TE ci-dessus) représentent des rapports grammaticaux différents. C'est pourquoi, quand nous transformons une phrase qui contient certaines classes d'équivalence, nous prenons soin de conserver leurs rapports grammaticaux originels.

Cependant, nous trouvons quelquefois des morceaux de phrase qui ne contiennent aucune de nos classes d'équivalence; autrement dit (dans le cas le plus simple), ils ne contiennent aucun matériau qui se retrouve ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques et le reste de la phrase doit être conservé dans notre disposition en tableau, au même titre que celui des morceaux récurrents. Mais nous n'avons pas à nous préoccuper de conserver leur rapport quand leur position relative change, puisque nous n'avons pas de raison de changer leur position relative : c'est seulement les classes d'équivalences que nous voulons redisposer. Pour ce matériau non récurrent, nous voulons seulement connaître son rapport aux classes d'équivalence et indiquer ce rapport dans l'analyse. L'étude du texte seul ne suffira peut-être pas, mais nous pouvons y arriver en faisant appel aux données grammaticales ou à la variation expérimentale. Revenons par exemple aux séquences Casais, who is self-exiled from Spain et the self -exiled Casals... Si cette dernière orme est S2 C, la première est C, C is S2 from Spain; puisque from Spain

37

est unique, tout ce que nous voulons savoir, c'est où le mettre quand nous disposons nos classes d'équivalence, autrement dit, quel est son rapport à ces classes. La grammaire nous apprend que dans des phrases de la forme NV APN l'unité minimale, dont PN est un constituant immédiat, est APN et que ce APN peut être remplacé par A tout seul 19. Par conséquent, si le A se trouve être membre d'une de nos classes d'équivalence alors que le PN ne l'est pas, nous associons le PN à A dans sa colonne d'équivalence en écrivant APN au lieu de A tout seul comme membre de la classe.

De façon plus générale, le matériau qui n'appartient à aucune classe d'équivalence, mais qui est lié grammaticalement à un membre d'une classe, est joint à ce membre pour former un membre élargi de la classe en question; ainsi self-exiled from Spain est maintenant dans la même classe que seïf-exiled. Ceci se justifie par le fait que, puisque ce matériau ne se retrouve nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le même rapport grammatical à la même classe d'équivalence), son seul effet, quand on représente le texte par ses classes d'équivalence spécifiques, est précisément son rapport au membre spécifique auquel il est grammaticalement lié.

On rencontre un cas particulier assez intéressant quand deux membres de la même classe d'équivalence constituent conjointement l'unité immédiatement supérieure de leur phrase (c'est-à-dire quand ils sont les constituants immédiats de cette unité), quand, par exemple, ces deux membres sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons considérer que ces membres constituent à eux deux un seul membre de leur classe commune et entrent tous deux dans un seul segment. Si nous les considérions comme deux occurrences de leur classe commune, il nous faudrait mettre chaque occurrence dans un segment distinct.

Les données grammaticales sont particulièrement utiles quand il s'agit de reconnaître les particules conjonctives. Il est facile d'identifier ces morphèmes à partir de la grammaire formelle, tout à fait indépendamment de leur sens, mais il peut être difficile de les identifier dans l'analyse purement contextuelle. Leur importance réside dans le fait que beaucoup de phrases d'un texte peuvent contenir les mêmes classes, à part quelques mots non classés, souvent situés au début, dont la fonction grammaticale est de lier ou d'introduire les phrases, et qui n'entrent pas dans les classes spécifiques qui couvrent la phrase ou le segment. Dans notre disposition en tableau, nous mettrons ces éléments, en raison de leur position grammaticale, dans une colonne spéciale au début. Nous pouvons même aller plus loin et mettre dans cette première colonne tout matériau qu'on ne peut faire entrer dans aucune des colonnes d'équivalence. Ce matériau conjonctif n'est pas toujours immédiatement évident; remarquons qu'on peut analyser beaucoup de phrases de la forme JVV that N1V1 comme constituées des classes d'équivalence N^, le NV that étant relégué dans la première colonne; par exemple dans la phrase We are proud

19. Sémantiquement, on dira que PN « modifie » le A.

38

that these concerts were recorded by our engineers, les membres connus des classes d'équivalence sont concerts et recorded; les mots qui les précèdent ne se retrouvent pas dans le texte et ne sont liés grammaticalement à aucun membre d'une classe; bien au contraire, du point de vue grammatical on peut les remplacer par des adverbes introductifs comme indeed, même si au sens purement grammatical ils sont en fait le sujet et le verbe principaux de la phrase.

En plus des rapports grammaticaux des classes grammaticales tout entières, on peut utiliser des informations concernant le rapport entre des morphèmes spécifiques ou des sous-classes grammaticales et les classes grammaticales; on peut par exemple établir que (dans certaines langues) les verbes intransitifs forment une sous-classe qui ne se trouve jamais accompagnée d'un objet et qui est équivalente à un verbe transitif accompagné d'un objet. Dans un texte donné, cela peut nous permettre de mettre un verbe transitif et son objet dans la même classe qu'un verbe intransitif ayant une position comparable.

Enfin un grand nombre d'équivalences détaillées s'appliquent à des morphèmes spécifiques. Les renseignements concernant ces équivalences ne nous sont pas fournis par la linguistique descriptive, qui traite généralement de classes entières, mais on peut les obtenir par des méthodes linguistiques puisqu'ils concernent des occurrences couplées et des restrictions spéciales — bien que dans la plupart des cas il soit nécessaire d'étudier ces restrictions en considérant plus d'une phrase à la fois. Supposons, par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs environnsments dans ce texte peuvent ne pas se ressembler assez pour nous permettre de les ranger dans la même classe d'équivalence, en dépit des avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons un certain nombre d'autres textes assez courts où ces deux mots figurent, nous constaterons qu'ils apparaissent souvent dans des environnements qui se correspondent et que, à certains égards, ce sont des inverses distributionnels; autrement dit, nous trouvons de nombreuses phrases comme N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could get, but he still sold it to me with a profit). Si les environnements de buy et sell dans notre texte sont semblables aux environnements couplés des autres textes, nous pourrons quand même, en considération de ces résultats plus généraux, mettre les deux mots dans la même classe d'équivalence, ou même les analyser comme étant inverses l'un de l'autre.

De cette façon on peut mettre dans une même classe contextuelle plus de mots qu'il ne serait possible autrement, et on peut faire usage de ce qui paraît être des liaisons sémantiques spéciales entre des mots (comme entre buy et sell ou même entre un verbe transitif et la présence d'un complément d'objet), sans sortir du cadre d'une étude purement formelle des occurrences. La raison en est qu'il y a un haut degré de corrélation entre les différences de sens et les différences de distribution linguistique; et si, dans les limites d'un texte, on ne peut pas montrer les similitudes

39

de distribution entre deux mots liés, on peut souvent y arriver dans un plus grand choix de textes, même très courts.

Nous n'avons fait qu'esquisser ici, avec quelques rares exemples, le genre d'information extérieure qu'on peut utiliser, à la fois parce que le domaine est vaste et parce qu'il y a encore beaucoup à faire. Des travaux plus approfondis dans ce sens, non seulement seront utiles à l'analyse de discours, mais constitueront également une extension intéressante de la linguistique descriptive.

Résultats

8. — Le tableau a double entrée.

L'analyse du discours nous donne une succession de segments contenant chacun certaines classes d'équivalence. Pour les disposer en tableau20, nous écrivons les segments les uns au-dessous des autres dans l'ordre du texte, les membres successifs de chaque classe formant une colonne comme au paragraphe 5.4., ce qui donne pour le texte très court du paragraphe 7.2. :

CS2 (S2 après C est is S2) CS2 (= S2 G sans le is) CS

(= MN; R^, = is N)

NR2 Les rangées indiquent les classes d'équivalence présentes dans chaque

segment, selon leur ordre (ou un autre rapport) à l'intérieur du segment; les colonnes indiquent les membres spécifiques de chaque classe présents dans les segments successifs. Le matériau qui ne rentre dans aucune classe d'équivalence, mais qui est lié grammaticalement à un membre spécifique d'une classe entre avec ce membre dans sa colonne, ainsi in Spain est compris dans le premier S2. Le matériau qui ne rentre dans aucune classe d'équivalence et qui n'est pas lié grammaticalement à un membre spécifique d'une classe entre dans une colonne spéciale au début (ici non représentée), qui se révélera contenir des morphèmes qui lient les phrases

20. Le tableau donné ici représente les phrases suivantes, extraites d'une chronique concernant des disques récemment sortis : Casals, who is self-exiled from Spain, stopped performing after the fascist victory... The self-exiled Casals is waiting across the Pyrenees for the fall of Franco... The memorable concerts were recorded in trades... The concerts were recorded first on tape. (Les autres phrases analysées en 7.2. ont été inventées par moi à des fins de comparaison.) Ces phrases ne constituent pas un fragment continu du texte, ce qui limite très sérieusement la pertinence du tableau à double entrée; mais cela n'a pas d'importance ici, puisque ce tableau sert seulement à illustrer l'organisation de ces dispositions.

40

ou les segments entre eux, ou indiquent un changement dans plusieurs classes d'un unique segment. Cette disposition en tableau donne donc du texte originel à une dimension une représentation à deux dimensions, dans laquelle chaque élément a deux coordonnées : l'une horizontale, par rapport aux autres éléments du segment auquel il appartient; l'autre Verticale, par rapport aux autres membres de sa classe.

On peut considérer que ce tableau à double entrée représente le texte tout entier, puisque tous les morphèmes du texte appartiennent à une classe ou à une autre du tableau et puisque celui-ci conserve les rapports entre les morphèmes. Même quand on a effectué de nombreuses transformations contextuelles et grammaticales, les classes et leurs membres sont définis à chaque étape de manière à ce qu'on puisse toujours reproduire le texte en partant du tableau et de la définition complète des classes qu'il contient. Il se peut que les segments du tableau, considérés séparément, ne soient pas « idiomatiques », c'est-à-dire qu'ils ne figureraient pas de façon naturelle dans la parole; mais la méthode n'exige pas qu'on préserve la langue idiomatique : tout ce que nous Voulons, c'est que la succession des segments soit équivalente contextuellement et grammaticalement au texte original. Même si le tableau suggère une critique littéraire ou une amélioration possible du texte, il n'est pas destiné à remplacer l'original.

On peut aussi considérer que ce tableau à double entrée indique les rapports purement distributionnels qu'entretiennent les classes d'équivalence qui s'y trouvent. En se plaçant à ce point de Vue, on peut travailler sur l'agencement en tableau, et examiner ses propriétés. On peut trouver des moyens de simplifier le tableau, en retirant par exemple les éléments communs, ou en rassemblant des groupes de séquences équivalentes plus importants que ceux utilisés dans la confection du tableau. On peut apprendre à traiter différents cas particuliers, comme par exemple une classe mobile qui entre dans un rapport étroit tantôt avec une classe, tantôt avec une autre, ou qui figure un nombre différent de fois dans divers segments. On peut essayer de régulariser ou de « normaliser » le tableau en harmonisant tous les segments, pour établir un unique segment « normal » auquel on pourra comparer tous les segments réels : par exemple, étant donné un segment où une des classes ne figure pas, on peut essayer de le transformer en un segment contenant toutes les classes (en préservant l'équivalence au cours de la transformation). On peut essayer de formuler une règle générale couvrant les modifications subies par les membres successifs d'une classe en descendant une colonne, pour tenter d' « expliquer » ou de « prédire » la forme spécifique prise par les classes de chaque segment — c'est-à-dire pour dériver les segments successifs à partir de la forme normale.

Toutes ces opérations sur le tableau ont pour effet d'isoler les éléments indépendants les plus généraux à partir desquels on peut décrire le texte (en dernière analyse les axes horizontal et Vertical), et de faire ressortir

41

les rapports qu'ils entretiennent dans le texte. En ce sens, toutes ces opérations ne sont que des raffinements de nos procédures initiales.

9. — Résultats.

On peut tirer diverses conclusions sur un texte particulier (ou un certain type de texte) en étudiant les propriétés de son tableau à double entrée, directement ou sous forme simplifiée. On aurait sans doute pu arriver à beaucoup de ces conclusions intuitivement et sans cette analyse formelle, mais l'intuition donne des résultats qui ne sont ni explicites ni rigoureux. De plus, à certains égards, la complexité et la masse du matériau nous mettent dans l'impossibilité de tirer toutes les conclusions pertinentes sans une analyse formelle et minutieuse. Les textes que nous avons été amenés à choisir ici à titre d'échantillon sont trop courts et trop simples pour montrer quel genre de conclusions l'analyse donne sur un texte ou un style particulier — nous réserverons ceci pour une présentation ultérieure d'un échantillon plus long, bien que seule l'analyse de très nombreux discours puisse montrer les détails de la méthode et la gamme de conclusions auxquelles elle permet d'aboutir. Pour donner une petite idée de ces conclusions, nous allons achever l'analyse de notre premier texte (paragraphe 6). L'analyse en était restée à ceci : P a comme membres Millions, Four out of five people in a nation wide survey, You too wilt, (and) your whole family will. W a comme membres Can't be wrong, Prefer X- to any hair tonic... 've used. Quatre des phrases, y compris le titre, sont représentées par cinq segments PW.

Arrivé là, on peut difficilement continuer sans avoir recours à l'équivalence grammaticale (cf. 10 n). Dans four out of fwe... say they prefer... nous avons P et W mais aVec say they entre les deux. Si notre texte se trouvait contenir they et four out of five dans des environnements équivalents, nous pourrions analyser directement cette phrase. Comme ce n'est pas le cas, nous faisons appel à l'équivalence grammaticale de they au nom qui le précède et qui est situé de façon comparable : four out of five..., sujet de say, parallèle à they, sujet de prefer. Nous mettons donc they dans la même classe P que four out of five... La phrase devient alors P say PW, qui se décompose en deux segments P say : PW, par application de la formule NV (that) NV = NV : NV; par conséquent, say est membre de W, puisque, à la suite deP, il forme avec Pun segment complet.

Venons-en maintenant à la, dernière phrase : You too will be satisfied. Nous savons que la première partie est membre de P; donc be satisfied est inclus dans W.

Ceci nous donne un point de départ pour l'analyse de la phrase précédente Every year, we sell more bottles of X- to satisfied consumers. Grammaticalement, X- to satisfied consumers est X- to AN, qui est équivalent à X- to N : N is A. Nous obtenons ainsi un segment consumers are satisfied;

42

et puisque la seconde partie de ce segment est W, nous mettons consumers dans P. Le reste de la phrase contient de nouvelles classes : puisque bottles se retrouve ailleurs dans le texte, nous le considérons comme représentant une classe possible d'équivalence, et nous le notons B; à cette occurrence de B nous associons le mot more, qui ne se retrouve pas ailleurs et qui est lié grammaticalement à bottles. Puisque sell se retrouve dans sold (== sell + morphème de passif), nous le notons S et nous lui associons every year, qui lui est lié grammaticalement. (Every year n'est semblable que par un morphème à since... years ago de la première phrase; plutôt que d'essayer de faire entrer ces syntagmes dans de nouvelles classes d'équivalence, nous remarquons que chacun d'eux est lié au membre de S qui lui est proche, et nous associons chaque syntagme à son membre de S). Il reste we, qui, grammaticalement, ne fait partie ni du syntagme B ni du syntagme S; en dépit du fait qu'il ne paraît pas se retrouver ailleurs, nous le mettons, à titre d'essai, dans une nouvelle classe /. (Nous Verrons plus loin qu'on peut considérer qu'il y a une forme zéro de / dans la première phrase.) Nous obtenons ainsi ISB to P; ce qu'on peut encore simplifier, puisque c'est grammaticalement équivalent à ISB : IS to P.

Enfin, il y a la première phrase : Millions of consumer bottles of X- have been sold since its introduction a few years ago. Si nous prenons comme point de départ Millions, membre reconnu de P, nous nous trouvons en face d'un reste, commençant par of, que nous ne pouvons pas analyser. Rapprochons plutôt bottles of X- have been sold de we sell bottles of X-. La première séquence est de la forme NXV, la seconde de la forme N^V^. Grammaticalement, have been sold est sell + passé + passif; donc, si nous prenons sell comme V, been sold est V*. Grammaticalement aussi, V + passif + by N est équivalent à V + passif (is sold by us = is sold). L'absence de tout by us après sold ne nous empêche donc pas de rapprocher les deux propositions; de we sell bottles (N2VNX) nous rapprochons bottles have been sold (NjV* = N± V*IV2); nous pouvons même dire que le morphème de passif, suivi ou non de 1' « agent » (by + N), est équivalent au sujet du verbe actif (c'est-à-dire le verbe sans le morphème de passif). Si we sell bottles of X- est ISB, alors bottles of X- have been sold est l'équivalent BS*I avec / zéro. Nous associons au S* qui le précède le morceau since... years ago, comme faisant aussi partie du morphème de passé, puisque ni l'un ni l'autre ne se retrouve ailleurs dans nos classes d'équivalence. Millions et consumer sont tous deux membres de P 21, mais il n'y a pas moyen de tirer parti de ce fait. Grammaticalement, consumer bottles est N^N^ = 2N, et millions of N2 est N3PN2= AT2; ainsi toute la séquence est liée grammaticalement à bottles (de la même façon que more était lié à bottles, cf. plus haut), ce qui laisse la phrase

21. Nous avons consumer dans P; et puisque la distinction singulier-pluriel ne figure pas dans nos classes, nous pouvons lier la chute du -s à l'occurrence de consumers dans la première phrase. En enlevant le s de l'élément P consumers, nous obtenons une forme P consumer pour la phrase.

43

sous la forme BS*I. Ceci signifie qu'il y a deux occurrences de mots P qui se perdent par l'inclusion dans une occurrence de B. Ce millions et ce consumer n'ont pas d'autre rapport distributionnel avec une autre occurrence de classe dans le texte (sauf leur analogie à more); il n'y a donc pas moyen de les faire entrer dans le tableau à double entrée. Les mêmes morphèmes se retrouvent bien ailleurs comme membres de P, mais dans des rapports différents avec d'autres classes.

Ceci met en évidence le rapport trompeur entre le titre et la première phrase. Si nous prenons le titre comme point de départ, nous trouvons Millions dans la première phrase et, en nous fondant sur notre analyse du titre, nous le mettons dans la classe P, pour nous apercevoir alors qu'il n'y a pas de classe P dans l'analyse finale de la phrase. (Les millions qui ne peuvent se tromper se révèlent être des bouteilles 22.) Si nous commençons par le slogan lui-même, nous avons une classe P (four out of five; you) qui est liée à W, et une classe B (bottles, millions of. ..bottles) qui est liée à S; et si nous en venons alors au titre, nous trouvons que le W est précédé non par un membre connu de P, ni par un mot nouveau que nous pourrions ranger dans P, mais par un mot qui ailleurs a été associé à un membre de B. (Les bouteilles se révèlent être des gens.) Voilà le résultat formel obtenu, qui est parallèle à ce qu'on aurait pu dire comme critique sémantique — à savoir que le texte du slogan (des millions de bouteilles vendues — tant de gens ne peuvent pas avoir tort de préférer X-) ne répond pas au titre (des millions ne peuvent pas avoir tort).

Le tableau à double entrée du slogan ne présente pas grand intérêt en lui-même :

PW Millions of people can't be wrong! BS*I (le B contenant le pseudo P) Millions of consumer bottles...

have been sold... CPW And four out of five people... say PW they prefer X-... P Four out of five people... can't be wrong. PW you too will prefer X~... PW your whole family wilt prefer X-... BS*I (= ISB) Every year we sell more bottles of X- S*I to P we sell to consumers PW You too will be satisfied!

10. — Interprétations.

Les résultats formels obtenus par ce genre d'analyse font plus que définir la distribution des classes, la structure des segments ou même la

22. Puisque millions of consumers serait un syntagme anglais courant (Pt of P2 = P2), l'emploi de la séquence presque identique millions of consumer devant bottles a pour effet de donner une première impression que la phrase parle de P; mais quand on atteint le mot bottles on voit que le sujet de la phrase est B, les mots P n'étant qu'adjectifs de B.

u

distribution des types de segments. Ils peuvent aussi révéler des particularités à l'intérieur de la structure, par rapport au reste de la structure. Ils peuvent montrer en quoi certaines structures ressemblent à d'autres, ou en quoi elles en diffèrent. Ils peuvent conduire à de nombreuses conclusions concernant le texte.

Tout ceci cependant est encore distinct de Y interprétation des résultats, qui doit tenir compte du sens des morphèmes et poser la question de savoir ce que l'auteur Voulait faire quand il a écrit ce texte. Cette interprétation est bien entendu tout à fait distincte des résultats formels, bien qu'elle puissse les suivre étroitement dans les voies qu'ils ouvrent.

Même les résultats formels peuvent conduire à des conclusions d'un intérêt plus général et qui dépassent le texte. L'examen de divers types de structure d'énoncé peut mettre en évidence des corrélations avec la personne ou la situation qui est à l'origine du texte, sans la moindre référence aux significations des morphèmes. Il peut aussi montrer quelles sont les faiblesses — d'un point de vue donné — inhérentes à un certain type de structure et quelles sont celles que l'on peut supprimer. Il peut révéler la présence des mêmes types de structure dans des textes différents, et il peut peut-être montrer les avantages de types particuliers de structure pour des textes futurs ou pour du matériau non linguistique.

Enfin cet examen remplit la fonction importante d'indiquer quels segments supplémentaires peuvent être ajoutés au texte sans en changer la structure. Il est souvent possible de montrer que si nous ajoutons aux différentes combinaisons de classes que nous trouvons dans les segments du texte, des segments contenant certaines combinaisons nouvelles de classes, la description de la structure d'énoncé devient plus simple et les exceptions disparaissent (pourvu que nous gardions intactes les exceptions intrinsèques, comme par exemple les conditions de délimitation). L'addition de ces segments peut rendre le texte plus régulier du point de vue de l'analyse du discours. Si, par exemple, le texte contient AB : AG : ZB, on peut dire que Z est équivalent au second degré à A, puisque tous deux se rencontrent devant B, mais A seulement se rencontre devant C. S'il n'y a pas d'exceptions intrinsèques au texte qui affectent cette restriction concernant Z, on peut ajouter le segment ZC au texte. Dans ce texte augmenté, l'équivalence A = Z est maintenant une question de parfaite com- mutabilité dans une gamme identique d'environnements, et non plus seulement le résultat secondaire d'une chaîne d'équivalences. L'addition de ces segments ne ressemble en rien à l'addition au texte de segments arbitraires. Cette recherche des segments que l'on peut ajouter devient particulièrement intéressante si l'on Veut savoir ce qui est impliqué mais n'est pas explicitement formulé dans un texte donné, ou si l'on veut voir ce que l'on peut tirer d'un texte donné en plus de ce que l'auteur y a déjà mis.

45

RÉSUMÉ.

L'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement. Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'une phrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire, membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classe d'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plus étroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classes d'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par des classes qui le composent, aux autres segments du texte. On examine alors la succession des segments pour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des schémas d'occurrence de classes.

Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention de l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris les junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces opérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapports d'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texte en question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales des différents morphèmes du texte.

L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de texte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décrit que le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours nous apprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications, exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dont les systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse du discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase; ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), mais le sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.

Traduit par Françoise Dubois-Charlier Paris.

analyse du discours

Documents