cadres de discours & chaÎnes de...

21
DEUX MODES DE SEGMENTATION TEXTUELLE : UNIVERS DE DISCOURS ET CHAÎNES DE RÉFÉRENCE Lydia-Mai HO-DAC CNRS/UMR 5610 et Université Toulouse-Le Mirail [email protected] 1 . ABSTRACT Discourse universes and referential chains are among the discourse phenomena that contribute to textual organization, and more specifically to textual segmentation. This textual segmentation consists in two mechanisms: bringing together several linguistics unities around a discourse object : circumstance(s) for the former, entity/ies for the latter; and dividing the text into segments which may or may not delimited by formal discourse markers. This paper presents a corpus-based study of the interactions between chains and discourse universes, by applying quantitative analysis concerning the distribution of several discourse markers through different corpora and different textual positions. 2 . RÉSUMÉ Les univers de discours tout comme les chaînes de référence sont des phénomènes discursifs qui participent à l'organisation du texte, et plus particulièrement, à sa segmentation. Cette segmentation textuelle consiste en deux processus conjoints : regrouper plusieurs unités linguistiques autour d'un même objet de discours : circonstance(s) pour les premiers, participant(s) pour les dernières ; et découper la matière textuelle en segments plus ou moins délimités par des marques formelles : des marqueurs discursifs. Ce travail propose une étude en corpus des interactions entre chaînes et univers de discours qui se base sur des analyses quantitatives de la répartition de certains marqueurs discursifs selon différents corpus et différentes positions textuelles. 3 . INTRODUCTION Cette étude procède à plusieurs analyses quantitatives de la répartition, dans des textes français, de certaines formes linguistiques impliquées dans la construction des univers de discours et des chaînes de référence. Nous travaillons sur des textes écrits. Le texte écrit est considéré comme un objet résultant d’un acte de discours et constitué de signes lexico-syntaxiques et de signes typo-dispositionnels disposés sur un certain support. Parmi ces signes, ceux qui nous intéressent ici sont porteurs d'un sens instructionnel, c’est-à- dire qu’une partie de leur sens sert à guider l’interprétation de l’allocutaire plutôt qu’à exprimer un contenu représentationnel. 1

Upload: doque

Post on 12-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

DEUX MODES DE SEGMENTATION TEXTUELLE :UNIVERS DE DISCOURS ET CHAÎNES DE RÉFÉRENCE

Lydia­Mai HO­DAC CNRS/UMR 5610 et Université Toulouse­Le Mirail 

hodac@univ­tlse2.fr

1 . ABSTRACT

Discourse universes  and referential  chains  are among  the discourse phenomena  that   contribute   to   textual   organization,   and   more   specifically   to   textual  segmentation.   This   textual   segmentation   consists   in   two   mechanisms:   bringing together several linguistics unities around a discourse object : circumstance(s) for  the former, entity/ies for the latter; and dividing the text into segments which may or  may not delimited by formal discourse markers. This paper presents a corpus­based  study   of   the   interactions   between   chains   and   discourse   universes,   by   applying  quantitative   analysis   concerning   the   distribution   of   several   discourse   markers  through different corpora and different textual positions. 

2 . RÉSUMÉ

Les univers de discours tout comme les chaînes de référence sont des phénomènes  discursifs qui participent à   l'organisation du texte,  et plus particulièrement,  à  sa  segmentation. Cette segmentation textuelle consiste en deux processus conjoints :  regrouper   plusieurs   unités   linguistiques   autour   d'un   même   objet   de   discours   :  circonstance(s) pour les premiers, participant(s) pour les dernières ; et découper la  matière textuelle en segments plus ou moins délimités par des marques formelles :  des marqueurs discursifs. Ce travail propose une étude en corpus des interactions  entre chaînes et univers de discours qui se base sur des analyses quantitatives de la  répartition de certains marqueurs discursifs selon différents corpus et différentes  positions textuelles. 

3 . INTRODUCTION

Cette étude procède à plusieurs analyses quantitatives de la répartition, dans des textes français, de certaines formes linguistiques impliquées dans la construction   des   univers   de   discours   et   des   chaînes   de   référence.   Nous travaillons sur des textes écrits. Le texte écrit est considéré comme un objet résultant d’un acte de discours et constitué de signes lexico­syntaxiques et de signes typo­dispositionnels disposés sur un certain support. Parmi ces signes, ceux qui nous intéressent ici sont porteurs d'un sens instructionnel, c’est­à­dire qu’une partie de leur sens sert à guider l’interprétation de l’allocutaire plutôt qu’à exprimer un contenu représentationnel.

1

Pour définir ce sens instructionnel, nous faisons appel au modèle de la systémique fonctionnelle (Halliday, 1985) qui distingue trois composantes impliquées dans la construction des textes : la composante interpersonnelle qui se rapporte à la manifestation des intentions discursives ; la composante idéationnelle qui concerne l’expression du contenu, le fait qu’un texte est “au sujet” de quelque chose et de ce fait  communique une représentation mentale ;   et   enfin,   la   composante   textuelle   qui   intègre   tous   les   moyens linguistiques   (moyens   lexico­syntaxiques   et   typo­dispositionnels   pour l’écrit) permettant d’organiser le texte et de guider l’interprétation de son contenu.

La principale distinction entre les univers de discours et les chaînes de référence est de nature textuelle et concerne leur mode de construction. Les cadres   se   construisent   vers   l’avant,   par   une   expression   initiale,   un introducteur  de cadre,  qui  a pour  fonction de fixer un repère sémantique (temporel, spatial ou notionnel dans le cas des univers). Ce repère sert alors de critère d’interprétation pour les propositions suivantes. Ainsi, tant que ce critère   reste   valide,   le   cadre   reste   ouvert.   A   l’inverse,   les   chaînes   de référence se construisent rétroactivement, par connections successives de la phrase en cours au discours précédent. Ainsi, tant qu’il y a des expressions en relation d’identité référentielle, la chaîne continue de se construire. 

Par   ailleurs,   les   univers   de   discours   et   les   chaînes   de   référence constituent   des   segments   de   texte,   puisqu’ils   délimitent   des   portions   de textes  qui  ont  une cohérence  interne.  Cette  cohérence se  situe  au niveau idéationnel : autour d’un repère circonstanciel pour les univers et autour d’un même référent pour les chaînes.

4 . LA SEGMENTATION TEXTUELLE

La segmentation textuelle existe à travers le texte par la présence de marqueurs   de   segmentation.   Ces   marqueurs   signalent   plus   ou   moins   la segmentation conceptuelle qui existe, elle, en dehors du texte, au niveau du discours  et  des   représentations  mentales  qu’il   implique.  La   segmentation conceptuelle consiste par exemple à subdiviser la représentation mentale de tout le discours en plusieurs sous­représentations, une entité en différentes parties à décrire, une procédure en différentes étapes à expliquer, ou encore une histoire en différents épisodes à narrer. Ces subdivisions sont plus ou moins marquées à la surface du texte par la mise en forme matérielle et/ou par   l’utilisation   d’expressions   particulières   et/ou   par   d’autres   facteurs linguistiques comme l'ordonnancement des différents éléments constituant le texte.   C’est   cette   segmentation   marquée   à   la   surface   du   texte   que   nous 

2

qualifions de segmentation textuelle. Typiquement, le découpage du texte en unités   typodispositionnelles   telles   que   le   découpage   en   sections   et   en paragraphes est de l’ordre de la segmentation textuelle. 

4.1. segmenter = regrouper * découper

Que ce soit d’un point de vue conceptuel ou textuel,  il y a dans la définition des segments les notions de regroupement et de découpage, ce que Heurley   qualifie   de   propriétés   fonctionnelles   et   structurelles   des   blocs informationnels (nos segments conceptuels) : 

“Each text was composed of several subparts, each being organized around a single   topic,   called  information   blocks.   Indeed,   an   informationally   based segmentation procedure revealed that, overall, texts were composed of information blocks  (i.e.   frame,  goal,   instruction  and  results)   that  were  characterized  both  by functional and structural properties.” (Heurley, 1997, 190)

Heurley mentionne deux propriétés fonctionnelles relatives au critère de regroupement, selon que l’on se place d’un point de vue sémantique (un topique commun) ou d’un point de vue plus rhétorique (une même étape dans le déroulement de la procédure : présentation du cadre théorique, du but,   etc.)1.   Nous   ramènerons   cette   distinction   à   celle   faite   entre   le   plan idéationnel et le plan interpersonnel. Sur le plan idéationnel, les unités sont liées par le fait qu'elles concernent un même objet de discours, c’est­à­dire un même (ensemble de) référent(s) ou un même ensemble de circonstances (une même localisation spatiale  ou  temporelle  par  exemple).  Le segment composé   est   alors   indexé   comme  étant  à   propos  du   référent   ou   comme s'interprétant dans les circonstances exprimées. Dans les deux cas, on peut considérer  que la thématique (au sens large) du segment concerne tant la circonstance exprimée que le référent. Sur le plan interpersonnel, les unités coopèrent à un même acte de langage, à une même intention (voir note 1). 

Pour   les   propriétés   structurelles,   les   blocs   informationnels   sont généralement délimités par de longues pauses durant le processus d’écriture. La mise en correspondance entre segmentation conceptuelle et segmentation textuelle peut consister à repérer dans les textes les différents marqueurs de segmentation, c’est­à­dire les traces et signaux (s’il y en a) de ces pauses. Cette   correspondance   se   réalise   par   exemple   par   le   découpage   en 

1 Nous retrouvons ici l’idée des structures intentionnelle et attentionnelle de Grosz & Sidner (1986) : aux segments constitués d’éléments regroupés autour d’un topique commun se superposent des segments régis par des intentions discursives particulières, chacune contribuant à la visée discursive générale du texte.

3

paragraphes. Mais la délimitation des blocs informationnels correspond aussi à   d’autres   marqueurs   tels   que   les   introducteurs   de   cadres,   certaines expressions référentielles particulières ou certaines constructions spéciales. De  plus,   il  ne   faut  pas  omettre  des  expressions  qui  ne marquent  pas   les bornes d’un segment, mais la continuité d’un segment. Ces expressions, à l'exemple des anaphoriques, renforcent la cohésion d'un segment en tissant des liens entre les éléments présents à l'intérieur du segment.

4.2. Des stratégies de continuité et de discontinuité

L'utilisation   d'un   texte   pour   communiquer   contraint   le   locuteur   à placer les informations en séquence, les unes à  la suite des autres.  Or, la représentation communiquée est généralement plus complexe qu’une simple séquence d’informations qui s’ajoutent les unes aux autres. Le locuteur doit alors signaler au mieux comment les informations sont à organiser, ce qui consiste à indiquer à l’allocutaire comment les informations sont à intégrer les unes par rapport aux autres, si elles sont en relation de continuité ou de discontinuité.

“An important task for the writer is to indicate discontinuity within the larger presupposed continuity of the text. In other words, the writer is faced with the tasks to  manage  the   interaction   through discourse   in   sequential   terms  and   to   segment discourse into chunks and indicate their boundaries, i.e. the discontinuity between one and another” (Goutsos, 1996, 504)

Ainsi, un segment textuel est composé d’un ensemble d’éléments en relation de continuité  (processus de regroupement),  ensemble délimité  par des marqueurs de discontinuité (processus de découpage). Cette organisation n’est   pas   une   simple   succession   de   segments :   des   segments   de   natures différentes peuvent  cohabiter  dans   le   texte et  donner  lieu à  une structure complexe faite de hiérarchies entre segments et parfois, d’alternances ou de chevauchements. C’est spécifiquement le cas des univers de discours et des chaînes de référence, comme l’illustre l’exemple (1) où  nous voyons une chaîne autour de la référence faite au  débat,  à   la  discussion  qui évolue à travers trois univers de discours.

4

(1)(1) Depuis la fin de la guerre froide,  le débat entre spécialistes des relations  transatlantiques®  s'est   trop souvent  contenté  d'osciller  entre   les  bons  sentiments  et   la  simplification.  Il®  ne  s’est  pas suffisamment   porté   sur   l’ampleur   des   changements   […].   La  première tendance, […]♦Plus récemment, la discussion® s'était portée sur un éloignement  supposé des valeurs sociales entre les deux rives de l'Atlantique,  auquel   les   événements   du   11   septembre   2001   ont   au   moins provisoirement   mis   fin.♦  Ce   débat®  se   poursuit,   mais  il®  est  maintenant limité à la sphère de l'analyse sociale.  En termes de  politique étrangère, cette discussion sur la dérive des continents® a   pris   la   forme   d'une   opposition   entre   l'unilatéralisme   de   la  politique américaine et   le  multilatéralisme de  leurs  partenaires  européens.♦ 

Dans   cet   exemple2,   nous   avons   trois   marqueurs   de   discontinuité circonstancielle sous la forme de trois adverbiaux cadratifs initiant chacun un univers de discours, et  cinq marqueurs de continuité  référentielle sous plusieurs   formes   :   deux   pronoms   personnels,   une   description   définie incomplète   et   deux   descriptions   démonstratives.   Notre   distinction   entre (dis)continuité   circonstancielle   et   (dis)continuité   référentielle   rejoint   la distinction faite entre les circonstances et les entités en jeu dans un discours. Alors   que   les   premières   constituent   des   repères   associées   aux   procès exprimés   dans   le   discours   (actions,  états,   événement,   etc.),   les   secondes constituent les sujets de ces procès. 

5 . UNIVERS DE DISCOURS ET CHAÎNES DE RÉFÉRENCE

5.1. Univers de discours

La notion des univers de discours est largement inspirée de la notion d’espaces mentaux développée par Fauconnier (1984). Cependant, alors que le modèle de Fauconnier concerne uniquement la segmentation conceptuelle, l’idée   de   l’encadrement   du   discours   a   trait   à   la   segmentation   textuelle. Comme   le   souligne   Charolles   (1997,   5),   le   recours   à   une   notion   “plus neutre”   permet   d’avoir   un   regard   peut­être   plus   grammatical   sur   un phénomène clairement cognitif. L’encadrement du discours consiste en une 

2 Dans nos exemples : les expressions introductrices d'univers sont en gras et les fins d’univers sont marquées d’un ♦; les expressions constructrices d'une chaîne sont en gras et suivies d’un ®. En (2), nous avons également encadré la continuité texto­stratégique temporelle par les balises [TSCtps] [TSC].

5

organisation textuelle bornée et construite par des expressions linguistiques : les   introducteurs  de cadres  ou adverbiaux cadratifs.  Ces  expressions  sont caractérisées   par   la   portée   de   sens   qu’elles   étendent   sur   la   ou   les proposition(s) qui la suivent. 

Selon le critère de regroupement spécifié,  différents  types de cadre sont à distinguer et parmi eux, les univers de discours qui constituent des unités   dont   l’interprétation   est   indexée   comme   devant   s’effectuer   dans certaines circonstances :  une situation spatiale et/ou  temporelle (En 2010,  Sur la planète Mars,), une situation notionnelle (En linguistique textuelle, A propos de Clinton,), une source d'énonciation (Selon Charolles), etc.

Dans cette étude, nous retiendrons particulièrement les cadres spatiaux et temporels. Ces types de cadre sont particulièrement aptes à fonctionner en séquences, créant ainsi de plus grandes portions de texte définies par le fait d’être organisées en cadres. Les introducteurs de ces cadres correspondent à des circonstants fréquemment thématisés, c’est­à­dire “en première position et ayant une portée extra­prédicative sur l’énoncé” (Le Querler, 1993, 177). L’exemple suivant montre une portion de texte (sur fond grisé) entièrement organisée par des cadres temporels. 

(2)(2) L'année 2002 a été marquée par une série de scandales financiersL'année 2002 a été marquée par une série de scandales financiers   […]. L'enchaînement des faits,   tout d'abord. La faillite d'Enron[…]. L'enchaînement des faits,   tout d'abord. La faillite d'Enron   était  déclarée  en  décembre  2001,  celle  de  Global  Crossing  enétait  déclarée  en  décembre  2001,  celle  de  Global  Crossing  en   janvier   2002.   Pour   son   rôle   dans   l'affaire   Enron,   le   cabinetjanvier   2002.   Pour   son   rôle   dans   l'affaire   Enron,   le   cabinet   d'audit Arthur Andersen était mis en examen en mars. d'audit Arthur Andersen était mis en examen en mars. [[TSCTSCtps]tps]  EnEn   juin,juin,  Enron reconnaissait avoir versé un total de 310 millions deEnron reconnaissait avoir versé un total de 310 millions de   dollars en espèces à ses dirigeants au cours de l'année 2001 etdollars en espèces à ses dirigeants au cours de l'année 2001 et   worldcom corrigeait ses comptes de 3,8 milliards de dollarsworldcom corrigeait ses comptes de 3,8 milliards de dollars..♦  LeLe   21   juillet,21   juillet,   la   faillite   de   worldcom   était   déclarée.la   faillite   de   worldcom   était   déclarée.♦  Le   24,Le   24,   lala   Securities and Exchange Commission (SEC) portait plainte contreSecurities and Exchange Commission (SEC) portait plainte contre   les dirigeants d'Adelphia, accusés d'avoir dissimulé 2,3 milliardsles dirigeants d'Adelphia, accusés d'avoir dissimulé 2,3 milliards   de dollars de dettes dans des sociétés non consolidées.de dollars de dettes dans des sociétés non consolidées.♦ En août,En août,  l'ancien Chief Executive Officer (CEO) de imclone était  mis enl'ancien Chief Executive Officer (CEO) de imclone était  mis en   examen pour délit d'initié.examen pour délit d'initié.♦ En septembre,En septembre, c'était au tour du CEO c'était au tour du CEO   et du Chief Financial Officer (CFO) de Tyco d'être mis en examenet du Chief Financial Officer (CFO) de Tyco d'être mis en examen   pour   corruption   :   il   leur   était   reproché   d'avoir   détourné   600pour   corruption   :   il   leur   était   reproché   d'avoir   détourné   600   millions   de   dollars,   dont   170   millions   de   prêts   personnelsmillions   de   dollars,   dont   170   millions   de   prêts   personnels   accordés par la société.accordés par la société.♦  Enfin le 5 novembre 2002,Enfin le 5 novembre 2002,   Harvey L.Harvey L.   Pitt,   président   de   la   SEC   et   champion   du   laisser­fairePitt,   président   de   la   SEC   et   champion   du   laisser­faire   réglementaire, était contraint de démissionnerréglementaire, était contraint de démissionner..♦[[TSCTSC]]

6

Tous ces scandales se sont produits dans un contexte économiqueTous ces scandales se sont produits dans un contexte économique   morose, très différent de l'euphorie des années 1990 : […]morose, très différent de l'euphorie des années 1990 : […]

La   récurrence   des   introducteurs   d’univers   temporels   crée   dans   cet extrait   une   continuité   à   un   niveau   purement   textuel,   puisque   le   point commun   n’est   plus   idéationnel   (une   circonstance   ou   un   référent),   mais textuel (un mode organisationnel). Nous retrouvons ici la notion des  Text­Strategic Continuities telle que l’a définit Virtanen (1992) : 

“[A Text­Strategic continuity refers] to the effect on the text of a continuous chain of markers belonging to the same line or notion of orientation. These may or may not refer to the same point on that line or to the same aspect of that notion.” (Virtanen, 1992, 91) “it is the text that is continuous, not necessarily the referential frame. Time, place or a member of a group of participants may change but the chain of references to a common temporal, spatial or participant­oriented frame still has the effect of forming continuity in the text and discourse” (Virtanen, 1992, 89)

La   constitution   de   continuités   texto­stratégiques   est   une   façon   de dépasser le niveau de modélisation que propose l’encadrement du discours3. De plus, la constitution de ces continuités peut permettre une caractérisation de certains textes selon qu'ils sont plus ou moins organisés temporellement (par exemple pour une chronologie) ou spatialement (comme dans un guide de   voyage).   L'idée   des   continuités   texto­stratégiques   peut   également s'appliquer   aux   chaînes  de   référence   en  délimitant   des  portions  de   texte organisées par des chaînes de référence. Nous pouvons alors distinguer des textes présentant une homogénéité référentielle (et donc des chaînes) de ceux présentant une hétérogénéité référentielle (et donc peu de chaînes).

5.2. Chaînes de référence

La phrase étant construite autour d’un ou plusieurs procès mettant en jeu une ou plusieurs entité(s), il est nécessaire (et obligatoire dans le cas des langues à sujet obligatoire comme le français) de préciser à chaque fois la ou les entité(s) concernée(s) par ce(s) procès. Si l’entité en jeu dans une phrase est   identique à  une entité  déjà  mise en jeu précédemment, une continuité référentielle   se   met   en   place   sous   la   forme   de   ce   que   l’on   appelle communément une chaîne de référence :

“On appelle  chaîne  de   référence  une  suite  d’expressions  d’un   texte  entre lesquelles l’interprétation établit une identité de référence.” (Corblin, 1985, 27)

3 A ce sujet, il faut remarquer que les univers apparaissent fréquemment en séquence   (en   continuités   texto­stratégiques),   ce   qui   peut   supposer   un fonctionnement différent selon que l’on ait à faire à un cadre isolé ou en séquence.

7

Les relations de coréférence peuvent être réalisées grammaticalement par diverses formes. Nous retiendrons particulièrement les pronominaux, les démonstratifs,   les   articles   définis   et   les   comparatifs.   Ces   quatre   types d’expressions   sont   généralement   définies   comme   étant   des   expressions anaphoriques, c’est­à­dire des expressions “dont l’interprétation référentielle dépend d’éléments déjà saillants ou manifestes” (Kleiber, 1994, 27).

Cette   définition   fait   apparaître   deux   traits   caractéristiques   de l’anaphore : d’une part, l’expression anaphorique est incomplète, puisqu’il lui manque de l’information pour pouvoir référer à une entité spécifique de son propre chef ;  d’autre part,   l’occurrence d’une expression anaphorique implique   l’existence   d’éléments   d’information   donnée   (dans   le   contexte textuel ou mémoriel de l’anaphorique). Ces deux traits soulignent la fonction de   connexion   que   jouent   les   expressions   anaphoriques   en  obligeant  un raccord   au   discours   précédent   de   fait   de   leur   incomplétude   sémantico­pragmatique.   Remarquons   que   la   notion   de   coréférence   n’intervient   pas explicitement   dans   cette   définition.   En   effet,   la   relation   anaphorique n’implique pas nécessairement de relation coréférentielle, comme dans les cas d’anaphore associative du type “Nous entrâmes dans un village. L'église  était située sur une hauteur”. Nous n’entrerons pas dans le détail de ces cas d’anaphores puisque ce qui nous intéresse ici, ce n’est pas la détermination du référent et la recherche de l’antécédent, mais la détection de relations de continuité. Ce qui nous importe pour cette étude, c’est que les expressions anaphoriques sont un gage certain de continuité référentielle.

Notons enfin que les chaînes de référence (comme résultat textuel de la   présence   de   continuités   référentielles)   peuvent   être   rapprochées   des progressions   thématiques (Daneš,   1974) ;   la   différence   étant   que   dans   le modèle   de  Daneš,   seules   les   reprises   effectuées   en  position  Thème   sont prises  en   compte.  Ce  modèle   propose  différents   schémas  de  progression thématique. Chaque schéma représente une façon dont peut se continuer la référence de proposition en proposition. Dans ce modèle, la proposition est envisagée en tant que message, constituée d’un thème (point de départ de ce qui est dit) et d’un rhème (ce qui est dit à propos du thème). Comme nous le présentons dans la partie suivante, notre étude se focalise sur les éléments présents en position initiale, envisagée comme un marqueur discursif. Ainsi, les  chaînes considérées  dans  cette  étude sont  également  des  progressions thématiques puisqu’elles ne sont prises en compte que si leur co­référent se réalise en position Thème.

8

6 . DES MARQUEURS POUR L’ETUDE DE LA SEGMENTATION

Dans   cette   partie,   nous   précisons   notre   définition   des   marqueurs discursifs,  et  présentons  différentes   formes   retenues  et   repérées  pour  nos analyses quantitatives. Cette présentation pourra paraître succincte et pour certains   très   généralisante.   Nous   précisons   que   cette   partie   ne   propose aucunement   une   théorisation   du   fonctionnement   discursif   des   formes étudiées,   mais   cherche   plutôt   à   délimiter   un   certain   nombre   de   formes repérables   de   façon   automatique   et   pertinentes   pour   marquer   ou accompagner une (dis)continuité dans le discours.

6.1. La problématique des marqueurs discursifs

La diversité (voir le désaccord) définitoire existant autour de la notion de marqueurs discursifs4 est en grande partie due à l’absence de corrélations entre une ou un ensemble de fonction(s) et une ou un ensemble de forme(s). 

  “the   definition   of   DMs   [discourse   markers]   is   not   independent   from   a particular  set  of   form chosen  to  be  studied;   therefore   it   is  unlike   that   it   can  be applicable to a different set of forms. (Romera, 2004, 21)

Un   marqueur   discursif   n’est   pas   un   élément   appartenant   à   une catégorie   grammaticale   définie.   Ce   qui   fait   d’un   élément   un   marqueur discursif, c’est sa fonction dans le discours (en contexte et en texte) et non une   quelconque   nature   “absolue”.   De   ce   fait,   il   est   vraisemblablement difficile de trouver un terrain d’entente et de délimiter ce sur quoi il  faut travailler, ce qu’il  faut étudier. Certains traits formels semblent cependant pouvoir être utilisés en tant qu’indices pertinents à l’accès à une fonction discursive, mais comme le précise Romera, ce ne sont que des indices dont l’usage   est   étroitement   liés   à   l’objectif   de   l’étude   et   non   des   traits caractéristiques à une fonction de niveau discursif :

“Formal features do not constitute reliable criteria to support an independent definition of DMs or a characterization of their status as a discourse category. All the properties used to defined the category of DMs come from analysis of partial sets of expressions which vary greatly depending on the researcher’s perspective.” (Romera, 2004, 7)

Le   problème   définitoire   des   marqueurs   discursifs   est   qu'ils   ne correspondent pas à des formes précises et stables, mais à des configurations 

4  Romera   (2004,   6)   établit   une   longue   liste   de   toutes   les   principales acceptions   recensées   autour   de   cette   notion :  discourse   markers,  discourse operators,  discourse   particles,  cue   phrases,  connectives   phrases,  pragmatic markers, pragmatics particles, punctors, discourse connectives, etc.

9

d’occurrences dans certaines positions textuelles, dans certains contextes. Au final,   le   seul   trait   caractéristique   des   marqueurs   discursifs   est   leur   sens instructionnel   (textuel)  vs.  leur   sens   représentationnel   (idéationnel). D’ailleurs, les marqueurs discursifs sont traditionnellement définis par leur faible contenu représentationnel c’est­à­dire qu’ils ne contribuent quasiment pas à la composante idéationnelle. Nous retrouvons ici la définition des cue­phrases (Grosz & Sidner 1986) qui sont des expressions signalant de façon explicite la structure intentionnelle ou attentionnelle du discours.

Dans cet article,  nous défendons l’idée que des éléments à  contenu plutôt représentationnel peuvent jouer le rôle de marqueurs discursifs dans certaines   configurations,   et   notamment   lorsqu’ils   sont   alliés   à   deux marqueurs particuliers : la position initiale et le changement de paragraphe.

6.2. La position initiale comme marqueur discursif

Ce   premier   marqueur   peut   paraître   marginal   de   prime   abord. Cependant, d’après notre définition, la position initiale semble constituer un marqueur exemplaire.  Au niveau de  la  construction du  texte :   la  position initiale   est   un  pivot   puisqu’elle   permet   conjointement  de   commencer  un texte, un paragraphe, une phrase et de relier ce qui va se dire au discours précédent. Elle est de ce fait une position privilégiée pour les marques de cohésion et d'organisation. D’un point de vue fonctionnel, cette position est définie par la fonction sémantico­pragmatique de Thème5 :  

“The Theme is a function in a clause as message. It is what the message is concerned   with :   the   point   of   departure   for   what   the   speaker   is   going   to   say” (Halliday, 1985, 38)

et

“the peg on which the message is hung” (Halliday, 1970, 161).

La zone qui correspond à la position thème est égale pour nous à toute la position préverbale : du premier mot de la phrase au dernier mot précédant le verbe principal6. Dans cette zone différents éléments peuvent apparaître selon la composante au niveau de laquelle ils jouent. Ainsi, nous avons des thèmes interpersonnels (des adverbiaux énonciatifs en majorité), des thèmes textuels   (les  marqueurs  d'intégration   linéaire  par   exemple)  et  des   thèmes idéationnels parmi lesquels on distingue les thèmes marqués (les adverbiaux 

5 Pour un état de l’art complet, se reporter à Gómez­Gonzáles (2001).6  Gómez­Gonzáles   (2001,   52­57)   constitue   un   panorama   des   diverses 

délimitations de la zone thème.

10

circonstanciels,   les   constructions  détachées)  des   thèmes non marqués  qui peuvent   être   soit   des   thèmes   topicaux   (les   sujets   grammaticaux   hors constructions spéciales), soit des thèmes spéciaux (les sujets grammaticaux des constructions spéciales7). 

(3)(3) Bien évidemment,  [Th interperso.] dans les pays voisins, pauvres  en ressources,[Th marqué]  l'énergie consommée  [Th topical]  est  bien mieux utilisée.En troisième lieu,  [Th textuel]  on   [Th spécial]  remarquera que l'excellente lecture [...]  est en vérité l'amorce [...] .

Ce qui caractérise principalement la notion de thème envisagée en tant que  position   initiale,   c'est   la  notion  de  point  de  départ.  Cette  notion  est particulièrement   importante  dans   les   processus   de   construction   des représentations mentales. En effet, tout ensemble est abordé par un point (de départ) qui doit comporter les instructions nécessaires au développement et au   raccord  de  cet  ensemble  à   ce  qui   l’entoure.  Dans  cette   approche,   les éléments en position initiale sont conçus comme des éléments de base pour la   construction   des   représentations   mentales   (Fauconnier,   1984, Gernsbacher, 1990). Ainsi ce qui compose le point de départ de toute unité textuelle ancre cette unité dans le discours précédemment interprété tout en indexant,  en orientant,  en guidant   l’interprétation de  la suite du discours. Nous retrouvons ici la fonction d'orientation que définissent Chafe (1976) et Dik (1997) pour expliquer la fonction des éléments en position initiale8  et que reprend Fries pour expliquer la fonction de thème.  

“[elements in initial position] limit the domain of applicability of the main predication  to   a   certain   restricted  domain   […]   set[ting]   the   spatial,   temporal  or individual   framework   within   which   the   predication   holds”   (Chafe,   1976,   53). “Theme functions as an orienter to the message. It orients the listener/reader to the message   that   is   about   to   be   perceived   and   provides   a   framework   for   the interpretation of that message” (Fries, 1995, 318)

Par sa fonction discursive d'orientation, la position initiale peut donc être considérée comme un marqueur discursif. De ce fait, nous supposons 

7 Les constructions spéciales sont des constructions qui présentent ce que l'on peut appeler un  thème spécial,  i.e.  un sujet grammatical  n'ayant pas de fonction idéationelle   première,   t.q.   dans   les   constructions   clivées,   présentationnelles, impersonelles, etc ou encore dans des commentaires où le sujet réalise le locuteur (voir l'exemple (3)).

8 Les ”Chinese­style topics” pour Chafe et les conditions de véridiction, les settings et les thèmes (au sens de constructions détachées) pour Dik.

11

que c'est justement là que se situent préférentiellement les expressions dont le sens instructionnel est de signaler la continuité ou la discontinuité de ce qui   suit   par   rapport   au  discours  précédent.  En   appuyant   davantage   cette supposition, nous posons l'hypothèse que la position initiale est d'autant plus forte   qu'elle   s'allie   à   un   autre   marqueur   discursif   :   le   changement   de paragraphe. 

6.3. Le changement de paragraphe

Les  intentions  qui  poussent  un  locuteur  à  poser  un changement  de paragraphe   sont   relativement   floues.   Les   différents   auteurs   qui   se   sont intéressés aux paragraphes s’accordent d’ailleurs à dire qu’il n’y a pas de véritable règle à ce mode de découpage (Virbel, 1986, Stark, 1988, Heurley, 1994, 1997). D’ailleurs, plusieurs expérimentations psycholinguistiques ont montré la variabilité de ce découpage de locuteur en locuteur et d’allocutaire en allocutaire9. Du point de vue de la production comme de l’interprétation, le découpage en paragraphes reste encore un mystère.  Le changement de paragraphe peut être l’indice d’une variété d’instructions : changement de point de vue, de référent, de thème, de style... Mais cela ne signifie pas qu'il est le fruit du hasard. Comme le remarque Stark (1988), les phrases initiales de paragraphe, lorsque le découpage en paragraphe n'a pas été modifié, sont jugées plus importantes que les autres par les lecteurs. Lors de nos analyses, nous mesurons si une forme apparaît préférentiellement en position initiale de première phrase de paragraphe ou non. Nous pensons trouver là un indice quant   à   sa   fonction   dans   le   marquage   des   discontinuités.   Cette   idée correspond à l’extrapolation de notre notion de point de départ, ce qui rejoint l’idée des continuités texto­stratégiques de Virtanen :

“A paragraph boundary may produce a highlighting effect on the paragraph initial sentence: this is where something starts. Signals of the temporal or locative TSCs may therefore be assumed to have the effect of separating what is to follow from what has gone before.” (Virtanen, 1992, 226)

Ainsi, nous posons l’hypothèse qu’une forme ayant pour fonction la réorientation du discours apparaît préférentiellement en position initiale de première phrase de paragraphe, cette position paragraphique devenant ainsi le point de départ non pas seulement de la phrase, mais aussi du paragraphe.

9 Ces expérimentations consistent à comparer les processus de lecture face à des textes dont le découpage en paragraphes est correct, erroné ou supprimé. 

12

6.4. Éléments repérés en position initiale

Quatre  éléments  distincts  peuvent  apparaître  en  position   initiale  de phrase   :   un   connecteur,   un   premier   élément   détaché   en   initiale,   un   ou plusieurs autres éléments détachés, un thème topical ou une construction à thème spécial. Les éléments détachés en initiale correspondent à tout ce qui est   compris   entre   le   début   de   la   phrase   (hors   connecteur)   et   le   sujet grammatical de la phrase. Le thème topical équivaut au sujet de la phrase, sauf si celui­ci appartient à une construction à thème spécial10.

6.4.1 Les circonstants détachés en position initiale

Différents   éléments   occupent   la   position   initiale   détachée   :   des adverbiaux circonstanciels, énonciatifs, textuels11 ou encore des appositions et   des   constructions   détachées.   Pour   cet   article,   seuls   les   adverbiaux circonstanciels  détachés  en  initiale [CIRC]  nous  intéressent ;  en distinguant particulièrement   les   circonstants   temporels   [CIRC_tps]   et   spatiaux [CIRC_spa]12  des   autres   circonstants.     Ces   circonstants,   en   position extraprédicative, peuvent prétendre au statut d’introducteur d’univers : 

“La position 1 (avant le sujet) est une position fondamentalement ponctuée et extraprédicative. On y trouve des adverbes énonciatifs (cependant, pourtant, […]) ainsi   que   des   compléments   circonstanciels   qui   permettent   de   construire   des repérages ponctuels de localisation spatio­temporelle et notionnelle (à un moment  donné, à tel endroit, dans telle situation) thématisant le point d’ancrage par rapport auquel l’énoncé subséquent13 décrira un phénomène.” (Fournier 1993 : 54)

6.4.2 Les expressions anaphoriques en position de thème topical

Une des formes principales des expressions anaphoriques est la forme pronominale. Les pronoms constituent des expressions remarquables par leur 

10  Par  manque évident  de  place,  nous ne  pouvons présenter   les  différents types   et   patrons   de   constructions   à   thème   spécial   retenues.   Cependant,   nous informons que ce repérage et cette caractérisation se fait de façon automatique par un programme développé par nous même au cours de notre travail de thèse. Nous nous tenons disponibles pour toutes questions relatives à ce programme.

11 Biber et al. (1999) présente une étude en corpus de la répartition en anglais des différents types d’adverbiaux cités.

12 La catégorisation des différents circonstants se fait de façon automatique par un programme basé sur le repérage d’expressions régulières (voir note 10). 

13 Et pour nous les énoncés subséquents appartenant au même univers.

13

absence   de   contenu   représentationnel,   absence   qui   leur   confère   un   rôle essentiellement instructionnel : signaler que le référent exprimé est toujours le même. Nous étudierons principalement le pronom de 3e personne (PRO3), marque privilégiée de la continuité du topique, de ce à propos de quoi on parle.

“Il  n'est  pas  utilisé  uniquement  pour indiquer  qu'il  s'agit   toujours  de Fred [dans Fred enleva son manteau. Il avait trop chaud], mais avant tout pour marquer un fait crucial de cohérence : que l'on va (continuer de) parler d'un référent  déjà saillant  lui­même ou présent dans une situation saillante et que l'on va parler en continuité avec ce qui l'a rendu saillant.” (Kleiber, 1994, 100)

Ce qui caractérise le pronom il, c'est précisément qu'il constitue une marque  pour   la  continuité   topicale  et  une marque pour   la   continuité   des circonstances définitoires de la situation saillante en cours (les circonstances  d'évaluation dans la terminologie kleiberienne, cf. Kleiber, 1990). 

Cette   idée  de   continuité   des  circonstances  d'évaluation   se   retrouve également   pour   distinguer   les   reprises   par  syntagmes   nominaux   définis [SNdef] et celles par syntagmes démonstratifs [SNDEM]. Ainsi, les premières semblent   signaler   qu'il   y   a   reprise   d'un   référent   et   de   ses   circonstances d'évaluation, tandis que “le contenu nominal du SN démonstratif (re)classifie le référent qu'il désigne comme un individu particulier de la classe des N” (Corblin, 1995, 66), sans maintien des circonstances d'évaluation. De ce fait, une reprise par [SNDEM]  s'associe souvent à un effet de rupture, ce qui n'est pas le cas des reprises par [SNDEF]. 

Pour notre étude,  nous sommes loin de pouvoir   identifier  avec des méthodes automatiques si nous sommes face à un syntagme faisant reprise ou non. Ce problème est moins important avec les démonstratifs qui sont majoritairement utilisés en reprise14.  Notre solution a été de distinguer des syntagmes présentant une tête nominale reprenant un élément déjà présent dans   la   section   en   cours   de   ceux   dont   la   tête   n'avait   pas   encore   été mentionnée.  Nous sommes  tout  à   fait  consciente  que cette  distinction ne couvre pas la distinction entre reprise ou non, elle nous permet néanmoins d'observer des variations de comportement significatives entre les  SNDEF_R (avec reprise) et les SNDEF (sans reprise). 

Nous avons effectué la même distinction pour les noms propres, ce qui nous   a   permis   de   distinguer,   cette   fois–ci   de   façon   plus   certaine,   les premières mentions (NP) des reprises (NP_R). Dans le cas de reprise des noms 

14 L'analyse en corpus de Manuelian (2004) montre que 78 % des SNDEF sont des  premières  mentions,  contre  17,5 % des  SNDEM ;   et  que  seuls  18 % sont  des reprises contre 82 % pour les SNDEM.

14

propres, nous nous trouvons face à des redénominations, ce qui correspond à “ré­instancier le référent sous une forme nominale identique à celle qui a été initialement employée” (Schnedecker, 1997, 32). La redénomination semble alors intervenir pour maintenir une continuité  en danger ou pour marquer l’ouverture d’une nouvelle chaîne de référence.

7 . MÉTHODOLOGIE ET CORPUS

Nous   avons   présenté   la   position   initiale   comme   un   marqueur important au niveau de l’organisation du discours ; elle sera pour nous le point   de   départ   de   nos   analyses.   Plutôt   que   de   repérer   les   différentes expressions qui nous intéressent, nous sommes partis de la description de ce qui compose la position initiale de chaque phrase de nos corpus d’étude et avons observé les variations de cette composition selon trois paramètres : la position paragraphique de la phrase, le corpus, et la présence d'un circonstant en   Init1.  Pour  mesurer   si   ces  variations   sont   significatives  ou  non,  nous avons   calculé   leur   écart   réduit   et   avons   considéré   comme   significatives toutes les variations présentant un écart réduit supérieur ou égal à 2.515.

Trois positions paragraphiques ont été retenues : [PH1] qui correspond à la première phrase de paragraphe, [DERPH] qui situe la dernière phrase et la [PH2] qui localise toutes les phrases comprises entre [PH1] et [DERPH]. 

Trois corpus ont été constitués pour l’étude. La distinction entre ces corpus   relève   de   nos   intuitions   quant   à   leur   organisation   en   univers spatiaux/temporels   et   en   chaînes   de   référence.   Le   corpus  ATLAS  (204505 mots)  est  composé  de   trois   textes descriptifs  de géographie sociale.  Leur contenu tourne autour de la répartition d’une ou plusieurs thématiques dans une zone géographique déterminée et dans une période temporelle plus ou moins déterminée16. Le corpus  PEOPL  (219705 mots) est constitué de trente portraits  de  personnalités  célèbres   issus  de  l’Encyclopædia Universalis  4e 

édition©   (1995).   Le   corpus  GEOPO  (247217   mots)   rassemble   des   textes publiés par l’IFRI17 concernant des problèmes de géopolitique actuelle et dont les   entités   principales   sont   des   personnages   contemporains   et   des 

15  L’écart   réduit   correspond   au   rapport   entre   l’écart   observé   dans   une configuration donnée (ici, un sous ensemble de phrases) et l’écart type (écart attendu eu égard à  la moyenne générale).  Tout écart  réduit supérieur à 2,5 est hautement significatif, puisque à un écart réduit de 2,58 correspond la probabilité 0.01,  i.e. 1 chance sur 100 pour attribuer cet écart au simple hasard.

16 Textes issus du projet GEOSEM (http://infodoc.unicaen.fr/geosem/)17 IFRI : Institut Français des Relations Internationales ( www.ifri.org )

15

phénomènes de société. Ces textes sont plutôt argumentatifs, à l’inverse des deux autres corpus qui présentent des textes principalement descriptifs.

8 . RÉSULTATS ET DISCUSSION

Dans nos trois corpus, 83 % des 23233 phrases présentent un thème topical et 30 % un élément détaché en initiale. En thème topical, nous avons 11,6 % de PRO3, 8 % de SNDEM, 52,5 % de SNDEF et 8,2 % de NP. Concernant les reprises, 31,3 % des têtes de SNDEF et 50 % des NP montrent une reprise. Les   circonstants   [CIRC]   représentent   68,9 %   des   éléments   détachés   en initiale : 30,3 % sont temporels et 11,1 % spatiaux.

Le   tableau(1)   présente   les   variations   observées   selon   la   position paragraphique et le type de corpus. Les écarts significatifs sont en gras. 

Tableau (1) : écarts selon les positions paragraphiques et selon les corpusForme PH1 PH2 DERPH ATLAS GEOPO PEOPL

PRO3 -15 +7.5 +3.4 -6.6 -8 +14.6SNDEM -1 -1.2 +3.2 +2.3 +1 -3.3SNDEM_R +0.3 -1.5 +2.2 +4.8 +1.4 -6.2SNDEF +12 -5.3 -3.8 +6.2 +9.8 -16SNDEF_R +6.5 -5 +1.7 +11.7 +5.2 -16.8NP +3.4 -0.6 -2.6 -5.1 -3.2 +8.3NP_R +0.4 +1.9 -3.7 -8.6 -10.4 +19CIRC +1.8 +0.4 -2.7 +2.3 -0.9 -0.8CIRC_tps +2.9 -1 -1.6 +0.2 -2.4 +2.6CIRC_spa +1.6 -2.6 +0.7 +14.4 -7.2 -7.2

Ces premiers résultats étaient plus ou moins attendus concernant la distinction entre PEOPL et les deux autres corpus. Les textes de PEOPL relatent l’histoire d’un personnage, référencé par son nom propre (NP(_R)), alors que GEOPO  et   surtout  ATLAS  relatent   plutôt   de   phénomènes   référencés préférentiellement par une description définie complète. La forte proportion de  PRO3  est   significative  du   fait   qu’un  portrait   parle   d’un   seul   et  même personnage qui constitue le topique général du texte (topique discursif). 

Les écarts observés dans  PEOPL sont inversés pour  ATLAS  et  GEOPO, qui montrent  des variations relativement  similaires :   tous  deux présentent  des textes dans lesquels la segmentation en chaînes de référence ne semblent pas dominer. La faible proportion de PRO3 en constitue un indice fort, ainsi que, l’utilisation   relativement  plus   forte   des  SNdef  par   rapport   au  grand  écart négatif que présente PEOPL pour cette forme de thème topical.

16

Au   niveau   circonstanciel,   nous   retrouvons   également   certaines attentes :  ATLAS  montre   naturellement   une   forte   présence   de   localisations spatiales   (écart   positif   de  CIRC_spa)   et  PEOPL  montre   un   écart   positif   de CIRC_tps   significatif,   ce   qui   paraît   usuel   pour   raconter   l’histoire   d’un personnage. 

Concernant les positions paragraphiques, le fort écart négatif de PRO3 en  PH1  renseigne   sur   la   fonction   de   marqueur   de   discontinuité   du changement de paragraphe. Le tableau(2) montre que cet écart se retrouve dans   tous   les   corpus.   Ce   qui   signifie   que   même   lorsque   la   continuité référentielle   est   forte   comme   dans  PEOPL,   le   changement   de   paragraphe entraîne   une   discontinuité   référentielle   (plus   de  SNDEF  et  NP  en  PH1).   En contrepartie de cet écart négatif, on remarque une forte association entre PH2 et PRO3, ce qui soutient la fonction de marqueur de continuité des PRO3. 

Au vu de nos résultats, des procédés tels que la redénomination ou, pour les SNDEF, la reprise de la tête nominale, ne sont pas spécialement plus présents en PH1 ; sauf pour ATLAS où il y a une association évidente entre PH1 et  SNDEF_R  et, en réaction, une dissociation entre  PH2  et  SNDEF_R. L'absence d'écarts significatifs pour les répartitions des  SNDEM nous signale que l'effet de rupture qui peut être associé à cette forme ne se réalise pas spécialement par un changement de paragraphe.

Tableau (2) : écarts selon les positions paragraphiques par corpus

FormeATLAS GEOPO PEOPL

PH1 PH2 DERPH PH1 PH2 DERPH PH1 PH2 DERPH

PRO3 -9.5 +5 +3.8 -8.2 +3.1 +3 -7 +3.1 +1SNDEM ­1.8 ­0.6 +2.9 ­1.9 +0.5 +1 +2 ­1.4 +0.8SNDEM_R +0.7 ­1.1 +0.7 ­1.3 ­0.5 +2.2 ­0.5 +0.4 ­0.3SNDEF +6.8 ­3 -3.5 +7.9 ­2.4 -3.9 +3.6 ­1.7 ­0.3SNDEF_R +4.7 -3.9 +0.2 +1.3 ­0.6 ­0.3 +0.9 ­1.1 +1.2NP ­0.9 +1.8 ­1.4 ­0.5 +0.2 0 +8.1 ­3.2 ­2NP_R +1.5 0 ­1.8 ­0.1 +1 ­1.7 +1.9 ­0.2 ­1.6CIRC +1.8 +0.4 -2.7 +2.3 -0.9 -0.8 0 +0.9 -1.9CIRC_tps +0.9 0 -1.3 +2.2 -0.9 -0.9 +2 -1 -0.3CIRC_spa -0.6 +1.1 -0.3 -0.5 +0.8 -0.2 +0.5 -0.7 -0.1

Enfin,   concernant   l'organisation   spatiale   et   temporelle,   nous remarquons que de façon générale, le temps est plus enclin à être exprimé en PH1  (tableau(1)),   et   donc   à   pouvoir   constituer   des   continuités   texto­stratégiques. Cet écart ne présente pas de variation significative si l'on prend 

17

les corpus séparément. Ainsi, quelque soit  le corpus,  PH1  semblent être la position préférée des CIRC_tps. 

Les résultats du tableau(2) ne nous renseignent pas davantage sur la possible   organisation   de   nos   corpus   selon   les   circonstances   spatiales   ou temporelles.   En   effet,   aucun   corpus   n'affiche   d'association   préférentielle entre un type de circonstant et la PH1. 

Tableau (3) : écarts selon les corpus par positions paragraphiques

FormePH1 PH2 DERPH

ATLAS GEOPO PEOPL ATLAS GEOPO PEOPL ATLAS GEOPO PEOPL

CIRC_spa +6.5 -5 -3.5 -0.5 +0.8 -0.2 +5.5 -4.1 -2.8

Par contre, si  l'on compare les corpus par positions paragraphiques, des écarts significatifs apparaissent,  notamment pour les  CIRC_spa, comme l'illustre le tableau(3). Nous retrouvons alors l'idée d'une forte organisation spatiale pour  ATLAS.  Cependant, on remarque que  DERPH  affiche également une   sur­présence   de  CIRC_spa.   Il   semble   alors   que   l'on   ait   affaire  à   une organisation spatiale à l'intérieur des paragraphes plutôt que de paragraphe en   paragraphe.   Ainsi,   à   l'intérieur   d'un   paragraphe   se   trouvent   plusieurs cadres   en   séquences,   comme   le  montrait   l'exemple   (2),   le   dernier   cadre ouvert correspondant finalement à la dernière phrase.

Nos   dernières   observations   portent   sur   les   variations   repérées   au niveau des thèmes topicaux lorsqu'il y a présence d'un CIRC. 

Tableau (4) : écarts selon la présence d’un circonstant en Init1

FormeATLAS GEOPO  PEOPL

CIRC tps spa CIRC tps spa CIRC tps spaPRO3 -2 +0.1 -2.2 -0.4 -2.4 -2.6 +8.5 +3.5 +0.7SNDEM -5.1 -1.7 -1.1 -5 -1.4 +1.3 -4 -0.9 0SNDEM_R -5.8 0 0 ­1.9 ­0.6 +0.8 -2.7 ­1.9 ­0.8SNDEF +2.3 +0.6 -1.4 0 +1.8 +0.8 -2.5 ­1.3 +2SNDEF_R +4.2 0 +3.1 +5 -0.2 -0.4 -1 -0.3 -1.4NP 0 -0.8 +2.2 +0.7 +3.5 -0.8 +2.5 +1.3 +0.9NP_R +0.6 +0.6 +1.6 +2.6 +1.6 +1.1 +5.4 +2.6 +1.6

Si   l'on s'intéresse  d'abord aux  PRO3,   il  apparaît  que pour  GEOPO,  un CIRC_spa soit lié à un effet de rupture et donc rejette la présence de  PRO3. Nous constatons le phénomène inverse pour  PEOPL  et les  CIRC_tps : dans ce corpus, la présence d'un CIRC ou d'un CIRC_tps favorise la présence d'un PRO3. L'organisation en chaînes de référence semble ainsi dominer l'organisation circonstancielle,   puisque   en   changeant   les   circonstances     du   procès, 

18

l'utilisation   d'un  PRO3  est   fortement   remarquée   pour   continuer   la   chaîne. Nous constatons  le même phénomène pour  les redénomination  NP_R  mais dans des  proportions moindres.  Dans ce  cas,  c'est   l'idée contraire qui  est avancée :   l'organisation   circonstancielle   pourrait   domine   l'organisation   en chaîne,   puisque   à   l'arrivée   d'un   circonstant,   notamment   temporel,   il   est nécessaire de redénommer le personnage.

Les SNDEM, qui peuvent s'associer à un effet de rupture notamment au niveau   des   circonstances   d'évaluation,   montrent   un   écart   négatif   quasi général lorsqu'il y a présence d'un CIRC. On notera que cet écart ne varie pas selon que l'on soit face à un CIRC_spa ou un CIRC_tps. Il semble donc que le phénomène de rupture des circonstants détachés en  initiale ne  trouve pas écho dans la présence d'un SNDEM  en thème topical. Par contre, il semble y avoir corrélation entre SNDEF_R et CIRC. Cette corrélation se retrouve avec les CIRC_spa  pour  ATLAS,   ce  qui   rejoint   les   résultats  précédents   relatifs  à   une organisation des paragraphes par  les cadres spatiaux.  Ainsi,   l'organisation spatiale   y   dominerait   l'organisation   en   chaînes,   puisque   à   l'arrivée   d'un nouveau repère spatial, une reprise définie serait nécessaire. Il faut constater que cela ne va pas dans le sens de la distinction de sens instructionnel entre les reprises démonstratives et les reprises définies. Une analyse qualitative semble   alors   nécessaire   pour   définir   l'impact   de   telles   reprises   sur   une organisation en univers de discours.

9 . CONCLUSION

Différentes   descriptions   se   dégagent   de   nos   résultats   quant   à l'organisation en cadres et en chaînes des différents corpus d'étude. Ainsi, il apparaît que le corpus de portraits se distingue fortement des autres par une organisation   faite   principalement   par   les   chaînes   de   références   et   plus minoritairement   par   des   cadres   temporels,   mais   généralement   dominés, englobés   dans   les   chaînes.   Le   corpus  ATLAS  montre   une   tout   autre organisation, principalement spatiale ; même si cette organisation ne semble pas  dépasser   le   cadre  du  paragraphe.  Cette  dominance  du  découpage  en paragraphe est  d'ailleurs générale à   tous  les corpus,  puisque les  PH1  sont généralement associées à des marques de rupture référentielle ou temporelle et dissociées des marques de continuité.

Dans   ce   travail,   nous   avons   voulu   montrer   que   des   méthodes d’analyse quantitative sont possibles pour étudier l'organisation du discours. Il   est   évident   que,   en   utilisant   de   telles   méthodes,   des   informations   se perdent dans la masse. Il est   également certain que ces premiers résultats sont encore insuffisants pour réellement décrire le fonctionnement discursif 

19

de ces deux modes de segmentation. Cependant, ces analyses apportent de nouvelles   données   sur   des   phénomènes   discursifs   généralement   analysés qualitativement et  sur  de faibles données.  De ce fait,  elles permettent  un regard nouveau sur des phénomènes qui, parce qu’ils sont discursifs, sont particulièrement délicats à analyser.

10 . RÉFÉRENCES BIBLIOGRAPHIQUES

BIBER  D.,  JOHANSSON  S.,  LEECH  G., CONRAD  S. & FINEGAN  E.  (1999) :  Grammar of  spoken and written english, Longman : London.

CHAFE W. (1976) : “Giveness Contrastiveness definiteness subjects topics and point of view”, in C.N.Li (ed) Subject and Topic, N­Y Academic Press, 25­55.

CHAROLLES  M. (1997) : “L'encadrement  du discours ;  univers champs domaines et espaces”, Cahier de Recherche Linguistique, 6, LanDisCo université Nancy2.

CORBLIN F. (1995) : “Les formes de reprise dans le discours : Anaphores et chaînes de référence”, Presses Universitaires de Rennes.

DANES F. (1974) : “Functional sentence perspective and the organisation of the text”, in   F.Daneš   (ed),  Papers   on   functional   sentence   perspective,   Mouton   :   La Hague, 106­128.

DIK  S.C.   (1997) :  Theory   of   Funtional   Grammar   Complex   and   Derived  Constructions/2, Mouton de Gruyter : Berlin/New­York.

FAUCONNIER G.  (1984) :  Espaces mentaux. Aspects de la construction du sens dans  les langues naturelles, Editions de Minuit : Paris.

FOURNIER  N. (1998) :  “La ponctuation des groupes circonstants dans le corpus Le Monde”, in C.Guimier (ed)  1001 circonstants, Presses universitaires de Caen, 47­67.

FRIES P. (1995) : “Themes Metod of Development and texts”, in R.Hasan & P.Fries (eds)  On   Subject   and   Theme   :   A   Discourse   Functional   Perspective,   John Benjamins : Amsterdam/Philadelphia, 317­359.

GERNSBACHER  M.A.   (1990) :  Language   comprehension   as   structure   building, Lawrence Erlbaum Associates ­ Mahwah, New Jersey .

GOMEZ­GONZALES M.A. (2001) :  The Theme­Topic interface. Evidence form english, John Benjamins : Amsterdam/Philadelphia.

GOUTSOS D. (1996) : “A model of sequential relations in expository text”, Text, 16(4), 501­533.

GROSZ  B.J.   &  SIDNER  C.L.  (1986) :  “Attention   Intentions   and   the   structure   of discourse”, Computational Linguistics, 12(3), 175­204.

HALLIDAY M.A.K (1970) : “Language structure and language function”, in R.Hasan & P.Fries (eds) New horizons in Linguistics, 140­164.

HALLIDAY M.A.K  (1985) :  An introduction to Functional Grammar, Edward Arnold : London.

HEURLEY  L.  (1997) : "Processing units in written texts : paragraphs or information blocks?",   in   J.Costermans   &   M.Fayol   (eds),  Processing   interclausal  relationships : studies in the production and comprehension of text, 179­200.

20

KLEIBER  G.  (1990) :   "Article  défini  et   démonstatif   :   approche  sémantique  versus approche   cognitive",   in   G.Kleiber   &   J.­E.Tyvaert   (eds),  L'anaphore   et   ses  domaines, Klincksieck ­ Paris, 199­227.

KLEIBER G. (1994) : Anaphores et pronoms, Duculot : Louvain­la­Neuve.LE QUERLER N. (1993) : "Les circonstants et la position initiale", in C. Guimier (eds), 

1001 circonstants, Presses Universitaires de Caen, 159­184 .MANUELIAN H. (2004) : Descriptions définies et démonstratives : analyses de corpus  

pour la génération de textes, thèse de doctorat de l'université de Nancy 2..ROMERA M. (2004) : Discourse Functional Units, LINCOM EUROPA.SCHNEDECKER C. (1997) : Noms Propres et Chaînes de référence, Univeristé de Metz.STARK H.A. (1988) :  “What do paragraph markings do?”,  Discourse Processes, 11, 

275­303.VIRBEL J. (1986) : “Langage et Métalangage dans le texte du point de vue de l'édition 

en informatique textuelle”, Cahiers de Grammaire, 10, 1­72..VIRTANEN  T  (1992) :  Discourse   Functions   of   Adverbial   Placement   in   English   :  

Clause­Initial  Adverbials  of  Time  and Place   in  Narratives  and  Procedural  Place Descriptions, Abo Akademi University Press.

21