une notation quasi arithmÉtique destinÉe …lecomte.al.free.fr/ressources/paris8_lsl/bh8.pdf ·...

8
HriMiMi 11:1.1», !.. Language. Henry Holt and Go, New York, 1933. | l | C . IIIIMNUY . N. Simlactic Structures. Mouton, The Hague, 1957. |'.'.| CIKIMSKV , N. Kxplanatory Models in Linguistics. Actes du Congrès international île Logique, Méthodologie et Philosophie des Sciences. Stanford University Press, I960, pp. 528-550. |:t| CIIOMSKY , N. On certain formai properties of grammars. Information and Contrat, 1959-1962, pp. 137-167. | l| CIIOMSKY, N. Aspects of thé Theory of Syntax. M. I. T. Press, Cambridge, Mass., 1965. < | AIU > IN , J. G. Syntol. Rutgers, The State University Press, New Brunswick, N. ,1., 1965. (îAii'M AN, H. Dependency Systems and phrase structure Systems. Information and Control, 8, 1965, pp. 304-337. (iuoss, M. On thé Equivalence of Models of Languages used in thé Fields of Mecha- nical Translation and Information Retrieval. Information Storage and Retrie- val, vol. 2, pp. 43-57. (iisoss, M., LENTIN, A. Notions sur les grammaires formelles. Gauthier-Villars, Paris, 1967. |1] HARRIS, Z. S. Methods in Structural Linguistics. Chicago, 1951. [21 HARRIS, Z. S. Discourse Analysis. Language, 28, 1952. [3] HARRIS, Z. S. Co-occurrence and Transformations in Linguistic Structure. Language, 33, 1957, pp. 283-340. [4| HAHRIS, Z. S. A cycling cancellation automaton for sentence well-formedness. /. C. G. Bulletin, vol. 5, n» 2, April-June, 1966. [5| HARRIS, Z. S. Mathematical structures of language. A paraître 1968. HOCKETT, C. F. Two models of grammatical description. Readings in Linguistics. Washington, 1957. KLEENE, S. C. Représentation of events in nerve nets and flnite automata, in C. E. Shannon et J. C. McCarthy (Eds), Automata Studies. Princeton University Press, 1956, pp. 3-41. KURODA, S. Y. Attachment Transformations (ronéotypé). M. I. T., 1965. LECERF, Y. Une représentation algébrique de la structure des phrases dans diverses langues naturelles. C. R. Acad. Sciences, 252, n° 2, Paris, 1961, p. 232. LEES, R. B. The grammar of english nominalizations. Mouton, La Haye, 1960. MARCUS, S. Algebraic Linguistics; Analytical Models. Académie Press, New York, 1967. M ARGUS, S., NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966. NIVAT, M. Transductions de Langages de Chomsky Thèse de doctorat (à paraître). POSTAL, P. Constituent Structure : a study of contemporary models of syntactic description. Mouton, La Haye, 1964. KLIVZIN, I. I. Modeli Yazika. Moscou, 1961, 191 p. Ross, J. A proposed rule for tree pruning (ronéotypé). M. I. T., 1965. (1) RUWET, N. La grammaire générative. Langages, n° 4, déc. 1966, Didier-Larousse. |2] RUWET, N. Introduction à la grammaire générative. Pion, Paris, 1967. SCIIAUMIAN, S. K., SOBOLEVA, P. A. Applicativnaja porozdajuscaja model' iscislenie iransformacy v russkom jazike, Izdat. ANSSR, Moscou, 1963. ScitAUMYAN, S. K. Strukturnaya lingvistika Nauka. Moscou, 1965. SHANNON, G. E., WEAVER, W. The mathematical theory of communication. Urbana, University of Illinois Press, 1949. 111 Sr.iiUTZKNBKRGER, M. P. Un problème de la théorie des automates. Séminaire Dubreil- Pisot, Institut Henri Poincaré, Paris, 1959. |lî| SC.MIIT/KNJIKHGKR, M. P. A remark on finite transducers. Information and Conlrol, •1, 1961, pp. 185-196. |3| SciiurzKNiiKiKiKn, M. P. On Context-Frce Languages and Pushdown Aulotiuila. /n/orinaliim and Control, fi-3, 1963. WICI.I.N, H. Immédiate Constituent*. Languiujc, vol. 2.'t, 1!M7, pp. SI-117. UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE AUX DESCRIPTIONS SYNTAXIQUES * Le but de cet article est de présenter les grandes lignes d'une méthode de description syntaxique, qui est nouvelle par le fait qu'elle amalgame les méthodes du logicien polonais Kasimir Ajdukiewiez [1] d'une part, et celles des linguistes structuralistes américains d'autre part [4] [5]. Il ne semble pas qu'une telle combinaison ait déjà été essayée, peut-être pour la raison que le travail d'Ajdukiewiez a été publié dans une revue polonaise de philosophie, et qu'il est donc demeuré inconnu de la plupart des linguistes. Nous ne nous intéressons pas ici au développement d'une méthode qu'un linguiste pourrait utiliser pour obtenir l'analyse d'un corpus lin- guistique, mais seulement à une nouvelle manière de présenter les résultats des recherches. La différence fondamentale entre cette méthode et celles qui sont encore en usage, repose dans le fait que, mis à part une liste, où à chaque élément linguistique (habituellement chaque mot) sont attribuées une ou plusieurs catégories, il nous suffit d'une règle simple de type quasi arithmétique, pour «calculer» le caractère syntaxique de toute séquence linguistique donnée (suite d'un ou plusieurs éléments), dans son contexte. La principale économie réalisée nous permet, en principe, de nous passer de descriptions syntaxiques spéciales. Ceci devrait être intéressant dans les cas où l'on a besoin d'une, pro- cédure entièrement mécanique pour déterminer la structure syntaxique d'une séquence donnée. En traduction automatique, par exemple, on se trouve dans une telle situation. On a vu [2] qu'on pourrait construire une machine capable de déterminer la structure d'une phrase, quelconque d'une langue source, si la syntaxe de cette langue pouvait être donnée à lu machine sous une forme spéciale que nous pouvons appeler opérationnelle. Il est fort possible que la préparation de la liste des éléinenls etdeHeulû- gories soit une étape décisive de la construction d 'u n e syntaxe operullon- * Cet article! n paru en anglais dans Lanijuagc, vol. 29, I95.'l, pp. 47TiH, II M AIA reproduit dans Language. and Information, Selcrlrd Kssïiys on lliclr Tlliwy mut A|>|l||. ration, Y. Har-llÙlcl, Addison-Wcsli-y et .In-nsiilom Aoudt-mlc l'ri'dll, \Mi\, NlMI» irmrivioiis In Société de Llnuuisl i<|iir d'Améi iqur qui mur, M milni'M A !>' |nilill|i|' «II fnmcnls. r V. BIBLIOGRAPHIE

Upload: vuongmien

Post on 02-Feb-2018

220 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966

HriMiMi 11:1.1», !.. Language. Henry Holt and Go, New York, 1933. | l | C. I I I IMNUY. N. Simlactic Structures. Mouton, The Hague, 1957. |'.'.| C I K I M S K V , N. Kxplanatory Models in Linguistics. Actes du Congrès international

île Logique, Méthodologie et Philosophie des Sciences. Stanford University Press, I960, pp. 528-550. |:t| CI I OMS KY, N. On certain formai properties of

grammars. Information and Contrat, 1959-1962, pp. 137-167. | l| CIIOMSKY, N. Aspects of thé Theory of Syntax. M. I.

T. Press, Cambridge, Mass., 1965. < | A I U > I N , J. G. Syntol. Rutgers, The State University Press, New

Brunswick, N. ,1., 1965. ( îAi i 'MAN, H. Dependency Systems and phrase structure Systems.

Information and Control, 8, 1965, pp. 304-337. (iuoss, M. On thé Equivalence of Models of

Languages used in thé Fields of Mecha- nical Translation and Information Retrieval. Information Storage and Retrie- val, vol. 2, pp. 43-57. (iisoss, M., LENTIN, A. Notions sur les grammaires

formelles. Gauthier-Villars, Paris, 1967.

|1] HARRIS, Z. S. Methods in Structural Linguistics. Chicago, 1951. [21 HARRIS, Z. S. Discourse Analysis. Language, 28, 1952. [3] HARRIS, Z. S. Co-occurrence and Transformations in Linguistic Structure. Language, 33, 1957, pp. 283-340. [4| HAHRIS, Z. S. A cycling cancellation automaton for sentence well-formedness.

/. C. G. Bulletin, vol. 5, n» 2, April-June, 1966. [5| HARRIS, Z. S. Mathematical structures of language. A paraître 1968. HOCKETT, C. F. Two models of grammatical description. Readings in Linguistics.

Washington, 1957. KLEENE, S. C. Représentation of events in nerve nets and flnite automata, in

C. E. Shannon et J. C. McCarthy (Eds), Automata Studies. Princeton University Press, 1956, pp. 3-41.

KURODA, S. Y. Attachment Transformations (ronéotypé). M. I. T., 1965. LECERF, Y. Une représentation algébrique de la structure des phrases dans diverses

langues naturelles. C. R. Acad. Sciences, 252, n° 2, Paris, 1961, p. 232. LEES, R. B. The grammar of english nominalizations. Mouton, La Haye, 1960. MARCUS, S. Algebraic Linguistics; Analytical Models. Académie Press, New York, 1967. M ARGUS, S., NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica,

1966. NIVAT, M. Transductions de Langages de Chomsky Thèse de doctorat (à paraître). POSTAL, P. Constituent Structure : a study of contemporary models of syntactic description. Mouton, La Haye, 1964. KLIVZIN, I. I. Modeli Yazika. Moscou, 1961, 191 p. Ross, J. A proposed rule for tree pruning (ronéotypé). M. I. T., 1965. (1) RUWET, N. La grammaire générative. Langages, n° 4, déc. 1966, Didier-Larousse. |2] RUWET, N. Introduction à la grammaire générative. Pion, Paris, 1967. SCIIAUMIAN, S. K., SOBOLEVA, P. A. Applicativnaja porozdajuscaja model' iscislenie

iransformacy v russkom jazike, Izdat. ANSSR, Moscou, 1963. ScitAUMYAN, S. K. Strukturnaya lingvistika Nauka. Moscou, 1965. SHANNON, G. E., WEAVER, W. The mathematical theory of communication. Urbana,

University of Illinois Press, 1949. 111 Sr.iiUTZKNBKRGER, M. P. Un problème de la théorie des automates. Séminaire Dubreil-

Pisot, Institut Henri Poincaré, Paris, 1959. |lî| SC.MIIT/KNJIKHGKR, M. P. A remark on finite transducers. Information and Conlrol,

•1, 1961, pp. 185-196. |3| SciiurzKNiiKiKiKn, M. P. On Context-Frce Languages and Pushdown Aulotiuila.

/n/orinaliim and Control, fi-3, 1963. WICI.I.N, H. Immédiate Constituent*. Languiujc, vol. 2.'t, 1!M7, pp. SI-117.

UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE AUX DESCRIPTIONS SYNTAXIQUES *

Le but de cet article est de présenter les grandes lignes d'une méthode de description syntaxique, qui est nouvelle par le fait qu'elle amalgame les méthodes du logicien polonais Kasimir Ajdukiewiez [1] d'une part, et celles des linguistes structuralistes américains d'autre part [4] [5]. Il ne semble pas qu'une telle combinaison ait déjà été essayée, peut-être pour la raison que le travail d'Ajdukiewiez a été publié dans une revue polonaise de philosophie, et qu'il est donc demeuré inconnu de la plupart des linguistes.

Nous ne nous intéressons pas ici au développement d'une méthode qu'un linguiste pourrait utiliser pour obtenir l'analyse d'un corpus lin-guistique, mais seulement à une nouvelle manière de présenter les résultats des recherches. La différence fondamentale entre cette méthode et celles qui sont encore en usage, repose dans le fait que, mis à part une liste, où à chaque élément linguistique (habituellement chaque mot) sont attribuées une ou plusieurs catégories, il nous suffit d'une règle simple de type quasi arithmétique, pour «calculer» le caractère syntaxique de toute séquence linguistique donnée (suite d'un ou plusieurs éléments), dans son contexte. La principale économie réalisée nous permet, en principe, de nous passer de descriptions syntaxiques spéciales.

Ceci devrait être intéressant dans les cas où l'on a besoin d'une, pro-cédure entièrement mécanique pour déterminer la structure syntaxique d'une séquence donnée. En traduction automatique, par exemple, on se trouve dans une telle situation. On a vu [2] qu'on pourrait construire une machine capable de déterminer la structure d'une phrase, quelconque d'une langue source, si la syntaxe de cette langue pouvait être donnée à lu machine sous une forme spéciale que nous pouvons appeler opérationnelle. Il est fort possible que la préparation de la liste des éléinenls etdeHeulû-gories soit une étape décisive de la construction d'une syntaxe operullon-

* Cet article! n paru en anglais dans Lanijuagc, vol. 29, I95.'l, pp. 47TiH, II M AIA reproduit dans Language. and Information, Selcrlrd Kssïiys on lliclr Tlliwy mut A|>|l||. ration, Y. Har-llÙlcl, Addison-Wcsli-y et .In-nsiilom Aoudt-mlc l'ri'dll, \Mi\, NlMI» irmrivioiis In Société de Llnuuisl i<| iir d'Améi iqur qu i mur, M milni'M A !>' |nilill|i|' «II fnmcnls.

r

V.

BIBLIOGRAPHIE

Page 2: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966

10

nelle. dont les instructions seraient appliquées de manière satisfaisante par un ca lcula teur digital, ou bien par un opérateur humain qui agirait de l'nrim entièrement mécanique.

A v a n t d e donner une description abstraite de cette nouvelle méthode, IKHIH discuterons un exemple simple. La séquence de l'anglais : Poor John slir/is sera// analysée selon une méthode récemment décrite [5], de la manière suivante. : poor est un A (adjectif), John est un N (nom), sleep est un V (verbe),-s est un Vv (morphème ajouté à un verbe afin de former un groupe verbal), et toutes ces étiquettes sont valables au moins pour le contexte donné. Ainsi en utilisant les descriptions syntaxiques A ~ N -> N1 (où l'arche désigne la concaténation et où la flèche signifie devient) et V ~ Vv -> V, à Poor John serait attribuée la classe N, à sleeps, V,donc,Poor John sleeps serait N ~ V, qui estlaformede phrase anglaise la plus fréquente.

D'après les notations proposées et expliquées dans cet article, John appartiendra à la catégorie n, poor à n/[n], sleeps à s/(n) où : n est à inter-préter comme la catégorie des séquences de type : nom, n/[n] comme la catégorie des séquences qui, lorsqu'elles ont un n à leur droite constituent une séquence qui appartient à cette même catégorie n, et s/(n) comme la catégorie des séquences qui lorsqu'elles ont un n à leur gauche, constituent une séquence appartenant à la catégorie des phrases. On peut vérifier mécaniquement, sans utiliser de description syntaxique, que la séquence Poor John sleeps est une phrase; on utilisera pour cela une opération voisine de la multiplication des fractions arithmétiques qui sera appliquée à l'index de séquence qui correspond à la séquence donnée :

11

(2') n/[n] s

qu'il n'est plus possible de dériver, ce qui montre (par le fait que la der-nière dérivée, ou exposant n'est pas, dans ce cas, formée d'un seul index) que la séquence entière, si elle est analysée de cette manière, n'est pas syntaxiquement connexe. En fait, nous sommes autorisés à dire que si Poor John sleeps est une séquence syntaxiquement connexe, alors John sleeps n'est pas un de ses constituants.

Remarquons encore qu'une liste d'éléments complète et qui possède le caractère indiqué, nous permet d'effectuer la synthèse de toutes les phrases possibles d'une langue donnée, sans aucune autre règle supplémentaire. Considérons, par exemple, une langue qui contient des éléments appartenant respectivement aux catégories n, nj[n], nj[s], et s/(n)[n] (la catégorie des séquences qui, avec n à gauche et n à droite, constituent des phrases). Nous savons que toute séquence syntaxiquement connexe d'éléments appartenant à n, s/(n)[n], /z/[s], n, s/(n)[n], n/[n], n/[n], n, pris dans cet ordre constituera une phrase, puisque le seul exposant est s; on peut le voir sur la dérivation suivante : (4) n s/(n)[n] n/[s] n s/(n)[n] n/[n] n/[n] n (5) n s/(n)[n] n/[s] n s/(n)[n] n/[n] n (6) n s/(n)[n] n/[s] n s/(n)[n] n (7) n s/(n)[n] n/[s] s (8) n s/(n)[n]n s

n/[n] n s/(n) En réduisant la sous-séquence n/[n] n à n, nous obtenons la

dérivée premier» N s/(n)

à partir de celle-ci, par une autre réduction, nous obtenons la seconde et dernière dérivée : (3) s.

Remarquons tout de suite un autre avantage de notre notation : nous avons non seulement une méthode mécanique pour vérifier la conncxilc syntaxique d'une séquence donnée, mais également une méthode mécanique pour découvrir ce qu'on appelle les constituants de toute séquence donnée qui est syntaxiquement connexe. Dans notre exemple nous voyons d'un simple coup d'œil que John sleeps n'est pas un constituant de Poor John slct-ps (bien que John sle.eps soit connexe), puisqu'on réduisant d'abord m'/(«) à s, nous aboutirions à la dérivée :

Vérifier si toutes ces catégories appartiennent à une langue donnée est, bien entendu, un problème empirique. Pour l'anglais, par exemple, on pourrait, en gros, répondre que oui. En fait, John knew thatPaul was a poor man serait une phrase du type mentionné. (La restriction « en gros « est nécessaire, étant donné qu'il est évident que les catégories utilisées ci-dessus sont trop grossières pour pouvoir être appliquées à des langue; naturelles; une telle application conduirait à accepter Man knew that John was poor a Paul comme phrase, ce que la plupart des gens hésiteraiI à faire). Il en est de même pour le français, où nous avons des phrases comme Jean savait que Paul était un pauvre homme, mais pas pour l'allemand qui ne possède pas la catégorie n/[s] (au moins à un niveau élémentaire où Paul war ein armer Mann et Paul ein armer Mann war ne, sont pas automatiquement des variantes d'une même phrase, mais où la première séquence, seule est une phrase, alors que la seconde est syntaxiquement non connexe).

Ces premières considérations devraient suffire à montrer que. L’attribution de catégories syntaxiques au moyen de tels symboles (qu i comportent, pour ainsi dire, des indications sur les contextes dans lesquels les membres de ces catégories apparaissent.) est une méthode supérieure

0)

(2)

Page 3: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966
Page 4: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966
Page 5: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966
Page 6: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966
Page 7: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966
Page 8: UNE NOTATION QUASI ARITHMÉTIQUE DESTINÉE …lecomte.al.free.fr/ressources/PARIS8_LSL/bh8.pdf · NICOLAU, Ed-S. Introducere in lingvistica matematcâ. Editura stiintifica, 1966