etap overview rus

112
Лингвистический процессор ЭТАП-3: компьютерная реализация модели «Смысл Текст» ETAP-3 Linguistic Processor: an NLP Implementation of the Meaning Text Theory Л.Л.Иомдин Институт проблем передачи информации им А.А.Харкевича РАН

Upload: yaevents

Post on 05-Jul-2015

1.828 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Etap overview rus

Лингвистический процессор ЭТАП-3: компьютерная реализация модели

«Смысл Текст»

ETAP-3 Linguistic Processor: an NLP Implementation

of the Meaning Text Theory

Л.Л.Иомдин

Институт проблем передачи информации им А.А.Харкевича РАН

Page 2: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 2

План доклада

1. Введение и общий обзор лингвистического процессора

2. Система машинного перевода ЭТАП-33. Некоторые уроки этой системы для

специалистов в области информатики и лингвистов

Page 3: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 3

Теоретические основы

И.А.Мельчук

Лингвистическая модель «Смысл ⇔ Текст»

Ю.Д.Апресян

Системная лексикография и теория интегрального описания языка

Page 4: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 4

Основные компоненты ЛП ЭТАП-3

Машинный перевод Глубоко аннотированные корпусы текстов Система перевода, основанная на

Универсальном сетевом языке UNL Компьютерный учебник лексики Синонимическое перифразирование Сопряжение семантики и онтологии Речевой синтез Языковой интерфейс к базам данных типа SQL Синтаксический корректор

Page 5: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 5

Основные особенности лингвистического процессора ЭТАП-3

• Информатика• Правиловый подход• Самонастройка системы на обрабатываемый

текст• Максимальное использование лингвистических

ресурсов в разных приложениях (reusability)• Лингвистика

• Строгое разделение языковых уровней• Структура синтаксических зависимостей• Лексикалистский подход

Page 6: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 6

Машинный перевод Русский ⇔ Английский

Морфологические словари объемом 130000 слов Комбинаторные словари объемом 100,000 слов

Русско-немецкий прототип Русско-французский прототип Русско-корейский прототип Русско-испанский прототип Англо-арабский прототип

Page 7: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 7

Объекты Этапы Словари

Входное предложение

Расширение

Морфологичес-кий анализ

Морфологический словарь входного языка

Комбинаторный словарь

входного языка

ПарсингВходнаяМорфС

ВходнаяСинтС

Нормализация

Входная НормС

Трансфер

Комбинаторныйсловарь

выходного языка

ВыходнаяНормС

Синтаксическийсинтез

Морфологичес-кий синтез

Морфологический словарь

входного языка

Общая архитектура процесса перевода

ВыходнаяСинтС

ВыходнаяМорфС

Выходное предложение

Page 8: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 8

Особенности системы МП ЭТАП-31. Множественный перевод

They made a general remark that …

(a) ‘they remarked in a general way that…’

(b) ‘they forced a general to remark that…’

Page 9: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 9

Неоднозначное английское предложение

He made a general remark that everything was OK

Page 10: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 10

Первый вариант древесной СинтС

Page 11: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 11

Второй вариант древесной СинтС

Page 12: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 12

Неоднозначное русское предложение

Моих друзей звали Иван и Петр

Page 13: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 13

Первый вариант СинтС

Page 14: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 14

Второй вариант СинтС

Page 15: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 15

Особенности системы МП ЭТАП-3: Интерактивность

Page 16: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 16

Самонастройка: Грамматика и словарь

• Общие закономерности: общие правила, применяемые к большим классам слов и используемые во всяком предложении Пример: согласование Adj + N

• Менее общие закономерности: конкретные правила, применяемые к замкнутым классам слов и имеющие ограниченную встречаемость. Пример 1: составные числительные Пример 2: длительные конструкции

Page 17: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 17

Особенности системы МП ЭТАП-3: Широкое использование лексических функций

• MAGN (disease) = grave• MAGN (fog) = heavy • MAGN (control) = strict

• MAGN (болезнь) = тяжелый• MAGN (туман) = густой

• MAGN (контроль) = строгий

Page 18: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 18

Свойства лексических функций• Универсальность• Внутриязыковая идиоматичность

grave disease, heavy fog *heavy disease, *grave fog.

• Межъязыковая идиоматичность тяжелая болезнь ‘heavy disease’ густой туман ‘dense fog’

Page 19: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 19

Практическое применение ЛФ в машинном переводе и в других опциях ЛП

• Разрешение лексической и синтаксической неоднозначности при синтаксическом анализе

• Идиоматичный перевод устойчивых выражений

• Синонимическое перифразирование

Page 20: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 20

Разрешение лексической неоднозначности

to draw a distinction – проводить различие

Оба глагола весьма многозначны: draw – свыше 50 значений проводить’ – более 10 значений

Page 21: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 21

Разрешение синтаксической неоднозначности

• support of the parliament ‘support by the parliament’ ‘support (given) to the parliament’

В лексико-функциональных контекстах синтаксические связи дизамбигуируются:

• The president had [Y=OPER2(X)] the support[X] of the parliament

• The president expressed [Y=OPER1(X)] full support [X] of the parliament

Page 22: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 22

Идиоматичный перевод:LF Temp

• March: in – март: в2• Tuesday: on – вторник: в1• dawn: at – рассвет: на2

• moment: at – момент: в1• Easter: at – пасха: на1

Page 23: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 23

Синонимическое перифразирование высказываний

• The United Nations ordered Iraq a report on chemical weapons

• the United Nations gave Iraq an order to write a report on chemical weapons

• Iraq was ordered by the United Nations to write a report on chemical weapons

• Iraq received an order from the United Nations to write a report on chemical weapons

Page 24: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 24

Синонимическое перифразирование высказываний

• X = CONV12 (X)

This group consists of 20 people –

Twenty people comprise this group;

• X + Y = ANTI1(X) + ANTI2(Y)

He began to observe the rules –

He stopped violating the rules

• X = LABOR12 + S0(X)

He respects his parents –

He treats his parents with respect

Page 25: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 25

Какова высота Пизанской башни?

Пизанская башня имеет в высоту 56 метров.

Пизанская башня возвышается на 56 метров.

Высота Пизанской башни составляет 56 метров.

Высота Пизанской башни равняется 56 метрам.

Высота Пизанской башни равна 56 метрам.

Высота Пизанской башни достигает 56 метров.

Пизанская башня – сооружение высотой в 56 метров.

Синонимическое и квазисинонимическое перифразирование высказываний

Page 26: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 26

How high is the tower of Pisa? How tall is the tower of Pisa? What is the height of the tower of Pisa?

The tower of Pisa is 56 meters high <tall>.The tower of Pisa stands 56 meters high <tall>.The tower of Pisa stands at 56 meters high <tall>. The tower of Pisa rises 56 meters.The tower of Pisa measures 56 meters in height. The height of the tower of Pisa is 56 meters.The height of the tower of Pisa is equals to 56 meters.The height of the tower of Pisa amounts to 56 meters. The tower of Pisa is a 56 meter high <tall> structure.The 56 meter high <tall> tower of PisaThe height of the tower of Pisa reaches 56 meters. The height of the tower of Pisa achieves 56 meters.

Синонимическое и квазисинонимическое перифразирование высказываний

Page 27: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 27

Какова высота X? - X имеет в высоту Num.X возвышается на Num.Высота X составляет Num.Высота X равняется Num.Высота X равна Num.Высота X достигает Num.X - сооружение высотой в Num.X высотой в Num.

Синонимическое перифразирование как средство совершенствования поиска в

поисковых машинах

Page 28: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 28

Лексикалистский подход:Богатство используемых словарейВажное понятие синтаксического

признака

Page 29: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 29

Образец словарной статьи (фрагмент): CHANCE

CHANCE1POR:SSYNT:COUNT,PREDTO,PREDTHATDES:'FACT','ABSTRACT’

Page 30: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 30

CHANCED1.1:OF,'PERSON'D2.1:OF,'FACT'D2.2:TO2D2.3:THAT1

Page 31: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 31

CHANCESYN1: OPPORTUNITYMAGN: GOOD1, FAIR1, EXCELLENTANTIMAGN: SLIGHT, SLIM, POOR,

LITTLE1, SMALLOPER1: HAVE, STAND1REAL1-M: TAKE

Page 32: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 32

CHANCEANTIREAL1-M: MISS1INCEPOPER1: GETFINOPER1: LOSECAUSFUNC1: GIVE <TO1>ZONE:R TRANS:ШАНС/СЛУЧАЙ

Page 33: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 33

CHANCE

REG:TRADUCT2.00TAKE:XLOC:RR:COMPOS/MODIF/POSSESCHECK1.1 DEP-LEXA(X,Z,PREPOS,BY1)N:01CHECK1.1 DOM(X,*,R)DO1 ZAMRUZ:Z(ПО1)2 ZAMRUZ:X(СЛУЧАЙНОСТЬ’)

Page 34: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 34

CHANCE

N:02CHECK2.1 DOM(X,*,*)DO1 ZAMRUZ:Z(СЛУЧАЙНО)2 STERUZ:X

TRAF:RA-EXPANS.16LA:THAT1TRAF:RA-EXPANS.22

Page 35: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 35

Мне безразлично, придет ли он.Мне безразлично, придет он или нет.Мне безразлично, кто придет.Мне безразлично, когда он придет.

*Мне странно, придет ли он.

*Мне странно, придет он или нет.

*Мне странно, кто придет.

*Мне странно, когда он придет.

Синтаксические признаки

Page 36: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 36

Мне безразлично, придет ли он.Мне безразлично, придет он или нет.Мне безразлично, кто придет.Мне безразлично, когда он придет.

безразлично = ПРЕДВОПР

Синтаксические признаки

Page 37: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 37

*Мне странно, придет ли он.*Мне странно, придет он или нет.*Мне странно, кто придет.*Мне странно, когда он придет.

странно ≠ ПРЕДВОПР

Синтаксические признаки

Page 38: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 38

?Мне безразлично, что он не пришел

Мне странно, что он не пришел.

Синтаксические признаки

Page 39: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 39

странно = ПРЕДЧТО

Мне странно, что он не пришел.

Синтаксические признаки

Page 40: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 40

безразлично ≠ ПРЕДЧТО

?Мне безразлично, что он не пришел.

Синтаксические признаки

Page 41: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 41

БЕЗРАЗЛИЧНЫЙ1

COMMENT:"НЕ ИМЕЮЩИЙ ЗНАЧЕНИЯ"

EXAMPLE:"МНЕ БЕЗРАЗЛИЧНО, КОГО ВЫБЕРУТ ПРЕДСЕДАТЕЛЕМ"

POR:A ЛИ

SYNT:КАЧЕСТВ,СИНТЕТ,ПРЕДКОГДА,ПРЕДВОПР

D2.1:ДАТ,'ЛИЦО'

TRAF:1-КОМПЛ.20

TRAF:1-КОМПЛ.21

TRAF:ПРЕДИК.19

****************************

ZONE:A

…..

Синтаксические признаки

Page 42: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 42

БЕЗРАЗЛИЧНЫЙ2

COMMENT:"РАВНОДУШНЫЙ (INDIFFERENT)"

EXAMPLE:"ОНА КО ВСЕМУ БЕЗРАЗЛИЧНА"

POR:A АЛ

SYNT:КАЧЕСТВ,СИНТЕТ

D2.1:К

****************************

ZONE:A

TRANS:INDIFFERENT

…..

Синтаксические признаки

Page 43: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 43

СТРАННЫЙ

POR:A АЛ

SYNT:КАЧЕСТВ,ПРЕДИНФ,ПРЕДКОГДА,ПРЕДЧТО,СИНТЕТ

D2.2:ДАТ

TRAF:1-КОМПЛ.20

TRAF:1-КОМПЛ.21

TRAF:ПРЕДИК.19

****************************

ZONE:A

TRANS:STRANGE

Синтаксические признаки

Page 44: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 44

Еще о синтаксических признаках

Признаки серии «пред» (“ПРЕДЧТО” и “ПРЕДЧТОБЫ”)

Признаки ВВОД-1 и ВВОД-2

Признак ДАТПОС.

Признаки *СОВ-1, *СОВ-2, *СОВ-3

Page 45: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 45

Признаки "предчто" и "предчтобы".Собственное управление слова и синтаксические признаки слова

(1) Жаль, что вас не было с нами.(2а) Я сомневаюсь, что он придет вовремя <чтобы

он пришел вовремя, придет ли он вовремя>.(2б) Что он придет вовремя <чтобы он пришел

вовремя>, сомнительно.(2в) Сомнительно, что он придет вовремя <чтобы

он пришел вовремя>.(3а) *Что он придет вовремя <чтобы он пришел

вовремя>, (было) сомнение.(3б) Что он придет вовремя <чтобы он пришел

вовремя>, вызывает (большое) сомнение.

Page 46: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 46

Признаки "предчто" и "предчтобы".Собственное управление слова и синтаксические признаки слова

Представляется невероятным, чтобы он решил уехать.

Я считаю невероятным, чтобы он решил уехать

Page 47: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 47Лекция 6. 47

Признаки "предчто" и "предчтобы".Собственное управление слова и синтаксические признаки слова

(а) Для поездки за границу необходимы деньги.

(б) Чтобы поехать за границу, необходимы деньги.

(в) Для поездки за границу необходимо, чтобы были деньги.

(г) Чтобы поехать за границу, необходимо, чтобы были деньги.

19 октября 2010 г.

Page 48: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 48

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

(а) Оказалось, что президент тяжело болен.

(б) Как оказалось [=ВВОД-1], президент тяжело болен.

(в) Президент, оказалось [=ВВОД-1], тяжело болен.

Page 49: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 49

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

олучается <выходит>, что мои усилия были напрасны.

олучилось <вышло>, что мои усилия были напрасны.

олучаться, выходить – имеют признак ВВОД-1 или нет?

ои усилия, получается <выходит>, были напрасны.

?Как получается <выходит>, мои усилия были напрасны.

? Мои усилия, получилось, были напрасны.

Как получилось, мои усилия были напрасны.

Page 50: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 50

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

олагается, чтобы школьники приходили в бассейн в резиновых шапочках.

сть ли у полагаться признак ВВОД-1?

ак полагается, школьники пришли в бассейн в резиновых шапочках.

кольники, как полагается, пришли в бассейн в резиновых шапочках.

Школьники, полагается, пришли в бассейн в резиновых шапочках.

озможно, требуется более высокая зернистость признаков

Page 51: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 51

(1а) Мы знаем, что металлы при нагревании расширяются, а при охлаждении сжимаются.

(1б) Как мы знаем [=ВВОД-2], металлы при нагревании расширяются, а при охлаждении сжимаются.

(1в) Металлы, мы знаем [=ВВОД-2], при нагревании расширяются, а при охлаждении сжимаются.

(2а) Вы знаете, что металлы при нагревании расширяются, а при охлаждении сжимаются.

(2б) Как вы знаете [=ВВОД-2], металлы при нагревании расширяются, а при охлаждении сжимаются.

(2в) Металлы, вы знаете [=ВВОД-2], при нагревании расширяются, а при охлаждении сжимаются.

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

Page 52: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 52

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

3а) Каждый школьник знает, что металлы при нагревании расширяются, а при охлаждении сжимаются.

3б) Как знает [=ВВОД-2] каждый школьник, металлы при нагревании расширяются, а при охлаждении сжимаются.

3в) ??Металлы, знает [=ВВОД-2] каждый школьник, при нагревании расширяются, а при охлаждении сжимаются.

Page 53: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 53

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

(а) Мы думали, что поезда в это время ходят каждый час.

(б) Как мы (и) думали [=ВВОД-2], поезда в это время ходили каждый час.

(в) ??Поезда в это время, мы думали [=ВВОД-2], ходили каждый час.

Возможно, требуется более высокая зернистость признаков

Page 54: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 54

Признаки "ВВОД-1" и "ВВОД-2".Точность определения

(1а) Мы сомневались, что поезда в это время ходят каждый час.

(1б) *Поезда в это время, мы сомневались [≠ВВОД-2], (не) ходят каждый час.

(1в) *Как мы (и) сомневались [≠ВВОД-2], поезда в это время (не) ходят каждый час.

(2а) Мы не сомневались, что поезда в это время ходят каждый час.

(2б) Поезда в это время, мы не сомневались, ходят каждый час.

(2в) Как мы (и) не сомневались, поезда в это время (не) ходят каждый час.

Page 55: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 55

Признак ДАТПОС

(1а) Охотник посмотрел в глаза тигра. (1б) Охотник посмотрел [=ДАТПОС] тигру в глаза. (2а) Мальчик погладил спину дога. (2б) Мальчик погладил [=ДАТПОС] догу спину.(3а) Я заглянул [=ДАТПОС] тигру [=ОДУШ] в глаза.(3б) *Я заглянул [=ДАТПОС] дому [#ОДУШ] в окна.(4а) Мальчик потрогал спину дога.(4б) ?Мальчик потрогал догу спину.(5а) Мальчик прикоснулся к спине дога.(5б) *Мальчик прикоснулся догу к спине.

Page 56: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 56

Признак ДАТПОС

(6а) Хирург удалил <вырезал> [=ДАТПОС] больному опухоль.

(6б) ?Хирург удалил опухоль больного.(6в) ??Хирург вырезал опухоль больного.(7а) Я поранил [=ДАТПОС] себе руку. (7б) *Я ранил [#ДАТПОС] себе руку. (7в) Я ранил себя в руку.

Page 57: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 57

Признаки *СОВ-1, *СОВ-2, *СОВ-3

*СОВ-1: надоесть, опротиветь, понравиться, разонравится, наскучить, хватить (хватит болтать), будет (тебе дуться)

Page 58: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 58

*СОВ-2: отвыкнуть, привыкнуть, устать, научиться, полюбить, разлюбить, передумать, раздумать, наловчиться, насобачиться, не миновать (тебе сидеть в тюрьме), давайте (работать)

Признаки *СОВ-1, *СОВ-2, *СОВ-3

Page 59: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 59

*СОВ-3: отучать, приучать, натаскивать

Признаки *СОВ-1, *СОВ-2, *СОВ-3

Page 60: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 60

Понятие синтагмы

REG:АГЕНТ.10 ТРАФАРЕТНОЕ НА VAL(1,X,S,ТВОР): ПРИЕМ ДЕЛЕГАЦИИN:01 ПРЕЗИДЕНТОМCHECK1.1 VAL(1,X,ТВОР)1.2 R-EQU(X,Y,8,ТВОР)&^#(Y,S,A)&#(Y,ОТР)&#(Y,ОТР-НЕ)&^ININT(X,Y,СОЧ)1.3 #(Y,S)/=(Y,АГЕНС)/=(Y,'КРИСТАЛЛ')/=(Y,МЕСТ)1.4 =(Y,S)/R-LEXR(Y,*,2,ИЗ)2.1 LEXR(Y,ТО3,ЧТО2)3.1 =(Y,S)/DOM(Y,*,ЭЛЕКТИВ)4.1 =(Y,ЛИЧН)&DOM(X,Z1,1-КОМПЛ)&^ORD(X,Y,Z1)4.2 DOM-NEQU(X,*,1-КОМПЛ,РОД)4.3 DEP-EQU(X,W,1-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_OPER1)4.4 DEP-EQU(X,W,2-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_LABOR1-2)DO1 SVUZOT:(X,Y,АГЕНТ)

Page 61: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 61

Группы условий синтагмы

REG:АГЕНТ.10 ТРАФАРЕТНОЕ НА VAL(1,X,S,ТВОР): ПРИЕМ ДЕЛЕГАЦИИN:01 ПРЕЗИДЕНТОМCHECK1.1 VAL(1,X,ТВОР)1.2 R-EQU(X,Y,8,ТВОР)&^#(Y,S,A)&#(Y,ОТР)&#(Y,ОТР-НЕ)&^ININT(X,Y,СОЧ)1.3 #(Y,S)/=(Y,АГЕНС)/=(Y,'КРИСТАЛЛ')/=(Y,МЕСТ)1.4 =(Y,S)/R-LEXR(Y,*,2,ИЗ)2.1 LEXR(Y,ТО3,ЧТО2)3.1 =(Y,S)/DOM(Y,*,ЭЛЕКТИВ)4.1 =(Y,ЛИЧН)&DOM(X,Z1,1-КОМПЛ)&^ORD(X,Y,Z1)4.2 DOM-NEQU(X,*,1-КОМПЛ,РОД)4.3 DEP-EQU(X,W,1-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_OPER1)4.4 DEP-EQU(X,W,2-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_LABOR1-2)DO1 SVUZOT:(X,Y,АГЕНТ)

Первая и вторая группы – линейные условия

Page 62: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 62

Группы условий синтагмы

REG:АГЕНТ.10 ТРАФАРЕТНОЕ НА VAL(1,X,S,ТВОР): ПРИЕМ ДЕЛЕГАЦИИN:01 ПРЕЗИДЕНТОМCHECK1.1 VAL(1,X,ТВОР)1.2 R-EQU(X,Y,8,ТВОР)&^#(Y,S,A)&#(Y,ОТР)&#(Y,ОТР-НЕ)&^ININT(X,Y,СОЧ)1.3 #(Y,S)/=(Y,АГЕНС)/=(Y,'КРИСТАЛЛ')/=(Y,МЕСТ)1.4 =(Y,S)/R-LEXR(Y,*,2,ИЗ)2.1 LEXR(Y,ТО3,ЧТО2)3.1 =(Y,S)/DOM(Y,*,ЭЛЕКТИВ)4.1 =(Y,ЛИЧН)&DOM(X,Z1,1-КОМПЛ)&^ORD(X,Y,Z1)4.2 DOM-NEQU(X,*,1-КОМПЛ,РОД)4.3 DEP-EQU(X,W,1-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_OPER1)4.4 DEP-EQU(X,W,2-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_LABOR1-2)DO1 SVUZOT:(X,Y,АГЕНТ)

Третья и четвертая группы – древесные условия

Page 63: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 63

Группы условий синтагмы

REG:АГЕНТ.10 ТРАФАРЕТНОЕ НА VAL(1,X,S,ТВОР): ПРИЕМ ДЕЛЕГАЦИИN:01 ПРЕЗИДЕНТОМCHECK1.1 VAL(1,X,ТВОР)1.2 R-EQU(X,Y,8,ТВОР)&^#(Y,S,A)&#(Y,ОТР)&#(Y,ОТР-НЕ)&^ININT(X,Y,СОЧ)1.3 #(Y,S)/=(Y,АГЕНС)/=(Y,'КРИСТАЛЛ')/=(Y,МЕСТ)1.4 =(Y,S)/R-LEXR(Y,*,2,ИЗ)2.1 LEXR(Y,ТО3,ЧТО2)3.1 =(Y,S)/DOM(Y,*,ЭЛЕКТИВ)4.1 =(Y,ЛИЧН)&DOM(X,Z1,1-КОМПЛ)&^ORD(X,Y,Z1)4.2 DOM-NEQU(X,*,1-КОМПЛ,РОД)4.3 DEP-EQU(X,W,1-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_OPER1)4.4 DEP-EQU(X,W,2-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_LABOR1-2)DO1 SVUZOT:(X,Y,АГЕНТ)

Первая и третья группы – необходимые условия

Page 64: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 64

Группы условий синтагмы

REG:АГЕНТ.10 ТРАФАРЕТНОЕ НА VAL(1,X,S,ТВОР): ПРИЕМ ДЕЛЕГАЦИИN:01 ПРЕЗИДЕНТОМCHECK1.1 VAL(1,X,ТВОР)1.2 R-EQU(X,Y,8,ТВОР)&^#(Y,S,A)&#(Y,ОТР)&#(Y,ОТР-НЕ)&^ININT(X,Y,СОЧ)1.3 #(Y,S)/=(Y,АГЕНС)/=(Y,'КРИСТАЛЛ')/=(Y,МЕСТ)1.4 =(Y,S)/R-LEXR(Y,*,2,ИЗ)2.1 LEXR(Y,ТО3,ЧТО2)3.1 =(Y,S)/DOM(Y,*,ЭЛЕКТИВ)4.1 =(Y,ЛИЧН)&DOM(X,Z1,1-КОМПЛ)&^ORD(X,Y,Z1)4.2 DOM-NEQU(X,*,1-КОМПЛ,РОД)4.3 DEP-EQU(X,W,1-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_OPER1)4.4 DEP-EQU(X,W,2-КОМПЛ,V)&#(W,СТРАД)&CORLF(X,W,_LABOR1-2)DO1 SVUZOT:(X,Y,АГЕНТ)

Вторая и четвертая группы – невозможные условия

Page 65: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 65

Проективность СинтС и парсинг для машинного перевода

В моих руках оно подобно будетКлючу от брошенной шкатулки в море.

Пушкин, Скупой рыцарь

Page 66: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 66

Проективность СинтС

В моих руках оно подобно будетКлючу от брошенной шкатулки в море.

Page 67: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 67

Проективность СинтО

В моих руках оно подобно будетКлючу от брошенной шкатулки в море.

Page 68: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 68

Проективность СинтО

В моих руках оно будет подобноКлючу от шкатулки, брошенной в море.

Page 69: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 69

Уроки машинного перевода для лингвистов.

Лексика и синтаксис

Page 70: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 70

Главная цель Великого поста, который начался для православных, – нравственно возвысить человека.

Пример из опыта работы системы МП ЭТАП-3. Лента ИТАР-ТАСС

Page 71: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 71

The chief aim of the Lent which has begun for the Orthodox – it is moral to elevate a person

Перевод фразы на английский язык

Page 72: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 72

‘Главная цель Великого поста… – возвышение человека является

нравственным’

Буквальное значение английского перевода

Page 73: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 73

В чем причина ошибки? Посмотрим на СинтС 1:

Page 74: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 74

Правильная СинтС 2

Page 75: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 75

идея

Всегда ли неправильна СинтС 1?

Page 76: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 76

The main idea of the Lent which has begun for the Orthodox – it is moral to elevate a person

Page 77: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 77

Два разных синтаксических типа существительных

• Существительные типа цель• Существительные типа идея

Page 78: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 78

Существительные типа 1) (с признаком ПРЕДИНФ)

цель, назначение, предназначение, задача, проблема, план, намерение, стремление

Page 79: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 79

Существительные типа 2)(с признаком ПРЕДПРЕДЛ)

идея, мысль, смысл, пафос, посылка, тезис, положение, принцип, постулат, утверждение, урок,высказывание, лозунг, девиз, результат, итог

Page 80: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 80

The chief aim of the Lent which has begun for the Orthodox – to elevate a person morally

Исправленный перевод

Page 81: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 81

Уроки машинного перевода для всех.

Пределы возможного

Page 82: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 82

На месте пожара был обнаружен мертвым пожилой сторож

Примеры из опыта работы системы МП ЭТАП-3. Новостные ленты

Page 83: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 83

An elderly guard was found on the site of fire by the dead man

Page 84: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 84

На месте пожара был обнаружен покойным пожилой сторож

Примеры из опыта работы системы МП ЭТАП-3. Новостные ленты

Page 85: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 85

Было подтоплено 820 домовладений

Примеры из опыта работы системы МП ЭТАП-3. Новостные ленты

Page 86: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 86

820 households were heated

Page 87: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 87

В 1999 году в ФРГ переехало 95 тысяч этнических немцев

Примеры из опыта работы системы МП ЭТАП-3. Новостные ленты

Page 88: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 88

In 1999 in the Federal Republic of Germany 95 thousand ethnic Germans were run over

Page 89: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 89

Всесильна ли статистика?

Page 90: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 90

акциялицопартия

Page 91: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 91

акция1: ‘ценная бумага’акция2: ‘активное мероприятие’

АКЦИЯ

Page 92: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 92

Page 93: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 93

Page 94: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 94

Page 95: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 95

Page 96: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 96

Page 97: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 97

лицо1: ‘часть головы’лицо2: ‘персона, человек’

ЛИЦО

Page 98: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 98

круглое лицо, идеальные черты лица, лицо со шрамом, лицом к лицу лица не увидать

ЛИЦО

Page 99: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 99

физическое лицо, юридическое лицо, официальное лицо, подпись ответственного лица, посторонним лицам вход воспрещен, лицо нетитульной национальности

ЛИЦО

Page 100: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 100

Знакомое лицо? Незнакомое лицо?

ЛИЦО

Page 101: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 101

Таможня – лицо державы

ЛИЦО

Page 102: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 102

Инспектор сделал официальное лицо

ЛИЦО

Page 103: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 103

Партия рабов

ПАРТИЯ

Page 104: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 104

Партия трудящихся

ПАРТИЯ

Page 105: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 105

Партия скрипки

ПАРТИЯ

Page 106: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 106

Партия скрипок

ПАРТИЯ

Page 107: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 107

Page 108: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 108

Page 109: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 109

Page 110: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 110

Page 111: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 111

Page 112: Etap overview rus

26 января 2011 г. Научный семинар Яндекса 112