natural language understanding reading group (nlu/rg) kick-off meeting

Post on 29-Jun-2015

287 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

NLU/RG

Константин Соколов

Mathlingvo, СПбГУ, i-Free

Санкт-Петербург, 2013

Пара слов о себе

• Mathlingvo• i-Free Innovations• AINL 2012-2013• СПбГУ• @vtqveant

1

Откуда NLU/RG

• R&D в i-Free Innovations

2

Зачем NLU/RG

• максимально быстро выйти на актуальные проблемы• больше вширь, чем вглубь• одному не разобраться

3

Формат NLU/RG

• Reading Group• чтобы было у кого спросить, если чего сам не понимаешь• ...и рассказать, если знаешь

4

Что такое NLU

• курс в Стенфорде (CS 224U, http://www.stanford.edu/class/cs224u)• несколько учебников ([Allen, Natural Language Understanding, 1994],

[Blackburn, Bos. Representation and Inference for Natural Language, 2006])• что-то вроде NLP• что-то про семантику• гораздо менее понятно, что вообще значит ”понимание” винженерном контексте

5

Что такое актуальное в NLU

• не (обязательно) недавнее• не (обязательно) модное• не (обязательно) революционное• даже не (обязательно) успешное

6

Что такое актуальное в NLU

• пример из прошлого: неевклидова геометрия (”идеиносятся в воздухе”)

• актуальное - это когда ”время пришло”

7

State of the Art в NLP

Прорывы последнего времени:

• Representation Learning• Manifold Learning• Deep Learning• &c.

8

State of the Art в NLP

Почему это модно?

• хорошо работает• можно считать на компьютерах• Big Data• бизнес видит ценность (?)• отвечают (или обещают ответить) на проблему, которая”носится в воздухе”

9

Актуальные проблемы в NLP

• Norvig on Chomsky (http://norvig.com/chomsky.html)• статистические методы vs. ”олдскульная” лингвистика• Возможен ли синтез? Имеет ли он смысл?

10

Программа NLU/RG

Принципы при составлении программы:

• актуальное (не модное, не недавнее, не революционное)• двигаться вширь• просить помощи• искать приложения в конкретных задачах (в научных ипромышленных)

Изначально рассчитывалась на год при еженедельных встречах.

11

Обзор программы

Обзор программы

http://nlu-rg.ru/files/nlu-rg-program.pdf

13

Обзор программы

Основные линии:

• лингвистическая• логическая• инженерная• актуальные проблемы• матметоды

14

Обзор программы

Лингвистическая линия:

• предоставить краткое введение в формальную семантику• закрыть пробелы• ввести основную терминологию• понять проблематику• познакомиться с историческим контекстом• узнать несколько имен

15

Обзор программы

Логическая линия:

• узнать об основных подходах к моделированию семантикиестественных языков

• сформировать четкое представление о сущностисемантики через обращение к теории моделей

• последовательно рассмотреть ряд конструкций,предлагавшихся для моделирования семантики

16

Обзор программы

Инженерная линия:

• рассмотреть ряд практических методов и реализаций изобласти (логического) программирования

• приложение (формальной) семантики к програмированию,обработке и представлению данных

• приложение (логического) программирования к обработкеестественного языка

17

Обзор программы

Актуальные проблемы:

• познакомиться с идеей нахождения представления данныхв структурном (символьном, алгебраическом) виде спомощью машинного обучения.

18

Обзор программы

Матметоды: от понятия множества со структурой к теориитопосов и HoTT.

• где смыкаются логика и геометрия• где встречаются порядок структур и аморфность данных• где одновременно присутствуют высокая сложность ивысокая абстрактность (В. Воеводский)

19

Административное

• порядок встреч: раз в две недели, СПбГПУ• регламент: 1,5 часа, обоснование темы, доклады,обсуждение

• гугл-группа: nlu-rg@googlegroups.com• сайт: http://nlu-rg.ru• wiki, репозитории

20

Слово аудитории

• кто откуда• кто с чем из указанного знаком• кто с чем готов помочь другим разобраться• кто готов программировать и чего хотел бы

21

Спасибо!

top related