Математическая лингвистика

Слайд 2

Это математическая дисциплина, предметом которой является разработка формального аппарата для описания

Это математическая дисциплина, предметом которой является разработка формального аппарата для

описания строения естественных и некоторых искусственных языков.

Что такое математическая (компьютерная)
лингвистика?

Задачи компьютерной лингвистики:
1. Распознавание и синтез речи
2. Машинный перевод
3. Анализ текста
4. Автоматическое извлечение данных

Слайд 3

Томита-парсер — это инструмент для извлечения структурированных данных (фактов) из текста

Томита-парсер — это инструмент для извлечения структурированных данных (фактов) из текста

на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов.

Томита - парсер

Слайд 4

«Князь Андрей, говоря это, был еще менее похож, чем прежде, на

«Князь Андрей, говоря это, был еще менее похож, чем прежде,

на того
Болконского, который развалившись сидел в креслах Анны Павловны и сквозь
зубы, щурясь, говорил французские фразы. Его сухое лицо все дрожало
нервическим оживлением каждого мускула; глаза, в которых прежде казался
потушенным огонь жизни, теперь блестели лучистым, ярким блеском. Видно было,
что чем безжизненнее казался он в обыкновенное время, тем энергичнее был он
в эти минуты почти болезненного раздражения.»

Как работает томита-парсер?

Слайд 5

«Князь Андрей, говоря это, был еще менее похож, чем прежде, на

«Князь Андрей, говоря это, был еще менее похож, чем прежде,

на того
Болконского, который развалившись сидел в креслах Анны Павловны и сквозь
зубы, щурясь, говорил французские фразы. Его сухое лицо все дрожало
нервическим оживлением каждого мускула; глаза, в которых прежде казался
потушенным огонь жизни, теперь блестели лучистым, ярким блеском. Видно было,
что чем безжизненнее казался он в обыкновенное время, тем энергичнее был он
в эти минуты почти болезненного раздражения.»

Пример неправильной программы