Корпусная лингвистика

Слайд 2

ПОНЯТИЕ КОРПУСНОЙ ЛИНГВИСТИКИ Корпусная лингвистика - раздел языкознания, занимающийся разработкой, созданием

ПОНЯТИЕ КОРПУСНОЙ ЛИНГВИСТИКИ

Корпусная лингвистика - раздел языкознания, занимающийся разработкой, созданием и

использованием текстовых корпусов с применением компьютерных технологий.
Термин впервые введен в употребление в
60-е годы ХХ века.
Корпусная лингвистика сформировалась как отдельный раздел науки о языке в первой половине 90-х годов XX века.
Слайд 3

ЛИНГВИСТИЧЕСКИЙ КОРПУС ЭТО СОВОКУПНОСТЬ ТЕКСТОВ:

ЛИНГВИСТИЧЕСКИЙ КОРПУС ЭТО СОВОКУПНОСТЬ ТЕКСТОВ:

Слайд 4

ЦЕЛЕСООБРАЗНОСТЬ СОЗДАНИЯ КОРПУСОВ

ЦЕЛЕСООБРАЗНОСТЬ СОЗДАНИЯ КОРПУСОВ

Слайд 5

ОБЪЕКТ И ПРЕДМЕТ КОРПУСНОЙ ЛИНГВИСТИКИ

ОБЪЕКТ И ПРЕДМЕТ КОРПУСНОЙ ЛИНГВИСТИКИ

Слайд 6

ЦЕЛЬ КОРПУСНОЙ ЛИНГВИСТИКИ - ИССЛЕДОВАНИЕ ЕСТЕСТВЕННОГО ИСПОЛЬЗОВАНИЯ ЯЗЫКА Задачи: Сбор текстов

ЦЕЛЬ КОРПУСНОЙ ЛИНГВИСТИКИ - ИССЛЕДОВАНИЕ ЕСТЕСТВЕННОГО ИСПОЛЬЗОВАНИЯ ЯЗЫКА

Задачи:
Сбор текстов с определенной

целью
Их машинная обработка
Помощь в создании словарей (лексикографическая поддержка)
Составление конкордансов (список встречающихся в тексте словоформ со словесным окружением, расположенных в алфавитном порядке)
Составление частотных словарей
Создание национальных корпусов
Исследование использования естественного языка в разных регистрах
Помощь в создании лингводидактических пособий
Слайд 7

ИСТОРИЯ СОЗДАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ Brown Corpus - создан в 1960-е годы

ИСТОРИЯ СОЗДАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ

Brown Corpus - создан в 1960-е годы в

Университете Брауна, содержал 500 фрагментов текстов по 2 тысячи слов в каждом.
Слайд 8

Слайд 9

Слайд 10

ИСТОРИЯ СОЗДАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ 1970 годы - частотный словарь русского языка

ИСТОРИЯ СОЗДАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ

1970 годы - частотный словарь русского языка Л.Н.

Засориной, 1 миллион слов
1980-е годы- русский корпус, созданный в Университете Уппсалы, Швеция, 1-1,5 миллиона слов
1980-е годы - Bank of English, Бирмингемский Университет, на данный момент - Word Banks Online, 500-550 миллионов слов
1985 год - Машинный фонд русского языка, создававшийся по инициативе А. П. Ершова
1991-1994 годы - British National Corpus, BNC, 100 миллионов слов