Новые информационные технологии в лингвистике

Содержание

Слайд 2

Новые информационные технологии в лингвистике Лекция № 3а. Экспертная система Hearsay II – система распознавания речи

Новые информационные технологии в лингвистике

Лекция № 3а. Экспертная система Hearsay II

– система распознавания речи
Слайд 3

Система Hearsay-II - Разработана в рамках проекта DARPA - Система Hearsay-II

Система Hearsay-II - Разработана в рамках проекта DARPA - Система Hearsay-II была

разработана в университете Карнеги-Меллона с целью распознавания связной речи на словаре 1000 слов

4

Слайд 4

Система Hearsay-II - Это экспертная система, разработанная с целью показать возможности

Система Hearsay-II - Это экспертная система, разработанная с целью показать возможности

решения специфических проблем понимания речи - А также возможности координации независимых процессов в рамках кооперативного поведения, направленного на решение проблем

4

Слайд 5

Система Hearsay-II - Базовые технологии, используемые в системе, включают как оперирование

Система Hearsay-II - Базовые технологии, используемые в системе, включают как оперирование

символами (верхние уровни), так и обработку сигналов (нижние уровни) - Объединение искусственно-интеллектуальных механизмов со специфическими акустическими и лингвистическими знаниями, было необходимо для решения задач понимания речи

4

Слайд 6

Речевые звуки есть следствие множества последовательных трансформаций от намерения, через семантические

Речевые звуки есть следствие множества последовательных трансформаций от намерения, через

семантические и синтаксические структуры, к речевой волне

4

Слайд 7

6 Структура коммуникационной системы для организации речевого поведения

6

Структура коммуникационной системы для организации речевого поведения

Слайд 8

7 Структура коммуникационной системы для организации речевого поведения


7

Структура коммуникационной системы для организации речевого поведения

Слайд 9

8 Информационно-кодовая модель коммуникации Шеннона и Уивера

8

Информационно-кодовая модель коммуникации Шеннона и Уивера

Слайд 10

В случае понимания речи осуществляется обратный процесс: от речевой волны –

В случае понимания речи осуществляется обратный процесс: от речевой волны –

к пониманию намерения автора речевого сообщения. На каждом этапе понимания возникают неясности и неопределенности

4

Слайд 11

Эффективно работающая система распознавания речи, основанная на знаниях, должна удовлетворять следующим

Эффективно работающая система распознавания речи, основанная на знаниях, должна удовлетворять следующим

требованиям: (1) Из всех возможных последовательностей операций (частных решений) хотя бы одна должна приводить к корректной интерпретации

4

Слайд 12

(2) Процедура анализа имеющихся вариантов интерпретации должна давать корректному варианту более

(2) Процедура анализа имеющихся вариантов интерпретации должна давать корректному варианту более

высокую оценку, чем другим конкурирующим вариантам (3) Вычислительные ресурсы (память и время вычислений), необходимые для отыскания правильной интерпретации, не должны превышать определенный порог

4

Слайд 13

- Представьте себе группу экспертов, которые сидят возле классной доски и

- Представьте себе группу экспертов, которые сидят возле классной доски и

пытаются решить какую-либо проблему - Каждый эксперт является специалистом в какой-то определенной области, имеющей отношение к решению проблемы - Формулировка проблемы и исходные данные записаны на доске

4

Слайд 14

- Каждый из экспертов думает над тем, чем он может помочь

- Каждый из экспертов думает над тем, чем он может помочь

в решении проблемы - Если кто-либо из них чувствует, что ему есть что сказать по этому поводу, он записывает свои соображения на доске - Эти соображения могут позволить другим экспертам внести определенный вклад в решение проблемы

4

Слайд 15

- Процесс прекращается (а эксперты расходятся по домам), когда проблема будет решена 4

- Процесс прекращается (а эксперты расходятся по домам), когда проблема будет

решена

4

Слайд 16

Такая методика совместного решения проблем эффективна, если соблюдаются определенные соглашения: -

Такая методика совместного решения проблем эффективна, если соблюдаются определенные соглашения: - все

эксперты должны говорить на одном и том же языке - должен существовать протокол определения очередности выступлений, когда сразу несколько экспертов хватаются за мел и направляются к доске

4

Слайд 17

Использование источников знаний в HEARSAY-II - Для генерации, комбинирования и развития

Использование источников знаний в HEARSAY-II - Для генерации, комбинирования и развития гипотез

интерпретации в системе HEARSAY-II используется несколько источников знаний (разных уровней) - Созданные гипотезы (интерпретации) разного уровня абстракции сохраняются на доске объявлений

4

Слайд 18

- Каждый источник знаний можно считать в первом приближении набором пар

- Каждый источник знаний можно считать в первом приближении набором пар

"условие-действие" - Система управляется прерываниями, что напоминает использование демонов во фреймовых системах - Источники знаний загодя объявляют об активизированных в них условиях, извещая, какой вид модификации данных будет влиять на выполнение этих условий

4

Слайд 19

- Большинство источников знаний в системе HEARSAY-II организовано так, что они

- Большинство источников знаний в системе HEARSAY-II организовано так, что они

распознают данные на определенном уровне лингвистического анализа, а выполняемые ими операции относятся к следующему по порядку уровню - Например, некоторый источник активизируется данными на силлабическом уровне и формирует лексическую гипотезу на уровне слов

4

Слайд 20

4 Взаимодействие между источниками знаний

4

Взаимодействие между источниками знаний

Слайд 21

4 Архитектура системы

4

Архитектура системы

Слайд 22

4 - Решатель проблем системы Hearsay-II реконструирует намерение из гипотетических интерпретаций,

4

- Решатель проблем системы Hearsay-II реконструирует намерение из гипотетических интерпретаций, формулируемых

на разных уровнях абстрагирования - Вычислительные ресурсы концентрируются на наиболее перспективных вычислениях
Слайд 23

4 - Окончательная конфигурация системы включает решающие компоненты с целью генерации

4

- Окончательная конфигурация системы включает решающие компоненты с целью генерации и

оценки речевых гипотез, а также для фокусировки управляющих механизмов с целью выявления наиболее значимых гипотез
Слайд 24

4 Выполнение трех требований позволяет построить эффективный решатель: - Только одна

4

Выполнение трех требований позволяет построить эффективный решатель: - Только одна последовательность применения

источников знаний может быть корректной - Выбирается только одна правильная общая интерпретация
Слайд 25

4 - Стоимость принятия решения ограничивается разумными пределами - Это ведет

4

- Стоимость принятия решения ограничивается разумными пределами - Это ведет к ограничениям

на число частичных интерпретаций - Чем больше неопределенность, тем больше должно порождаться гипотез - Тем лучше должно быть качество выбора из имеющихся гипотез
Слайд 26

4 Решающая модель системы Hearsay-II - Каждый источник знаний представлен как

4

Решающая модель системы Hearsay-II - Каждый источник знаний представлен как множество пар

условие-действие - Условный компонент описывает ситуацию, в которой источник знаний может принять участие в принятии решения, деятельный компонент содержит информацию о том, какое действие производится, и как оно интегрируется в ситуацию
Слайд 27

4 - Источники знаний извлекают из сигнала акустические параметры, классифицируют акустические

4

- Источники знаний извлекают из сигнала акустические параметры, классифицируют акустические сегменты

в фонетические классы, распознают слова, оценивают фразы, а также генерируют и оценивают гипотезы для нераспознанных слов или слогов
Слайд 28

4 Взаимодействие между источниками знаний

4

Взаимодействие между источниками знаний

Слайд 29

4 Функциональное описание источников знаний системы понимания речи Уровень получения сигнала,

4

Функциональное описание источников знаний системы понимания речи

Уровень получения сигнала, извлечения параметров,

сегментации, и разметки
Осуществляет оцифровку сигнала, измерение параметров, и разметку
Слайд 30

4 Функциональное описание источников знаний системы понимания речи Уровень разметки слов

4

Функциональное описание источников знаний системы понимания речи

Уровень разметки слов
Создает гипотезы слогового

уровня из сегментов
Создает гипотезы-слова из слогов
Слайд 31

4 Функциональное описание источников знаний системы понимания речи Уровень генерации фраз-островков

4

Функциональное описание источников знаний системы понимания речи

Уровень генерации фраз-островков
Создает гипотезы последовательностей

слов, которые представляют потенциальные фразы из слов-гипотез и слабых грамматических знаний
Пытается интерпретировать последовательность слов, и, если возможно, создать гипотезу-фразу
Слайд 32

4 Функциональное описание источников знаний системы понимания речи Уровень расширения фраз

4

Функциональное описание источников знаний системы понимания речи

Уровень расширения фраз
Предсказывает все возможные

слова, которые синтаксически могут предшествовать или последовать фразе
Оценивает соответствия между гипотезами-сегментами и парами слово-фраза
Создает гипотезы-фразы из верифицированных соответствий пар слово-фраза
Слайд 33

4 Функциональное описание источников знаний системы понимания речи Уровень оценки, запрета,

4

Функциональное описание источников знаний системы понимания речи

Уровень оценки, запрета, интерпретации
Оценивает правильность

новой, или модифицированной гипотез с использованием информации, из других источников знаний
Слайд 34

4 Функциональное описание источников знаний системы понимания речи Уровень оценки, запрета,

4

Функциональное описание источников знаний системы понимания речи

Уровень оценки, запрета, интерпретации
Принимает решение

об остановке процесса (в случае наличия лучшего решения, или израсходования доступных ресурсов) и осуществляет выбор лучшей гипотезы-фразы в качестве выхода
Слайд 35

4 Архитектура системы

4

Архитектура системы

Слайд 36

4 Архитектура системы Архитектура с классной доской не диктует проектировщику определенный

4

Архитектура системы

Архитектура с классной доской не диктует проектировщику определенный режим управления

знаниями в системе, например нисходящую или восходящую стратегию построения рассуждений
Слайд 37

4 Пример Система работает в предметной области ответов на вопросы при

4

Пример

Система работает в предметной области ответов на вопросы при поиске документов

из коллекции рефератов статей по компьютерным наукам
Например распознаются фразы:
«Which abstracts refer to theory of communication?»
«List those articles»
«What has McCarthy written since nineteen seventy-four».
Слайд 38

4 Пример Словарь системы содержит 1011 слов, включая все словоформы

4

Пример

Словарь системы содержит 1011 слов, включая все словоформы

Слайд 39

4 Пример Грамматика устроена так, что семантические и прагматические ограничения содержатся

4

Пример

Грамматика устроена так, что семантические и прагматические ограничения содержатся прямо в

грамматике
Так вместо просто категории «имя», грамматика системы включает такие категории как: «тема», «автор», «год» и «издатель»
Слайд 40

4 Пример Такие грамматики называются семантическими грамматиками В этой грамматике за

4

Пример

Такие грамматики называются семантическими грамматиками
В этой грамматике за каждым словом может

следовать 17 других слов из словаря
В обычной грамматике коэффициент ветвления значительно выше – 51 слово в среднем
Слайд 41

4 Пример Работу системы рассмотрим на примере распознавания последовательности «ARE ANY

4

Пример

Работу системы рассмотрим на примере распознавания последовательности «ARE ANY BY FEIGENBAUM

AND FELDMAN?» Каждый основной шаг системы, как правило, соответствует действию одного источника знаний
Слайд 42

4 Пример

4

Пример