Основные направления исследований в области искусственного интеллекта

Содержание

Слайд 2

Инженерия знаний Необходимой частью любой интеллектуальной системы являются знания. Понятие “инженерия

Инженерия знаний

Необходимой частью любой интеллектуальной системы являются знания.
Понятие “инженерия знаний”

в 1977 г. ввел Э. Фейгенбаум, который писал: «По опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого — ведь эксперт знает гораздо больше, чем сам осознает».
Слайд 3

Данные, информация, знания Данными называют информацию фактического характера, описывающую объекты, процессы

Данные, информация, знания

Данными называют информацию фактического характера, описывающую объекты, процессы и

явления предметной области, а также их свойства.
В процессах компьютерной обработки данные проходят следующие этапы преобразований:
исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);
Слайд 4

Данные, информация, знания представление на специальных языках описания данных, предназначенных для

Данные, информация, знания

представление на специальных языках описания данных, предназначенных для ввода

и обработки исходных данных в ЭВМ;
базы данных на машинных носителях информации.
Слайд 5

Данные, информация, знания На практике часто отождествляются определения таких понятий, как

Данные, информация, знания

На практике часто отождествляются определения таких понятий, как "информация",

"данные", "знания". Однако эти понятия необходимо различать. Данные несут в себе сведения о событиях, произошедших в материальном мире, и являются регистрацией сигналов, возникших в результате этих событий. Однако данные не тождественны информации. Станут ли данные информацией - зависит от того, известен ли метод преобразования данных в известные понятия.
Слайд 6

Данные, информация, знания

Данные, информация, знания

Слайд 7

Данные, информация, знания Пример 1. Мы можем услышать речь человека, обращающегося

Данные, информация, знания

Пример 1. Мы можем услышать речь человека, обращающегося к

нам, говорящего на иностранном и незнакомом нам языке. С одной стороны, мы получили от него данные в виде звуков, но с другой - никакой информации от него мы получить не смогли, т.к. не сумели понять передаваемые нам данные. Они для нас были закодированы, а метода раскодирования мы не знали. По своей природе данные являются объективными, так как это результат регистрации объективно существующих сигналов, вызванных изменениями в материальных телах или полях. Например, к данным можно отнести следующее: 45, 12, 8, red и т.д.
Слайд 8

Данные, информация, знания Пример 1. Методы являются субъективными. В основе искусственных

Данные, информация, знания

Пример 1. Методы являются субъективными. В основе искусственных методов

лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные людьми (субъектами). Например, к методам можно отнести: алгоритм (последовательность действий) перевода с одного иностранного языка на другой, алгоритм распознавания последовательности символов и преобразования их в слова и т.д.
Слайд 9

Данные, информация, знания

Данные, информация, знания

Слайд 10

Данные, информация, знания Пример 2. Когда мы видим 45, 12, 8,

Данные, информация, знания

Пример 2. Когда мы видим 45, 12, 8, red

и т.д., то можно утверждать, что мы имеем дело с данными. В том случае, когда видим 45 кг, 12 лет, 8 метров, red = красный, то мы имеем дело с информацией, т.к. применительно к данным нами использовался соответствующий метод их восприятия: что-то взвесили, определили возраст, измерили длину, перевели иностранное слово на понятный нам язык. Одни и те же данные могут в момент потребления представлять разную информацию в зависимости от степени адекватности (соответствия) взаимодействующих с ними методов.
Слайд 11

Данные, информация, знания Пример 3. С одной стороны, 45 кг -

Данные, информация, знания

Пример 3. С одной стороны, 45 кг - это

информация. Но с другой стороны, мы не можем в данный момент сказать чего именно 45 кг. Это может быть вес человека, вес коробки, вес мешка с мукой или сахаром. И в этой ситуации только что полученная нами информация может опять превратиться в данные (т.к. требуется очередной метод уточнения полученных сигналов).
Слайд 12

Данные, информация, знания Пример 3. Например, если нас интересует вес, который

Данные, информация, знания

Пример 3. Например, если нас интересует вес, который может

выдержать мост, то 45 кг для нас будет информацией (т.к. в данном случае не важно к чему именно относится этот вес). Если же мы решили варить варенье, то 45 кг для нас станут данными, т.к. требуется дальнейшее уточнение, к чему именно эти килограммы относятся - к ягодам, сахарному песку и т.д.
Слайд 13

Данные, информация, знания Пример 3. Данные, составляющие информацию, имеют свойства, однозначно

Данные, информация, знания

Пример 3. Данные, составляющие информацию, имеют свойства, однозначно определяющие

соответствующий метод получения этой информации. Причем необходимо учитывать тот факт, что информация не является статичным (постоянным) объектом - она достаточно быстро может меняться со временем и существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных.
Слайд 14

Данные, информация, знания

Данные, информация, знания

Слайд 15

Данные, информация, знания

Данные, информация, знания

Слайд 16

Данные, информация, знания Давайте охарактеризуем знания. Прежде всего, у каждого из

Данные, информация, знания

Давайте охарактеризуем знания. Прежде всего, у каждого из нас

есть индивидуальный способ их применения. Например, таблицу умножения, которую Вы изучали в начальной школе, применяете и сейчас при решении сложных задач. Кроме того, знания должны иметь структуру, связь между собой, а не быть хаотичными. Очень важно постоянно их использовать и пополнять.
Слайд 17

Данные, информация, знания Можно сделать вывод, что фиксируемые воспринимаемые факты окружающего

Данные, информация, знания

Можно сделать вывод, что фиксируемые воспринимаемые факты окружающего мира

представляют собой данные. При использовании данных в процессе решения конкретных задач - появляется информация. Результаты решения задач, истинная, проверенная информация (сведения), обобщенная в виде законов, теорий, совокупностей взглядов и понятий представляют собой знания.
Слайд 18

Категория “знания” Знания в ИИС существуют в следующих формах: исходные знания

Категория “знания”
Знания в ИИС существуют в следующих формах:
исходные знания (правила,

выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);
Слайд 19

Категория “знания” описание исходных знаний средствами выбранной модели представления знаний (множество

Категория “знания”

описание исходных знаний средствами выбранной модели представления знаний (множество логических

формул или продукционных правил, семантическая сеть, иерархии фреймов и т.п.;
представление знаний структурами данных для хранения и обработки в ЭВМ;
базы знаний на машинных носителях информации.
Слайд 20

Определение “знания” Из толкового словаря С. И. Ожегова: «Знание — постижение

Определение “знания”

Из толкового словаря С. И. Ожегова:
«Знание — постижение действительности сознанием,

наука»;
«Знание — это совокупность сведений, познаний в какой-либо области».
Из японского толкового словаря:
«Знания — это результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности».
Слайд 21

Определение “знания” Исследователи в области ИИ : «Знания — это закономерности

Определение “знания”

Исследователи в области ИИ :
«Знания — это закономерности предметной области

(принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области».
«Знания — это хорошо структурированные данные или данные о данных, или метаданные».
«Знания — формализованная информация, на которую ссылаются или используют в процессе логического вывода» .
Слайд 22

Разработка интеллектуальных информационных систем или систем, основанных на знаниях. Цель -

Разработка интеллектуальных информационных систем или систем, основанных на знаниях.

Цель

- выявление, исследование и применение знаний экспертов для решения сложных задач, возникающих на практике, имитация человеческого искусства анализа неструктурированных и слабоструктурированных проблем.
Частным случаем являются экспертные системы (ЭС).
Слайд 23

Разработка естественно-языковых интерфейсов и машинный перевод. Машинный перевод–выполняемое на компьютере действие

Разработка естественно-языковых интерфейсов и машинный перевод.
Машинный перевод–выполняемое на компьютере действие

по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.
Слайд 24

Разработка естественно-языковых интерфейсов и машинный перевод. «Лингвистический арифмометр» Смирнова-Троянского В 1933

Разработка естественно-языковых интерфейсов и машинный перевод.

«Лингвистический арифмометр» Смирнова-Троянского
В 1933 году

изобретатель П.П.Смирнов-Троянский получил в СССР патент на механическую «машину для подбора и печатания слов при переводе с одного языка на другой» -«Лингвистический арифмометр» .
Он предложил и автоматический двуязычный словарь, и схему кодирования межъязыковых грамматических соответствий; правда, только для «синтетического» языка эсперанто.
Слайд 25

Разработка естественно-языковых интерфейсов и машинный перевод. 40-е годы −первые системы МП

Разработка естественно-языковых интерфейсов и машинный перевод.

40-е годы −первые системы МП


Теоретической основой начального периода работ по машинному переводу был взгляд на язык, как кодовую систему.
В марте 1947 специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.
В 1949 г. он составил меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода.
Слайд 26

Разработка естественно-языковых интерфейсов и машинный перевод. Концепция Interlingva Идеи Уивера легли

Разработка естественно-языковых интерфейсов и машинный перевод.

Концепция Interlingva
Идеи Уивера легли в

основу подхода к МП, основанного на концепции Interlingva: стадия передачи информации разделена на два этапа.
На первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка),
На втором этапе результат этого перевода представляется средствами выходного языка.
Слайд 27

Разработка естественно-языковых интерфейсов и машинный перевод. Первые системы МП В 1952

Разработка естественно-языковых интерфейсов и машинный перевод.

Первые системы МП
В 1952 г.

состоялась первая конференция по МП в Массачусетском технологическом университете.
В 1954 г. Джорджтаунский эксперимент. В Нью-Йорке была представлена первая система МП —IBM Mark II(словарь в 250 единиц и 6 грамматических правил), осуществлявшая перевод с русского языка на английский.
В 1954 г. первый эксперимент по МП был осуществлен в СССР И.К. Бельской и Д.Ю. Пановым в Институте точной механики и вычислительной техники АН СССР.
Первая система МП с английского языка на русский на универсальной вычислительной машине была разработана коллективом под руководством Ю. А. Моторина.
Слайд 28

Разработка естественно-языковых интерфейсов и машинный перевод. Системы прямого перевода Причины невысокого

Разработка естественно-языковых интерфейсов и машинный перевод.

Системы прямого перевода
Причины невысокого качества

МП в 50-е годы были:
ограниченные возможности аппаратных средств:
малый объем памяти;
низкая скорость доступа к информации;
невозможность полноценного использования языков программирования высокого уровня;
отсутствие теоретической базы по компьютерной лингвистики.
Системы МП первого поколения –системы прямого перевода (СПП)–представляли собой программно-аппаратные комплексы, анализирующие текст пословно «слово за словом» (word-to-word) без синтаксической и смысловой целостности.
Слайд 29

Разработка естественно-языковых интерфейсов и машинный перевод. Системы МП в 60-е годы

Разработка естественно-языковых интерфейсов и машинный перевод.

Системы МП в 60-е годы
Разработка

систем МП в 60-е годы:
в США при финансировании Мормонской церкви;
в Канаде (например система METEO);
в Европе —группами GENA (Гренобль) и SUSY (Саарбрюкен);
в СССР (Москва) отечественными лингвистами (И.А. Мельчук и Ю.Д. Апресян) —лингвистический процессор ЭТАП.
Слайд 30

Разработка естественно-языковых интерфейсов и машинный перевод. Новый импульс в разработке систем

Разработка естественно-языковых интерфейсов и машинный перевод.

Новый импульс в разработке систем

МП (70-80-е годы)
Новый подъем исследований в области МП был связан с серьезными достижениями в области искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.
Исследователи ставили целью развитие «реалистических» систем МП, предполагавших участие человека на различных стадиях процесса перевода.
Слайд 31

Разработка естественно-языковых интерфейсов и машинный перевод. Технология TM (translationmemory) В процессе

Разработка естественно-языковых интерфейсов и машинный перевод.

Технология TM (translationmemory)
В процессе перевода

сохраняется исходный сегмент текста(предложение) и его перевод;
если подобный исходному сегмент обнаруживается, он отображается вместе с переводом и указанием совпадения;
затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой.
Слайд 32

Разработка естественно-языковых интерфейсов и машинный перевод. Советские системы МП 70-80 гг.

Разработка естественно-языковых интерфейсов и машинный перевод.

Советские системы МП 70-80 гг.
В

СССР с середины 70-х годов были созданы промышленные системы МП:
АМПАР (английский-русский);
НЕРПА (немецкий -русский);
ФРАП (французский-русский);
АСПЕРА (русский -английский).
Автоматические терминологические словари.
На этих разработках основываются такие системы МП, как Stylus, Socratи другие.
Слайд 33

Разработка естественно-языковых интерфейсов и машинный перевод. Stylus — система МП, включающая

Разработка естественно-языковых интерфейсов и машинный перевод.

Stylus — система МП, включающая

множество словарей по разным ПрО;
Universal Translator — многоязычная система МП;
Socrat — система, позволяющая сканировать документы, переводить их содержимое и проверять орфографию;
Polyglossum — многоязычная система МП с широким набором предметных словарей;
Promt — многоязычная система МП, содержащая множество словарей по разным ПрО;
WebTranSite — система для перевода web-страниц;
Lingvo — компьютерный англо-русский и русско-английский словарь.
Слайд 34

Разработка естественно-языковых интерфейсов и машинный перевод.

Разработка естественно-языковых интерфейсов и машинный перевод.

Слайд 35

Разработка естественно-языковых интерфейсов и машинный перевод. Проблему перевода английского предложения Е,

Разработка естественно-языковых интерфейсов и машинный перевод.

Проблему перевода английского предложения Е,

скажем, во французское предложение F можно представить в виде следующего уравнения, предусматривающего применение правила Байеса:
Слайд 36

Разработка естественно-языковых интерфейсов и машинный перевод. Это правило указывает, что мы

Разработка естественно-языковых интерфейсов и машинный перевод.

Это правило указывает, что мы

должны рассмотреть все возможные французские предложения F и выбрать из них то, которое максимизирует произведение Р(Е\ F) P(F). Коэффициент Р(Е) можно проигнорировать, поскольку он является одинаковым для любого F. Коэффициент Ρ (F) представляет собой языковую модель для французского языка; он указывает, насколько велика вероятность появления данного конкретного предложения во французском тексте.
Слайд 37

Разработка естественно-языковых интерфейсов и машинный перевод. Вероятность P(E\F) представляет собой модель

Разработка естественно-языковых интерфейсов и машинный перевод.

Вероятность P(E\F) представляет собой модель

перевода; она указывает, насколько велика вероятность того, что некоторое английское предложение будет использоваться в качестве перевода, если дано определенное французское предложение.
Слайд 38

Разработка естественно-языковых интерфейсов и машинный перевод. В качестве языковой модели P(F)

Разработка естественно-языковых интерфейсов и машинный перевод.

В качестве языковой модели P(F)

может использоваться любая модель, позволяющая присвоить предложению определенное значение вероятности. При наличии очень большой совокупности текстов можно оценить Ρ (F) непосредственно путем подсчета количества случаев появления каждого предложения в этой совокупности текстов.
Слайд 39

Разработка естественно-языковых интерфейсов и машинный перевод. Например, если с помощью Web

Разработка естественно-языковых интерфейсов и машинный перевод.

Например, если с помощью Web

будет собрано 100 миллионов французских предложений и обнаружено, что предложение "Clique ici" (Щелкните здесь) появляется 50 тысяч раз, то Р( "Clique ici") равно 0,0005. Но даже при наличии 100 миллионов примеров количество экземпляров большинства возможных предложений будет равно нулю.
Слайд 40

Разработка естественно-языковых интерфейсов и машинный перевод. Поэтому как правило используется языковая

Разработка естественно-языковых интерфейсов и машинный перевод.

Поэтому как правило используется языковая

модель двухсловных сочетаний, в которой вероятность французского предложения, состоящего из слов f1…fn, может быть представлена следующим образом:
Слайд 41

Разработка естественно-языковых интерфейсов и машинный перевод. Для этого необходимо знать вероятности

Разработка естественно-языковых интерфейсов и машинный перевод.

Для этого необходимо знать вероятности

двухсловных сочетаний, такие как Р("Eiffel" | "tour") = .02. Эти данные позволяют учитывать только самые локальные проявления синтаксических связей, в которых слово зависит лишь от предыдущего слова. Но этого часто достаточно для грубого перевода.
Слайд 42

Разработка естественно-языковых интерфейсов и машинный перевод. Задача выбора модели перевода, Р(Е|F),

Разработка естественно-языковых интерфейсов и машинный перевод.

Задача выбора модели перевода, Р(Е|F),

является более сложной. Начнем с одной чрезмерно упрощенной модели перевода, которая обнаружила свою способность вырабатывать приемлемые варианты перевода примерно в половине случаев.
Слайд 43

Разработка естественно-языковых интерфейсов и машинный перевод. Рассматриваемая чрезмерно упрощенная модель перевода

Разработка естественно-языковых интерфейсов и машинный перевод.

Рассматриваемая чрезмерно упрощенная модель перевода

основана на таком принципе: "Чтобы перевести предложение, просто переведите каждое слово отдельно, независимо от другого, в порядке слева направо". Это — модель выбора однословного сочетания. Она позволяет легко вычислить вероятность перевода:
Слайд 44

Системы автоматического реферирования и аннотирования Рефератом называют: доклад на определенную тему,

Системы автоматического реферирования и аннотирования

Рефератом называют:
доклад на определенную тему, включающий обзор

соответствующих литературных и других источников;
изложение содержания научной работы, книги и т. д.
Аннотация - краткая характеристика произведения печати или рукописи.
Аннотацию от реферата отличают:
существенно меньший объем;
обязательная констатация назначения аннотируемого произведения (для каких категорий читателей оно предназначено).
Слайд 45

Системы автоматического реферирования и аннотирования На первом проводится сопоставление текста и

Системы автоматического реферирования и аннотирования

На первом проводится сопоставление текста и фразовых

шаблонов, в результате чего выделяются блоки наибольшей лексической и статистической релевантности.
На втором — путем соединения выделенных фрагментов формируется итоговый документ.
Для реализации первого этапа используют модель линейных весовых коэффициентов. В соответствии с ней каждому блоку U текста оригинала автоматически (на основании определенных правил) приписываются весовые коэффициенты:
Слайд 46

Системы автоматического реферирования и аннотирования k1 - учитывают расположение блока: во

Системы автоматического реферирования и аннотирования

k1 - учитывают расположение блока: во всем

тексте или некотором разделе; в начале, середине или конце текста; во вводной части, заключении и т. д.;
K2 - учитывают результаты автоматической индексации документа ;
Слайд 47

Системы автоматического реферирования и аннотирования k3 - учитывается наличие в блоке

Системы автоматического реферирования и аннотирования

k3 - учитывается наличие в блоке таких

ключевых фраз и выражений, как «в заключение...», «в данной статье...», «согласно результатам анализа...», «отличный от...», «малозначащий...» и т. п. ;
k4 - учитывают вхождение термина в заголовки, колонтитулы, первый параграф текста, пользовательский профиль запроса и т. п.
Коэффициент важности блока B(U) = α1k1 + α2k2 +α3k3 +α4k4 .
Слайд 48

Системы автоматического реферирования и аннотирования Microsoft Word (начиная с версии 7

Системы автоматического реферирования и аннотирования

Microsoft Word (начиная с версии 7 имеется

функция автоматического реферирования);
ОРФО 5.0 (разработчик — компания «Информатик»), включающую функцию автоматического аннотирования русских текстов;
«Либретто» (разработчик — компания «МедиаЛикгва»), обеспечивающую автоматическое реферирование и аннотирование русских и английских текстов (система встраивается в Word);
«МедиаЛингва Аннотатор SDK 1.0», служащий инструментарием для реализации функций автоматического реферирования и аннотирования в прикладных ИАС;
Слайд 49

Системы автоматического реферирования и аннотирования поисковая система «Следопыт», включающая средства автоматического

Системы автоматического реферирования и аннотирования

поисковая система «Следопыт», включающая средства автоматического реферирования

и аннотирования документов;
• поисковая машина «Золотой Ключик» компании Textar, обеспечивающую составление рефератов и аннотаций;
• Intelligent Text Miner (IBM);
• Oracle Context
Слайд 50

Генерация и распознавание речи. Системы распознавания по сложности обычно делят на

Генерация и распознавание речи.

Системы распознавания по сложности обычно делят

на следующие группы:
Системы автоматического распознавания изолированных слов. То есть система должна распознавать пословно произносимые человеком команды;
Слайд 51

Генерация и распознавание речи. Системы автоматического распознавания слитной речи. То есть

Генерация и распознавание речи.

Системы автоматического распознавания слитной речи. То есть

система должна уметь выделять слова в естественном частично слитном потоке человеческой речи;
Системы понимания речи. То есть системы, которые наделены элементами интеллекта, что позволяет, во-первых, на основе смыслового анализа более правильно выделять слова в потоке речи, а, во-вторых, сохранять информацию в некой базе знаний, откуда она может быть легко извлечена для решения определенных интеллектуальных задач.
Слайд 52

Генерация и распознавание речи. Cистема распознавания русской речи RuSpeech. (компании Intel

Генерация и распознавание речи.

Cистема распознавания русской речи RuSpeech. (компании

Intel и Cognitive Technologies. В основе лежит БД, содержащая цифровое представление звучания непрерывной русской речи с соответствующими текстами и фонетической транскрипцией. БД включает звуковые фрагменты для более 50 тыс. предложений с фонетической разметкой каждого из них. В создании БД RuSpeech приняли участие 220 дикторов. Она содержит около 50 часов непрерывной речи, имеет объем 15 Гб .
Слайд 53

Генерация и распознавание речи.

Генерация и распознавание речи.


Слайд 54

Генерация и распознавание речи. Необработанная речь. Обычно, поток звуковых данных, записанный

Генерация и распознавание речи.


Необработанная речь. Обычно, поток звуковых данных,

записанный с высокой дискретизацией (20 КГц при записи с микрофона либо 8 КГц при записи с телефонной линии).
Слайд 55

Генерация и распознавание речи. Анализ сигнала. Поступающий сигнал должен быть изначально

Генерация и распознавание речи.


Анализ сигнала. Поступающий сигнал должен быть

изначально трансформирован и сжат, для облегчения последующей обработки. Есть различные методы для извлечения полезных параметров и сжатия исходных данных в десятки раз без потери полезной информации. Наиболее используемые методы:
анализ Фурье;
линейное предсказание речи.
Слайд 56

Генерация и распознавание речи. Речевые кадры. Результатом анализа сигнала является последовательность

Генерация и распознавание речи.


Речевые кадры. Результатом анализа сигнала является

последовательность речевых кадров. Обычно, каждый речевой кадр – это результат анализа сигнала на небольшом отрезке времени (порядка 10 мс.), содержащий информацию об этом участке (порядка 20 коэффициентов). Для улучшения качества распознавания, в кадры может быть добавлена информация о первой или второй производной значений их коэффициентов для описания динамики изменения речи
Слайд 57

Генерация и распознавание речи.

Генерация и распознавание речи.

Слайд 58

Генерация и распознавание речи. Акустические модели. Для анализа состава речевых кадров

Генерация и распознавание речи.

Акустические модели. Для анализа состава речевых кадров

требуется набор акустических моделей. Рассмотрим две наиболее распространенные из них.
Шаблонная модель. В качестве акустической модели выступает каким-либо образом сохраненный пример распознаваемой структурной единицы (слова, команды). Вариативность распознавания такой моделью достигается путем сохранения различных вариантов произношения одного и того же элемента (множество дикторов много раз повторяют одну и ту же команду). Используется, в основном, для распознавания слов как единого целого (командные системы).
Слайд 59

Генерация и распознавание речи. Модель состояний. Каждое слово моделируется как последовательность

Генерация и распознавание речи.

Модель состояний. Каждое слово моделируется как последовательность

состояний указывающих набор звуков, которые возможно услышать в данном участке слова, основываясь на вероятностных правилах. Этот подход используется в более масштабных системах.
Слайд 60

Генерация и распознавание речи. Акустический анализ. Состоит в сопоставлении различных акустических

Генерация и распознавание речи.

Акустический анализ. Состоит в сопоставлении различных акустических

моделей к каждому кадру речи и выдает матрицу сопоставления последовательности кадров и множества акустических моделей. Для шаблонной модели, эта матрица представляет собой Евклидово расстояние между шаблонным и распознаваемым кадром (т.е. вычисляется, как сильно отличается полученный сигнал от записанного шаблона и находится шаблон, который больше всего подходит полученному сигналу). Для моделей, основанных на состоянии, матрица состоит из вероятностей того, что данное состояние может сгенерировать данный кадр.
Слайд 61

Генерация и распознавание речи. Корректировка времени. Используется для обработки временной вариативности,

Генерация и распознавание речи.

Корректировка времени. Используется для обработки временной вариативности,

возникающей при произношении слов (например, “растягивание” или “съедание” звуков).
Слайд 62

Генерация и распознавание речи. Последовательность слов. В результате работы, система распознавания

Генерация и распознавание речи.

Последовательность слов. В результате работы, система распознавания

речи выдает последовательность (или несколько возможных последовательностей) слов, которая, наиболее вероятно, соответствует входному потоку речи.
Слайд 63

Генерация и распознавание речи. На сегодняшний день основными направлениями развития систем

Генерация и распознавание речи.

На сегодняшний день основными направлениями
развития систем речевого

общения видятся следующие:
минимизация необходимого словаря;
улучшения качества распознавания и синтеза непрерывной речи;
передача и распознавание интонации, акцентов, особенностей произношения, а также распознавание речи с «нестандартным» произношением;
выделение смысловой составляющей распознанного текста.
Слайд 64

Обработка визуальной информации (OCR-системы) Понятие образа Образ, класс — классификационная группировка

Обработка визуальной информации (OCR-системы)

Понятие образа
Образ, класс — классификационная группировка в

системе классификации, объединяющая (выделяющая) определенную группу объектов по некоторому признаку.
Слайд 65

Обработка визуальной информации (OCR-системы) Образное восприятие мира — одно из загадочных

Обработка визуальной информации (OCR-системы)

Образное восприятие мира — одно из загадочных

свойств живого мозга, позволяющее разобраться в бесконечном потоке воспринимаемой информации и сохранять ориентацию в океане разрозненных данных о внешнем мире. Воспринимая внешний мир, мы всегда производим классификацию воспринимаемых ощущений, т. е. разбиваем их на группы похожих, но не тождественных явлений.
Слайд 66

Обработка визуальной информации (OCR-системы) Например, несмотря на существенное различие, к одной

Обработка визуальной информации (OCR-системы)

Например, несмотря на существенное различие, к одной

группе относятся все буквы А, написанные различными почерками, или все звуки, соответствующие одной и той же ноте, взятой в любой октаве и на любом инструменте, а оператор, управляющий техническим объектом, на целое множество состояний объекта реагирует одной и той же реакцией.
Слайд 67

Обработка визуальной информации (OCR-системы) В лучших OCR-системах используется технология распознавания, свойственная

Обработка визуальной информации (OCR-системы)

В лучших OCR-системах используется технология распознавания,

свойственная человеку. У человека распознавание образа является многоступенчатым
Слайд 68

Обработка визуальной информации (OCR-системы) Работа системы типа Fine Reader включает два

Обработка визуальной информации (OCR-системы)

Работа системы типа Fine Reader включает

два крупных этапа.
1. Анализ графических изображений:
• выделение таблиц, картинок;
• определение областей распознавания;
• выделение строк, символов.
2. Распознавание отдельных символов.
Слайд 69

Обработка визуальной информации (OCR-системы) В шаблонных классификаторах с помощью критерия сравнения

Обработка визуальной информации (OCR-системы)

В шаблонных классификаторах с помощью критерия

сравнения определяется, какой из шаблонов выбрать из базы. Самый простой критерий — минимум точек, отличающих шаблон от исследуемого изображения. К достоинствам шаблонного классификатора относятся хорошее распознавание дефектных символов («разорванных» или «склеенных»), простота и высокая скорость распознавания.
Недостатком является необходимость настройки системы на типы и размеры шрифтов.
Слайд 70

Обработка визуальной информации (OCR-системы) Наиболее распространены признаковые классификаторы. Анализ в них

Обработка визуальной информации (OCR-системы)

Наиболее распространены признаковые классификаторы. Анализ в

них проводится только по набору чисел или признаков, вычисляемых по изображению. Таким образом, происходит распознавание не самого символа, а набора его признаков, т. е. производных данных от исследуемого символа. Это неизбежно вызывает некоторую потерю информации.
Слайд 71

Обработка визуальной информации (OCR-системы) Структурные классификаторы переводят образ символа в его

Обработка визуальной информации (OCR-системы)

Структурные классификаторы переводят образ символа в

его топологическое представление, отражающее информацию о взаимном расположении структурных элементов символа. Эти данные могут быть представлены в графовой форме. Такой способ обеспечивает инвариантность относительно типов и размеров шрифтов.
Недостатками являются трудность распознавания дефектных символов и медленная работа.
Слайд 72

Обработка визуальной информации (OCR-системы) Технология распознавания с помощью структурно-пятенных эталонов получила

Обработка визуальной информации (OCR-системы)

Технология распознавания с помощью структурно-пятенных эталонов

получила название "фонтанное преобразование" (от английского font - шрифт). Он позволяет представить изображения в виде набора пятен, связанных между собой n-арными отношениями, задающими структуру символа.
Слайд 73

Обработка визуальной информации (OCR-системы) Эти отношения (то есть расположение пятен друг

Обработка визуальной информации (OCR-системы)

Эти отношения (то есть расположение пятен

друг относительно друга) образуют структурные элементы, составляющие символ. Наглядно это можно представить себе в виде теннисных шаров, нанизанных на резиновый жгут . Шары могут сдвигаться относительно друг друга. Такую связку подвижных шаров можно "натянуть" на различные изображения одного символа, и система становится менее зависимой от шрифтов и дефектов.
Слайд 74

Обработка визуальной информации (OCR-системы) Практическое применение OCR-систем поиск людей по фотографиям;

Обработка визуальной информации (OCR-системы)

Практическое применение OCR-систем
поиск людей по фотографиям;
поиск месторождений

полезных ископаемых и прогнозирование погоды по данным аэрофотосъемки и снимкам со спутников в различных диапазонах светового излучения;
Слайд 75

Обработка визуальной информации (OCR-системы) составление географических карт по исходной информации, используемой

Обработка визуальной информации (OCR-системы)

составление географических карт по исходной информации, используемой

в предыдущей задаче;
анализ отпечатков пальцев и рисунков радужной оболочки глаза в криминалистике, охранных и медицинских системах.
Слайд 76

Обучение и самообучение. Включает модели, методы и алгоритмы, ориентированные на автоматическое

Обучение и самообучение.

Включает модели, методы и алгоритмы, ориентированные на

автоматическое накопление и формирование знаний с использованием процедур анализа и обобщения данных. К данному направлению относятся системы добычи данных (Data mining) и системы поиска закономерностей в компьютерных базах данных.
Слайд 77

Обучение и самообучение. Деревья решения являются одним из наиболее популярных подходов

Обучение и самообучение.

Деревья решения являются одним из наиболее популярных

подходов к решению задач Data Mining. Они создают иерархическую структуру классифицирующих правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид дерева. Для принятия решения, к какому классу отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня.
Слайд 78

Обучение и самообучение. Вопросы имеют вид "значение параметра A больше x?".

Обучение и самообучение.

Вопросы имеют вид "значение параметра A больше x?".

Если ответ положительный, осуществляется переход к правому узлу следующего уровня, если отрицательный - то к левому узлу; затем снова следует вопрос, связанный с соответствующим узлом.
Слайд 79

Обучение и самообучение.

Обучение и самообучение.


Слайд 80

Игры и машинное творчество. Охватывает создание компьютерной музыки, стихов, интеллектуальные системы

Игры и машинное творчество.

Охватывает создание компьютерной музыки, стихов, интеллектуальные

системы для изобретения новых объектов, cоздание интеллектуальных компьютерных игр
Слайд 81

Системы когнитивной графики. Ориентированы на общение с пользователем ИИС посредством графических

Системы когнитивной графики.

Ориентированы на общение с пользователем ИИС посредством графических образов,

которые генерируются в соответствии с изменениями параметров моделируемых или наблюдаемых процессов. Когнитивная графика позволяет в наглядном и выразительном виде представить множество параметров, характеризующих изучаемое явление, освобождает пользователя от анализа тривиальных ситуаций, способствует быстрому освоению программных средств.
Слайд 82

Системы когнитивной графики.

Системы когнитивной графики.

Слайд 83

Системы когнитивной графики.

Системы когнитивной графики.

Слайд 84

Системы контекстной помощи. В них пользователь описывает проблему, а система на

Системы контекстной помощи.

В них пользователь описывает проблему, а система

на основе дополнительного диалога конкретизирует ее и выполняет поиск относящихся к ситуации рекомендаций. В обычных гипертекстовых системах, наоборот, компьютерные приложения навязывают пользователю схему поиска требуемой информации.
Слайд 85

Программное обеспечение систем ИИ Языки программирования, ориентированные на обработку символьной информации

Программное обеспечение систем ИИ

Языки программирования, ориентированные на обработку символьной информации

языки логического программирования (PROLOG), языки представления знаний (OPS 5, KRL, FRL),
интегрированные- программные среды, содержащие арсенал инструментальных средств для создания систем ИИ (КБ, ARTS, GURU, G2),
оболочки экспертных систем (BUILD, EXSYS Professional, ЭКСПЕРТ),
Слайд 86

Признаки ИИС коммуникативные способности — способ взаимодействия конечного пользователя с системой;

Признаки ИИС

коммуникативные способности — способ взаимодействия конечного пользователя с системой;
решение

сложных плохо формализуемых задач, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, характеризующейся неопределенностью и динамичностью исходных данных и знаний;