Инновационные технологии в переводе

Содержание

Слайд 2

План 1.История развития машинного перевода. 2. Современные системы автоматизированного перевода. 3. Наиболее популярные онлайн-сервисы.

План

1.История развития машинного перевода.
2. Современные системы автоматизированного перевода.
3. Наиболее популярные онлайн-сервисы.

Слайд 3

Термином «машинный перевод» (МП, он же Machine Translation или MT) называют

Термином «машинный перевод» (МП, он же Machine Translation или MT) называют

действие, когда один естественный язык переводится на другой с использованием для этого специального программного обеспечения.
Машинный, а точнее, компьютерный перевод — это письменный перевод, поскольку в результате получается  письменный текст.
Слайд 4

История машинного перевода берет начало в XVII веке, когда такими философами,

История машинного перевода берет начало в XVII веке, когда такими философами,

как Лейбниц и Декарт было выдвинуто предположение о существовании некоего кода, соединяющего между собой слова разных языков.
Все предположения носили гипотетический характер, и никому не удавалось в действительности создать машину для перевода.
Слайд 5

В конце 1830-х гг. о расширении привычных возможностей перевода задумался английский

В конце 1830-х гг. о расширении привычных возможностей перевода задумался английский

изобретатель Чарльз Бэббидж, предложивший проект первого в истории компьютера.
Суть работы будущей машины состояла в использовании потенциала машинной памяти для хранения словарей. 
Слайд 6

Первые заявления на получение патента на «переводческую машину» были поданы в

Первые заявления на получение патента на «переводческую машину» были поданы в

середине 30-х годов ХХ века. Одно заявление было подано французским изобретателем Ж. Арцруни, просто создавшим автоматический двуязычный словарь на перфоленте.
Слайд 7

Другое было сделано советским ученым Петром Троянским, чье изобретение было более

Другое было сделано советским ученым Петром Троянским, чье изобретение было более

детальным.
Оно включало в себя, как двуязычный словарь, так и способы работы с грамматическими ролями между двумя языками на основе Эсперанто.
Слайд 8

Данная система представляла собой три этапа: первый заключался в следующем –

Данная система представляла собой три этапа:

первый заключался в следующем – редактор,

носитель языка, должен был связать слова исходного языка (ИЯ) в логические формы в соответствии с синтаксическими функциями;
на втором этапе машина должна была «перевести» все эти формы на язык перевода (ПЯ);
на третьем этапе носитель языка перевода занимался редактированием полученного результата.
Слайд 9

Первый план по созданию машин для перевода на базе компьютеров был

Первый план по созданию машин для перевода на базе компьютеров был

предложен Уорреном Уивером, исследователем Фонда Рокфеллера, в его меморандуме от июля 1949года. 
Данные предложения базировались на теории информации, получившей успех во время Второй Мировой войны в связи с криптографией и распространения идеи об универсальных принципах естественных языков.
Слайд 10

В 1954 г. состоялся так называемый «Джорджтаунский эксперимент»: публике был представлен

В 1954 г. состоялся так называемый «Джорджтаунский эксперимент»: публике был представлен

первый электронный переводчик – русско-английская система IBM Mark II, содержавшая словарь из 250 единиц и 6 грамматических правил. 
Слайд 11

Ранние системы использовали большие двуязычные словари и запрограммированные вручную правила, по

Ранние системы использовали большие двуязычные словари и запрограммированные вручную правила, по

выстраиванию на выходе слов в правильном порядке.
В конечном итоге, такой способ был признан ограниченным, и развитие лингвистических наук, например, генеративной лингвистики или трансформационной грамматики, было нацелено на улучшение качества перевода.
Слайд 12

Большой удар был нанесен по исследованиям в области машинного перевода после

Большой удар был нанесен по исследованиям в области машинного перевода после

публикации отчета ALPAC ( специальный комитет по прикладной лингвистике) в 1966 году.
В результате было установлено, что машинный перевод дороже, медленнее и менее точный в сравнении с переводом, выполненным человеком, и несмотря на большие капиталовложения, в ближайшее время машинный перевод не достигнет того же качества, что и перевод, выполненный человеком.
Слайд 13

Новый этап развития технологий машинного перевода связан с появлением вычислительной техники

Новый этап развития технологий машинного перевода связан с появлением вычислительной техники

в конце 70-х – начале 80-х гг. ХХ в.
Программисты отказались от идеи создания «идеальной» машины-переводчика: новые системы разрабатывались с целью многократного увеличения скорости перевода информации, но с обязательным участием человека для достижения идеального качества.
Слайд 14

В 80-е годы в Японии был большой ажиотаж, связанный с машинным

В 80-е годы в Японии был большой ажиотаж, связанный с машинным

переводом. С появлением компьютеров пятого поколения Япония планировала прыгнуть выше всех в области техники и программирования, проект, связанный с созданием программ для перевода с/на английский, заинтересовал многие компании (Fujitsu, Toshiba, NTT, Brother, Catena, Matsushita, Mitsubishi, Sharp, Sanyo, Hitachi, NEC, Panasonic, Kodensha, Nova, Oki).
Исследования 80-х годов основывались на переводе лингвистических единиц при помощи морфологического, синтаксического и семантического анализа.
Слайд 15

Очередной виток исследований в 90-х гг. прошлого века связан с колоссальным

Очередной виток исследований в 90-х гг. прошлого века связан с колоссальным

прогрессом современных персональных компьютеров и появлением Интернета.
Возможности перевода в режиме онлайн позволяют преодолеть языковой барьер и осуществлять навигацию по иностранным сайтам.
Слайд 16

В настоящий момент большое количество исследований ведется в области статистического машинного

В настоящий момент большое количество исследований ведется в области статистического машинного

перевода и машинного перевода на базе примеров перевода.
Сегодня немногие компании используют статистический машинный перевод в коммерческих целях, например, Microsoft (использует свою собственную патентованную статистическую программу МП для перевода статей базы).
Возобновился интерес к гибридизации, исследователи совмещают синтаксические и морфологические (т. е. лингвистические) знания в статистических системах с уже существующими правилами.
Слайд 17

два аспекта, определяющих актуальность задач машинного перевода: все возрастающая потребность в

два аспекта, определяющих актуальность задач машинного перевода:

все возрастающая потребность в

переводах в науке, литературе, дипломатии, экономике и других областях деятельности;
для машинного перевода гораздо яснее критерии оценивания результатов, чем в задачах понимания текстов, организации диалогов и др.
Слайд 18

К современным средствам автоматизации перевода можно отнести, во-первых, компьютерные словари типа

К современным средствам автоматизации перевода можно отнести,

во-первых, компьютерные словари типа ABBYY

Lingvo, MultiLex, Polyglossum, а также онлайновый словарь MultiTran, глоссарии, энциклопедии, справочные издания, стилистические справочники, онлайновые газетные и журнальные архивы в электронном формате;
во-вторых, так называемые системы переводческой памяти (Translation Memory) типа Trados Translator's Workbench, Deja Vu, SDLX, Wordfast, OmegaT и другие;
в-третьих, системы машинного перевода типа PROMT, STYLOS, MAGIC GOODY и другие.
Слайд 19

Электронный словарь – компьютерная база данных, содержащая особым образом закодированные словарные

Электронный словарь – компьютерная база данных, содержащая особым образом закодированные словарные

статьи, позволяющие осуществлять быстрый поиск слов, часто с учетом морфологических форма и с возможностью поиска сочетаний слов, а также с возможностью изменения направления перевода.
Слайд 20

Преимущества электронных словарей: 1. высокая скорость обработки информации; 2. портативность носителя

Преимущества электронных словарей:

1. высокая скорость обработки информации;
2. портативность носителя информации;
3. наличие

новейшей лексики за счет быстрого обновления, особенно в быстро развивающихся областях (нанотехнологии, компьютерные технологии и т.п.);
4. одновременный доступ к нескольким словарям;
5. возможность смены направления перевода.
Слайд 21

Translation Memory (ТM) Один из новых инструментов переводчика - база данных,

Translation Memory (ТM)

Один из новых инструментов переводчика - база данных, где

хранятся выполненные переводы, иногда ее называют еще «память переводов»
Принцип работы технологии ТМ довольно прост - в процессе перевода пары "исходный текст - конечный (переведенный) текст" накапливаются в базе (или базах) данных и затем используются для перевода новых документов.
Слайд 22

Система переводческой памяти Trados предназначена для больших переводческих центров, где накопилось

Система переводческой памяти Trados

предназначена для больших переводческих центров, где накопилось много

параллельных текстов (два текста, один из которых — перевод другого).
Она позволяет не переводить дважды одно и то же предложение, а просто находит такое же или очень похожее предложение в базе параллельных текстов и выдает уже сделанный кем-то перевод. При больших массивах однотипных текстов такой подход весьма эффективен.
Слайд 23

выгоды, которые предоставляет технология TM пользователям: Повышение производительности труда переводчика. Подстановка

выгоды, которые предоставляет технология TM пользователям:

Повышение производительности труда переводчика. Подстановка даже на

80% совпадающих сегментов из базы переводов, может сократить время работы над переводом на 50-60%.
Экономия средств, как прямое следствие экономии времени.
Единство терминологии стиля при наличии базы переводов по тематике переводимого документа.
Создание преемственности рабочего процесса, что гарантирует отсутствие сбоев в работе компании.
Слайд 24

Translation Memory не лишена ряда существенных недостатков: Большие стартовые затраты. Большой объем ручной работы.

Translation Memory не лишена ряда существенных недостатков:

Большие стартовые затраты.
Большой объем

ручной работы.
Слайд 25

Системы машинного перевода: Для обозначения автоматизированного перевода используют термин САТ. Английский

Системы машинного перевода:

Для обозначения автоматизированного перевода используют термин САТ. Английский термин

– computer-assisted translation, computer-aided translation – CAT.
При узком понимании этого понятия к САТ относят такие системы автоматизации перевода как SDL Trados, Deja Vu, StarTransit, Wordfast и другие. 
Слайд 26

Системы машинного перевода отличают по трем аспектам: рабочим языкам (различают двуязычные

Системы машинного перевода отличают по трем аспектам:

рабочим языкам (различают двуязычные и

многоязычные системы машинного перевода);
типам текстов (для перевода письменного текста и устного диалога);
ограничениям по предметной области (обусловлены поддержкой в них лексики, соответствующей той или иной области знаний: медицины, информатики, математики и пр.).
Слайд 27

традиционно системы машинного перевода делятся на три категории: основанные на правилах

традиционно системы машинного перевода делятся на три категории:

основанные на правилах (rule-based),

где грамматика проработана глубже, языковых правил больше,
статистические или основанные на примерах (example-based),где происходит динамическое порождение языковых правил для конкретных текстовых примеров,
гибридные системы.
Слайд 28

основанные на правилах системы Системы на основе грамматических правил производят анализ

основанные на правилах системы

Системы на основе грамматических правил производят анализ текста,

который используется в процессе перевода.
Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков.
Основной принцип работы таких систем — связь структур исходного и конечного текстов.
Слайд 29

Системы на основе грамматических правил часто разделяют еще на три подгруппы:

Системы на основе грамматических правил часто разделяют еще на три подгруппы:

 системы

пословного перевода,
трансфертные системы
и интерлингвистические системы.
Слайд 30

Преимущества систем на основе грамматических правил: грамматическая и синтаксическая точность, стабильность

Преимущества систем на основе грамматических правил:

грамматическая и синтаксическая точность,
стабильность результата,
возможность настройки

на специфическую предметную область.
Слайд 31

недостатки систем на основе грамматических правил: необходимость создания, поддержки и обновления

недостатки систем на основе грамматических правил:

необходимость создания, поддержки и обновления лингвистических баз

данных,
трудоемкость создания такой системы,
высокая стоимость.
Слайд 32

Статистические системы используют статистический анализ. В систему загружается двуязычный корпус текстов

Статистические системы

используют статистический анализ.
В систему загружается двуязычный корпус текстов (содержащий большое

количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д.
Система является самообучаемой — при выборе варианта перевода она опирается на полученную ранее статистику
Слайд 33

Достоинства статистическихсистем: быстрота настройки и легкость добавления новых направлений перевода.

Достоинства статистическихсистем:

быстрота настройки и 
легкость добавления новых направлений перевода.

Слайд 34

Недостатки: наличие многочисленных грамматических ошибок и нестабильность перевода.

Недостатки:

наличие многочисленных грамматических ошибок и 
нестабильность перевода.

Слайд 35

Гибридные системы сочетают в себе подходы, описанные ранее и позволят объединить

Гибридные системы

сочетают в себе подходы, описанные ранее и
позволят объединить все преимущества,

которыми обладают статистические системы и системы, основанные на правилах.
Слайд 36

Для автоматизации своей переводческой деятельности многие лингвисты используют онлайн - переводчики,

Для автоматизации своей переводческой деятельности многие лингвисты используют

онлайн - переводчики, такие

как Promt, Google, Transneed, онлайн - словари Multitran, Lingvo, MrTranslate и другие онлайн - ресурсы. 
CAT-системы, например Transit, Trados, Wordfast, Across, Meta Texis, Star и т.п.
Они характеризуются наличием специальной памяти Translation Memory, в которой накапливаются соответствия оригинал-перевод
Слайд 37

Программы для проверки правильного синтаксиса и стиля текста в текстовом редакторе,

Программы для проверки правильного синтаксиса и стиля текста в текстовом редакторе,

входящие в блок орфографического контроля:

1. Программа Bullfighter проверяет правописание, синтаксис и стиль текста в приложениях Microsoft Word и PowerPoint,
2. English Writing Software
3. Grammar Checker 7.0
4. Grammar Slammer-Non-Windows 4.0
5. Grammar Slammer 4.2
6. Grammatica English
7. SpellCheckPlus
8. WhiteSmoke English 2009

Слайд 38

наиболее популярные онлайн-сервисы, доступные современным пользователям сети Интернет: Translate.ru (онлайн-переводчик компании

наиболее популярные онлайн-сервисы, доступные современным пользователям сети Интернет:

Translate.ru (онлайн-переводчик компании ПРОМТ)
SYSTRANet

(Systran)
Google Trnslate (Google)
Free Translation (SDL)
Babel Fish (Systran)
Worldlingo (Systran)
InterTran (Translation Experts Limited)
ImTransator (Smartlink Corp)
Tranlslate Online.ua
 Windows Life Translator (Microsoft)
Слайд 39

1. Translate.ru (PROMT) http://www.translate.ru Компания ПРОМТ считается абсолютным лидером на российском

1. Translate.ru (PROMT) http://www.translate.ru

Компания ПРОМТ считается абсолютным лидером на российском рынке услуг

онлайнового перевода. Данный сервис существует с 1998 года (для западных пользователей есть версии на других языках по адресу: www.online-translator.com).
Онлайн-переводчик ПРОМТ поддерживает семь европейских языков (английский, русский, итальянский, немецкий, испанский, португальский и французский) и осуществляет переводы в 25 направлениях:
Слайд 40

Можно выбрать определенную тематику – общение, бизнес, компьютеры, автомобили, путешествия, спорт

Можно выбрать определенную тематику – общение, бизнес, компьютеры, автомобили, путешествия, спорт

или «другое».
Пользователь имеет возможность выбрать дополнительные настройки (подключить специализированные словари, установить настройки для перевода текстов большего объема, получить грамматическую информацию).
Недостатком программы является ограничение объема вводимого текста до 500 знаков.
Слайд 41

2. SYSTRANet http://www.systranet.com/ Сервис онлайн-перевода, предлагаемый другим мировым лидеров в области

2. SYSTRANet http://www.systranet.com/

Сервис онлайн-перевода, предлагаемый другим мировым лидеров в области систем машинного

перевода - американской компанией Systran.
Онлайн-перевод текста этого сервиса поддерживает 15 языковВ общей сложности, данный переводчик осуществляет переводы в 53 языковых направлениях.
Слайд 42

Кроме обычной функции перевода связных текстов онлайн-переводчик SYSTRANet также осуществляет переводы

Кроме обычной функции перевода связных текстов онлайн-переводчик SYSTRANet также осуществляет переводы

веб-страниц, а также файлов с расширениями .txt, .htm, .rtf.
Кроме того, пользователю предлагается опция выбора тематических словарей или создания собственного словаря.
Но чтобы создать свой словарь или загрузить файл поддерживаемого формата, сначала необходимо зарегистрироваться на данном сайте.
Слайд 43

3.Google Translate http://translate.google.com/ http://translate.google.ru/ Сервис Google Translate представляет собой онлайн-переводчик текстов

3.Google Translate http://translate.google.com/ http://translate.google.ru/

Сервис Google Translate представляет собой онлайн-переводчик текстов и веб-страниц, который

является одним из элементов поисковой системы Google.
Данный онлайн-переводчик работает с 51 языком осуществляет перевод в 2250 языковых направлениях.
В данном сервисе появилось несколько новых удобных функций. Теперь можно не пользоваться кнопкой «Перевести», так как программа автоматически переводит слово или текст по мере их ввода в соответствующее поле.
Слайд 44

При переводе отдельных слов программа функционирует как онлайн-словарь и предлагает все

При переводе отдельных слов программа функционирует как онлайн-словарь и предлагает все

возможные варианты перевода, разбивая все слова по частям речи.
Программа предлагает пользователю выбрать опцию «Показать транслитерацию», которая осуществляет написание данного слова средствами расширенной латиницы.
Как и другие онлайн-переводчики текстов, Google осуществляет перевод веб-страниц.
Кроме того, он поддерживает дополнительную поисковую функцию «Поиск с переводом», которая позволяет найти веб-сайты на языке пользователя по переводу того или иного слова или предложения.
Слайд 45

4. Free Translation www.freetranslation.com Сервис онлайн-перевода Free Translation, предоставляемый компанией SDL,

4. Free Translation www.freetranslation.com

Сервис онлайн-перевода Free Translation, предоставляемый компанией SDL, поддерживает 32

языка.
В общей сложности, данный переводчик осуществляет переводы в 86 языковых направлениях. 
Слайд 46

Free Translation предоставляет дополнительные опции по улучшению качества переводов исключительно членам

Free Translation предоставляет дополнительные опции по улучшению качества переводов исключительно членам

FreeTranslation Platinum Club, для регистрации в котором необходимо внести плату в размере 9,95 долл. (в год).
Установив дополнительные опции, можно воспользоваться специализированными словарями по тематикам Business, IT, Current Affairs и переводить большие тексты объемом до 10 тыс. знаков.
Слайд 47

5. Babel Fish http://babelfish.yahoo.com/ Одна из первых систем автоматизированного перевода, доступного

5. Babel Fish http://babelfish.yahoo.com/

Одна из первых систем автоматизированного перевода, доступного в режиме

онлайн, была запущена в1997 году компанией AltaVista, но затем была интегрирована поисковой системой Yahoo, дополнившей данный сервис онлайн-перевода новыми языками.
Онлайн-переводчик Babel Fish, как и следующий далее переводчик Worldlingo, использует технологию перевода Systran. Онлайновая «рыбка» осуществляет перевод текстов онлайн объемом до 150 слов и веб-сайтов в 38 языковых направлениях:
Слайд 48

Babel Fish ограничивает объем текста до 5 Кбайт (приблизительно 800 слов),

Babel Fish ограничивает объем текста до 5 Кбайт (приблизительно 800 слов),

данное ограничение сохраняется и при переводе web-страниц.
Как правило, качество переводов, выполняемых Babel Fish, сравнимо с качеством переводов онлайн от Google Translate, но уступает качеству переводов от Translate.ru. При переводе в данной программе обычно теряется разбивка на абзацы.
Слайд 49

6. Worldlingo http://www.worldlingo.com/en/products_services/worldlingo_translator.html Данный онлайн-переводчик поддерживает 32 языка и позволяет выполнить

6. Worldlingo http://www.worldlingo.com/en/products_services/worldlingo_translator.html
Данный онлайн-переводчик поддерживает 32 языка и позволяет выполнить перевод текстов

онлайн объемом до 500 слов.
Данный онлайн-переводчик имеет преимущество в плане функциональных возможностей является возможность выбора 20 специализированных тематик и ввода специальных символов, характерных для каждого языка.
Слайд 50

7. InterTran http://www.tranexp.com:2000/Translate/result.shtml Онлайн-переводчик InterTran (InteractiveTran) представляет собой один из продуктов

7. InterTran http://www.tranexp.com:2000/Translate/result.shtml


Онлайн-переводчик InterTran (InteractiveTran) представляет собой один из продуктов компании

Translation Experts Limited.
Переводчик поддерживает 27 языков перевода.
Текст для перевода можно вводить на любом из этих языков, однако недостатком этого переводчика является то, что он переводит только тексты и не позволяет выбрать специализированные словари при переводе текста определенной тематики.  
Слайд 51

8. Im Translator http://translation.imtranslator.net Онлайн-сервис Im Translator является продуктом американской корпорации

8. Im Translator http://translation.imtranslator.net

Онлайн-сервис Im Translator является продуктом американской корпорации Smartlink Corp,

также основанным на базе технологии, разработанной российской компанией ПРОМТ. В отличие от сервиса Translate.ru, Im Translator снабжен стандартным набором функций и выполняет перевод в 19 языковых направлениях
К дополнительным функциональным возможностям данного онлайн-переводчика относятся наличие электронного словаря и программы для проверки орфографии. Однако данный переводчик не предлагает пользователю опцию подключения тематических словарей.
Слайд 52

9. Translate Online.ua http://pereklad.online.ua/ Это украинский сервис онлайн-перевода, поддерживающий 7 языков.

9. Translate Online.ua http://pereklad.online.ua/

Это украинский сервис онлайн-перевода, поддерживающий 7 языков.
 Переводчик предлагает выбрать

соответствующую тематику текста: авто, бизнес, интернет, общий, право и техника. Кроме того, имеется простая, но очень полезная функция – непосредственно под окном для ввода текста расположен небольшой удобный словарь.
Слайд 53

10. Windows Live Translator http://www.microsofttranslator.com/Default.aspx Компания Microsoft запустила свой онлайновый сервис

10. Windows Live Translator http://www.microsofttranslator.com/Default.aspx

Компания Microsoft запустила свой онлайновый сервис перевода Windows

Live Translator.
По своим функциональным возможностям данный онлайн-переводчик практически не отличается от стандартных онлайн-переводчиков. Переводчик поддерживает 19 языков.
Слайд 54

Все переводы с английского языка на европейские языки (кроме русского), китайский

Все переводы с английского языка на европейские языки (кроме русского), китайский

и японский осуществляются собственным переводчиком, разработанным компанией Microsoft, а все остальные переводы выполняются на базе переводческой технологии Systran.
Удобством этого онлайн-переводчика является русскоязычный интерфейс, устанавливаемый автоматически, в зависимости от IP.
Однако разработчики наложили ряд ограничений на функциональные возможности данного сервиса: в режиме перевода текста можно загружать тексты объемом только до 500 символов.