Компьютерная терминография и компьютерный перевод

Содержание

Слайд 2

1.1. Понятие компьютерной терминографии. Термин как основной объект терминографии. Построением специальных

1.1. Понятие компьютерной терминографии. Термин как основной объект терминографии.

Построением специальных

терминологических словарей занимается
терминография, представляющая собой особый раздел лексикографии.
В то же время терминография тесно связана с терминоведением - наукой о терминах. Соответственно,
компьютерная терминография - это наука о составлении электронных терминологических словарей.
Слайд 3

Термин - это слово (словосочетание) метаязыка науки или области практической деятельности

Термин - это слово (словосочетание) метаязыка науки или области практической деятельности

человека, имеющее четкое и (по возможности) однозначное определение, требующее специальных знаний из соответствующей профессиональной сферы.

Терминосистема в целом отражает соответствующую область знания, а каждый ее компонент (термин) называет или характеризует составляющие этой области знания.

Поскольку области знания объективны, а термины и терминосистемы «привязаны» к конкретному языку или даже к конкретной научной школе, важной задачей терминографии становится стандартизация и унификация терминов, а также их однозначный перевод на разные языки мира.
Унификации терминосистем служат терминологические стандарты.

Слайд 4

1.2. Терминологические банки данных. Современные компьютерные технологии позволяют обрабатывать и сохранять

1.2. Терминологические банки данных.

Современные компьютерные технологии позволяют обрабатывать и сохранять большие

массивы терминов по различным областям знания.
Такие массивы терминов называются терминологическими базами (банками) данных (ТБД).

По количеству задействованных в базе данных языков различаются переводческие (многоязычные) и информационно-нормативные (одноязычные) ТБД.

Слайд 5

Крупные ТБД имеются: • в Научно-исследовательском институте комплексной информациипо стандартизации и

Крупные ТБД имеются:
• в Научно-исследовательском институте комплексной информациипо стандартизации и качеству

(ВНИИКИ) (www.vniiki.ru);
• в Международной организации по стандартизации (англ. ISO =International Organization for Standardization, www.iso.org/obp/ui).

Большинство электронных терминологических словарей носит дескриптивный характер и представляет термины отдельной отрасли знания. При этом востребованы и толковые (одноязычные), и переводные (двуязычные или многоязычные) словари. Разнообразные терминологические словари русского языка (анатомический, экономический, психологический и т.д.) представлены, в частности, на портале Gramota.ru (www.gramota.ru/slovari/online), а переводные терминологические словари, относящиеся к разным отраслям знания, можно найти по адресу www.diclib.com.

Слайд 6

При описании термина важными оказываются следующие его свойства, сопоставимые с отдельными

При описании термина важными оказываются следующие его свойства, сопоставимые с отдельными

зонами словарной статьи:
1) семантика: связь термина с обозначаемым понятием;
2) словоизменение: особенности образования морфологических форм термина;
3) словообразование: включение термина в словообразовательное гнездо, установление связей между однокоренными словами (ср.прилагательные коммуникативный и коммуникационный, относящиеся к разным значениям термина «коммуникация»);
4) синтаксические связи: управление, сочетаемость с другими терминами и нетерминами;
5) парадигматические связи в терминосистеме: синонимы, антонимы, гиперо-гипонимические связи, пересечения значения, терминологические ряды;
6) произношение;
7) примеры использования в контексте;
8) происхождение;
9) переводные эквиваленты.
Слайд 7

2.1 Понятие перевода и машинного перевода. Свыше 5 млрд. жителей Земли

2.1 Понятие перевода и машинного перевода.

Свыше 5 млрд. жителей Земли

используют около трех тысяч языков, и все большее их количество включается в мировые информационные потоки.

Перевод обычно понимается как деятельность, «в результате которой некоторый текст на одном языке ставится в соответствие тексту на другом языке, при этом обеспечивается их смысловая эквивалентность».

Слайд 8

2.2 Классификация и примеры систем МП. Системы машинного перевода моделируют работу

2.2 Классификация и примеры систем МП.

Системы машинного перевода моделируют работу

человека-переводчика.

Машинный (или автоматический) перевод (МП) - выполняемое компьютером действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.

К числу наиболее распространенных в России систем МП относятся:
• Stylus - система МП, включающая множество словарей по разным предметным областям;
• Universal Translator— многоязычная система МП;
• Socrat - система, позволяющая сканировать документы, переводить их содержимое и проверять орфографию;
• Polyglossum - многоязычная система МП с широким набором предметных словарей;
• Promt - многоязычная система МП, содержащая множество словарей по разным предметным областям;
• Web TranSite- система для перевода веб-страниц (сам процесс перевода веб-страниц и сообщений компьютерных программ называется локализацией).

Слайд 9

С точки зрения роли человека в процессе выполнения МП различают следующие

С точки зрения роли человека в процессе выполнения МП различают следующие

его виды:
• МАНТ (Machine-assisted human translation) - перевод, осуществляемый человеком с использованием компьютера;
• НАМТ (Human-assisted machine translation) - машинный перевод при участии человека;
• FAMT (Fully-automated machine translation) - полностью автоматизированный машинный перевод.

Три поколения систем:
1) П-системы - системы прямого перевода (direct systems);
2) Т-системы - системы с синтаксическим преобразованием исходного текста (от англ. transfer - преобразование);
3) И-системы - системы с семантическим и прагматическим анализом (interlingua- язык-посредник).

Слайд 10

2.3 Этапы осуществления полностью автоматизированного МП. В целом схема машинного перевода

2.3 Этапы осуществления полностью
автоматизированного МП.

В целом схема машинного перевода

включает следующие этапы:
1) ввод в компьютер текста на ИЯ,
2) его морфологический анализ, т.е. определения части речи и морфологических характеристик каждого слова,
3) синтаксический анализ каждого предложения текста ИЯ (поиск основных членов предложения и определение типов синтаксических связей между ними, выражаемых в виде дерева зависимостей или дерева непосредственных составляющих),
4) семантический анализ каждого предложения ИЯ, в результате которого создается семантическое представление этого предложения, независимое от типа языка (общее и для ИЯ, и для ПЯ),
5) синтаксический синтез предложений ПЯ (создание предложений правильной синтаксической структуры, соответствующей правилам ПЯ и типу синтаксической структуры предложения на ИЯ,
6) морфологический синтез каждого слова в составе отдельных предложений текста ПЯ (постановка слов ПЯ в нужных морфологических формах);
7) вывод текста на ПЯ.
Слайд 11

2.4 Параметры оценки систем МП. Сравнение и оценка систем МП осуществляется

2.4 Параметры оценки систем МП.

Сравнение и оценка систем МП осуществляется по

следующим параметрам (Framework for the Evaluation of Machine Translation, FEMTI):
• характеристики программного обеспечения: надежность системы, удобство использования, скорость работы, возможность обновлений, эффективность, мобильность и т.п.;
• характеристики пользователя и задач перевода: особенности пользователя, автора и текста, а также назначение перевода;
• особенности системы МП: стратегия построения системы, лингвистические ресурсы и т.п.;
• специфика выходного текста: точность, целостность, стиль и т.п., а также наличие ошибок любого характера.
Слайд 12

2.5 Проблемы МП. Отдельные трудности процесса МП связаны с необходимостью определения

2.5 Проблемы МП.

Отдельные трудности процесса МП связаны с необходимостью определения

анафорических связей в текстовом целом (anaphorare solution), снятия омонимии на разных уровнях, а также с необходимостью привлечения в процесс перевода экстралингвистических знаний.

Председатель Центральной избирательной комиссии назначается президентом Российской Федерации.
Согласно задумкам американских ученых, сразу после старта вражеские ракеты будут уничтожать авиационные лазеры и мобильные комплексы малых противоракет.