Постредактирование машинного перевода

Содержание

Слайд 2

Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП

Содержание

1. Место МП в переводческом процессе
2. Экспресс-оценка применимости МП
3. Улучшение качества

МП
4. Стратегии постредактирования МП
5. Оценка эффективности интеграции МП
Слайд 3

Место МП в переводческом процессе Классическая схема: Источник –> переводчик –>

Место МП в переводческом процессе

Классическая схема:
Источник –> переводчик –> реципиент
Схема с

МП:
Источник –> МП –> переводчик –> реципиент
Эффекты от изменения схемы:
Фокус работы переводчика смещается с перевода на редактирование.
В отличие от типичного процесса с живым переводчиком и редактором, здесь имеем дело с механизированной письменной речью (робот).
Слайд 4

Место МП в переводческом процессе Особенности работы с роботом-переводчиком Преимущества Возможность

Место МП в переводческом процессе

Особенности работы с роботом-переводчиком
Преимущества
Возможность настройки
Предсказуемость поведения
Отсутствие ошибок из-за

человеческого фактора
Недостатки
Требует навыков и умения в обращении
Требует понимания алгоритмов работы
Вероятность трудноисправимых ошибок разработчиков
Слайд 5

Место МП в переводческом процессе Первые впечатления от машинного перевода аналогичны

Место МП в переводческом процессе

Первые впечатления от машинного перевода аналогичны реакции редактора

на неидеальный перевод:
Все плохо, выкинуть и переписать
Вот здесь грубейшая ошибка и тут просто смешно
А вот тут сообразил, молодец…
Готовый перевод = сумма работы МП и переводчика, при этом работа переводчика не равна нулю.
Ключевой фактор для качественного и эффективного редактирования – степень доверия автору редактируемого текста.
Слайд 6

Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП

Содержание

1. Место МП в переводческом процессе
2. Экспресс-оценка применимости МП
3. Улучшение качества

МП
4. Стратегии постредактирования МП
5. Оценка эффективности интеграции МП
Слайд 7

Экспресс-оценка применимости МП Подход к оценке: Акцент на удобство редактирования МП

Экспресс-оценка применимости МП

Подход к оценке:
Акцент на удобство редактирования МП
Базовые сведения о

технологии
Доступная функциональность с точки зрения организации процесса перевода
Применимость МП к текстам определенного типа
Возможности для повышения степени доверия к МП
Слайд 8

Экспресс-оценка применимости МП Критерии для оценки МП: Эквивалентность по числу компонентов

Экспресс-оценка применимости МП

Критерии для оценки МП:
Эквивалентность по числу компонентов предложения и

эквивалентность перевода по каждому компоненту
Исходный текст:
Being a leading group in the field, we are seeking for best methods
Машинный перевод:
Будучи одной из ведущих в этой области, мы ищем наиболее эффективные методы
Пропущенные составляющие: group
Неэквивалентный перевод: best
Слайд 9

Экспресс-оценка применимости МП Критерии для оценки МП: Знание предметной области Исходный

Экспресс-оценка применимости МП

Критерии для оценки МП:
Знание предметной области
Исходный текст:
Drilling mud is

pumped down the pipe to cool the bit
Машинный перевод:
Буровой раствор закачивается вниз по трубе для охлаждения бита
Неэквивалентный перевод для предметной области: bit
Слайд 10

Экспресс-оценка применимости МП Критерии для оценки МП Устойчивость соблюдения терминологии Исходный

Экспресс-оценка применимости МП

Критерии для оценки МП
Устойчивость соблюдения терминологии
Исходный текст:
The document contains

a heading with the heading data inserted by the system.
Машинный перевод:
Документ содержит заголовок с возглавляющими данными, вставленными системой.
Несоблюдение терминологии: heading
Слайд 11

Экспресс-оценка применимости МП Критерии для оценки МП Связность: слова-связки, служебные части

Экспресс-оценка применимости МП

Критерии для оценки МП
Связность: слова-связки, служебные части речи, окончания
Исходный

текст:
The level set by the user is incorrect.
Машинный перевод:
Уровня, установленного пользователем является неверным.
Ошибки в связности: падеж слова «уровень» и зависимых от него, пропущенная запятая после «пользователем»
Слайд 12

Экспресс-оценка применимости МП Выводы по оценке МП

Экспресс-оценка применимости МП

Выводы по оценке МП

Слайд 13

Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП

Содержание

1. Место МП в переводческом процессе
2. Экспресс-оценка применимости МП
3. Улучшение качества

МП
4. Стратегии постредактирования МП
5. Оценка эффективности интеграции МП
Слайд 14

Улучшение качества МП Настройка МП – отдельный этап перед началом процесса

Улучшение качества МП

Настройка МП – отдельный этап перед началом процесса перевода,

который имеет смысл при:
большом объеме однородных текстов,
жестких требованиях к терминологии и стилю,
работе в команде переводчиков,
крайне сжатых сроках.
Слайд 15

Улучшение качества МП Основные шаги Определение тематики подлежащего переводу текста и

Улучшение качества МП

Основные шаги
Определение тематики подлежащего переводу текста и подбор подходящих

(специализированных) словарей.
Получение списка наиболее частых терминов-оборотов в переводимых текстах, определение их переводных эквивалентов и занесение в словарь.
Получение списка наиболее часто встречающихся слов и проверка их текущего перевода системой МП.
Установка требуемых правил перевода.
Слайд 16

Улучшение качества МП Результаты: Повышение оценки применимости МП по вышеперечисленным критериям,

Улучшение качества МП

Результаты:
Повышение оценки применимости МП по вышеперечисленным критериям, в частности:

выдерживание терминологии и предметной области.
= >
Снижение объема редактирования МП переводчиком:
за счет настройки предметной области – с 80 % до 50 %,
за счет настройки терминологии – с 50 % до 30 %.
= >
Повышение общего качества готового перевода.
Слайд 17

Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП

Содержание

1. Место МП в переводческом процессе
2. Экспресс-оценка применимости МП
3. Улучшение качества

МП
4. Стратегии постредактирования МП
5. Оценка эффективности интеграции МП
Слайд 18

Стратегии постредактирования МП Полное редактирование с проверкой каждого компонента текста по

Стратегии постредактирования МП

Полное редактирование с проверкой каждого компонента текста по исходному

фрагменту
Исходный текст:
To this end, final analysis results are not quite obvious.
Машинный перевод:
С этой целью окончательные результаты анализа не совсем очевидны.
Перевод переводчика:
Заключение, полученное в результате анализа, не дало окончательного ответа на этот вопрос.
(При этом в глоссарии: analysis results = результаты анализа)
Объем постредактирования предложения: 100 %
Слайд 19

Стратегии постредактирования МП Использование МП исключительно в качестве подсказки по терминологии

Стратегии постредактирования МП

Использование МП исключительно в качестве подсказки по терминологии
Исходный текст:
To

this end, final analysis results are not quite obvious.
Машинный перевод:
С этой целью окончательные результаты анализа не совсем очевидны.
Перевод переводчика:
Окончательные результаты анализа, тем не менее, не дали ответа на этот вопрос.
(При этом в глоссарии: analysis results = результаты анализа)
Объем постредактирования предложения: 82 %
Слайд 20

Стратегии постредактирования МП Использование МП в качестве грамматического подстрочника с подбором

Стратегии постредактирования МП

Использование МП в качестве грамматического подстрочника с подбором синонимичных

выражений
Исходный текст:
SWIFT also brings the financial community together to work collaboratively to shape market practice and define standards
Машинный перевод:
SWIFT также примиряет финансовое сообщество для работы совместно, чтобы сформировать практику рынка и определить стандарты
Перевод переводчика:
SWIFT также объединяет финансовое сообщество для совместной работы в целях формирования рыночной практики и определения стандартов
Объем постредактирования предложения: 65 %
Слайд 21

Стратегии постредактирования МП Чтение МП и исправление вызывающих сомнения мест с

Стратегии постредактирования МП

Чтение МП и исправление вызывающих сомнения мест с обращением

к исходному тексту
Исходный текст:
Distributor may not take legal action against any infringer without SDA's prior written consent.
Машинный перевод:
Дистрибьютор может не подать в суд против никакого нарушителя без предварительного письменного согласия SDA.
Перевод переводчика:
Дистрибьютор не имеет права подавать в суд на какого-либо нарушителя без предварительного письменного согласия SDA
Объем постредактирования предложения: 34 %
Слайд 22

Стратегии постредактирования МП Чтение МП и исправление очевидных погрешностей без обращения

Стратегии постредактирования МП

Чтение МП и исправление очевидных погрешностей без обращения к

исходному тексту
Исходный текст:
Our study focuses on emergent visual rhetorical practices that can inspire advertisers.
Машинный перевод:
Наше исследование сосредотачивается на визуальных риторических методах на стадии становления, которые могут вдохновить рекламодателей.
Перевод переводчика:
Наше исследование сосредотачивается на визуальных риторических приемах, находящихся на стадии становления, которые могут вдохновить рекламодателей.
Объем постредактирования предложения: 14 %
Слайд 23

Стратегии постредактирования МП Сводная таблица по стратегиям редактирования

Стратегии постредактирования МП

Сводная таблица по стратегиям редактирования

Слайд 24

Стратегии постредактирования МП Основные критерии для выбора стратегии редактирования: знание предметной

Стратегии постредактирования МП

Основные критерии для выбора стратегии редактирования:
знание предметной области
степень владения

исходным и целевым языком
сроки и предполагаемый объем постредактирования
опыт работы с данной системой МП
степень доверия машинному переводу
наличие технических средств для анализа внутренней структуры МП
Слайд 25

Содержание 1. Место МП в переводческом процессе 2. Экспресс-оценка применимости МП

Содержание

1. Место МП в переводческом процессе
2. Экспресс-оценка применимости МП
3. Улучшение качества

МП
4. Стратегии постредактирования МП
5. Оценка эффективности интеграции МП
Слайд 26

Оценка эффективности интеграции МП Основные эффекты от интеграции: Увеличение скорости работы

Оценка эффективности интеграции МП

Основные эффекты от интеграции:
Увеличение скорости работы переводчика
Снижение объема

работы при редактировании переводов, полученных от команды переводчиков
Повышение качества готового перевода
Дополнительные затраты на интеграцию:
Техническое и организационное внедрение, обучение
Настройка МП по проекту
Влияющие факторы:
Квалификация переводчиков
Удобство технической инфраструктуры
Слайд 27

Оценка эффективности интеграции МП Пример статистики по проекту: Перевод: 66 страниц

Оценка эффективности интеграции МП

Пример статистики по проекту:
Перевод:
66 страниц
с английского на

русский
каталог продукции
Статистика ТМ: 19 % совпадений
Участники: 2 переводчика, редактор
Система МП: PROMT 9.5
Слайд 28

Оценка эффективности интеграции МП Пример статистики по проекту: Этап предварительной настройки

Оценка эффективности интеграции МП

Пример статистики по проекту:
Этап предварительной настройки МП:
Количество строк

в частотном списке – 305
Количество терминов, занесенных в словарь, – 110
Время настройки – 1:14
На 3 страницы текста приходится 5 терминов, заносимых в словарь.
Скорость настройки:
около 200 строк частотного списка в час, ИЛИ
около 78 терминов в час, ИЛИ
около 47 страниц в час
Слайд 29

Оценка эффективности интеграции МП Пример статистики по проекту: Этап постредактирования МП

Оценка эффективности интеграции МП

Пример статистики по проекту:
Этап постредактирования МП переводчиками:
в режиме

фриланс – 26 страниц/сутки
при почасовом контроле времени – 6 страниц/час
Этап редактирования текстов, полученных от переводчиков:
средний объем исправлений – 5 %
скорость редактирования – 16,5 страниц/час
Слайд 30

Оценка эффективности интеграции МП Пример статистики по проекту: Итого на 66

Оценка эффективности интеграции МП

Пример статистики по проекту:
Итого на 66 страниц:
Настройка МП

= 1,4 ч.
Перевод = 11 ч.
Редактирование = 4 ч.
= 16,4 ч.