24/05/2017 Услуги перевода Цены Акции Статьи Блог Контакты Заказать перевод

Машинный перевод: фантастика или реальность?

Машинный перевод: фантастика или реальность?

Сегодня в нашем блоге мы предлагаем внести некоторую ясность в вопросе, волнующем умы как профессиональных лингвистов, так и обывателей, далеких от лингвистических споров.

Качественный машинный перевод уже стал классикой научной фантастики, однако в отличие от экспериментов по телепортации, необходимые для машинного перевода технологии уже существуют, и систем машинного перевода появилось уже весьма не мало и они продолжают совершенствоваться. С виду подобные тенденции для людей, занимающихся переводом, выглядят угрожающе, поскольку грозятся отобрать у переводчика его хлеб, однако при ближайшем рассмотрении выясняется, что машина ещё и близко не подошла к тому, чтобы заменить человека, и на то есть свои причины.

Для начала следует разобраться, что же такое машинный перевод, и каких он бывает разновидностей. Согласно свободной энциклопедии «Википедия», «Машинный перевод - это процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем." Сразу стоит обратить внимание на фразу «в идеале» smile:idea: . Системы машинного, или автоматического перевода не идеальны. Даже машинный письменный перевод далек от совершенства, чего уж говорить об устном. При использовании систем машинного перевода без использования человека не обойтись, в силу чего различаются несколько видов взаимодействия человека и компьютера:

1. Постредактирование — машина делает перевод, человек-редактор перевод исправляет.
2. Предредактирование — человек адаптирует текст, делает его более подходящим для переработки машиной (текст размечается, устраняются единицы текста с неоднозначным значением и т. д.)
3. Интерредактирование — редактирование текста происходит непосредственно в процессе перевода.
4. Смешанные системы — используются несколько принципов взаимодействия человека и машины

Из вышеупомянутого следует, что автоматический перевод на нынешнем этапе развития не такой уж и автоматический — человека так или иначе стоит привлекать к работе, оплачивать его труд и т. д. А делать это приходится именно потому, что автоматический перевод несовершенен smile:( . На данный момент ни одна система машинного перевода не способна выполнить полноценный письменный перевод, который бы требовал минимальной редактуры, или не требовал её вовсе. Всё дело в принципе работы подобных программ.

Различаются два основных алгоритма машинного перевода:
основанный на правилах;
основанный на статистике.

В первом случае программа использует заложенные в неё грамматические, морфологические и синтаксические правила, во втором — большой объем языковых пар (тексты на двух разных языках, содержащие соответствующие друг другу предложения). Первый принцип используется в большинстве автономных систем (ПРОМТ и т. д.), по второму принципу работают онлайновые системы перевода: Google Translate, Яндекс.Перевод и Lingvo.Pro компании ABBYY. Исходя из опыта использования подобных систем, можно сделать вывод, что статистические системы демонстрируют намного более удовлетворительные результаты. Переводчик Google действительно выдаёт относительно вменяемый текст, причем можно даже говорить о сохранении тематики. Минусом статистического принципа является, во-первых, необходимость наличия подключения к интернету, во-вторых, зависимость от базы данных. Крупные концерны, такие как Google, располагают огромной базой данных, которую можно использовать для операции перевода, однако не все компании являются Гуглом.

Говоря же о тематике, одним из принципов, которыми должен руководствоваться пользователь, если он желает получить машинный перевод относительно приемлемого качества, является правильный подбор тематики и максимально возможная стандартизация текста. Наиболее стандартизованные тексты машина переводит наиболее адекватно, по крайней мере при использовании статистического принципа.

Являясь преимуществом для перевода текстов технической тематики, для художественных текстов стандартизация не применима, т. к. в художественном тексте наиболее важным критерием как раз таки является новизна, нестандартность использования языковых средств и экспрессивность. Таким образом, несмотря на прогресс систем автоматического перевода, главенствующая роль всё же принадлежит человеку.

Кроме того, результат работы автоматической системы перевод может стать прекрасным поводом для смеха, а если не повезёт, то и для беды. К счастью, большинство людей не готово доверить машине перевод важных документов, а вот веселья от существующих вариантов переводов программой генерируется предостаточно. Один из канонических примеров раннего этапа развития машинного перевода: фраза из Евангелия от Матфея (Матф. 26:41) на латинском Spiritus quidem promptus est caro autem infirma была переведена на русский следующим образом: «Водка крепка, а закуска протухла» smile:oops: . Что тут сказать.

И ещё кое-что: автоматический перевод не стоит путать с автоматизированным. Самое главное отличие — при автоматизированном переводе переводчиком является именно человек. При этом используются специальные программы, позволяющие улучшить качество перевода. К ним могут относиться:

электронные словари (ABBYY Lingvo, Multitran, Multilex, GoldenDict и т. д.);
программы проверки правописания;
программы проверки грамматики;
терминологические базы данных;
программы автоматизированного перевода (OmegaT, Trados).

Вопрос качества работы систем машинного перевода стоит на стыке двух дисциплин: информационных технологий и лингвистики, причем ни одна из них пока не готова предложить решения для системы перевода, способной конкурировать с разумом человека. Ни в IT, ни в лингвистике до сих пор не раскрыт вопрос природы человеческой речи, глубинный принцип её формирования не ясен, а потому о системах, способных полностью заменить человека мы можем только мечтать, что, возможно, и к лучшему smile;) .

Ошибка добавления комментария:
Неверно указан код защиты от автоматических сообщений.