Переводчики онлайн - мой тестик
Как вероятно все уже знают Microsoft запустил сервис Windows Live Translator (бета) - онлайновый сервис для перевода текстов и целых веб-страниц с одного языка на другой.
Как и все системы машинного перевода Windows Live Translator не является идеальным. Перевод получается приблизительным и зачастую бессвязным.
Я решил сравнить как работают переводные сервисы поисковых систем и некоторых других “отдельно стоящих” сервисов. Интересные данные получаются :)
Исходный текст (первый абзац статьи о машинном переводе в английской Википедии):
Machine translation, sometimes referred to by the acronym MT, is a sub-field of computational linguistics that investigates the use of computer software to translate text or speech from one natural language to another. At its basic level, MT performs simple substitution of words in one natural language for words in another. Using corpus techniques, more complex translations may be attempted, allowing for better handling of differences in linguistic typology, phrase recognition, and translation of idioms, as well as the isolation of anomalies.
Windows Live Translator, Yahoo!, AltaVista а также популярный (и забитый по завязку рекламой) Free Online Language Translator выдали почти идентичный перевод (Language Translator не перевел пару слов):
Машинным переводом, иногда ссылался к M T акронима, будет sub-field вычислительной лингвистики которая расследует пользу средства программирования компьютера перевести текст или речь от одного естественного языка к другим. На своем основном уровне, M T выполняет просто замещение слов в одном естественном языке для слов в других. Использующ методы corpus, более сложные переводы могут быть попытаны, позволяющ для более лучший регулировать разниц в лингвистических типологии, опознавании фразы, и переводе идиоматизмов, также,как изоляция аномалий.
Вероятно это не удивительно если принять во внимание что программное обеспечение для перевода языков всем вышеуказанным компаниям предоставил один разработчик - Systran.
Так же как и для Google. Но при этом, как ни странно, у Google переведенный текст значительно отличается от конкурентов:
Автоматический перевод, иногда называют путем сокращения СП является подпункта области компьютерной лингвистики расследует использование компьютерных программ для перевода текста или речи с одного естественного языка на другой. На своем базовом уровне, MT выполняет простой замене одного слова в естественном языке слов, в другом. Использование корпус методы, более сложные переводы могут быть попытки, что позволяет лучше с различиями в языковой типологии, слова признания и перевод фразы, а также изоляции аномалий.
Не намного понятнее :), но нет откровенных ляпов типа позволяющ, использующ, попытаны… И все слова переведены. Вероятно здесь и срабатывает знаменитый “искуственный интелект от Google” :) … и конечно помощь пользователей этого онлайн переводчика.
Ведь к программному обеспечению от Systran, в полном соответствии с веяниями времени, Google добавил функцию “Suggest a better translation” с помощью которой можно предложить свой вариант перевода. При накоплении определенного количества исправлений система перевода “становиться умней” и постепенно со временем (как обещает Google) будет переводить все лучше и лучше.
И на последок - русскоязычный онлайн сервис от компании PROMT:
Машинный перевод, иногда упоминаемый МП акронима, является подполем компьютерной лингвистики, которая исследует использование программного обеспечения, чтобы транслировать текст или речь от одного естественного языка до другого. На его основном уровне, МП выполняет простую замену слов на одном естественном языке для слов в другом. Используя методики совокупности, более сложные трансляции могут быть предприняты, учитывая лучше обрабатывание различий в лингвистической типологии, распознавании фразы, и трансляции идиом, так же как изоляции аномалий.
Совсем даже не плохо! Во всяком случае - единственный переводчик, из тех что я использовал, который правильно перевел аббревиатуру MT (Machine Translation) на русский язык.
Конечно, мое “исследование” никак не претендует на какие-то выводы. Это просто так - наблюдения человека заинтересованного. А для того чтобы сказать что-то существенное, нужны более серьезные тесты.
Кстати - перевод от Google уже завоевывал кой-какие первые места. Правда это был такой далекий 2005 год :)