август 19, 2014
Сотрудники компании FireEye обнаружили в переводчике Google тайный шифр, основанный на латинской фразе "Lorem Ipsum", использующейся в интернете в качестве бессмысленного текста для заполнения пустого места на макетах веб-страниц. Об этом в своём блоге сообщил специалист по кибербезопасности Брайан Кребс.
В интернете.
rkn.gov.ru
Шифр удалось обнаружить исследователю FireEye Майклу Шукри (Michael Shoukry) и его помощнице, не называющей своего реального имени и пользующейся в сети никнеймом Kraeh3n.
Секретный "язык" оказался встроен в сервис Google Translate. При вводе в поле перевода латинского словосочетания "lorem ipsum", написанного с двух строчных букв, сервис сообщал, что по-английски оно означает "Китай". Обратный порядок слов — "ipsum lorem" — переводился как "интернет". Те же слова, но написанные с заглавных букв — "Lorem Ipsum" — выдавали аббревиатуру Организации Североатлантического альянса, НАТО (NATO).
Ввод в Google Translate ещё нескольких версий написания фразы позволял обнаружить и другие засекреченные слова. Большая их часть была так или иначе связана со всемирной сетью и Китаем.
Дальнейшие исследования показали, что в качестве шифра использовались не только первые два слова из текста шаблонной фразы, а вся фраза целиком. Перевод разных отрывков текста выдавал порой самые удивительные результаты — от фраз о том, что "Россия возможно будет страдать", до предложений вроде "Китай — это боль" и "Возможно, это и есть интернет".
Мы подумали, что, возможно, Google просто ошибается в переводе. Но то, что слова получают такие значения — Китай, НАТО, свободный интернет — заставило задуматься. Просто баг? Или шифр внедрён в переводчик намеренно? Неужели с его помощью кто-то может общаться? Что это на самом деле?
Как пишет Брайн Кребс, узнавший об открытии странного шифра в Google Translate от одного из своих знакомых, исследователям удалось протестировать "баг" в переводчике всего несколько недель. Начиная с 16 августа слова "Lorem Ipsum", в каком бы виде они ни были написаны, стали выдавать только один вариант перевода — "Lorem Ipsum".
Представитель Google рассказал Кребсу, что интернет-компания обнаружила неисправность в алгоритме переводчика и устранила её. Странности перевода в IT-гиганте объяснили сбоем в сервисе, отказавшись от дальнейших комментариев.
Существующий сегодня алгоритм перевода Google Translate был внедрён американской интернет-компанией в 2007 году. Система основывается на постоянном самообучении, улучшая собственные способности за счёт анализа текстов, переведённых с одного языка на другой живыми людьми. Часть языковых пар переводится Google напрямую, другие — через промежуточный перевод на английский язык.
Фраза-шаблон, начинающаяся со слова "", представляет собой искажённый отрывок из трактата древнеримского философа и государственного деятеля Цицерона "О пределах добра и зла". Трактат был написан в 45 году до нашей эры.
Версия фразы, использующаяся дизайнерами при заполнении макетов страниц, не имеет перевода. Оригинальный же кусок, из которого сделан шаблон, выглядит так: "Neque porro quisquam est, qui dolorem ipsum, quia dolor sit, amet, consectetur, adipisci velit" (перевод: "нет никого, кто возлюбил бы, предпочел и возжаждал бы само страдание только за то, что это страдание"),.