Website translation into 96 languages

Friday 25 November 2016

Человечество приблизилось к созданию универсального языка

Нейросеть Google Translate составила единую базу смыслов человеческих слов
Ошибки в переводе у Google Translate будут теперь случаться гораздо реже благодаря технологии нейронных сетей, которую компания предложила для восьми языковых пар.


Сама Google называет алгоритм – Neural Machine Translation или, сокращённо, NMT – крупнейшим достижением в машинном переводе естественного языка за последнее десятилетие.

«Универсальный язык» нейронной сети Google Neural Machine Translation (GNMT). На левой иллюстрации разными цветами показаны кластеры значений каждого слова, справа внизу — смыслы слова, полученные для него от из разных человеческих языков: английского, корейского и японского.



Перевод текста теперь полностью выполняет нейросеть. Традиционно ИИ использовался в Google Translate в ограниченном режиме, для некоторых вспомогательных задач. Например, для сравнения текстов, доступных на нескольких языках, вроде официальных документов ООН или Европарламента. В таком режиме сравнивался перевод каждого слова в текстах.

Нейросеть NMTS работает на принципиально новом уровне. Она не только анализирует существующие варианты перевода в процессе обучения, но и выполняет интеллектуальный анализ предложений, разбивая их на «словарные сегменты». В определённой репрезентации внутри сети эти «словарные сегменты» соответствуют смыслам слов.

Эта внутренняя репрезентация внутри сети и является в каком-то определении универсальным языком человечества. К сожалению, люди не смогут разговаривать на нем, потому что язык представляет собой машинный код. Тем не менее, существование такой универсальной базы смыслов, которая объединяет все языки мира является научным достижение.


Некоторые Примеры смешивания целевых языков в многоязычной модели
Улучшилась и способность Google Translate к контекстному переводу – NMT анализирует фразу или абзац, а не отдельные слова, что позволяет получить более естественный и грамматически правильный перевод.
На данный момент перевод с помощью нейронных сетей работает только на восьми языках: английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком. В планах Google - реализовать поддержку всех языков, которые сейчас доступны в сервисе.


Новая универсальная архитектура GNMT, которая переводит любые языковые пары


Специалисты объясняют, что «новый универсальный язык» — представляет собой единое многомерное пространство, составленное при помощи техники t-SNE, то есть методом нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding).

Научная работа с описанием многоязычной системы машинного перевода Neural Machine Translation System на базе нейросети опубликована в открытом доступе. 

ОФИЦИАЛЬНЫЙ САЙТ: http://www.mediaholding100.com/
ON-LINE ТЕЛЕВИДЕНИЕ: http://www.televidenie.tv/
FACEBOOK: