Уважаемые пользователи Голос!
Сайт доступен в режиме «чтение» до сентября 2020 года. Операции с токенами Golos, Cyber можно проводить, используя альтернативные клиенты или через эксплорер Cyberway. Подробности здесь: https://golos.io/@goloscore/operacii-s-tokenami-golos-cyber-1594822432061
С уважением, команда “Голос”
GOLOS
RU
EN
UA
konstantin
6 лет назад

Почему AI до сих пор не освоил точный перевод языка?

Привет. В наше время, благодаря технологиям, мы ощущаем беспрецедентную возможность коммуникации между людьми. Однако, язык все еще остается барьером в бизнесе и маркетинге. Несмотря на то, что технологические устройства могут быстро и легко коммуницировать, людям из разных уголков мира часто это не доступно.

Бюро переводов работают, делая презентации, контракты, инструкции по аутсорсингу и рекламные объявления понятными всем предполагаемым получателям. Некоторые агентства также предлагают «локализацию» опыта. Например, если компания продает в Квебеке, рекламные объявления должны быть в Квебекском французском, а не на европейском французском. Компании, не склонные к риску, могут неохотно инвестировать в эти переводы. Следовательно, эти предприятия не достигнут полного проникновения на рынок.

Мировые рынки ждут, но языковой перевод на основе AI еще не готов, несмотря на недавние достижения в области обработки естественного языка и анализа настроений. У AI по-прежнему возникают трудности с обработкой запросов на одном языке без дополнительных осложнений перевода. В ноябре 2016 года Google добавила нейронную сеть в свой инструмент перевода. Однако, некоторые из его переводов по-прежнему неточны. 

Идеальный сценарий для машинного обучения и искусственного интеллекта - это что-то с фиксированными правилами и четким критериями успеха или неудачи. В качестве наглядного примера такого успеха можно привести шахматы и игру Go, где машина победила лучших игроков. Это произошло быстрее, чем кто-либо ожидал из-за очень четких правил игры и ограниченным набором ходов.

Язык является противоположным примером. Здесь не существует четких правил. Разговор может идти в бесконечном количестве разных направлений. И тогда, конечно, нам нужны маркированные данные для обучения. Мы должны объяснить машине, что является правильным, а что нет.

Но природа языка такова, что очень сложно сделать такие унифицированные маркеры. Даже два переводчика могут не согласится друг с другом по поводу точности перевода. Язык - это дикий запад, с точки зрения данных.

Технология Google теперь может анализировать весь контекст предложения, а не просто перевод отдельных слов. Тем не менее, глюки случаются довольно часто. Итак, почему последовательный точный перевод до сих пор ускользает от искусственного интеллекта?

Проблема в том, что анализ «всего» предложения все еще не является достаточным. Точно так же значение каждого конкретного слова в предложении зависит от остальной его части, а смысл предложения зависит от остальной части абзаца и остальной части текста, поскольку смысл текста раскрывается в более широком контексте, чем предложение, оно зависит от культуры, намерений говорящего и т.д.

Сарказм и ирония имеют смысл только в этом расширенном контексте. Аналогично, идиомы могут быть проблематичными для автоматизированных переводов.

Перевод Google хорош, если вы используете его только как инструмент, то есть не заменяете им человеческого понимания.

Мы должны понимать хрупкость машинной интерпретации. Потому что переводить - это в основном интерпретировать, это не просто идея, а ощущение. Человеческие чувства и идеи могут понять только люди, но даже и люди иногда не понимают друг друга.

Культура, пол и даже возраст могут создавать препятствия для этого понимания, а, кроме того, чрезмерная зависимость от технологий ведет нас к культурному и политическому упадку. Аргентинский писатель Хулио Кортазар называл словари «кладбищами». Он считает, что автоматические переводчики можно назвать «зомби».

Эрик Камбрия является научным исследователем AI и доцентом Технологического университета Наньян в Сингапуре. Он в основном фокусируется на обработке естественного языка, которая лежит в основе языкового AI-перевода. 

Он также видит сложности и связанные с этим риски. "Есть так много вещей, которые мы бессознательно делаем, когда читаем фрагмент текста". Чтение требует нескольких взаимосвязанных задач, которые не были учтены в прошлых попытках автоматизировать перевод.

Самая большая проблема с машинным переводом сегодня состоит в том, что мы склонны перейти от синтаксической формы предложения на языке оригинала к синтаксической форме этого предложения на языке перевода. Это не то, что мы, люди, делаем. Сначала мы расшифровываем значение предложения на оригинальном языке, а затем трансформируем этот смысл на родной язык.

Кроме того, существуют культурные риски, связанные с этими переводами. Новые технологические инструменты иногда отражают основные предубеждения.

Существует, как правило, два параметра, которые определяют то, как мы проектируем «интеллектуальные системы». Одним из них является значение, которое можно назвать предубеждением тех, кто создает эти системы. И второе - это окружающий мир, в котором они учились. Если вы создадите системы AI, которые в большей степени отражают предубеждения их создателей и окружающего мира, вы получаете некоторые, иногда очень серьезные неудачи.

Инструменты перевода должны быть прозрачными относительно их возможностей и ограничений. Идея о том, что одна система может воспринимать языки, которые очень разнообразны семантически и синтаксически друг от друга, и утверждать, что они объединяют или универсализуют их, или, по существу, делают их родственной сущностью, это неправильно.

Не смотря на существующие проблемы, по мнению некоторых экспертов эта сфера имеет коммерческий потенциал роста. Например, номенклатура товаров на онлайн-рынках, таких, как Amazon, потенциально могут быть автоматически переведены и оптимизированы для покупателей в других странах.

Подробней, фото1, фото2, фото3

0
848.590 GOLOS
Комментарии (5)
Сортировать по:
Сначала старые