ИИ проиграл в лексическом богатстве специалистам по переводу текстов

11 февраля

Исследователи из Мэрилендского и Тилбургского университетов решили сравнить, как искусственный интеллект способен справляться с переводами текстов с точки зрения грамматической и лексической насыщенности. Результаты экспериментов порадовали – выяснилось, что человек-переводчик справляется с зарубежным материалом гораздо лучше, чем машинные алгоритмы. Однако есть и плохое открытие – ученые установили, что машинный перевод способен оказывать негативное влияние на чистоту человеческого языка.

Экспериментаторы изучили несколько различных категорий машинной обработки текста, среди которых – статистический машинный перевод, нейронная МО, Transformer от программистов Microsoft, а также сети долгой краткосрочной памяти. Каждому из машинных алгоритмов было предложено выполнить перевод между французским, английским и испанским языком. После этого исходные тексты ученые сравнили с полученными обработанными материалами по девяти критериям.

«Результаты эксперимента оказались однозначными. Нами было установлено, что независимо от того, какой тип модели машинной обработки мы использовали, обучающие данные всегда превосходили машинный перевод по лексическому и грамматическому разнообразию. Иными словами, с точки зрения синонимов и лексики, переводы из набора рекомендаций во всех случаях были более насыщенными и разнообразными», – отмечают эксперты.

В резюме эксперимента ученые отметили, что в связи с широким использованием различных систем МО наступил момент, когда требуется изучить влияние алгоритмов ИИ на человеческий язык. Ученые задались вопросом, если машинный перевод – упрощенная версия обучающих данных, о чем это может говорить с позиции социолингвистики и как данный прецедент повлияет на чистоту человеческого языка в ближайшие годы?

Читайте также