Европейские языки погибнут в цифровом мире
Группа ученых из различных европейских стран определила цифровое представление 21 из 30 изученных языков как "несуществующее" или в лучшем случае "слабое". Отчет приурочен к Европейскому дню языков...
Группа ученых из различных европейских стран определила цифровое представление 21 из 30 изученных языков как "несуществующее" или в лучшем случае "слабое". Отчет приурочен к Европейскому дню языков (26 сентября), символизирующему важность развития богатого языкового и культурного наследия Европы.
Исландский, латвийский, литовский и мальтийский языки имеют наивысший риск исчезновения в цифровом мире, но и другие языки, такие как болгарский, греческий, венгерский и польский, тоже под угрозой.
Исследование, подготовленное более чем 200 экспертами и описанное в 30 частях на официальном онлайн-ресурсе исследовательских центров Многоязычного европейского технологического сообщества (Multilingual Europe Technology Alliance Network of Excellence, META-NET), оценило технологическую поддержку каждого из языков в четырех различных областях: машинный перевод, речевое взаимодействие, текстовый анализ и доступность языковых источников.
Несколько языков, например исландский, латвийский, литовский и мальтийский, получили низший балл по всем четырем направлениям. Даже английский с его наилучшим результатом не может считаться имеющим "отличную поддержку" – только "хорошую". Голландский, французский, немецкий, итальянский и испанский получили оценку "посредственная поддержка". Такие языки как баскский, болгарский, каталонский, греческий, венгерский и польский имеют "фрагментарную поддержку", что также относит их к группе повышенного риска.
Языковые компьютерные технологии используются для обработки устной и письменной речи. Известные примеры: проверка орфографии и грамматики, цифровые "личные помощники" (такие как Siri для iPhone), телефонные диалоговые системы и поисковые сайты.
Нехватка необходимого ПО для языков высокого риска означает, что они не смогут выжить в нынешнем цифровом мире. Языковые технологические системы зависят в первую очередь от больших массивов разговорных и письменных данных, которые трудно составить для языков с относительно небольшим числом носителей.
Окончательный вывод отчета: Европе нужны скоординированные широкомасштабные мероприятия для создания недостающих технологий и их переноса на языки, близкие к цифровому вымиранию. Профессор Ганс Узкорейт, координатор META-NET, сказал: "Результаты нашего исследования весьма тревожны. Большинству европейских языков уделяется недостаточно внимания, а некоторые практически игнорируются. В свете этих результатов мы сейчас не можем быть уверены в будущем значительной части наших языков."