Выбирай : Покупай : Используй

Вход для партнеров

Вход для продавцов

0

В открытый доступ выложен ИИ, расшифровывающий обрывки древних текстов. Фото

Технологии ИИ стали использовать для восстановления полного текста надписей на древнегреческом, которые уцелели лишь фрагментарно. Система также позволяет датировать и определять место происхождения текста. Правда, только с относительной точностью.

От фрагментов к целому

DeepMind, подразделение компании Alphabet, занимающееся решениями в области искусственного интеллекта (ИИ), разработало новую систему, которая позволяет не только восстанавливать древние тексты по фрагментам, но также приблизительно датировать их и определять место происхождения.

В частности, речь идет о древнегреческих надписях, нанесенных на неорганические поверхности (камень, металл), что исключает использование радиоуглеродного метода для их датирования. «Для решения этих задач эпиграфы ищут текстовые и контекстные параллели в похожих надписях. Однако для человека чрезвычайно сложно объять всю существующую релевантную информацию, чтобы выявить подлежащие паттерны», — говорит Теа Зоммершильд (Thea Sommerschield), историк и эксперт в области машинного обучения, которая участвовала в разработке новой системы.

Именно тут приходит на помощь машинное обучение. Программа, разработанная в DeepMind при участии Зоммершильд, Ithaca («Итака») базируется на модели машинного обучения, натренированной на 78608 надписях, сделанных на древнегреческом языке. Как и все такие модели, она ищет регулярные структуры (паттерны) в имеющемся у нее массиве данных, кодирует эту информацию в сложные математические модели и на их основании предлагает возможные варианты по восстановлению полного текста по имеющимся фрагментам, а также вероятное время создания надписи и ее источник.



Пример работы Ithaca

Ithaca и ее исходный код опубликованы в общем доступе на сайте ithaca.deepmind.com, поэтому воспользоваться ею могут попытаться все желающие.

Относительная точность

Создатели Ithaca указывают, что ее точность в реставрации фрагментированных текстов составляет около 62%. Она также позволяет определить примерный географический источник надписи с точностью порядка 71% и время создания с разбросом в 30 лет.

Система не может работать полностью автономно. Предлагаемые ею варианты основываются на данных, собранных с помощью традиционных археологических методов. «Ithaca — это вспомогательный инструмент для историков», — отметила Зоммершильд. На то, чтобы быть полноценным ИИ-историком, эта программа претендовать не может».

Тем не менее, как указывают сторонние эксперты, даже относительно невысокая результативность Ithaca может существенно помочь историкам и археологам в расшифровке и восстановлении фрагментированных текстов, пусть даже конечный результат будет допускать разночтения.

Как сделать умный телевизор полезным: 10 лучших приложений для Android TV

Зоммершильд также отметила, что одной из ключевых черт Ithaca является ее гибкость: программу можно успешно применять для работы не только с древнегреческими текстами, но и с любыми другими при наличии нужного объема данных для обучения ИИ. Это открывает дополнительные возможности для историков.

«62% точности — это немало, но и не слишком много, — говорит Алексей Водясов, технический директор компании SEQ. — Возможно, в будущем удастся повысить точность расшифровки, но для этого нужна модель с максимально возможным объемом исходных данных. При этом количество сохранившихся надписей на древних языках отнюдь не бесконечно, а значит, существуют и предельные значения точности этих моделей».