Искусственный интеллект, обученный на русских классиках, стал драматургом
Попытки механизировать литературное творчество предпринимались на протяжении многих столетий. Можно вспомнить, например, логическую машину философа XII века Раймунда Луллия, фактически способную создавать комбинации понятий.
Особенно активно процесс механизации шел в XX веке, и появление компьютеров его только ускорило. Но настоящий прорыв произошел в 1997 году, когда были созданы LSTM-сети (Long short-term memory).
Это особый вид рекуррентных нейросетей, которые могут обучиться долговременным зависимостям. То есть они способны на длительное сохранение информации и повторное обращение к ней. А сейчас существуют еще более совершенные сети-трансформеры на основе алгоритма GPT (Generative Pre-trained Transformer).
Например, вы пишете рассказ при помощи GPT-2, и эта сеть способна запомнить подряд 1024 токена, то есть частей слов, слов или отдельных букв, из которых состоит ваш текст. Допустим, в первом предложении вы ввели персонажа по имени Василий. Если вы повторите имя этого героя в течение следующих 1024 токенов, то сеть «вспомнит» его и поймет, что это тот же герой.
А вот при разработке экспериментальной нейросети «НейроСтаниславский» был задействован еще более совершенный алгоритм последнего поколения GPT-3, способный запомнить 2048 токенов. Сеть создана студентами Университета науки и технологий МИСИС в коллаборации с Биеннале театрального искусства.
За основу была взята общедоступная модель RuGPT-3, предварительно наученная русскому языку. Для ее дальнейшего обучения на драматурга был подобран датасет, в который вошли пьесы Чехова, Островского и других русских классиков. В итоге получилось 14 000 диалогов «реплика-ответ» и «реплика, реплика – ответ».
Затем разработчики сравнили результаты разных моделей на нескольких датасетах и оценили их показатели: время предсказывания, количество логичных ответов и др.
В итоге для дальнейшей работы оказались выбраны RuGPT3_small для ответа на реплику и RuGPT3_medium для продолжения реплики. Для масштабного обучения «НейроСтаниславского» были задействованы мощности одного из суперкомпьютеров.
В итоге получился простой интерфейс, в котором любой желающий может писать свою пьесу в текстовом редакторе или обращаться за помощью к ИИ.
Первое произведение искусственного драматурга уже не только написано, но и поставлено на сцене: режиссер Ярослав Шевалдов в соавторстве с «НейроСтаниславским» создал фрагмент, посвященный К. С. Станиславскому и В. И. Немировичу-Данченко. Источником вдохновения стала книга Станиславского «Моя жизнь в искусстве».
В конце прошлого года этот фрагмент был поставлен артистами театра «Ведогонь» и сыгран на Всероссийской научно-практической конференции «Репертуарный театр в контексте XXI века». Чаще всего ИИ обучают писать либо стихи, либо короткие тексты, потому обращение к драматургии – достаточно необычный ход.
И хотя сейчас активно идут споры о месте ИИ в искусстве и авторском праве на произведения, это не делает эксперименты с искусственным интеллектом в сфере творчества менее интересными и значимыми.