Все чаще в интернете появляются тексты или изображения, про которые на первый взгляд (а иногда и на второй) сложно сказать, созданы они человеком или искусственным интеллектом. Это сбивает с толку и наводит на мысль, что скоро всех авторов контента «заменят роботы». Однако не все так просто: технологии все еще не совершенны, да и человек все равно нужен для правильной постановки запросов – иначе ничего хорошего нейросеть не сгенерирует.
Как нейросети создают тексты
Работа нейросети по генерации текста напоминает работу нашего мозга. На входе сеть получает некоторое количество переменных, проводит их через свои алгоритмы, подвергает анализу всю доступную по этой теме информацию и на выходе выдает определенный ответ. Нечто подобное совершает наш мозг, например, при решении математических задач.
Нейросети работают не только в заданных им заранее массивах данных: они способны к постоянному обучению. Именно поэтому качество результата быстро прогрессирует со временем. При написании текста нейросеть не просто подставляет подходящее слово по каким-то признакам, но распознает контексты, в которых это слово может употребляться. Поэтому тексты, создаваемые Искусственным Интеллектом, во многих случаях выглядят как осмысленные.
Составляющими нейросети являются нейроны, которые делятся на три типа, в зависимости от выполняемых задач: входные, скрытые и выходные. Но так как нейронов всех трех типов большое количество, то говорят про их слои, которые делятся на те же три типа. Первый слой получает информацию, второй ее анализирует, а третий выдает результат.
Для повышения скорости анализа текста и создания нового во многих нейросетях используют бинарное кодирование. В этом случае сеть имеет дело не с буквами, а с кодом «1 0».
Помимо входной информации нейросети для генерирования собственного текста необходима обширная информационная база об окружающем мире, базы символов (бинарных кодов или букв) и понимание синтаксиса естественного языка. Последнее, конечно, не гарантирует создание осмысленных предложений. Многие помнят знаменитую фразу лингвиста и философа Ноама Хомского «Colorless green ideas sleep furiously» («Бесцветные зеленые идеи спят яростно»). Он приводил ее как пример фразы, построенной грамматически верно, но при этом не имеющей смысла.
В нашей статье мы рассмотрим работу только бесплатных или имеющих бесплатную версию нейросетей. Для нашего короткого тестирования моделей, работающих с текстами, мы выбрали очень простой запрос – незаконченное предложение «Я купил новый смартфон, но».
Начнем с отечественных моделей. Кибернетика в России и в СССР имеет долгую историю, а начало ее расцвета приходится на 60-е годы XX века. Советские ученые активно продвигали идеи машинного перевода, распознания речи, самоорганизующихся систем и сетевых технологий. При этом они обменивались опытом и со своими зарубежными коллегами.
Балабоба
Одна из популярных российских нейросетей, созданная разработчиками Яндекса. Она была запущена 17 июня 2021 года, доступна и бесплатна для всех. Для работы достаточно зайти на сайт Балабобы и согласиться с тем, что ИИ «не знает, что говорит». Также попросят подтвердить, что вы помните об ответственности за распространение созданных текстов. В итоге откроется поле, в которое можно ввести фразу, которую продолжит нейросеть.
Работа Балабобы основана на языковой модели YaLM (Yet another Language Model), также разработанной специалистами Яндекса. В своей работе они ориентировались на языковые модели на основе архитектуры Transformer, в том числе на алгоритм обработки естественного языка GPT-3 компании Open AI. YaLM дает нейросети возможность запоминать правила естественного языка, подбирать и правильно употреблять в контексте слова.
В нашем тесте Балабоба предположила негативное продолжение нашего предложения. Сеть «набалабобила» текст, напоминающий начало инструкции на тот случай, если новый смартфон сломался. Текст выглядит как вполне осмысленная статья, написанная автором-человеком. Он состоит из вводной части и содержания, включающего в себя пункты будущей потенциальной статьи. Как видим, Балабоба не создает целую статью, а только предлагает ее план.
До конца этого года Яндекс планирует выпустить и интегрировать в свои продукты (Алиса, Поиск, Почта и т.д.) свой аналог чат-бота ChatGPT. Новая разработка получила название YaLM 2.0. Так что вполне вероятно, что все пользователи вскоре получат доступ к новой нейросети.
Порфирьевич
Порфирьевич – аналог GPT-2. Но это необычная нейросеть специализируется на литературных текстах. Хотя и с запросами технического плана тоже справляется.
Сеть обучена на огромной базе произведений русской литературы. Даже свое имя она получила в честь литературного персонажа из романа Виктора Пелевина – робота-полицейского Порфирия Петровича. ИИ создает небольшие продолжения для заданных запросов. Пока что Порфирьевич не генерирует длинные рассказы или статьи, так что вряд ли ленивые авторы смогут воспользоваться его услугами.
Сеть была создана программистом Михаилом Гранкиным и открыта для всех по решению разработчика. Чтобы воспользоваться возможностями нейросети, нужно просто зайти на ее официальный сайт, написать предложение или его начало и нажать кнопку «Дополнить». Если предложенный вариант не устраивает пользователя, то он может получить другую версию, нажав кнопку «Варианты».
Порфирьевич
Порфирьевич предположил, что наше тестовое неоконченное предложение – это запрос о помощи в проблемной ситуации. Сеть создала короткий текст, напоминающий вопрос, какие обычно публикуют в форуме специалистов те, кто не смог сам разобраться с некой проблемой. Текст напоминает именно заголовок темы. В нем есть отсылка к более развернутому запросу («Описание внутри»). Правда сама сеть ограничилась только кратким продолжением тестового предложения – никаких подробностей.
RuGPT-3
Нейросеть, созданная разработчиками SberDevices в 2020 году, была создана на базе GPT-3 от OpenAI. Большинство моделей российской сети имеют открытый код и доступны всем. Чтобы воспользоваться сеткой, необходимо просто зайти на ее сайт, сформулировать, как пишут разработчики, «затравку», и нажать на кнопку «Дополнить». На сайте есть примеры формулировок различных затравок.
Для обучения модели использовали огромные массивы данных суперкомпьютера «Кристофари» и платформы ML Space от SberCloud. Естественно, создатели сети не берут на себя ответственность за результаты и их релевантность, а также корректность информации.
RuGPT-3
Нейросеть может создавать тексты в разных стилях и жанрах: инструкции, научные статьи и пр. И это довольно объемные и содержательные тексты. Однако наш эксперимент показал, что в процессе их создания ИИ отклоняется от темы. В тестовой затравке речь идет о смартфоне, и само предложение RuGPT-3 дополнила вполне корректно: «…во время пользования смартфоном, клавиатура не работает». Но уже в следующем предложении нейросеть уходит в сторону и рассказывает, как починить клавиатуру в том случае, если она отсоединилась от ноутбука. И дальше в тексте речь идет именно о ноутбуках. Особенно впечатляет совет: «Поэтому, если вы не хотите испортить ноутбук в первый же день, постарайтесь не отходить от ноутбука на слишком большое расстояние».
Переходим к зарубежным нейросетям, которые специализируются на работе с текстами. Большинство из них платные или предоставляют короткий бесплатный тестовый период. Мы выбрали две, с которыми можно работать бесплатно.
Chat GPT
Одна из самых известных нейросетей, которая у всех на слуху. Chat GPT разработан компанией OpenAI, одним из основателей которой является Илон Маск. Появился чат совсем недавно, 30 ноября 2022 года, но уже заставил говорить о себе. Многоязычный сервис умеет выполнять множество задач: генерировать или переводить тексты, отвечать на вопросы, писать коды и даже дипломные работы. Количество пользователей, работающих с ним, рекордно растет с каждым месяцем.
Основой чат-бота была языковая модель GPT-3.5. Но уже в марте этого года вышла новая мультимодальная модель GPT-4: теперь нейросеть распознает изображения (фотографии, лейблы, карты), понимает шутки и поддерживает больше языков. Chat GPTтакже понимает запросы на русском, но пользователям из России придется включить VPN для работы с чат-ботом.
Протестировать Chat GPT «без регистрации и смс» можно в поисковике Bing через браузер Edge. Компания OpenAI принадлежит Microsoft, поэтому недавно они внедрили популярного чат-бота в свой поисковик в своем же браузере, в раздел «Чат» на главной странице.
Во время теста робот честно сообщил, что не может понять наш обрывочный запрос, и попросил описать проблемы подробнее. Тогда мы решили задать ему конкретный вопрос: «Как выбрать хороший смартфон?»
На новый запрос мы получили развернутый ответ. После вводной фразы под пятью пунктами бот перечислил параметры, на которые следует обратить внимание при покупке нового смартфона.
Конечно, пункты расписаны не подробно: просто общая и очевидная информация. Приведем в пример один из пунктов:
«Качество камеры – это еще один важный фактор при выборе смартфона. Если вы любите фотографировать, то выберите смартфон с хорошей камерой.»
Но нельзя не отметить, что сеть отлично хорошо владеет русским языком (значение слов, их употребление в контексте, синтаксис), понимает запросы, в ответах не отступает от темы. Запросы для нее лучше формулировать в виде конкретных вопросов или утверждений. Кстати, под текстом чат-бот перечислил источники, из которых брал информацию – так что при желании ее можно проверить.
На данный момент по качеству генерируемых текстов и по палитре возможностей Chat GPT идет впереди конкурентов. Чат-боту можно задать вопрос и получить развернутый ответ, можно попросить его написать текст на определенную тему и даже определенного объема – и он с этим справится.
Rytr
Ещё одна зарубежная нейросеть, которая генерирует тексты более чем на 30 языках – в том числе на русском. Запрос автоматически переводится на английский, а результат – на выбранный вами язык. Сеть частично бесплатная и позволяет сгенерировать до 10 000 символов в месяц без оплаты.
Сервис работает на основе алгоритма GPT-3 и поддерживает много настроек: можно выбрать тон текста, уровень креативности, сценарий использования (от текста для блога до песни или рассказа). Нейросеть способна даже создавать SEO-оптимизированные статьи.
Чтобы работать с Rytr, необходимо зарегистрироваться на ее сайте, указав свою электронную почту. После регистрации можно выбрать все необходимые опции и задать ключевые слова или фразу для генерации текста.
Для тестового запроса в качестве сценария использования мы выбрали «Идеи для написания блога и Содержание (План)». На наш запрос нейросеть выдала несколько вариантов, вполне подходящих для потенциального блога. Хотя продолжение тестового предложения выглядит несколько странно: «Это не работает». Но дальше сеть раскрывает тему, что делать, если смартфон не работает.
Вторая тема, предложенная сетью: «Потом я понял...». Rytr предположил, что у человека с покупкой смартфона могут возникнуть множество проблем (стоимость телефона, скрытые расходы, непредвиденные счета, плата за контракт).
Третий и четвертый варианты плана блога, предложенные сетью, посвящены той же теме, что и первый – техническим проблемам со смартфоном. В каждом случае нейросеть предлагает общие компоненты: тему и структуру с подзаголовками и выводами.
Все больше проектов и компаний начинают применять нейросети в разных сферах своей деятельности. Судя по всему, их развитие – одно из самых перспективных направлений ИТ в ближайшее время. Возможно, когда-то ИИ все же заменит человека-автора, а люди будут работать операторами нейросетей.