Образование, книги, периодика и
библиотеки в электронном веке

Совсем как люди: поют, рисуют, продают и учатся писать книги. Сумеют ли нейросети заменить авторов, редакторов и менеджеров в обозримом будущем?

Системы машинного обучения и алгоритмы в 2020 году прошли очередной этап развития и окончательно стали технологическим мейнстримом. Алгоритмы GPT-3 и их аналоги научились верстать веб-сайты, снимать видеоклипы и писать осмысленные стихи и прозу. Специальный корреспондент «Либинформа» Денис Козлов выяснял, смогут ли нейросети в ближайшее время повлиять на издательскую деятельность и каким будет это влияние.

 

Дизайн, рэп, эссеистика, программирование: чему нейросети научились к 2021 году

17 ноября 2020 года в ютьюбе был опубликован необычный клип американского рэп-исполнителя Эминема (псевдоним Маршалла Брюса Мэтерса). Трехминутная композиция (дисс) в саркастической манере высмеивает CEO компании Facebook Марка Цукерберга, но внимание пользователей сети привлек вовсе не юмор в духе компьютерных гиков. Песня, неотличимая от других произведений в дискографии Эминема, была записана с помощью нескольких нейронных сетей.

Текст нейросетевого Эминема сгенерирован сервисом Shortly Read, работающим под управлением алгоритма GPT-3, голос музыканта клонирован с помощью технологии Google Tacotron 2 (о технологиях клонирования голосов «Либинформ» уже писал ранее), а видеоряд создали авторы канала 30HZ, посвященного дип-фейкам (созданию компьютерных клонов) популярных артистов и музыкантов.

Эксперименты 30HZ доказывают, что технологии могут повторять манеру исполнения и на основе известных им музыкальных фрагментов создавать новые аранжировки музыкантов независимо от стиля и жанра исходных произведений. Так в видеотеке канала соседствуют вымышленные откровения певицы Билли Айлиш и никогда не существовавший в реальности совместный сингл рэперов первой величины Тупака Шакура, Notorious B.I.G, Эминема и DMX.

Применяемые в дип-фейках алгоритмические модели GPT-3 (Generative Pretrained Transformer Model 3) компании Илона Маска и Сэмюэля Альтмана OpenAI — это наиболее продвинутая на сегодняшний день автоматизированная система обработки естественного языка. Компания утверждает, что этот комплекс программного обеспечения подходит для любых задач на английском языке. 

Похожие технологии есть и в сервисе Shortly Read: нейросеть от Google позволяет в несколько кликов с помощью заданных параметров подготовить заметку, новость, эссе или художественное произведение. Услугами виртуального райтера Shortly Read можно воспользоваться бесплатно. Единственное ограничение — сервис работает только с текстами на английском языке.

Скандальными экспериментами с мультимедиа в прошлом году отметились и российские компании. Студия Артемия Лебедева в июне 2020 года объявила о том, что за псевдонимом дизайнера Николая Иронова скрывается искусственный интеллект. За год работы машина успешно выполнила 20 коммерческих заказов, следует из профиля Иронова на сайте студии.

Тем не менее российские разработки в области обработки естественного языка несколько отстают от мировых. Это может быть связано как с неблагоприятной финансовой конъюнктурой в России, так и с затратностью таких экспериментов. Известно, что обучение алгоритмов GPT-3 стоило компании OpenAI более 5 миллионов долларов США.

И все же пишущие по-русски нейросети вовсе не редкость. Так, в 2019 году была представлена нейросеть “Порфирьевич”. Ее алгоритм основан на GPT второго поколения, он осмысленно и с учетом синтаксических стандартов дописывает заданные пользователем короткие фрагменты текста. Более сложная разработка ruGPT-3 (репозиторий Github) была представлена Сбербанком. Заявлено, что эта система основана на исходном коде OpenAI и умеет не только дописывать тексты, но также отвечает на вопросы и сама программирует, получив от пользователя некоторый фрагмент кода.

Кроме того, алгоритмы обработки языка используются при ранжировании поисковой выдачи Яндекса, для фильтрации нежелательных сообщений (спама и фишинга) в почтовых сервисах, а также в системах машинного перевода веб-страниц и в рекомендательных системах торговых (aliexpress) и стриминговых (больше всех преуспела компания spotify) платформ.

Успех этих технологий, созданных с применением машинного обучения и общедоступных данных, породил общественную дискуссию. Самый важный вопрос на повестке дня, так и не получивший однозначного ответа: этично ли клонировать музыку, видео и тексты живых авторов и исполнителей? Второй по порядку, но едва ли менее значимый вопрос затрагивает творческую составляющую: смогут ли нейронные сети однажды полностью вытеснить с рынка настоящих авторов, и какими последствиями внедрение алгоритмов обернется для производителей информации и правообладателей?

Границы возможного: заменят ли нейросети авторов?

Ограничения искусственного интеллекта многократно исследовались не только учеными, но также культурологами, писателями-фантастами и сценаристами телевизионных сериалов. Жанр сериального фэнтези, например, многократно рассматривал искусственный интеллект и как благо, и одновременно как угрозу человечеству. В многосерийных драмах «Person of interest» («Подозреваемый») и «Star trek: Discovery» («Звездный путь: Дискавери») системы искусственного интеллекта стали самостоятельными, ключевыми персонажами. 

Сценаристы отмечают, что автономность машин даже в кино и сериалах пока невозможно объяснить языком науки. С этим, вероятно, связан эффект антропоморфии, то есть очеловечивания машин в книгах, фильмах и сериалах. Во-первых, самостоятельность искусственного интеллекта в реальном мире требует колоссальных вычислительных мощностей,  во-вторых — компьютеры пока не научились структурировать информацию и принимать решения с точностью и скоростью, доступной только человеческому разуму.

Примеры внедрения нейросетей в бизнесе подтверждают эти тезисы. Так, компания Alibaba Group в 2018 году поставила амбициозную цель заменить живых копирайтеров алгоритмами на своих торговых площадках. Нейросети должны были готовить текстовые описания товаров с Aliexpress на нескольких языках. 

Вскоре выяснилось, что искусственный интеллект, создавая коммерческие тексты, допускает массу ошибок, не всегда учитывая поведенческие особенности покупателей. Сделав правильные выводы, китайская компания частично вернула работу площадок под контроль авторов и редакторов, но продолжила свой эксперимент.

Другой опыт с текстом от нейросети также оказался неоднозначным. Анонимные разработчики некоторое время обучали нейросеть GPT-2 писать тексты на основе эротических романов, а затем предложили ей создать оригинальное произведение на основе библейского текста. Получившийся в результате опус «The Orange Erotic Bible» копирует ритмику «святого писания», но напрочь лишен какой бы то ни было драматургии; стилистически он напоминает не очень качественный фанфик с любительского сайта.

Впрочем, некоторые эксперименты с текстами оказались более успешными. Студент из Беркли Лиам Порр публиковал в своем блоге статьи, написанные с помощью GPT-3. Комментаторы отмечают, что статьи Порра мало чем отличаются от распространенных книг по мотивации и саморазвитию, при этом многие читатели не сумели распознать в авторе его искусственную идентичность.

Еще одна разработка на основе GPT-3 научилась писать стихи на английском языке. В отличие от стихов, написанных алгоритмами GPT-2, в них присутствуют динамика и связность. Впрочем, и в этом случае о самостоятельности и авторском стиле говорить пока рано — стилистические особенности стихов компьютерного поэта ограничены массивом предоставленных алгоритму данных. В случае если этих данных мало, то и качество генерируемых текстов будет снижаться. 

Все это позволяет утверждать, что в ближайшее время нейросети не сумеют вытеснить авторов с рынка, а помогут последним улучшить свои произведения за счет алгоритмов предугадывания слов и вариативности. Следовательно, сами нейросети стоит рассматривать не как конкурентов авторам, а всего лишь как новые инструменты творческого поиска. 

Пиши, сокращай — тестируй, продавай. Какие технологии издательствам стоит попробовать уже сегодня

О негативных последствиях новой волны цифровизации в организационной структуре издательств «Либинформ» писал в статье. На этот раз остановимся на новых возможностях, которые дают технологии нейросетей и машинного обучения. Для удобства выделим три ключевых направления в издательской деятельности: 

редакторское дело,

маркетинг и копирайтинг,

продажи.

Редактура и предпечатная подготовка текстов — ключевое направление для экспериментов с нейросетями на Западе, но мало исследованное российскими практиками. Нейросети могут ускорить подготовку в связке «автор — редактор», то есть там, где требуются точность и скорость интеллектуальной работы.

Нейросетевые технологии за последние годы хорошо научились работать с синтаксическими и орфографическими ошибками: GPT-3 и ее российский форк качественно вычитывают и обрабатывают тексты, а при должной настройке моделей определяют и стилистические огрехи. Все это происходит в автоматическом или полуавтоматическом режиме. 

Это «умение» машин позволило корпорациям встроить элементы нейросетей в свои флагманские продукты. Ознакомиться с работой электронных редакторов можно в приложении Grammarly, похожий инструмент развивается в текстовом редакторе Google Docs, который понимает тексты на русском языке.

Нейросети также полезны и эффективны в повседневной работе маркетологов и копирайтеров при подготовке текстов для сайта и разработке контента для веб-интерфейсов (UI/UX). Ключевая особенность GPT-3 и аналогичных алгоритмов — высокая точность сравнения. Подготовив тексты для веб-сайта, копирайтер может протестировать и оптимизировать их с помощью алгоритмов.

Попробовать алгоритмы для авторов можно в сервисе Broco (поддерживаются тексты на английском), оптимизировать рекламные объявления, контент страниц и лендингов — на платформе Copysmith, а инструмент vwo подойдет для A/B-тестирования.

Алгоритмы GPT-3 пока широко не применяются в продажах и консультационных сервисах. Недавний эксперимент с медицинским чат-ботом закончился неудачей: бот посоветовал пациенту покончить жизнь самоубийством.

Тем не менее эксперименты показали, что GPT-3 в большинстве случаев успешно имитирует поведение человека в чате и может взять на себя некоторые обязанности онлайн-консультанта, специалиста справочной службы и менеджера по продажам. В этом случае качество сервиса определяется доработкой свободно доступных алгоритмов под задачи компании.

Упомянутые выше технологии призваны экономить время и ускорить работу, связанную с подготовкой корреспонденции, информационных сообщений и больших текстов. GPT-3 в перспективе могут автоматизировать продажи, если они ведутся при помощи чат-ботов. С позиции разработчиков нейросетей дело за малым: внедрить технологии, обучить персонал и модернизировать инфраструктуру компании, что в условиях финансовой турбулентности не всегда просто.