Аудиоконниги в России — 2020: стратегии издателей, технологические тренды, прогнозы и возможности роста

28.12.2020

Продажи электронных книг в 2020 году выросли на 31%. В первом полугодии группа компаний «Литрес», лидер электронного издательского рынка, продала 9,5 миллионов цифровых документов, 21% из них — это аудиокниги. Рост аудиосегмента также отмечают в других российских компаниях, специализирующихся на дистрибуции электронных книг. Корреспондент «Либинформ» Антон Константинов выяснил, почему пользователи все чаще слушают книги, как этот тренд обострил конкуренцию книжных платформ.

Кто управляет рынком аудиокниг в России

Объем российского рынка электронных книг в 2020 году по данным генерального директора группы компаний «Литрес» Сергея Анурьева, обнародованным на Московской международной книжной ярмарке (презентация), составил 8,5 миллиарда рублей. За три последних года этот показатель вырос более чем в 1,5 раза (динамика роста около 30% в год). По прогнозу к 2021 году доля сегмента электронных книг в общем книгоиздании составит 15%. При этом в 2020 году спрос на аудиокниги вырос на 35%, отмечается в исследовании.

В рейтинг крупнейших игроков российского рынка аудиокниг по версии «Литрес» входят одноименный флагманский интернет-магазин компании (55% рынка по результатам продаж за два квартала 2020 года), шведская стриминговая платформа Storytel (18%), принадлежащая «Литрес» Mybook (8%), платформа Сергея Белоусова «Патефон», зарегистрированная в Литве (6%), сервис «ЗвукиСлов», где гендиректором выступает Сергей Анурьев из «Литрес» (5%), Bookmate (2%), другие игроки делят 5% рынка. «Литрес» и аффилированные с ней сервисы де факто образуют монополию, занимающую не менее 68% рынка аудиокниг.

Генеральный директор российского представительства Storytel Борис Макаренков в интервью Forbes Life оценил объем отечественного рынка аудиокниг в 3 миллиарда рублей, что, с некоторыми оговорками, соответствует данным, которые озвучивали представители «Литрес».

Сервисы в погоне за пользователями

Все ключевые игроки рынка аудиокниг сделали ставку на мобильные приложения и не прогадали: во время весенних каникул компании отметили рост выручки. В 2020 году пользователи больше времени проводили наедине с гаджетами — представители компаний единодушны во мнении, что это ключевое для сегмента аудиокниг изменение потребительской парадигмы.

Вместе с тем обострилась и конкуренция бизнес-моделей и подходов к производству аудиоконтента. Доминирующая на рынке компания «Литрес» имела возможность одновременно реализовать несколько моделей производства контента и его распространения. Независимые авторы могут использовать «Литрес» как витрину для продажи собственных произведений («Самиздат»), волонтеры могут озвучивать книги, зарегистрировавшись в проекте «Чтец». «Литрес» одновременно продает электронные и аудиокниги в своем интернет-магазине, предоставляет доступ по подписке в MyBook и в «ЗвукахСлов».

Проект «Чтец» позволяет публиковать на портале «Литрес» около 2 тысяч единиц контента (аудиокниг и подкастов) ежемесячно. «Компания уже второй год в лидерах по числу релизов, которые выпускает студия и проект "Чтец"», — рассказал руководитель интегрированных издательских сервисов «ЛитРес» Евгений Селиванов журналу «Университетская книга». По данным «Литрес» до 40% аудиокниг, представленных на российском рынке, озвучено проектом «Чтец».

Storytel работает по подписной модели с полным доступом к каталогу. Компания вложилась в маркетинговые инструменты и в разработку собственного контента.

С одной стороны приток аудитории должна стимулировать агрессивная реклама на телевидении и у популярных ютуб-блогеров. С другой стороны, Storytel развивает на собственной площадке подкасты и аудиосериалы собственного производства. Компания, также как и «Литрес», предоставляет авторам загружать собственные произведения на платформу с помощью портала для издателей Storytel Hub.

Bookmate заявляет своим ключевым преимуществом каталог (1 800 000 электронных книг на разных языках, включая аудиокниги) в том числе 50 000 позиций бесплатного контента (произведения из общественного достояния — русская и зарубежная классика) и книги на русском языке издательской группы «Эксмо-АСТ»: 18 000 наименований, ранее доступных эксклюзивно в «Литрес».Кроме того, компания поддерживает независимые издательства Individuum и PopcornBooks.

Все ключевые игроки экспериментируют со своими каталогами, пытаясь удерживать пользователей и увеличивать средний чек. Storytel, Bookmate, «ЗвукиСлов» и «Патефон» помимо аудиокниг, записанных профессионалами, предлагают подписчикам подкасты и лекции. «Литрес» и Storytel также фиксируют рост количества любительских и авторских озвучек.

При этом представители компаний соглашаются, что качественная аудиокнига — штучный и не дешевый в производстве продукт. Записать качественный звук в студии могут позволить себе известные писатели, которые имеют сложившуюся аудиторию. Любители часто не могут обеспечить должный уровень записи, но тем не менее, качество любительских и авторских озвучек год от года только растет.

Какие аудиокниги слушали в России в 2020 году

Подводя итоги года, работающие в России сервисы аудиокниг опубликовали списки наиболее востребованных среди читателей произведений. Абсолютным лидером по присутствию в рейтингах стала многосерийная фентези-сага «Шантарам» Грегори Дэвида Робертса.

Вторую строчку делят «Тонкое искусство пофигизма. Парадоксальный способ жить счастливо» Марка Мэнсона (лидер рейтинга Bookmate, 5-е место в Storytel) и «Sapiens. Краткая история человечества» Юваля Ноя Харари (1-я позиция в рейтинге Storytel,

2-я позиция на «Литрес»).

Замыкает тройку лидеров книга о финансовой грамотности Роберта Кийосаки «Богатый папа. Бедный папа». На 4- и 5-м местах по количеству упоминаний в рейтингах аудиокниг — произведения Бориса Акунина и антиутопия Джорджа Оруэлла «1984» (5-е место в рейтинге MyBook, 11-е в Storytel).

Таким образом, доминирующими жанрами в 2020 году были детективы, нон-фикшн, книги по финансовой грамотности и популярная психологическая литература. Например, аудиокнига «Подсознание может всё!» Джона Кехо в 2020 году занимала вторую строчку в чарте продаж «Литрес».

Эксперименты с аудиоформатами

В 2020 году все ключевые игроки рынка аудиокниг экспериментировали с системами синтеза речи (TTS). Технологию синтеза речи трудно назвать новой. Автоматическое озвучивание давно используют в специализированных библиотеках для людей с инвалидностью по зрению. Однако перспектива озвучивать контент голосами «роботов» кажется все более заманчивой, поскольку технология синтеза, разрабатываемая софтверными компаниями в течение последних 30 лет, пережила за последние годы ревизию, переосмысление и качественный рост.

В 2000-х робоголоса-синтезаторы решали сугубо утилитарные задачи узкого спектра: например, озвучивание программ на настольных компьютерах для людей с инвалидностью, информирование операторов промышленных установок без визуальных средств управления и в системах экстренного предупреждения о пожарах и чрезвычайных ситуациях. Голоса, воспроизводимые всеми этими системами оставляли желать лучшего, но ситуация изменилась из-за роста мобильного рынка и благодаря популярности платформ совместной разработки.

Комбинация голосовых синтезаторов с системами обработки естественной речи позволила техногигантам в 2010-х создавать «голосовых помощников» и встраивать их в гаджеты и системы умного дома. Общий принцип работы приложений-помощников в целом прост: алгоритмы распознают голосовые команды пользователей, а синтезаторы речи сопровождают выполнение этих команд, поддерживая диалог с пользователями.

Сегодня на российском рынке представлены западные разработки — это Siri от Apple и Google Ассистент. Доминирующим в своем сегменте и самым функциональным отечественным помощником считается «Алиса» от «Яндекса», своих ассистентов разрабатывают Mail.Ru Group («Маруся»), банки «Тинькоff» («Олег») и Сбербанк («Сбер», «Афина», «Джой»).

Коммерческий успех голосовых помощников и разработки в сфере машинного обучения в середине 2010-х значительно подняли качество автоматической речи: на смену «робоголосам» пришли новые TTS — речевые движки, имитирующие и клонирующие человеческие голоса. Нельзя сказать точно, почему компании стали модернизировать голоса своих помощников: по одной из версий на это повлияло стремление очеловечить машины и исследовательский интерес, по другой, рост аудитории подкастов и Youtube, показавший, что пользователям комфортнее общаться с машиной, речь которой фонетически и интонационно близка к естественной человеческой.

Следующий этап развития речевых технологий начался в 2016 году: в сентябре британская компания DeepMind представила нейросеть WaveNet, научившуюся с высокой точностью клонировать голоса людей, а также имитировать звуковое окружение диктора и писать для аудиофрагментов музыкальное сопровождение (схожий функционал есть в приложении Voice Memos от Apple). Компания Google позже частично применила технологии DeepMind для генерации английской и японской речи в своем голосовом помощнике.

В том же году Adobe представила на конференции Adobe MAX экспериментальный инструмент VoCo (подробное описание продукта на английском), который, также как и WaveNet, на основе аудиозаписей-примеров переводит произвольный текст в аудиозаписи, неотличимые от естественной речи. Также как и WaveNet, технология Adobe достаточно точно имитирует фонетические особенности речи: расставляет паузы на основе знаков препинания, делает после некоторых манипуляций логические ударения.

С подачи журналистов The Verge техноблогеры окрестили VoCo «фотошопом для звука», однако высокое качество проекта сыграло с ним злую шутку. Adobe не включила VoCo в свой флагманский продукт Creative Cloud по этическим соображениям: разработчики посчитали, что инструмент мог быть использован для мошенничества и распространения фальшивых новостей.

Дальнейшие исследования клонирования речи продолжались не только в компаниях — прототипами заинтересовалось сообщество разработчиков свободного программного обеспечения. Часть алгоритмов, представленных в WaveNet, была переписана под популярную программную библиотеку TensorFlow. Впоследствии код многократно модифицировался в разных проектах на Github и аналогичных ему порталах для совместной разработки программного обеспечения. Наиболее популярные проекты такого рода можно протестировать; исходный код этих программ доступен в репозиториях Real Time Voice Cloning и Multi Tacotron Voice Cloning (второй поддерживает русский язык) под свободной лицензией MIT.

Несмотря на сравнительную доступность и гибкость инструментов синтеза речи, на российском издательском рынке запись аудиокниг «робоголосами» вызывают интерес, но пока не получила широкого распространения. Очевидно, и это показал опыт голосовых помощников, старые TTS не привлекают поколение потребителей, избалованных подкастами и Youtube, а новые технологии — это не только возможности, но и дополнительные риски.

Озвучивание книг с применением технологий клонирования имеет серьезные этические и юридические уязвимости. Дело в том, что профессиональные актеры и авторы рассматривают свои голоса, как инструмент заработка, и не стремятся подписывать контракты на их сериализацию, а факты неавторизованного использования голосов и записей резонно считают пиратством.

Вероятно, поэтому запоминающиеся голоса-клоны в перспективе ближайших лет используют только крупные издательства и IT-компании в качестве эксперимента: развитие собственных студий звукозаписи внутри издательств и книжных платформ в настоящее время кажется акторам издательского рынка более реалистичной и в целом оптимальной задачей.

Борис Макаренков отмечает, что стратегия Storytel предполагает расширение библиотеки студийного контента за счет эксклюзивов с участием популярных актеров и писателей. Один из успешных эксклюзивов Storytel — аудиосериал Дмитрия Глуховского «Пост», вышедший летом 2019 года — в ближайшее время получит второй сезон.

Директор по цифровому контенту издательства «АСТ» Максим Лозовский не исключает, что за технологиями синтеза речи будущее, однако считает, что издателям спешить не стоит. «Есть частное мнение, что драйвером производства аудио в ближайшей перспективе станет text to speech, — рассказал он «Университетской Книге», — безусловно, есть риск получить аудиофастфуд, и придется аккуратно его дозировать на рынке».

Управляющий директор «Bookmate» Андрей Баев в интервью «The Village» признал эксперименты с автоматической озвучкой неудачными. «Пока качество оставляет желать лучшего, — рассказал он изданию, — мы записали книгу очень достойного качества с одним из сервисов, но пока все равно не покидает ощущение, что навигатор читает книгу».