Образование, книги, периодика и
библиотеки в электронном веке

Текстоцентрический подход в образовании придется менять

Интервью с Юрием Чеховичем, президентом компании «Антиплагиат»: о роли искусственного интеллекта в развитии высшего образования, ИИ-инструментах в системе «Антиплагиат» и их дальнейшем развитии.

Юрий Викторович, об искусственном интеллекте как о трендовой технологии сейчас говорят буквально на каждом отраслевом мероприятии. Инструменты на базе ИИ появляются в том числе в цифровой среде вузов, и не иметь их сегодня в арсенале — значит, признаться в отставании от лидеров. Как Вы в целом оцениваете реальное влияние ИИ на образовательный процесс? 

Вокруг применения искусственного интеллекта сейчас действительно много шумихи. В том числе ее много в высшем образовании. Вузы находятся в конкурентной среде, борются за цифры приема и потому вынуждены следовать трендам. Очевидно, что наличие в университете тех или иных ИИ-инструментов используется для привлечения внимания абитуриентов. И в другую сторону это тоже работает — вузу стыдно признаваться, если у него нет или недостаточно сервисов на базе AI. Это все, на мой взгляд, часть технологического гула. 

А вот как технологии ИИ влияют на качество обучения на самом деле, мы увидим лет через пять, когда нынешние студенты, которые начинали учиться в эпоху развитого искусственного интеллекта, выпустятся из университетов и дойдут до работодателей. Тогда станет понятно, насколько их квалификация соответствует текущим потребностям рынка труда, действительно ли информационные технологии серьезно улучшили подготовку востребованных специалистов. Пока же влияние ИИ-агентов на образовательные результаты не доказано, нет даже понимания, в лучшую или в худшую сторону оно оказывается.

Как Вы думаете, через 5 лет умение пользоваться инструментами искусственного интеллекта будет обязательным требованием для любого абитуриента при поступлении в вуз? Или этот навык и так сформируется естественным образом?

Не думаю, что умение пользоваться генеративными нейросетями и другими сервисами на базе искусственного интеллекта будет чем-то определяющим для успешного поступления в вуз, потому что это будет вполне естественный навык для людей, которые и так ими постоянно пользуются, как сегодня компьютером или Интернетом. Все современные успешные сервисы построены на том, что у них очень низкий порог входа, пользоваться ими может практически любой человек. Технологии стали ближе к людям, и, соответственно, расширяются возможности их использования в повседневной жизни, в том числе в обучении. 

Считается, что использование ИИ-ассистентов будет способствовать персонализации образования, поможет студенту выстраивать обучение в индивидуальном ритме. А еще такие помощники могут безоценочно корректировать успеваемость, не критикуя работу и результаты обучающегося. Как это может изменить роли студента и преподавателя?

Начну с того, безоценочно ли действует ИИ-агент. Искусственный интеллект — это алгоритм: как его обучили, так он и будет действовать. Если надо, он тоже может выдать студенту ответ: «Кто так интеграл берет? Где тебя учили? Пять лет назад вас бы не пустили на порог университета!», или строго напомнить о пропущенных занятиях. Все зависит от того, на каких примерах и с какими ограничениями специалисты обучали ИИ. 

Кроме того, я как представитель поколения, рожденного в эпоху, когда не было Интернета и соцсетей, не считаю, что безоценочность — это хорошо. У студента должны быть стимулы к учебе. Они должны оставаться в рамках корректного взаимодействия с педагогом, но сама идея о том, чтобы не сравнивать детей между собой по их образовательным результатам, мне не близка. Почему нет? Есть спортивные соревнования, чемпионаты, олимпиады, и прогресс там достигается ровно за счет того, что их участников сравнивают между собой. Любой бизнес — это тоже постоянное сравнение с конкурентами, в котором, если ты не выигрываешь, значит, ты не успешен. Поэтому большой вопрос — к чему может привести массовая безоценочность и «уравниловка» в образовании. 

Что касается вопроса о смене ролей участников образовательного процесса — мне он видится крайне серьезным. Я сам нахожусь внутри научно-образовательной системы, изучаю прогнозы и, хотя предсказывать конкретные перемены не берусь, уверен, что эти роли могут поменяться существенно. На мой взгляд, успеха будут достигать как раз те вузы, кто правильно угадают или вычислят эту смену ролей. Такие университеты смогут совершить резкий рывок в своем развитии и, возможно, внезапно стать лидерами. И это может случиться совершенно неожиданно. Вот кто ожидал в 2021 году, что генеративный искусственный интеллект так «выстрелит»? Так же может произойти и со сменой роли преподавателя и студента. 

Какие риски и угрозы от применения генеративных нейросетей в образовательном процессе Вы считаете наиболее вероятными?

Один из наиболее серьезных рисков связан с тем, что сегодня самыми  успешными пользователями сервисов на базе генеративного ИИ являются те, кто и самостоятельно умеет хорошо писать тексты: научные статьи и другие материалы. Для таких людей ИИ становится хорошим помощником и позволяет получать результат того же качества быстрее, либо результат лучшего качества с теми же временными затратами. А вот как эти инструменты будут работать на тех, кто не научился редактировать тексты вручную, — неизвестно. Не окажется ли так, что отсутствие «ручных» навыков поставит их в проигрышное положение? Что будет с такими специалистами, если они вдруг останутся без интеллектуального помощника? 

Другой риск заключается в существующем текстоцентрическом образовании, когда во многих учебных дисциплинах показателем качества и уровня квалификации обучающегося считается текст: дипломная или курсовая работа, эссе. Почти каждый студент подтверждает квалификацию тем, что в состоянии написать текст, который дальше можно презентовать, например, на защите дипломного проекта. Презентационная часть, похоже, не теряется, если только в будущем не появится возможность отправить на защиту вместо себя виртуального интеллектуального помощника. А вот часть, связанная с подготовкой текста, под серьезной угрозой. Представленная студентом работа перестает быть адекватным мерилом уровня его квалификации. При этом, чем больше будут развиваться генеративные нейросети, тем выше будет этот риск. Очевидно, что текстоцентрический подход в образовании придется менять.

На что? Какие форматы оценки квалификации и качества обучения студента могут появиться на смену письменным работам? 

Хороший вопрос, и тот, кто найдет на него хороший ответ, возможно, станет лидером отрасли. 

Мне кажется, что решение должен принимать обобщенный работодатель. Кто ему нужен, какой специалист? Человек, который хорошо умеет писать статьи? В исследовательском институте такой работник, вероятно, пригодится, и даже будет не важно, с помощью какого инструментария он будет это делать. Но если мы говорим про специалистов другого вида, аналитиков или инженеров, то они должны владеть сервисами, которые позволяют оптимизировать процессы или проводить точные расчеты. Умеют ли они при этом писать хорошие тексты, не так важно. 

Как Вы относитесь к тому, что сейчас ИИ не считается соавтором человека при написании научной статьи? Может ли эта позиция со временем измениться в академическом сообществе? 

Дискуссия о возможности указывать в научной статье или в любой другой публикации в качестве соавтора искусственный интеллект осталась в прошлом. Года полтора назад было несколько попыток включения ChatGPT в список авторов научной публикации, но это быстро прекратилось по прозаическим причинам. Дело в том, что быть автором — это не просто получать какие-то блага или иметь дополнительную строчку в списке публикаций. Автор — это тот, кто несет ответственность за публикацию. Все авторы научной публикации должны разделять полную ответственность за ее содержание и сам факт ее наличия. Компьютерная программа, кем бы она ни была написала и обучена, не может нести ответственность за вашу научную работу. Теперь у журналов четкая позиция в этом вопросе. По крайней мере в свежих публикациях я не видел, чтобы какие-либо ИИ-инструменты были указаны в качестве соавторов. 

С другой стороны, редакции научных журналов требуют от авторов перечислять в разделе «Инструменты» ИИ-сервисы, которые использовались при подготовке статьи. 

Думаю, вряд ли дискуссии по этому вопросу возобновятся в ближайшее время, потому что включать ИИ-агентов в число авторов — примерно то же самое, что указывать в этом же списке ноутбук, Microsoft Word, Google и т. п. Однако не факт, что мы не вернемся к этому обсуждению лет через 10–20, но для этого должна произойти очередная информационно-технологическая революция. 

Юрий Викторович, предлагаем теперь обсудить ИИ-инструменты, которые использует «Антиплагиат». В вашей Памятке по работе с искусственно сгенерированными текстами отмечено, что «невозможно сказать с вероятностью 100%, что текст писал не человек», и даны рекомендации проверяющему эксперту для анализа текста. Как Вы полагаете, в дальнейшем технологии приблизят нас к тому, что можно будет достоверно определять: сгенерирован ли проверяемый текст нейросетью или полностью написан человеком? 

Чтобы было понятно, в чем здесь принципиальная проблема, я поясню: результат работы алгоритма поиска текстовых совпадений автоматически дает и объективные доказательства существования совпадений — источники, с которыми совпал проверяемый текст. Далее, даже при наличии перефразирования или переводных заимствований, легко проверить, действительно ли совпадают тексты. 

Когда же мы говорим о детекторах искусственного текста, то имеем ситуацию «слово алгоритма» против «слова человека». Объективного подтверждения, например, наличия этого текста в какой-то гипотетической «Базе данных всех искусственных текстов», конечно, не существует. При этом хорошо известно, что любой сложный алгоритм может допускать ошибки. Любые компьютерные программы могут содержать ошибки. Алгоритмы на базе машинного обучения искусственного интеллекта принципиально не могут быть на 100% точными. Таким образом, с одной стороны, есть не безошибочный алгоритм, с другой — заинтересованный не независимый человек. 

Специалисты в области генеративного ИИ обсуждают различные идеи того, как можно было бы гарантированно отличать сгенерированные тексты от естественных. Одним из таких способов могло бы стать внедрение в тексты невидимой глазу и известной только разработчику пометки, некого подобия водяного знака, который бы свидетельствовал, что текст сгенерирован. Вариантов реализации меток существует довольно много, однако у этого способа есть уязвимости. 

Очевидно, что факт внедрения водяных знаков в генерируемые тексты тем или иным сервисом невозможно будет сохранить в тайне. И так же очевидно, что такая особенность сделает этот сервис гораздо менее привлекательным для пользователей. Им просто перестанут пользоваться те, кому нужно будет создать необнаруживаемый на предмет генерации текст. Думаю, что это слишком большая категория пользователей, чтобы сервисы стали ими рисковать.

Так как же подтвердить: текст сгенерирован или нет? Наши специалисты проанализировали большое количество случаев, в которых пользователи не соглашались с оценками алгоритма и выявили определенный перечень признаков того, что текст был сгенерирован. Как правило, это признаки, которые еще и говорят о материале плохого качества, недостаточного для учебной или научной работы: в нем есть семантические и логические повторы, ошибки связности текста, проблемы со ссылками на источники, малоосмысленные фразы. Кроме того, хорошо видны «склейки» авторского и машинного текста. Чаще всего эти признаки встречаются в совокупности и фактически подкрепляют друг друга. 

Насколько в условиях применения генеративных нейросетей может возрасти риск неправомерных заимствований, когда в сгенерированном тексте есть отрывок из чужой работы, но он не оформлен, как положено, в виде цитаты, и к нему не указан источник?  

Риск есть и очень серьезный. Использование искусственного интеллекта можно представить в виде айсберга, у которого над водой расположена видимая малая часть, а под водой скрывается оставшаяся большая часть. Так вот этичные способы использования ИИ, вроде генерации идей, структур, аннотирования источников, перевода — это лишь видимая часть айсберга. Подводная его часть, о которой не очень принято говорить, заключается в том, что генеративные сервисы используют преимущественно или для увеличения объема работы за счет сгенерированного произвольного текста по теме, или для перефразирования неправомерно заимствованного текста (генеративные модели, как правило, отлично справляются с перефразированием). 

Какие вызовы стоят перед разработчиками в плане выявления переводных заимствований, то есть отрывков из источников, которые опубликованы только на иностранном языке и не были переведены на русский?

Существует много разных способов, как переводной текст может попасть в ту или иную работу. Многие из них не связаны с нарушениями. Например, автор опубликовал статью на русском языке и захотел опубликовать еще и на английском с соблюдением всех этических норм. Для этого по условиям авторского договора ему нужно получить разрешение от первого издателя и уведомить второго о первоисточнике. 

Естественно, что когда кто-то находит подходящую работу, допустим, на английском языке, на котором издана бОльшая часть публикаций в мире, переводит ее на другой язык и публикует под своим именем, то это является переводным плагиатом в чистом виде, и такие случаи, конечно, нужно обнаруживать. Особенно в такой ситуации уязвимы научные журналы, так как автор рискует, пожалуй, только своей репутацией, а издатель может получить иск и понести финансовую и даже уголовную ответственность. 

«Антиплагиат» может обнаружить, что некий недобросовестный автор взял чужую статью на английском языке, перевел ее, условно, на испанский, с испанского на немецкий и потом на русский и выдал за свой материал?

Обычно на такие длинные цепочки переводов мало кто тратится. Чаще всего текст переводят на другой язык и потом немного перефразируют. У нас в системе есть модули, которые определяют переводные заимствования при наличии исходного текста на языке первоисточника. Другой вопрос, что перевод в целом неоднозначен. Одно и то же можно перевести разными способами, что особенно заметно в художественных произведениях. Поэтому результат такой проверки не может быть стопроцентно точным. 

Есть ли у Вас планы по расширению перечня языков, на которых «Антиплагиат» определяет переводные заимствования? И есть ли вообще в этом необходимость?

Сейчас «Антиплагиат» определяет переводные заимствования на ста языках. Тем самым мы покрываем более 99% всего того материала, что публикуется в мировой научно-образовательной среде. Дальше расширяться, по большому счету, некуда, хотя периодически к нам обращаются, например, вузы, в которых преподают на языках малых народов России, или поступают запросы на иностранные региональные языки. Вот такого рода расширения могут быть реализованы. 

А что насчет технологии поиска изображений — планируете ли Вы дальнейшее ее развитие?

Пока мы в стадии внутренней опытной эксплуатации этой технологии, которую постепенно доводим до массового использования. Поиск изображений заработал пару лет назад, и в нем пока нет возможности проверки всего потока документов в реальном времени. Пользователь сервиса может проверить конкретное изображение, но чтобы проверить по изображениям весь поток, когда в течение сессии идет несколько сотен работ в минуту, требуется провести дополнительные работы по улучшению надежности. Надеемся, в 2025 году этот инструмент выйдет уже в полномасштабном варианте.

Из интересного, что мы сделали в последнее время, отмечу еще возможность работы с рукописными материалами. Это в большей степени актуально для средних образовательных школ, для которых есть требование ФГОС, что ученические работы, написанные от руки, особенно выпускные сочинения, должны проверяться на наличие плагиата. Инструментария для проверки таких работ практически не было. Теперь он есть у нас: рукописная работа может быть проверена по всем базам «Антиплагиата» в реальном времени. 

Кстати, для высшей школы это тоже может быть актуально. К примеру, в Индии значительная часть студенческих выпускных работ пишется от руки на бумаге на английском языке.

Юрий Викторович, спасибо за интересный разговор. Мы с Вами обсудили тему искусственного интеллекта в образовании. А используете ли Вы какие-либо ИИ-агенты в быту? Может быть, у Вас есть любимое приложение или технология на основе ИИ, которая помогает Вам в повседневной жизни?

Я активно использую переводчики и различные инструменты по улучшению текстов на английском языке. Машинный перевод удобен, когда он еще и сопряжен с возможностями распознавания с картинки: наводишь камеру на изображение с надписью на незнакомом языке и тут же получаешь перевод. 

Что касается генеративных сервисов, они для меня, скорее, объект исследований, их я использую в профессиональных целях для понимания того, какие у них есть возможности, преимущества и недостатки.

В целом, все мы так или иначе используем ИИ-инструменты ежедневно, в быту, иногда даже не понимая, что все это — обученные алгоритмы.

 

Вопросы: Александр Никифоров, Екатерина Позднякова

Текст: Екатерина Позднякова