Цифровизация: готовы ли мы?

О необходимости нормативного регулирования правоотношений в области генеративных нейронных сетей.
Мы живем во времена, когда на конкурсе художников из 300 человек победила нейронная сеть (midjourney), причем автор создал изображение, просто написав фразу («text to image»), которая нейросетью была переработана в изображение. Многие видели перенос стиля изображения на их фотографию, который демонстрировало приложение Prisma. В Интернете есть видеозаписи общения людей с «умными» домофонами. Также появились генеративные сети, создающие изображения «котиков, которых никогда не было».

С учетом высокой скорости развития нейронных сетей и законодателю, и судам в ближайшие годы нужно быть готовыми к регулированию правоотношений в данной области.

Перенос стиля или создание изображения генеративной нейронной сетью (GAN) достигается за счет использования других изображений, имеющих авторство. В скрытом пространстве нейронной сети формируются данные, содержащие признаки изображения, как его понимает нейросеть. Эти признаки могут быть перенесены на любое изображение или использованы для создания нового. Человечество приходит к тому, что все, что можно, уже нарисовано, и остается только комбинировать имеющиеся изображения. Таким образом, в ближайшее время мы можем столкнуться с вопросом авторства изображений, полученных с помощью генеративных нейросетей, – ведь при создании результата используется результат чужой интеллектуальной деятельности. Чьим творением в таком случае считать данное изображение – автора картины, программиста или человека, написавшего текст для создания изображения? Или, может быть, всех вместе? В ситуации, описанной в начале статьи, конкурс имел призовой фонд.

В зарубежном законодательстве вопрос об использовании чужих произведений для обучения искусственного интеллекта, в том числе одной из его архитектур – генеративной сети, – решен следующим образом: использование считается добросовестным. Российской правовой системе с этой проблемой еще предстоит определиться. Во избежание конфликтов в области авторских прав и для развития технологий, связанных с генеративными нейросетями, подход, при котором подобное использование результатов интеллектуальной деятельности признается добросовестным, представляется целесообразным.

Генеративные сети позволяют создавать изображения из текстового описания (например, я направил такие работы на конкурс, приуроченный ко Дню юриста, проводимый АП СПб). Возможно, в ближайшие годы появятся программы для создания видео путем введения текстовой фразы или создания фильмов прямо из сценария, что даст серьезный инструментарий для появления «Deep fake»-видео, в правдоподобности которых будет сложно усомниться. При этом и голос, и лица персонажей будут полностью созданы из образцов, имеющихся в публичном доступе (пример подобного видео – Леонардо Ди Каприо, покупающий овощи на российском рынке за биткойн). Сейчас уже есть нейронные сети, синхронизирующие движение губ с дубляжом фильма и создающие полное ощущение, что актер говорит на языке дубляжа.

Нейронным сетям все равно, что создавать, – они могут генерировать объекты от безобидных картинок до изображений людей в неприглядных ситуациях: рамки создаваемого будут определяться только лицом, формирующим задачу. В описанном только что случае видео было маркировано «deep caprio», что позволяло определить подделку. В других случаях видео может быть менее безобидным и не будет иметь каких-либо меток.

В связи с этим возникает вопрос законодательного регулирования контента, создаваемого нейронными сетями. Для возможности свободного развития технологии необходимо, с одной стороны, снимать ограничения, а с другой – ограничить спектр ее применения. Так, в случае создания вредоносного контента ответственность, безусловно, должен нести оператор, поставивший задачу его создания.

В некоторых странах введен законодательный запрет на создание «deep fake», обусловленный проблемами использования этой технологии. В России технология «deep fake» пока не вызвала широкого резонанса, однако с учетом курса на цифровизацию и биометрию серьезно задуматься над этим стоит уже сейчас, особенно принимая во внимание объем данных в «даркнете», содержащих банковскую тайну, которой, казалось бы, там быть не должно. Нейронные сети – это сфера, которая будет стремительно развиваться в ближайшие десятилетия, и чем больше будет цифровых данных, тем «умнее» они будут становиться. Возможно, в недалеком будущем у каждого появится «собственный ИИ», который можно будет самостоятельно обучать для собственных нужд, подгружая данные из Сети.

Однако на пути развития ИИ уже есть препятствия в виде законодательных ограничений на оборот персональных данных. Чтобы обучить нейросеть, требуется создать базу примеров (dataset), демонстрирующую вариативность данных. Так, чтобы научить нейронную сеть распознавать рукописные цифры, был создан dataset (mnist), содержащий 60 тыс. образцов рукописных цифр. Вопрос авторства возникает и при использовании чужого dataset для обучения нейросети: например, один человек создал обучающую базу, а другой ее использовал или скомпилировал со своей для обучения нейронной сети.

Когда речь идет о распознавании паспортных данных и иных документов, ситуация существенно осложняется. Обработка персональных данных приводит к необходимости совершения дополнительных действий. На мой взгляд, обучение нейросетей стоит исключить из законодательных ограничений на обработку персональных данных, поскольку нейросети способны принести большую пользу – например, страницы паспорта при сканировании могут преобразовываться в текстовую форму для заполнения договоров, что способно уменьшить трудовые и временные затраты на оформление документов. Без использования такой технологии и при обработке данных «вручную» возрастает вероятность ошибок вследствие человеческого фактора.

Для обучения нейросетей существует большое количество публичных баз данных, однако созданных в России – единицы. На помощь может прийти изменение изображений документов – аугментация. Однако важно учитывать, что использование «синтетических» данных может привести к «синтетическим» результатам.

Разработки в области компьютерного зрения и object detection приравнены к научному уровню, в связи с чем представляется целесообразным расширить возможность оборота данных для этих целей. Например, для обучения нейросети цензурированию запрещенной символики в видеозаписи необходимо собрать базу образцов. Это может повлечь серьезные проблемы для программистов в случае обнаружения правоохранителями, к примеру, 60 тыс. случаев запрещенной символики на чьем-либо компьютере. А если программист будет работать над dataset для цензурирования, допустим, изображений порнографического характера в потоковом видео, – тем более.

Цифровые технологии используются повсеместно. В некоторых странах уже принимаются законы, регулирующие правоотношения в области нейросетей. Например, в ряде стран разрабатываются законопроекты, закрепляющие права граждан на безопасные и эффективные системы ИИ, защиту от дискриминации со стороны алгоритмов, на контакт с человеком, а не с роботом в определенных ситуациях. По этому пути идут многие страны. Например, в США проходит судебное разбирательство о возможности обладания патентом самим искусственным интеллектом (Dabus).

Что касается нормативного регулирования данной сферы в России, то оно пока ограничено Кодексом этики искусственного интеллекта¹.

Вместе с тем в области высоких технологий сейчас разворачивается настоящее сражение. Мировые лидеры решили дискриминировать российских потребителей. В ряде случаев встречается простой отказ в обслуживании, как это сделал Netflix; в некоторых случаях – ограничения (например, в приеме платежей, как это сделали Apple и Google). Данным обстоятельством потребители остались недовольны и стали обращаться в суд. Однако российские суды начали отказывать в требованиях, и вот уже представители иностранных компаний ходят по судам, размахивая пачками отказных решений и намекая судам, что остальные решения должны быть такими же. При этом пользователь, приобретая оборудование или оплачивая сервис, рассчитывал на его определенные потребительские свойства. Даже если компания не обязывалась предоставлять какие-либо услуги, отключение работающего сервиса пользователю, на мой взгляд, должно расцениваться как злоупотребление правом со стороны компании, если это отключение не продиктовано техническими проблемами. Поэтому представляется, что судам общей юрисдикции следует встать на защиту прав граждан, пострадавших из-за введения санкций. Арбитражные суды, например, уже применяют специфические нормы к истцам из недружественных государств, как это было сделано по делу № А28-11930/2021 («АГ» писала об этом).

Нельзя обойти вниманием и проблемы в области информационных технологий, с которыми столкнулась Россия за последние 30 лет. В стране нет какой-либо популярной национальной операционной системы и других независимых систем; в магазинах отсутствует произведенное в РФ компьютерное «железо». Несмотря на наличие нобелевского лауреата за изобретение технологии лазерных компакт-дисков², отечественный рынок не смог предложить потребителям ни одного произведенного в России привода компакт-дисков. При этом российские программисты занимают первые места на международных соревнованиях по программированию.

Представляется, что высшие учебные заведения, в том числе с помощью студентов, могли бы разработать российскую операционную систему, дружелюбную к пользователю, а если перевести всех чиновников на отечественное ПО, сэкономленные средства можно было бы направить на разработки в области информационных технологий.

Председатель Совета молодых адвокатов Омской области Евгений Забуга, выступая в мае 2018 г. на II научно-практической конференции молодых адвокатов «Традиции и новации адвокатуры», посвященной Ф.Н. Плевако, отмечал: «Искусственный интеллект, искусственные нейронные сети не способны выполнять творческую функцию, у них есть только аналитическая компонента. Традиционной адвокатуре, которая занимается не только вопросами гражданского и арбитражного права, роботы-юристы конкуренцию составить не смогут».

Не соглашусь с подобным утверждением. Нейронная сеть уже победила в конкурсе, обойдя 300 художников, и это только начало. Генетические алгоритмы нейросетей незаменимы в вопросах оптимизации – то, что человек будет рассчитывать неделю, нейросеть сделает за 15 минут. Нейросети могут заменить и упростить многие задачи – например, логотип нашего адвокатского образования создан нейросетью, а наш телеграм-бот (@LawNowBot) использует ИИ для поиска правильного ответа в своей базе.

Таким образом, творческая компонента нейросетей стремительно развивается, что подтверждают существенные инвестиции в данную отрасль³.

В Сети уже высказывались мнения, что со временем адвокатов могут заменить роботы. Однако выступать в судах роботы еще не умеют, поэтому «судьба» художников адвокатам пока не грозит. Несмотря на то что нейросеть может сформировать решение суда, судьям пока переживать тоже не стоит – для разработки «эталонного» dataset судебных решений придется «сломать много копий».

Как видно из перечисленных примеров, эпоха думающих машин (perceptron) приближается, поэтому стоит задуматься о регулировании данной сферы, так как соответствующие правоотношения уже существуют. Более того, ожидается их стремительный рост.

То, что Россия, очевидно, сделала ставку на высокие технологии, подтверждает наличие большого количества соответствующих программ повышения квалификации. Однако образовательным учреждениям важно осознавать, что повышение квалификации должно позволять выпускникам сразу применять эти технологии на практике. В связи с этим правовое регулирование вопросов цифровых активов должно создавать почву для развития цифрового пространства во всех его проявлениях.

¹ Кодекс этики ИИ был подписан в рамках первого международного форума «Этика искусственного интеллекта: начало доверия», состоявшегося в октябре 2021 г.

² Жорес Алфёров – советский и российский ученый-физик, лауреат Нобелевской премии по физике за разработку полупроводниковых гетероструктур и создание быстрых опто- и микроэлектронных компонентов (2000 г.).

³ Например, Илон Маск создал проект Open Ai для разработок в области ИИ (Dall-E – разработка этой компании). Обработка естественного языка (NLP) – одна из быстро развивающихся областей нейронных сетей; при этом уже созданы специальные библиотеки для обработки русского языка с учетом падежей и окончаний (pyMorph).

Короткая ссылка на новость: https://www.lawnow.ru/~HcYV6

Цифровизация: готовы ли мы?

Цифровизация: готовы ли мы?

Представление интересов в судах общей юрисдикции

Комментарии пользователей

Новости

Публикации

Следите за новостями

Юридический форум

Последние комментарии