Машинное творчество и право: две части одного целого
Published: Nov. 25, 2022
Latest article update: July 15, 2023
Машинное творчество становится одной из самых важных технологий при создании объектов интеллектуальной собственности. Это происходит во многих отраслях творческой деятельности, как с указанием на использование технологий, так и с утаиванием данной информации. В итоге человеческое творчество может быть заменено творчеством ЭВМ.
Можно предположить, что в дальнейшем все творческие специальности могут исчезнуть и стать такой же экзотикой, как ручная работа мастера. Они будут цениться в определенных социальных кругах, но в массовом обороте окажется труд машины, которая будет эффективнее и экономичнее, чем человек.
Тем не менее в регулировании машинного творчества существуют нерешенные правовые вопросы, так как законодатели многих стран подходят с осторожностью к регулированию новых объектов, чтобы не навредить дальнейшему развитию этой сферы. Аналогичная ситуация была при создании компьютерных программ.
В статье описан процесс создания творческого объекта при помощи машинного обучения. Выявлены его основные элементы, обнаружилась правовая нерешенность на этапе сбора данных. В связи с этим проанализированы два основных подхода к использованию объектов интеллектуальной собственности. Выявлены недостатки подходов при создании машинного обучения и предложен альтернативный вариант.
Keywords
Авторское право, искусственный интеллект, машинное творчество, информация, интеллектуальная собственность, произведения, творчество, информационное право, анализ текста и данных, данные
Машинное творчество — это уже не миф, а реальность, которая проникла во все сферы нашей жизни. Представленная в мае 2020 года группой ОрепАІ статья, описывающая принципы работы технологии Generative Pre-trained Transformer 3 (далее — GPT-3)1, а также аналогичная по заявленному функционалу программа от Сбера, выложенная в Open Source, могут создать еще больше предпосылок к неоднозначному регулированию и закреплению интеллектуальных прав2. Пример написания статьи с помощью искусственного интеллекта на технологии GPT-3 был продемонстрирован в The Guardian и привлек широкое внимание общественности [1].
Можно предположить, что в дальнейшем все творческие специальности могут исчезнуть и стать такой же экзотикой, как ручная работа мастера. Они будут цениться в определенных социальных кругах, но в массовом обороте распространится труд машины, которая будет эффективнее и экономичнее, чем человек. Помимо написания статей искусственным интеллектом существуют различные технологии, реализуемые в коммерческих целях и обладающие схожим функционалом, например чат-боты3, аналитические обзоры4, картины5; местные новости6; спортивные новости [2], короткие новостные отчеты [3], романы7; стихи8 и т.д.
Право в большинстве случаев следует за социальными явлениями; пытаясь урегулировать новообразовавшиеся институты. Но с технологиями обычно происходит иначе. Новая технология как социальное явление остается неурегулированным. Например; если рассматривать компьютерные программы; то сначала не существовало специального регулирования; а все правоотношения строились по общим принципам договорного права между лицами, участвующими в сделке [4]. Лица; не участвующие в договоре; могли использовать программу в своих интересах.
Лишь в 1976 году Конгресс Соединенных Штатов Америки принял новый закон об авторском праве; который включал в себя помимо прочего регулирование компьютерных программ в рамках авторского права [5]. Данное изменение закона об авторском праве было преждевременным и представляло собой несбалансированный вариант дальнейшего регулирования9; который сначала отложили по причине опасений со стороны Конгресса США10; а впоследствии, при повторном рассмотрении, законопроект был принят без дополнительных правок в части регулирования компьютерных программ.
Преждевременное принятие закона создало условия для формирования различных способов охраны компьютерных программ [6]. При этом излишнее расширение охраны для компьютерных программ создало пробелы в праве, которые впоследствии суды США уточняли с переменным успехом11.
Возможно, законодательное регулирование компьютерных программ в США было обусловлено стремлением страны стать крупнейшим технологическим гигантом, так как в рамках авторского права охраняется выражение, а не содержание. Еще одной причиной стала «гонка» подходов в регулировании со Всемирной организацией интеллектуальной собственности (далее — ВОИС), которая была создана в 1967 году и начала заниматься регулированием компьютерных программ на международном уровне.
Наиболее эффективным способом охраны со стороны ВОИС был выбран институт sui generis (особого режима охраны), который задал жесткие критерии в отношении защиты от копирования. Но представленный проект «Типовых положений об охране программного обеспечения вычислительных машин» не получил поддержки [7]. Мировое сообщество избрало путь, предложенный США. Тем самым был закреплен существующий на данный момент способ охраны, который запутал ситуацию настолько, что «никто этот клубок распутать не может»12.
Возможно, по этому пути сейчас идет и регулирование машинного творчества. Оно отличается от регулирования компьютерных программ, что обусловлено несколькими причинами: 1) существует потенциальный риск снижения технологического развития машинного творчества; 2) мировое сообщество в рамках отдельных стран ждет коллективного взвешенного решения международных организаций13; 3) трудно находить баланс интересов между обществом и компаниями14; 4) традиционная модель интеллектуальной собственности плохо справляется с технологическими вызовами15.
Отметим, что настоящее время отличается от периода возникновения компьютерных программ и в экономическом плане. На рынке предложений товаров, работ и услуг в интернете функционируют крупные технологические компании, заинтересованные в правовой монополии на данные объекты, которые впоследствии могут заменить человека и потенциально сократить экономические издержки16.
Стоит согласиться с мнением А.Ю. Цариковского, А.Ю. Иванова, Е.А. Войн икание: «Цифровизация экономики, как и сходные по социально-экономическому значению технологические трансформации прошлого (индустриализация, электрификация и т.д.), несет с собой комплекс перемен. Кто-то выигрывает от этих перемен, а кто-то проигрывает» [8, с. 12]. Интересно, как на этот процесс трансформации будут реагировать общество и государство.
Государству сложно что-то противопоставить этим технологических компаниям, так как они захватили большую часть рынка и сформировали у пользователей привыкание к сервисам, которые установлены на каждом устройстве17. Кроме того, для интернет-компаний нет единого контролирующего органа вследствие экстерриториальности [9].
Вытеснение людей технологиями было продемонстрировано в компании Amazon. Изначально она функционировала прежде всего как книжный магазин с профессиональными рецензиями от журналистов18. Но по мере технологического развития компания стала использовать технологии больших данных, которые позволяли учитывать пользовательский интерес при предложении товара, что отражалось на проценте покупок. Руководство компании приняло решение о поэтапном сокращении сотрудников и закупке и поддержке вычислительных мощностей. Экономическая модель ведения бизнеса с внедрением технологий вместо людей стала технологическим прорывом. На данный момент многие успешные крупные компании строят свой бизнес вокруг больших данных19.
Технология создания творческих объектов стала развиваться как отрасль искусственного интеллекта в 50-60 годах20 и получила название «машинное творчество». Оно активно развивалось в узкоспециализированных лабораториях либо самостоятельно людьми творческих профессий. Но технология машинного творчества была лишь отраслью искусственного интеллекта, и соответственно их дальнейшее развитие было взаимосвязано21, что негативно сказалось на этой сфере. В итоге машинное творчество не могло развиваться вплоть до 2010 года по нескольким причинам: 1) нехватка технологических мощностей; 2) недостаточные объемы данных; 3) отсутствие интернета как главного инструмента развития общества на данный момент [10]; 4) нежелание компаний инвестировать в неперспективные проекты.
На тот момент перечисленные выше причины были барьером для дальнейшего регулирования искусственного интеллекта, но на данном этапе технологического развития они перестали быть преградой для дальнейшего преобразования этой сферы. В связи с этим машинное творчество снова создает правовые неопределенности в традиционной системе права.
Примером машинного творчества является создание изображений кошек одним нажатием кнопки. В общем виде разработчику для создания картинки необходимо выполнить определенную последовательность действий22.
После выполнения этих двух этапов процесс написания программы по созданию изображений кошек для программистов заканчивается. Но впоследствии сам алгоритм и набор данных будут совершенствоваться за счет действий пользователя и (или) разработчика.
Из рассмотренного примера можно сделать следующие выводы. Самое главное в машинном творчестве — данные. Без них машинное творчество не сможет существовать. Чем больше данных, тем более точным будет результат [11]. Для маленького стартапа количество картинок, возможно, составит десятки тысяч в трех выборках. В большинстве своем программисты будут скачивать картинки из интернета.
При этом стоит отметить, что есть открытые данные, которые публикуются для использования, но они предназначены преимущественно для статистических целей23 (например, данные о местах с наибольшей проходимостью — для открытия магазина в данной местности, для получения сведений о перекрестках с длительными пробками и т.д.). А открытых данных с объектами интеллектуальной собственности в России не существует по причине невозможности отказа от интеллектуальных прав по российскому праву. Возможен вариант, что будут использоваться только объекты общественного достояния, но сама вариативность итогового продукта снижается. Возникает ключевой вопрос: может ли разработчик использовать объекты авторского права из интернета без разрешения правообладателя?
Вопрос данных является краеугольным камнем во всех отраслях права, которые связаны с машинным обучением, поскольку машинное обучение преимущественно представляет собой набор данных и невозможно создать какой-либо проект, не используя их. Правовое регулирование процесса сбора и обработки данных осуществляется неоднородно во многих правопорядках, на него влияет экстерриториальность создания продукта и правового регулирования.
Данные, загруженные в технологию машинного творчества, по общему правилу являются объектами интеллектуальной собственности, так как их большинство представляют собой творческий объект другого автора, который охраняется в рамках авторского и (или) патентного права. Вопрос, который был поставлен выше, может быть разрешен следующими путями: 1) получением разрешения у правообладателя; 2) ограничением исключительных прав; 3) расширительным пониманием доступа.
Первый вариант — традиционный в рамках регулирования интеллектуальной собственности. Если создано произведение, то это право действует запретительно в отношении третьих лиц. Никто не вправе использовать произведения без предварительного разрешения правообладателя. Данный подход является устоявшимся способом использования интеллектуальных прав, но если при использовании малого количества данных он релевантней, то в случае с технологиями больших данных этот способ представляется не совсем возможным24. Получение разрешения каждого правообладателя — затратный по времени и финансам процесс, кроме того, проблематичен поиск самого правообладателя.
Данные обстоятельства позволяют сделать вывод, что получение разрешения правообладателя на использование объектов не представляется возможным при создании коллекций данных.
Второй вариант представляет собой возможность использования механизма ограничения интеллектуальных прав. Такой способ был применен в Директиве об авторском праве на едином цифровом рынке (Directive on Copyright in the Digital Single Market) [12]. В законодательном акте путем прямого действия были введены ограничения для анализа данных и текста (text and data mining). Под анализом данных и текста понимается «любой аналитический метод, направленный на анализ текста и данных в цифровой форме в целях получения информации, которая включает, но не ограничивается паттернами, тенденциями и корреляциями»25.
Исходя из дефиниции, можно утверждать, что указанный механизм введен специально для случаев анализа коллекций данных при создании объектов машинным творчеством. Само понятие имеет широкое применение, при котором можно рассматривать любое действие разработчика как анализ текста и данных.
При этом стоит учитывать, что в данном определении не проводится разграничение между данными и информацией, хотя по своей природе два этих объекта разнородны и направлены на разного рода правоотношения. Соотношение данных и информации — дискуссионный вопрос на практике. Следует предполагать, что данные — это та часть информации, которая возникает только при их использовании. Информацию можно сравнить с нефтью. Пока она хранится и не добывается, она остается таковой. Как только она начинает обрабатываться, она становится данными, которые в дальнейшем регулируются в зависимости от сферы использования.
Согласно Директиве, ограничение интеллектуального права на воспроизведение возможно в двух случаях. Первый из них предназначен для исследовательских организаций и учреждений культурного наследия, которые могут осуществлять анализ данных и текста при законном доступе (Lawfill access)26. Под законным доступом понимается доступ к материалу, основанный на политике открытого доступа (open access policy) либо посредством договорных отношений между правообладателями и исследовательскими организациями или учреждениями культурного наследия, таких как подписки, либо другими законными способами27 (например, подписка на сервис, если в договоре не указано иное, а также объекты, находящиеся в интернете).
Данный способ ограничения интеллектуального права разрешает использовать материал, который не принадлежит разработчикам, только в исследовательской деятельности. Само определение субъектов дает основание полагать, что в качестве таких лиц невозможно понимать частные компании, которые в рамках своей деятельности выполняют исследовательскую работу28. Притом, как написано в Директиве, университеты и исследовательские институты могут работать с частными компаниями, но только в рамках государственно-частного партнерства29. Однако доступ к результатам, полученным в результате таких научных исследований, не может быть предоставлен на льготной основе предприятию, оказывающему решающее влияние на такую организацию30.
Второй способ ограничения исключительных прав направлен на частные компании31. В отличие от первого ограничения здесь нет закрытого списка субъектов. Ограничение позволяет использовать в своей деятельности анализ данных и текста, если не будет нарушено право других лиц. Последние могут ограничить данный способ путем внесения уведомления о запрете совершения таких действий в отношении данных материалов (как указано в Директиве, это возможно сделать, например, с помощью машиночитаемых средств в случае материалов, размещенных в открытом доступе в интернете). Данный случай представляет собой договорной запрет на осуществление таких действий, который не может быть проигнорирован никаким образом. Если такое ограничение существует, то разработчику следует спрашивать разрешения у правообладателя либо отказаться от данных материалов.
Общее правило использования материалов на сайте представляет собой двухступенчатый тест: 1) материал получен при использовании законного доступа; 2) на ресурсе правообладателя не содержится ограничений на анализ данных и текста (это возможно путем использования машиночитаемых средств, включая метаданные и условия веб-сайта или услуги)32.
Данные ограничения являются попыткой установить ограничение интеллектуальных прав в коммерческих целях33. Но во многих научных трудах данная концепция была раскритикована, так как в большинстве своем это не дает никакой возможности анализа данных и текста частным компаниям. Это порождает непроницаемые границы. Следует предполагать, что минусы данной Директивы таковы:
Однако ни один из этих вариантов нельзя считать достаточным для обеспечения устойчивого решения с точки зрения возможности повторного использования данных, поскольку держатели данных все равно будут иметь возможность ограничить повторное использование своих незащищенных баз данных посредством ограничительных договорных положений». Притом как наиболее приемлемое указывается решение отменить право sui generis, так как этот механизм охраны никаким образом не стимулирует развития технологий, как было изначально задумано36.
В данном случае баланс интересов между обществом и правообладателем был применен государством против общества, что дало возможность частным компаниям в своей предпринимательской деятельности применять законодательные ограничения интеллектуальных прав. Возможно, в дальнейшем будет еще больше негативных практик, которые вводят новые ограничения, то есть продолжат усиливать монополии правообладателей.
Также в ограничениях, предложенных Европейским союзом, возможны случаи договорного запрета использования законодательных ограничений, что является областью нетрадиционной правовой природы. Если государство вводит ограничения, то невозможно вводить ограничения на ограничения. Это создает возможность ухода от первого ограничения в пользу второго, на которое оно направлено. Возможно, это был способ государства соблюсти тот самый баланс, который будет потерян. Но это представляет собой введение в коммерческий оборот неоднозначного механизма, который в дальнейшем будет так же неудачен, как базы данных и компьютерные программы, которые не имеют четких критериев.
Исходя из всего сказанного, мы приходим к выводу, что законодателю в Европейском союзе плохо удалось разобраться в содержании данной технологии, созданы новые нерешенные задачи, которые невозможно будет изменять на законодательном или правоприменительном уровне. Данный случай также похож на регулирование компьютерных программам и баз данных, когда были введены неточные и неоднозначные критерии, которые не имеют устойчивого базиса для развития общественных технологий. Эта Директива еще раз показывает, что правовое регулирование сложных технологических объектов плохо укладывается в традиционные основы интеллектуальной собственности.
Третий способ, предлагаемый автором статьи, представляет собой использование права доступа на данные без ограничений. Право доступа закреплено в Законе «Об информации, информационных технологиях и о защите информации», согласно которому доступ к информации — возможность получения информации и ее использования [15]. Притом граждане (физические лица) и организации (юридические лица) вправе осуществлять поиск и получение любой информации в любых формах и из любых источников при условии соблюдения требований, установленных настоящим Федеральным законом и другими федеральными законами.
Так А.А. Ефремов, Н.П. Коптева, А.К. Терещенко считают, что цифровая экономика — это экономика, основу которой составляют свободный информационный обмен, что должно быть обеспечено законодательными мерами <... > Формирование электронного государства и цифровой экономики требует свободного оборота данных. Важным условием является открытость данных [16, с. 5].
Право на доступ дает возможность искать, получать и использовать любую информацию в любых источниках. Это можно сравнивать с творчеством человека. При создании нового произведения автор так или иначе вдохновляется идеями и образами, полученными в течение жизни; например, при прослушивании музыки определенного жанра автор будет создавать схожую музыку, поэтому великие композиторы вырабатывали хороший вкус с детства. Автор не наносит никакого вреда правообладателю, так как фактически не воспроизводит это произведение публично.
Так же и при анализе данных и текста разработчик не нарушает в экономическом плане права правообладателя. Различные произведения могут быть загружены в наборы данных, но при выдаче результата сами произведения «размываются». Конечно, возможны случаи, когда разработчик загрузил все произведения определенного автора и тем самым создал аналогичные произведения, но данный случай подходит под понятие злоупотребление правом.
Вследствие этого видится разумным использование механизма доступа к объектам интеллектуальной собственности без разрешения правообладателя. При этом стоит учитывать, что в Законе имеются два неопределенных момента касательно возможности регулирования.
Во-первых, в механизме доступа используется понятие «информация», что создает неопределенность касательно статуса понятия «данные». Видится разумным считать, что информация и данные — это равнозначные термины, но термин «информация» шире.
Во-вторых, в ст. 1 указанного Закона сказано, что его положения не распространяются на отношения, возникающие при правовой охране результатов интеллектуальной деятельности и приравненных к ним средств индивидуализации, за исключением случаев, предусмотренных настоящим Федеральным законом.
Возможно, релевантным будет внесение механизма сбора и обработки данных в ст. 8 Закона «Об информации, информационных технологиях и о защите информации». Это позволит сбалансированно предоставлять возможность собирать, обрабатывать, использовать, создавать, охранять и защищать права на машинное творчество, что в итоге положительным образом скажется на развитии искусственного интеллекта.
Неслучайно В.Ф. Яковлев считал, что задача государства состоит не в том, чтобы управлять, а в том, чтобы регулировать экономические отношения. При этом главным средством государственного воздействия на экономику становятся законы и нормативные акты [17].
Однозначный и устойчивый путь разрешения вопроса, связанного с данными, еще не предложен и остается дискуссионным. На данный момент объекты машинного творчества создаются по принципу «пока не поймали», основанном на том, что незаконное использование определенного произведения в коллекции данных в машинном творчестве нельзя обнаружить, а исследовать содержание самой коллекции представляется невозможным вследствие того, что компании не будут разглашать свою коммерческую тайну либо не будут раскрывать свою интеллектуальную собственность.