Соотношение и разграничение информации и данных
Опубликована Ноя. 1, 2024
Последнее обновление статьи Дек. 7, 2024
Данные являются основополагающим объектом для функционирования новых цифровых технологий, искусственного интеллекта и всей цифровой экономики. По этой причине во многих правовых актах начинают использовать понятие «данные», а не понятие «информация». Однако в российском законодательстве и доктрине не разработаны критерии разграничения этих понятий, что приводит к существованию трех различных подходов к пониманию и соотношению указанных категорий, а вследствие этого к возникновению ошибок и неточностей в терминологическом аппарате. Проанализировав различные точки зрения, можно констатировать, что данные имеют неструктурированную и хаотичную природу, информация имеет определенный контекст и целостное содержание, при этом данные могут трансформироваться в информацию, а информация в данные. Первичны всегда данные, поскольку путем их соединения выстраивается определенный контекст и содержание, тем самым формируется информация. Доказывая это утверждение в рамках регулирования персональных данных, был сделан вывод, что основной объект этих правоотношений должен называться «личная информация», а не «персональные данные», так как данные сами по себе не содержат информацию личного характера, но если эти данные могут использоваться для идентификации и ассоциироваться с конкретным физическим лицом, то можно утверждать, что они преобразуются в личную информацию и подлежат регулированию в рамках персональных данных. Кроме того, в новой редакции ст. 71 Конституции Российской Федерации было введено новое понятие «цифровые данные», которое ранее не использовалось в российском правовом регулировании. Исходя из этого, можно утверждать, что под цифровыми данными прежде всего понимаются данные, обрабатывающиеся с использованием информационных технологий и доступные для обработки в цифровой форме, например открытые данные.
Ключевые слова
Искусственный интеллект, цифровая экономика, информация, данные, база данных, персональные данные, цифровые данные, личная информация, сквозные технологии, анонимные данные
Во многих исследованиях и правовых актах подчеркивается, что данные являются основополагающим объектом для функционирования новых цифровых технологий, искусственного интеллекта и всей цифровой экономики1. При этом изначально в российском праве понятие «информация» выступало в качестве основного объекта правового регулирования. Переход от повсеместного использования информации к данным произошел единовременно, вместе с тем в российской правовой науке и законодательстве не определены различия и соотношения между ними, что негативно влияет на существующее и дальнейшее регулирование. Вместе с тем если провести различия между данными и информацией, то это позволит создать специальное регулирование, учитывающее уникальные черты и характеристики этих объектов.
В российском законодательстве содержится три основных подхода к пониманию и соотношению категорий «информация» и «данные»2:
Существование трех разных подходов к соотношению информации и данных негативно влиет на многие сферы деятельности, в связи с этим создается объективная необходимость в их разграничении6. Основную предпосылку этой проблемы известный российский эксперте области информационных технологий Л. С. Черняк объяснил следующим образом: «Сейчас — дело и не дело — используется словосочетание "информационные технологии". Стоит сказать несколько слов по этому поводу. Прежде всего, потому что со времен Клода Шеннона на инженерном уровне произошло смешение понятий, объединение представлений об информации и данных или сигналах, кодирующих эту информацию. С легкой руки первопроходцев информацией стали называть, по существу, набор данных. До последнего времени, пока системы были относительно просты, отсутствие четкого разделения на данные и информацию не имело практического значения. Но с появлением сложных информационных систем, где функции распределены между человеком и машиной, где человек является активной составляющей, а также с развитием таких дисциплин, как управление знаниями, требуются более точные определения базисных понятий: "данные", "информация" и "знание". В литературе можно найти сотни различных определений понятия "информация"; многие из них противоречивы. Но коль скоро мы пока не можем точно определить, что такое информация, то и что такое информационные технологии, не очень понятно. Но сохраним его, как говорится, "термин занят"»7.
В различных сферах научного знания существуют попытки провести разграничение между информацией и данными, так как благодаря такому разнообразию информационных форм и воплощений было построено множество специализированных информационных теорий, в которых была предпринята попытка отразить важные аспекты информации8. Так, профессор философии и этики информации в Оксфордском университете и Болонском университете Л. Флориди считает, что данные определяются как любое различие или отсутствие единообразия, а информация — как хорошо сформированные, осмысленные, правдивые данные9. Хань Сючжи утверждает, что по сравнению с данными информация обладает характеристиками постоянства, независимости, процесса и знания, поскольку является выражением конкретного содержания, а сами отношения между данными и информацией аналогичны отношениям между «формой» и «содержанием»10. Е. А. Войниканис и М. В. Якушев считают, что есть еще одно неотъемлемое свойство информации — ее противостояние хаосу11, добавляя к этому: «Не случайно еще и то, что само слово "информация", как известно, происходит от латинского information, что означает "разъяснение" или "осведомленность", а информацией оказываются только те передаваемые сообщения, которые уменьшают неопределенность у получателя информации»12. Такого же подхода придерживается О. А. Городов: «Данное утверждение будет тем более справедливо, если рассматривать информацию как знание, как меру устранения неопределенности представления о чем-либо. Следовательно, неизвестность (незнание) — это не информация, а нечто ей противоположное»13. В данном случае как нечто противоположное информации стоит понимать данные.
Основоположник кибернетики и математической теории связи Н. Винер предложил следующее определение информации: «Информация — это обозначение содержания, полученного нами из внешнего мира в процессе приспосабливания к нему нас и наших чувств. Процесс получения и использования информации является процессом нашего приспособления к случайностям внешней среды и нашей деятельности в этой среде»14. Следует отметить, что Н. Винер подчеркнул в своем определении два важных критерия. Информация — это содержание, следовательно, данные — это форма. При этом процесс получения и использования информации является интерпретацией случайностей внешней среды, соответственно данных. Раскрывая это понятие, В. А. Палицын указал, что содержание в этом определении — это состав, структура, свойства, связи, отношения и состояния объектов и явлений, выражаемые качественными и количественными характеристиками, а процесс приспособления к объектам внешнего мира — использование соответствующих (технических, психологических и иных) инструментов и методов для раскрытия смысла обозначений и обнаружения содержания объекта или явления15. В. А. Палицын сделал из этого вывод: «Информация есть "обозначение содержания", но лишь тогда, когда это обозначение воспринимается человеком и понимается им, иначе говоря, становится информацией для индивидуума, обладающего соответствующими чувствами, знаниями, интеллектом, способностями и опытом»16.
О. Н. Новокшанов предложил следующее разграничение: «1) отрывочные, разрозненные, несогласованные, возможно противоречивые сведения об отдельных признаках, свойствах, особенностях объекта являются данными. Такие сведения характеризуют один или несколько признаков (элементов) объекта, но не позволяют получить целостное представление об объекте (системе) или какой-либо его формально обособленной части (подсистеме); 2) согласованные, системно организованные сведения, с достаточной степенью полноты (целостности) характеризующие объект (или некоторую его сторону) и позволяющие идентифицировать его, являются информацией; 3) целостные сведения об объекте, его сущности, законах и условиях его возникновения, существования, функционирования и развития являются знанием»17.
Исходя из этих исследований, можно констатировать, что все они основаны на концепции «данные — информация — знания — мудрость» (Data — Information — Knowledge — Wisdom)18. В этой концепции существует четы ре уровня, где каждый последующий уровень добавляет определенные свойства к предыдущему19. С правовой точки зрения важны два уровня: нижний уровень — данные (data), которые являются наборами фактов и знаний в необработанном, хаотичном виде; следующий уровень — информация (information), содержащая в себе сгруппированные данные с определенным контекстом и целостным содержанием.
Применить эту концепцию в правовой плоскости можно на следующих примерах. Субъекту известны следующие данные: 5, 4, 7, 9, 40, 90. Они не имеют ценности сами по себе, но если к ним добавить определенный контекст, например, что это номера квартир жильцов в определенном доме, не платящих за коммунальные услуги, то данные уже становятся информацией, и она может иметь потенциальную пользу для субъекта20. Кроме того, с помощью соединения разнородных данных формируется определенный правовой режим информации. Так, если в предыдущем примере добавить следующие данные: Никита, Степан, Екатерина, Светлана, Полина, то эта информация идентифицирует определенных людей и тем самым подпадает под регулирование персональных данных.
В этой связи в некоторых правопорядках, в том числе и в России, проявляются ошибки в терминологическом аппарате. Так, в России закон, регулирующий отношения, связанные с обработкой персональных данных, имеет название Федеральный закон от 27.07.2006 № 152-ФЗ «О персональных данных»21. Однако представляется целесообразным обозначить этот термин не «персональные данные», а «персональная (личная) информация»22. При этом исходя из определения персональных данных, содержащегося в п. 1 ст. 3 названного Закона, можно констатировать, что, во-первых, законодатель подчеркнул, что эти данные — это прежде всего информация, а во-вторых, она идентифицирует прямо или косвенно определенное или определяемое физическое лицо и имеет определенный контекст (содержание).
Кроме того, в одних иностранных правопорядках предметом регулирования общественных отношений являются персональные данные23, а в других — личная информация24. Следует предполагать, что это связано прежде всего с тем, что первоначально многие страны (например, Россия) присоединились к Конвенции о защите физических лиц при автоматизированной обработке персональных данных25 и имплементировали в свое законодательство содержащиеся в ней положения и подходы, в том числе терминологический аппарат. Однако некоторые страны пошли собственным путем. Так, в Китае в нескольких законах были разграничены понятия «данные» и «информация»26.
Законодатель сделал вывод, что данные, регулируемые Законом о безопасности данных, следуют правилу преобразования «данные — информация — знание — мудрость», рассматривающему данные как носитель информации, а информация относится к знаниям, содержащимся в данных27. В китайской науке утверждается, что данные сами по себе не содержат информации личного характера, но если эти данные могут использоваться для идентификации и ассоциироваться с конкретным физическим лицом, то можно утверждать, что они преобразуются в личную информацию и подлежат регулированию в соответствии с Законом о защите личной информации28.
Таким образом, следует предполагать, что данные могут трансформироваться в информацию, а информация в данные. С позиции регулирования персональных данных можно констатировать, что если невозможно идентифицировать кого-то из множества, то это данные, но если это становится возможно, например путем добавления других данных, то данные трансформируются в информацию. Указанный подход нашел отражение в концепции анонимных данных в Общем регламенте Европейского Союза по защите данных29, в рамках которого анонимные данные не являются персональными данными, так как в отношении них были применены специальные действия и методы для получения хаотичного набора данных. Однако при этом существует вероятность того, что можно осуществить «деанонимизацию» этих данных, то есть получить из хаотичного набора данных личную информацию30.
Соотношение и разделение информации и данных можно продемонстрировать на примере регулирования базы данных, так как именно в этом объекте происходит совмещение данных и информации. В российском праве под базой данных понимается представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (абз. 2 п. 2 ст. 1260 ГК РФ31). Хотя в данном определении прямо не указывается, но согласно вышеизложенной концепции в базе данных содержится именно информация, так как она систематизирована определенным образом и в определенном контексте. Подтверждением этому является определение информационной системы, под которой понимается совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств (п. 3 ст. 2 Федерального закона от 27.07.2006 № 149-ФЗ «Об информации...»).
Кроме того, в новой редакции ст. 71 Конституции Российской Федерации32 было введено понятие «цифровые данные». Этот объект ранее не использовался в российском правовом регулировании, в отличие от иностранных правопорядком Так, согласно Гражданскому процессуальному кодексу Китая с 2012 г. одним из видов доказательств в гражданском судопроизводстве признаются электронные данные, в частности сообщения WeChat, а записи онлайн-трансакций принимаются судами КНР в качестве надлежащих доказательств33. В Индии был принят Закон «О защите цифровых персональных данных» 2023 г., в рамках которого охраняются только персональные данные в цифровой форме34. В Регламенте (ЕС) 2018/1807 Европейского парламента и Совета от 14.11.2018 «О свободном обращении неличных данных в Европейском Союзе» подчеркивается, что электронные данные занимают центральное место в современных инновационных экономических системах и обществе и приносят большую пользу при анализе или в сочетании с услугами и продуктами; это понятие понимается прежде всего как объект, выраженный в цифровой форме35.
Исходя из этого, можно утверждать, что под цифровыми данными понимаются данные, обрабатываемые с помощью информационных технологий и доступные для обработки в цифровой форме. В связи с этим цифровыми данными являются, например, открытые данные, которые понимаются как информация, размещенная в сети «Интернет» в виде систематизированных данных, организованных в формате, обеспечивающем их автоматическую обработку без предварительного изменения человеком, в целях неоднократного, свободного и бесплатного использования36.
При этом видится обоснованным, что регулирование в рамках многих искусственных устройств, основанных на данных (преимущественно это технологии искусственного интеллекта), следует распространять не на информацию, а только на данные, так как на основе них формируется целостная информация. В российском праве сходный подход закреплен в Федеральном законе от 29.12.2010 № 436-ФЗ «О защите детей от информации, причиняющей вред их здоровью и развитию»37. Так, в рамках указанного Закона осуществляется охрана детей отданных, причиняющих вред их здоровью и (или) развитию, путем введения специальных требований к ним, в том числе запрета на распространение определенной информации среди детей определенного возраста (ст. 11). Согласно буквальному толкованию этого Закона, данные — это всё, что содержится вне поля зре
ния ребенка, а информация — это то, что уже попало в его поле зрения. Сходным образом следует регулировать искусственные устройства, а именно путем установления обязательных требований к качеству данных. При этом должны применяться и другие обязательные юридические требования к искусственным устройствам.
Таким образом, проанализированные исследования и приведенные примеры показывают, что данные имеют неструктурированную и хаотичную природу, информация же имеет определенный контекст и целостное содержание, при этом данные могут трансформироваться в информацию, а информация в данные. Однако первичны всегда данные, так как путем их соединения и выстраивается определенный контекст и содержание, тем самым формируется информация.
БИБЛИОГРАФИЯ
1. Винер Н. Человек управляющий. - СПб. : Питер, 2001. - 283 с.
2. Войниканис Е. А., Якушев М. В. Информация. Собственность. Интернет. Традиция и новеллы в современном праве. - М. : Волтерс Клувер, 2004. - 176 с.
3. Городов О. А. Информационное право : учебник для бакалавров. - 2 е изд. - М. : Проспект, 2019. - 303 с.
4. Новокшанов О. Н. Содержание и соотношение понятий «данные», «информация», «знания» в теории обеспечения национальной безопасности // Право и государство: теория и практика. - 2014. - Т. 10. - № 118. - С. 67-72.
5. Озерова А. С. Уголовно-правовая защита личной информации в Китае в условиях построения системы социального кредитования // Актуальные проблемы российского права. - 2022. - № 5. - С. 196-206.
6. Палицын В. К вопросу о соотношении понятий «знания», «информация», «данные» // Наука и инновации. - 2018. - Т. 2. - № 180. - С. 44-49.
7. Семенов В. В. Гражданско-правовая основа законодательства о защите личной информации в России и Китае // Юрист. - 2022. - № 11. - С. 7-10.
8. Терещенко Л. К. Трансформация понятийного аппарата информационного права в условиях цифровизации // Журнал российского права. - 2022. - Т. 26. - № 12. - С. 98-110. - https://doi.org/10.12737/jrl.2022.131.
9. Черняк Л. Grid как будущее компьютинга // Открытые системы. - 2003. - № 1. - URL: https://www.osp.ru/os/2003/01/182390 (дата обращения: 11.12.2023).
10. Ackoff R. L. From data to wisdom // Journal of applied systems analysis. - 1989. - № 16 (1). - P. 3-9.
11. Bawden D., Robinson L. Introduction to Information Science. - Facet Publishing, 2015. - 384 p.
12. Burgin M., Hofkirchner W. Information Studies and the Quest for Transdisciplinarity: Unity through Diversity. - World Scientific, 2017. - 560 p.
13. Cai P., Chen L. Demystifying data law in China: a unified regime of tomorrow // International Data Privacy Law. - 2022. - Vol. 12. - No. 2. - P. 75-92. - https://doi.org/10.1093/idpl/ipac004.
14. Frické M. The knowledge pyramid: the DIKW hierarchy // Knowledge Organization. - 2019. - № 46 (1). - P. 33-46.
15. Han Xuzhi. The Ambiguous Use of the Scope of Information Rights and its Consequences (信息权利范畴的模 糊性使用及其后果) (in Chinese) // 1 East China University of Political Science and Law Journal. - 2020. - № 86. - URL: https://m.sohu.com/a/386219380_731697/?Pvid=000115_3w_a.
16. Meter H. J. van. Revising the DIKW pyramid and the real relationship between data, information, knowledge, and wisdom // Law, Technology and Humans. - 2020. -Vol. 2. - No. 2. - P. 69-80. - https://doi.org/10.3316/agispt.20210112042035.
Материал поступил в редакцию 26 января 2024 г.