Состоялась экспертная сессия «Данные как инфраструктура» под эгидой Всемирного банка

Состоялась экспертная сессия «Данные как инфраструктура» под эгидой Всемирного банка

15 декабря 2020 года продолжился онлайн-цикл экспертных сессий по вопросам политики в области данных «Данные как ключевой фактор конкурентоспособности российской экономики». В рамках второй сессии цикла состоялось экспертное обсуждение на тему «Данные как инфраструктура». Сессия была организована Всемирным банком совместно с Агентством стратегических инициатив (АСИ) при поддержке Института развития информационного общества (входит в консорциум на базе Центра компетенций НТИ по большим данным МГУ имени М.В. Ломоносова) с целью уточнения положений готовящегося доклада Всемирного банка о развитии экономики данных и политике управления данными в России.

Напомним, первая экспертная сессия, организованная Всемирным банком совместно с Национальным центром цифровой экономики МГУ (базовая организация для Центра компетенций НТИ по большим данным МГУ) и Институтом развития информационного общества, прошла 24 ноября 2020 года и была посвящена обсуждению политики России в области обеспечения доверия к экосистеме данных.

Ключевая тема второй экспертной сессии – управление данными в течение всего их жизненного цикла на основе обеспечения надежной и эффективной инфраструктуры данных. В готовящемся докладе Всемирного банка инфраструктура данных понимается как цифровая инфраструктура, способствующая обмену данными и их совместному использованию.

Модераторами встречи выступили Вера Адаева, директор центра цифрового развития АСИ, и Олег Петров, старший специалист по цифровой трансформации Всемирного банка.

Вера Адаева описала ключевые задачи экспертного обсуждения: «Первая задача – посмотреть на те практики, которые уже представлены в докладе, и выразить свое отношение к ним. Вторая задача – предложить… новые практики, которые можно подсветить как действительно хороший результат работы российской стороны в разных проявлениях – общественности, государства, бизнеса… Еще один момент, на который стоило бы обратить внимание, – выработка рекомендаций, потому что регуляторных инициатив возникает довольно много разных, каждый день нам преподносит новые события, к которым все относятся по-разному. Регуляторика, соответственно, тоже совершенно по-разному начинает формироваться, не всегда опираясь на тот хороший опыт, который должен использоваться».

Олег Петров обратил внимание на то, что после публикации доклада «Конкуренция в цифровую эпоху» Всемирный банк начал подготовку исследования по вопросам развития экономики данных и политики управления данными в России. При этом работа над новым докладом, в том числе проведение экспертных семинаров, интервью и их анализ, началась в 2019 году. В середине 2020 года планировалось представить результаты общественности, однако публикация доклада была отложена по двум причинам: во-первых, Всемирный банк начал разработку глобального отчета об экономике данных, соотноситься с которым должен и доклад, посвященный России, во-вторых, существенное влияние на процессы в области данных оказала пандемия COVID-19. «Сегодняшняя встреча чрезвычайно важна, чтобы сделать обновление по многим вопросам, особенно связанным с разделом “Данные как инфраструктура”», – сообщил спикер.

«Серия экспертных дискуссий организована для получения обратной связи, экспертных оценок и других перспектив наших российских партнеров, коллег по докладу, который Всемирный банк готовит уже более года на тему развития экономики данных и политики управления данными в Российской Федерации, который является частью нашего глобального исследования по экономике данных. Сейчас готовится новый глобальный доклад о мировом развитии уже по экономике данных (через несколько месяцев будет опубликован). Сегодняшнее обсуждение как раз послужит нахождению правильных подходов и правильной оценке нынешних тенденций как в Российской Федерации, так и в мире, которые будут отражаться как в российском докладе, так и в международных глобальных докладах по этой теме», – обобщил Олег Петров.

«В ближайшем будущем правительству России важно решить вопросы по управлению данными, которые имеют стратегическое значение для дальнейшего развития экономики. Сюда относится развитие системы управления данными на федеральном уровне и на уровне регионов; средства, с помощью которых создается доступ к национальным ресурсам данных власти, бизнеса и граждан; согласованное управление во всей экосистеме [данных], обновление и координация действующих норм, правил и стандартов. В нашем будущем докладе по политике данных в России мы поднимаем все эти вопросы», – во вступительном слове к сессии отметил Рено Селигманн, директор и постоянный представитель Всемирного банка в Российской Федерации.

В основе исследования Всемирного банка лежит концептуальная схема анализа национальных политик в области работы с данными ведущих стран мира, состоящая из трех основных компонентов: 1) данные как инфраструктура (политики, предназначенные для обеспечения надежного управления данными); 2) доверие к данным (политики, которые создают и поддерживают доверие к экосистеме данных и связанным с ней учреждениям); 3) ценность данных (политика, которая поощряет и облегчает создание ценности с помощью данных). На содержании первого компонента подробно остановился Эндрю Стотт, ведущий специалист по цифровой трансформации Всемирного банка, один из авторов доклада. Рассмотрение данных как инфраструктуры предполагает анализ следующих аспектов: управление данными, информационная безопасность, качество и стандарты, мастер-данные (основные данные) / устранение дублирования.

При этом именно аспект управления данными, по словам Эндрю Стотта, является основополагающей политикой в сфере данных как инфраструктуры. «Мы сосредоточились на теме управления данными, потому что основные опасения, которые высказываются основными заинтересованными сторонами в России (мы общались со многими из них в 2019 году), связаны именно с управлением данными. Речь об этом идет в контексте работы, которую ведет федеральное правительство, которое занимается Национальной системой управления данными (НСУД). Если говорить о ситуации в мире, это та область, которая развивается быстро, своего рода “движущаяся цель”, о чем мы говорим в докладе», – отметил спикер.

«Теперь государство стало рассматривать данные как стратегический актив, как актив, который требует правильного управления. Это управление должно вестись отдельно от того, что происходит в линейных структурах, которые производят данные изначально. Мы говорим о большом количестве линейных подразделений в системе государственного управления. Все они должны обмениваться данными. Речь идет об открытых данных и о совместном использовании данных. Но этот обмен должен происходить в более защищенном режиме», – обратил внимание Эндрю Стотт. Он также привел примеры международных стратегических инициатив в данной области.

«Правительства все больше склоняются к организации национальных систем управления данными. Это не единая государственная база данных, это гораздо более широкая система, модель, в которую будут включаться правила, рекомендации, определения, требования качества, стандарты, обеспечивающие (семантическую) интероперабельность данных. Кроме того, сюда также войдут модели взаимодействия между различными государственными органами, будут определяться национальные зоны ответственности в области использования данных, в том числе коллективного. Необходимо объединить целый ряд систем в рамках некой глобальной экосистемы [данных]. Такая модель должна расширяться согласованно и систематично. Эта работа должна вестись государственными органами, но и не только ими. При этом предписывающий характер такой работы, скорее всего, будет более действенным, в случае если данные будут собираться со всей страны», – добавил эксперт.

Один из российских авторов доклада Юрий Хохлов, председатель совета директоров Института развития информационного общества, руководитель проекта «Мониторинг и стандартизация развития и использования технологий хранения и анализа больших данных в цифровой экономике Российской Федерации» Центра компетенций НТИ по большим данным МГУ, в своем выступлении рассказал об особенностях использования данных как инфраструктуры в России.

«Мы говорим о том, что необходимым условием для использования на национальном уровне данных разными заинтересованными сторонами должно стать наличие зрелой цифровой инфраструктуры для передачи данных, их хранения и обработки», – отметил спикер.

Он обозначил масштабные национальные проекты по развитию телекоммуникационной инфраструктуры для работы с данными и по формированию вычислительной инфраструктуры.

«Одна из зон отставания для России – это развитие суперкомпьютерной инфраструктуры для работы с данными, инфраструктуры высокопроизводительных вычислений. К сожалению, в топ-500 мы теряем свои позиции, несмотря на запуск Сбербанком в 2019 году самого мощного в России суперкомпьютера “Кристофари”», – поделился эксперт.

Переходя к прикладным цифровым платформам, Юрий Хохлов сообщил: «Для того чтобы извлекать максимальную пользу, получать эффекты и дивиденды от использования данных, необходимо развивать цифровые платформы, в которых эти данные обрабатываются. Веяние последнего времени не только на международном уровне, но и в России – это формирование крупных экосистем цифровых платформ, которые характерны для передового бизнеса. Здесь я хочу отметить несколько крупных проектов по созданию экосистем работы с данными, которые реализуются в России. Это проекты “Сбера”, “Яндекса”, Mail.ru Group, МТС, других компаний. Происходит мощная консолидация процессов обработки данных, когда они погружаются в экосистемы взаимосвязанных цифровых платформ, решавших до этого отдельные задачи, а сейчас предоставляющих с помощью суперприложений весь набор сервисов в одном устройстве для пользователя».

По этому же пути, по словам Юрия Хохлова, идет и развитие экосистемы цифровых платформ российских органов власти: «Мы стартовали с десяток лет назад с Инфраструктуры электронного правительства, которая состоит из ряда компонентов (ЕПГУ, ЕСИА, СМЭВ, ФРГУ, ЕСНСИ и так далее), и дополняем ее новыми платформами (НСУД, “ГосТех”, ГЕОП), которые позволят работать с государственными данными не только для решения задач органов власти при взаимодействии с бизнесом и гражданами, но и путем предоставления сервисов и собранных в государственных платформах данных бизнесу и гражданам для их взаимодействия между собой». Эксперт также отметил, что большие массивы данных создаются, используются и управляются научно-образовательным сообществом, которое тоже заинтересовано в работе с данными.

В конце своего выступления Юрий Хохлов представил выводы и рекомендации, которые в основном адресованы федеральному правительству. Кроме этого, по мнению спикера, важно адресовать рекомендации и другим стейкхолдерам, в том числе бизнесу, гражданскому обществу и научно-образовательному сообществу.

Далее последовали развернутые комментарии двух российских экспертов относительно положений, приведенных в главе «Данные как инфраструктура» проекта доклада.

Михаил Петров, директор Департамента цифровой трансформации Счетной палаты РФ, заметил, что в докладе достаточно четко и полно освещены проблемы управления государственными данными и даны необходимые рекомендации. В то же время, по мнению эксперта, необходимо добавить, что к числу основных проблем, во-первых, относится отсутствие единого подхода к выстраиванию единой архитектуры данных во всех государственных информационных системах (по данным издания CNews, сейчас в органах исполнительной власти эксплуатируется более 800 государственных информационных систем, более 10 тысяч ведомственных и более 18 тысяч региональных). Во-вторых, нет единого подхода к обеспечению качества данных в государственных информационных системах. Эксперт пояснил, что под качеством данных подразумевается полное понятие, включающее своевременность, непротиворечивость, консистентность, отсутствие ошибок, актуальность, своевременность и т. п.

Михаил Петров также выразил мнение, согласно которому стоит более подробно раскрыть задачи НСУД, Цифровой аналитической платформы Росстата, их взаимосвязь, а также связь с другим системным окружением в аспекте их развития.

Иван Бегтин, директор Ассоциации участников рынка данных, рекомендовал разработчикам актуализировать представленные в нем данные, которые, как упоминалось ранее Олегом Петровым, собирались преимущественно в 2019 году и актуальны на начало 2020 года.

По мнению Ивана Бегтина, излишним в материалах доклада является акцент на НСУД. «То, что обсуждалось два года назад вокруг Национальной системы управления данными, и то, чем она является сейчас, – это… две принципиально разные ситуации. Если до этого НСУД обсуждалась как некоторая регуляторная структура, некоторый набор документов, которые могут быть превращены в законы, в иной комплект документов, которые будут регулировать взаимоотношения по работе с данными между органами власти, то сейчас НСУД – это, по сути, некоторая информационная система, к которой уже пристыковывают разного рода нормативку. Эта система сейчас выступает в значительной степени как замена Единой системы межведомственного электронного взаимодействия (СМЭВ), точнее как расширение СМЭВ», – поделился Иван Бегтин. Согласно его мнению, следовало бы также дополнить доклад информацией о мониторинге национальных систем статистики.

В ответ на выступление Ивана Бегтина Юрий Хохлов заметил, что России нужна явно сформулированная стратегия в области данных. При этом, по его словам, концепция НСУД на роль такой стратегии вряд ли может претендовать. «Видимо, это должно стать главной рекомендацией доклада: России нужна собственная национальная стратегия работы с данными, адресованная ко всем стейкхолдерам (власти, бизнесу, гражданскому обществу, научно-образовательному сообществу)», – сообщил Юрий Хохлов.

«Я согласен с Юрием Хохловым, что, безусловно, нам нужна национальная стратегия управления данными или национальная стратегия данных… Нам нужна четкая связка этого с искусственным интеллектом, перезапуском тематики открытых данных…», – ответил Иван Бегтин.

Открытые данные будут обсуждаться в рамках следующих сессий цикла, обратил внимание Олег Петров.

Далее состоялась панельная дискуссия. В частности, о направлениях цифрового развития Росстата рассказал Григорий Остапенко, заместитель руководителя ведомства. Среди таких направлений: 1) Система оперативной статистики (эксперимент 2020 года); 2) Цифровая аналитическая платформа (предполагает наличие всей отчетности в электронном виде, следование всех органов власти единым стандартам статистического производства); 3) Проект «Статистика 24+» (подразумевает создание новых статистических инструментов, развитие Цифровой аналитической платформы).

Большинство спикеров, выступивших в рамках панельной дискуссии, поддержали экспертные комментарии Михаила Петрова и Ивана Бегтина, при этом дополнив их или обратив внимание на некоторые другие аспекты управления данными.

Так, Ольга Пархимович, специалист по открытым государственным данным АНО «Информационная культура», вновь затронула вопросы открытых данных и качества данных. «Если говорить про качество данных, есть несколько моментов, которые мы заметили при работе с данными Казначейства Минфина России. Во-первых, очень часто отсутствует форматно-логический контроль… Также необходимо создавать машиночитаемые справочники-классификаторы с обеспечением версионности, о чем тоже часто забывают. Это препятствует не только изучению и анализу данных, но и построению временных рядов, анализу данных с течением времени. Также необходимо обеспечивать согласованность данных… Очень важно использовать данные тем, кто их публикует и производит, а также налаживать обратную связь с пользователями открытых данных и обществом», – отметила Ольга Пархимович.

По мнению руководителя направления «Цифровое развитие» Центра стратегических разработок Александра Малахова, большее внимание в докладе может быть уделено региональной специфике, особенно в части отраслевого регулирования и качества данных. «Еще хотелось бы отметить отдельные вопросы по отдельным типам данных. У нас есть нормативно-правовая информация. И даже если не делать весь НСУД, как он изначально задумывался, но привести в порядок НСИ [нормативно-справочную информацию], сделать обязательным ее использование, привести к гармонизации с ключевыми национальными справочниками, то это уже существенно делу поможет», – поделился своей точкой зрения спикер. «Кроме того, различные типы данных, таких как геоинформационные данные, потоковые данные (интернет вещей, все что идет от него), вопрос документов и архивов – это все отдельные вопросы, которые, наверное, не совсем корректно в докладе такого типа агрегировать вместе», – добавил Александр Малахов.

По мнению Светланы Опенышевой, руководителя ОГКУ «Правительство для граждан» (Ульяновская область), доклад может быть дополнен разделом о цифровой зрелости государственных услуг, что, по словам спикера, очень актуально для регионального уровня. Большую значимость для практиков также может иметь отражение в докладе кейсов работы с данными не только на федеральном, но и на региональном и муниципальном уровнях.

Свою точку зрения выразила Анна Серебряникова, президент Ассоциации больших данных: «Кроме роли НСУД и ГЕОП, нужно также отметить внедрение “Цифрового профиля” гражданина (это большая тема сегодня, уже идущий эксперимент) и эксперимент с платформой “ГосТех”, которая недавно начала развиваться, но тем не менее мы рассчитываем на то, что она будет развиваться еще сильнее. Еще один вопрос, на который хочу обратить внимание, – это подход к экспериментальным правовым режимам, [регуляторным] песочницам… Тема с экспериментальными правовыми режимами и переводом этих экспериментов в промышленную эксплуатацию – тема, которой мы будем заниматься в ближайшее время очень активно. Для бизнеса это ключевая история. Мы верим в то, что именно через режим песочниц нам удастся преодолеть проблемы, связанные с обезличиванием персональных данных, возможностью работы на объединенных массивах данных и так далее».

Анна Серебряникова также затронула вопрос требований бизнеса к государственным информационным системам. «Чем бизнесу может помочь государство? Уровнем сервиса. Простой ответ. У бизнеса, у крупного особенного, есть сейчас доступ к государственным системам, но нет определенного уровня качества [данных]. Это то, над чем мы сейчас работаем для того, чтобы сделать проекты бесшовными», – заключила эксперт.

В рамках последующей открытой дискуссии Игорь Агамирзян, вице-президент НИУ «Высшая школа экономики», отметил, что к вопросу о качестве данных следовало бы добавить и вопрос о качестве метаданных (онтологии, классификаторы и т. д.): «Стратегия работы с данными должна, несомненно, включать и некую стратегию работы с метаданными».

В ответ на этот комментарий Юрий Хохлов пояснил, что в качестве полезной практики в докладе рекомендуется изучить и использовать европейский опыт проекта SEMIC (Semantic Interoperability Community), посвященного «семантике и наведению порядка с описанием информационных объектов в различных информационных системах».

Никита Уткин, председатель ТК 194 «Кибер-физические системы», руководитель программ РВК, рекомендовал разработчикам доклада «замахнуться» на связь данных во всей экосистеме развития цифровых технологий (интернет вещей, хранение и аналитика данных, машинное обучение, искусственный интеллект, киберфизические системы, кибербезопасность и т. д.).

Ведущий научный сотрудник Центра технологий государственного управления РАНХиГС Алексей Ефремов обратил внимание разработчиков доклада на то, что «проводимые эксперименты и вводимые экспериментальные режимы, безусловно, должны подлежать соответствующей оценке, чтобы это было не просто экспериментами ради экспериментов».

«Мы получили много полезных рекомендаций, мнений от участников мероприятия. Мы, безусловно, учтем эти мнения на следующем этапе нашей работы», – поделился Эндрю Стотт.

Юрий Хохлов также поблагодарил экспертов встречи за комментарии, отметив: «Какие-то рекомендации, которые были даны с точки зрения доработки доклада, они вполне понятны и естественны, но некоторые из них, на самом деле, адресуются самим стейкхолдерами Российской Федерации. И правительство, и органы власти, которые за это отвечают, должны сами этим озаботиться, услышав консолидированное мнение, подкрепленное лучшими международными практиками, которое собрала команда Всемирного банка, подготовившая этот раздел доклада».

«Наша задача не только иметь вертикальную размерность управления данными, связанную с системой государственного управления в России (речь идет и о федеральном, и о региональном уровнях, и об уровне местного самоуправления). Но не менее важным является культура использования данных, формирование экосистемы данных, которая распространяется и на другие ветви власти (законодательную, судебную)», – добавил Юрий Хохлов.

Он также анонсировал третью экспертную сессию о ценности данных, а также дискуссию о проблемах нормативного регулирования данных. Эти встречи планируется провести в январе 2021 года.

В наступающем году, после завершения экспертных консультаций, будет опубликована окончательная версия доклада, поделился Олег Петров. Он также выразил признательность экспертам за их участие в сессии и комментарии.

В мероприятии приняли участие Татьяна Ершова, координатор направления развития партнерских отношений Центра компетенций НТИ по большим данным МГУ, и Сергей Афанасьев, ведущий специалист Центра.

Панель управления

Авторизация
*
*
Генерация пароля