1 декабря 2021 года в онлайн-формате состоялось II ежегодное заседание Подкомитета «Данные» (ПК 02), входящего в Технический комитет по стандартизации «Искусственный интеллект» (ТК 164). Эксперты обсудили достигнутые результаты и дальнейшие планы в области национальной и международной стандартизации работы с большими данными.
Напомним, ТК 164 представляет собой зеркальное отражение на национальном уровне профильного международного подкомитета ISO/IEC JTC 1 SC 42 Artificial Intelligence. В составе ТК 164 действует ПК 02, функции секретариата которого выполняет Национальный центр цифровой экономики МГУ. Деятельность ПК 02 поддерживается в рамках проекта Центра компетенций НТИ по большим данным МГУ (Центра НТИ МГУ).
Преодоление отставания от международной стандартизации
«С самого начала деятельности рабочей группы, а потом Подкомитета “Данные” мы взяли курс на преодоление отставания Российской Федерации от международной стандартизации больших данных. Наш подкомитет совместно с экспертами успешно справляется с этой задачей», — отметил Сергей Афанасьев, ответственный секретарь ПК 02, ведущий специалист Центра НТИ МГУ.
Так, уже утвержден и вступил в силу основополагающий терминологический национальный стандарт в области работы с большими данными, гармонизированный с международным. Спустя день после заседания подкомитета Росстандарт утвердил еще один национальный стандарт — ГОСТ Р 59926-2021/ISO/IEC TR 20547-2:2018 «Информационные технологии. Эталонная архитектура больших данных. Часть 2. Варианты использования и производные требования». Вышеупомянутые стандарты идентичны международным и подготовлены Центром НТИ МГУ совместно с Институтом развития информационного общества (ИРИО). Кроме того, эти организации разработали оригинальный национальный стандарт о требованиях к техническому заданию в области оперирования большими данными, который тоже утвержден Росстандартом 2 декабря 2021 года и вступит в силу 1 марта 2022 года.
Ждут своего утверждения еще два разработанных проекта стандартов в области эталонной архитектуры больших данных, а также проект стандарта о структуре управления процессами аналитики больших данных.
Параллельная национальная и международная стандартизация
На сегодня ПК 02 запускает разработку серии ГОСТов, посвященных качеству данных для аналитики и машинного обучения. Эта серия национальных стандартов отличается тем, что ее планируется утвердить практически одновременно с соответствующей международной серией.
«На международном уровне серия стандартов о качестве данных тоже пока находится на проектной стадии, то есть не утверждена. Поэтому работа на национальном и международном уровнях сейчас ведется параллельно. Таким образом, мы можем влиять на содержание международной серии, представляя Россию на международном уровне, а также не допускать отставания — если оно и будет, то самым минимальным», — сообщил Сергей Афанасьев.
В ходе заседания эксперты подкомитета поддержали идею активно участвовать в разработке серии международных стандартов о качестве данных для аналитики и машинного обучения.
«Вопросы качества данных очень важны для Российской Федерации: например, в стране массово создаются государственные наборы данных для обработки с помощью технологий машинного обучения. Участие в разработке и принятие стандартов по качеству данных будут служить интересам России, позволят использовать передовые знания, зафиксированные в разрабатываемых стандартах», — уверен Юрий Хохлов, глава ПК 02, председатель совета директоров ИРИО, руководитель проекта Центра НТИ МГУ.
Еще эксперты подкомитета приняли решение рекомендовать Росстандарту проголосовать за то, чтобы в международном подкомитете ISO/IEC JTC 1 SC 42 Artificial Intelligence началась работа по международной стандартизации структуры жизненного цикла работы с данными для искусственного интеллекта.
«Крайне важно провести фундаментальные исследования в области качества данных и жизненного цикла данных, прежде всего применительно к аналитике больших данных и машинному обучению. Такое исследование помогло бы России внести весомый вклад в разработку международных стандартов по аналогичной тематике», — добавил Юрий Хохлов.
С докладами, посвященными ходу разработки проектов международных стандартов о качестве данных для аналитики и машинного обучения, также выступили Александр Богданов, руководитель дирекции развития цифровых технологий ИРИО, профессор СПбГУ, и Надежда Щеголева, руководитель департамента развития технологий больших данных ИРИО, профессор СПбГУ.