Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило два новых стандарта в области больших данных. Документы разработаны Национальным центром цифровой экономики МГУ (в рамках проекта Центра компетенций НТИ по большим данным МГУ) и Институтом развития информационного общества (ИРИО).
Согласование и утверждение документов координировал Подкомитет «Данные» (ПК 02) Технического комитета по стандартизации «Искусственный интеллект» (ТК 164).
Один из утвержденных стандартов — ГОСТ «Информационные технологии. Эталонная архитектура больших данных. Часть 2: Варианты использования и производные требования». Документ входит в серию из пяти стандартов по эталонной архитектуре больших данных и представляет собой русскоязычную адаптацию международного технического отчета ISO/IEC TR 20547-2:2018 Information technology — Big data reference architecture — Part 2: Use cases and derived requirements. В скором времени в России планируется утвердить и другие стандарты серии.
Принятый национальный стандарт описывает примеры использования больших данных в различных областях, в том числе в госуправлении, здравоохранении, обороне, энергетике, астрономии, физике и социальных медиа. В документе также содержатся выводы, посвященные тому, какой должна быть архитектура системы для работы с большими данными, и основанные на анализе представленных вариантов использования.
Сведения об опыте применения больших данных, в первую очередь отражающие американскую практику, собирались и обрабатывались по единой методике, что позволяет использовать их при планировании и реализации отечественных проектов в сходных областях. Так, большим данным отводится существенная роль в ряде ключевых национальных стратегий и программ, в том числе развития информационного общества, цифровой экономики и электронного (цифрового) правительства.
«Чтобы устранить неясности и заложить стабильную основу для решения проблем и использования возможностей в области больших данных, международные органы по стандартизации — Международная организация по стандартизации (ИСО) и Международная электротехническая комиссия (МЭК) — утвердили набор стандартов и технических отчетов. Мы предпринимаем усилия для того, чтобы сделать эти документы доступными для широкого круга российских специалистов путем их адаптации в качестве национальных стандартов», — отметил Юрий Хохлов, глава ПК 02, председатель совета директоров ИРИО, руководитель проекта Центра компетенций по большим данным МГУ.
«Стандарты в области данных являются важнейшей частью нормативно-технической базы в области искусственного интеллекта (ИИ). Это объясняется различными причинами, прежде всего тем, что разработка наиболее распространенных алгоритмов ИИ — алгоритмов машинного обучения — невозможна без специальным образом подготовленных наборов данных. Кроме того, оценка соответствия интеллектуальных систем установленным требованиям осуществляется также на специальных тестовых наборах данных. Таким образом, качество данных, используемых при создании и испытании интеллектуальных алгоритмов, во многом определяет качество прикладных систем ИИ в целом», — обратил внимание председатель ТК 164 Сергей Гарбук.
Второй утвержденный стандарт — ГОСТ «Информационные технологии. Большие данные. Техническое задание. Требования к содержанию и оформлению» — является оригинальной российской разработкой. Документ устанавливает основные требования к содержанию и оформлению технического задания в области оперирования большими данными, а также особенности подобных технических заданий для государственных и муниципальных закупок.
Стандарт помогает полноценно отразить потребности заказчиков, заинтересованных в поставке массивов больших данных, разработке и использовании технологий больших данных. Это, в свою очередь, позволяет снизить риски неоднозначного понимания указанных потребностей и невыполнения обязательств со стороны подрядчиков и поставщиков.
«При правильном использовании большие данные помогают организациям принимать важные стратегические решения, экономить время и ресурсы, лучше понимать тенденции и потребности рынка. Без грамотного оперирования большими массивами данных невозможно развитие и применение технологий ИИ, новых производственных технологий, построение цифровых двойников для умных производств, а также создание умных городов», — обратил внимание основной разработчик стандарта Валентин Паджев, руководитель дирекции правовых программ ИРИО.
Оба утвержденных ГОСТа вступят в силу 1 марта 2022 года.
Напомним, первый национальный стандарт в области больших данных вступил в силу 1 ноября 2021 года. Документ устанавливает русскоязычные термины и их определения, необходимые при работе с большими данными.