Об утверждении Правил по сбору, обработке, хранению, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами

Приказ Министра цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан от 21 октября 2020 года № 394/НҚ. Зарегистрирован в Министерстве юстиции Республики Казахстан 23 октября 2020 года № 21495. Утратил силу приказом Министра цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан от 20 марта 2023 года № 99/НҚ.

      Сноска. Утратил силу приказом Министра цифрового развития, инноваций и аэрокосмической промышленности РК от 20.03.2023 № 99/НҚ (вводится в действие с 01.04.2023).

      В соответствии с подпунктом 63-3) статьи 7 Закона Республики Казахстан от 24 ноября 2015 года "Об информатизации", ПРИКАЗЫВАЮ:

      1. Утвердить прилагаемые Правила по сбору, обработке, хранению, передаче электронных информационных ресурсов для аналитики данных в целях реализации функций государственными органами.

      2. Департаменту цифровизации Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан в установленном законодательном порядке обеспечить:

      1) государственную регистрацию настоящего приказа в Министерстве юстиции Республики Казахстан;

      2) размещение настоящего приказа на интернет-ресурсе Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан после его официального опубликования;

      3) в течение десяти рабочих дней после государственной регистрации настоящего приказа в Министерстве юстиции Республики Казахстан представление в Юридический департамент Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан сведений об исполнении мероприятий, предусмотренных подпунктами 1) и 2) настоящего пункта.

      4. Контроль за исполнением настоящего приказа возложить на курирующего вице-министра цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан.

      5. Настоящий приказ вводится в действие по истечении десяти календарных дней после дня его первого официального опубликования.

      Министр цифрового развития,
инноваций и аэрокосмической промышленности
Республики Казахстан
Б. Мусин

  Утверждены приказом
Министра цифрового развития,
инноваций и аэрокосмической промышленности
Республики Казахстан
от 21 октября 2020 года № 394/НҚ

Правила по сбору, обработке, хранению, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами

Глава 1. Общие положения

      1. Настоящие Правила по сбору, обработке, хранению, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами (далее - Правила), разработаны в соответствии с подпунктом 63-3) статьи 7 Закона Республики Казахстан от 24 ноября 2015 года "Об информатизации" (далее – Закон) и определяют порядок по сбору, обработке, хранению, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами.

      2. Действие настоящих Правил не распространяется на:

      1) отношения, возникающие при осуществлении Национальным Банком Республики Казахстан и организациями, входящими в его структуру, работ по сбору, обработке, хранению, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами;

      2) электронные информационные ресурсы содержащие сведения составляющие государственные секреты и охраняемую законом тайну;

      3) электронные информационные ресурсы содержащие информацию о конкретных явлениях, процессах и лицах, составляющих данные следствия и дознания.

      4) конфиденциальную информацию ограниченного распространения.

      3. В настоящих Правилах используются следующие основные понятия и сокращения:

      1) уполномоченный орган в сфере информатизации (далее – уполномоченный орган) – центральный исполнительный орган, осуществляющий руководство и межотраслевую координацию в сфере информатизации и "электронного правительства";

      2) информационная система (далее – ИС) – организационно-упорядоченная совокупность информационно-коммуникационных технологий, обслуживающего персонала и технической документации, реализующих определенные технологические действия посредством информационного взаимодействия и предназначенных для решения конкретных функциональных задач;

      3) информационно-коммуникационная услуга (далее – ИК-услуга) – услуга или совокупность услуг по имущественному найму (аренде) и (или) размещению вычислительных ресурсов, предоставлению программного обеспечения, программных продуктов, сервисных программных продуктов и технических средств в пользование, включая услуги связи, посредством которых обеспечивается функционирование данных услуг;

      4) извлечение, преобразование и загрузка (далее – ETL) - процесс извлечения данных из базы данных информационной системы государственных органов, их преобразования и загрузки в единое хранилище данных;

      5) единое хранилище данных (далее – ЕХД) – хранилище большого объема данных, которые хранятся как в неструктурированном так и структурированном виде, имеющие специализированные инструменты доступа к данным;

      6) обезличивание персональных данных – действия, в результате совершения которых определение принадлежности персональных данных субъекту персональных данных невозможно;

      7) база данных (далее – БД) – организованная структура, предназначенная для хранения, изменения и обработки данных;

      8) поставщик данных – юридические лица, на которых возложены обязанности по предоставлению данных для осуществления аналитики согласно Закону;

      9) аналитика данных – процесс обработки данных с целью получения информации и выводов для принятия решения;

      10) база данных информационной системы государственных органов (далее – БД ИС ГО) – совокупность данных информационной системы государственных органов;

      11) задача – ситуация, требующая анализа и управленческих решений для оптимизации деятельности государственных органов, а также в целях реализации стратегических планов, государственных программ и планов развития;

      12) запрос – документ, который содержит информацию в части описания постановки реализуемой задачи, методологии расчета, сведения об используемых данных из систем-источников, периодичность обновления данных, названия графиков и их описание, определения ожидаемого результата;

      13) заказчик аналитики – центральный исполнительный орган, государственный орган, непосредственно подчиненный и подотчетный Президенту Республики Казахстан, местный исполнительный орган, которому необходимы обработанные данные по поставленной задаче в целях реализации государственных функций;

      14) исторические данные – данные, содержащиеся в базе данных с момента создания;

      15) регламент взаимодействия – документ, устанавливающий правила, порядок и основные процедуры взаимодействия между оператором и владельцем данных в части определения ответственности участников при обеспечении взаимодействия, перечня информационных объектов, расписания и способов организации взаимодействия, связанных с процессами приема и передачи информации;

      16) электронные информационные ресурсы – информация, предоставленная в электронно-цифровой форме и содержащаяся на электронном носителе, интернет-ресурсе и (или) в информационной системе;

      17) оператор информационно-коммуникационной инфраструктуры "электронного правительства" (далее - оператор) юридическое лицо, определяемое Правительством Республики Казахстан, на которое возложено обеспечение функционирования закрепленной за ним информационно-коммуникационной инфраструктуры "электронного правительства";

      18) ER-диаграмма – схема, показывающая структуру базы данных с указанием связей между различными сущностями (таблицами базы данных);

      19) информационно-аналитическая система "Smart Data Ukimet" – объект информатизации, размещенный на информационно-коммуникационной платформе "электронного правительства" и предназначенный для формирования единого пространства данных для целей предоставлений аналитической информации по деятельности Правительства Республики Казахстан.

      4. При обработке, хранении, передаче электронных информационных ресурсов для осуществления аналитики данных в целях реализации функций государственными органами учитываются единые требования в области информационно-коммуникационных технологий и обеспечения информационной безопасности.

Глава 2. Порядок сбора электронных информационных ресурсов

Параграф 1. Инициирование запроса

      5. В случае возникновения ситуаций, требующих анализа с целью принятия управленческих решений для оптимизации деятельности государственных органов, а также в целях реализации стратегических планов, государственных программ и планов развития, заказчик аналитики направляет запрос на аналитику данных уполномоченному органу.

      6. Уполномоченный орган в срок не более 5 (пяти) рабочих дней рассматривает полученный запрос от заказчика аналитики и при положительном решении дает поручение об исполнении оператору.

      В случае отрицательного решения уполномоченный орган направляет заказчику аналитики мотивированное обоснование о невозможности проведения аналитики.

      7. Обоснованием отказа являются:

      1) отсутствие оцифрованных данных для проведения аналитики;

      2) отсутствие социальных/экономических эффектов;

      3) необходимость для проведения аналитики конфиденциальных данных, сведений, составляющих государственную тайну;

      3) отсутствие методологии расчетов для проведения аналитики;

      4) отсутствие логической архитектуры базы данных (описание полей, таблиц и связей в базе данных) необходимых для проведения аналитики.

      8. Оператор в срок не более 10 (десяти) рабочих дней со дня поступления поручения определяет наличие в ЕХД данных, которые необходимы для реализации аналитики данных согласно запросу. В случае отсутствия необходимых данных для реализации аналитики оператор направляет запрос уполномоченному органу о подключении БД ИС ГО к ЕХД.

      9. В случае отсутствия БД ИС ГО в ЕХД уполномоченный орган совместно с оператором в срок не более 10 (десяти) рабочих дней согласовывает с поставщиком данных информацию касательно имеющихся данных в ИС, физическую и логическую структуры БД ИС ГО, способ подключения, перечень передаваемых и обезличиваемых данных, сроки исполнения.

Параграф 2. Разработка и утверждение регламента взаимодействия

      10. Оператор в течение 10 (десяти) рабочих дней запрашивает у поставщика данных анкету для сбора общих сведений о программно-телекоммуникационной среде государственного органа согласно приложению 1 к настоящим Правилам и техническую документацию (ER-диаграмма, логическая и физическая модель данных, архитектура данных).

      11. Оператор в течение 20 (двадцати) рабочих дней разрабатывает регламент взаимодействия информационно-аналитической системы "Smart Data Ukimet" с ИС ГО совместно с поставщиком данных. Для разработки регламента взаимодействия поставщик данных передает оператору техническую информацию, в соответствии с требованиями к описанию источников данных согласно приложению 2 к настоящим Правилам.

      12. Оператор в течение 7 (семи) рабочих дней согласовывает, утверждает и направляет поставщику данных регламент взаимодействия.

      13. Поставщик данных в течение 5 (пяти) рабочих дней согласовывает и утверждает регламент взаимодействия.

      14. В случае необходимости внесения изменений в регламент взаимодействия, поставщик данных направляет официальное письмо оператору с обоснованием необходимых изменений.

      15. Оператор в течение 10 (десяти) рабочих дней согласовывает, утверждает и направляет поставщику данных регламент взаимодействия с внесенными изменениями.

      16. Поставщик данных в течение 3 (трех) рабочих дней согласовывает и утверждает регламент взаимодействия с внесенными изменениями.

Параграф 3. Обезличивание данных

      17. В соответствии со статьей 17 Закона Республики Казахстан от 21 мая 2013 года "О персональных данных и их защите" при передаче данных происходит их обязательное обезличивание в порядке, определяемом Правилами сбора, обработки персональных данных.

      18. В целях обезличивания данных используется инструкция по обезличиванию персональных данных и функция одностороннего хеширования без возможности обратного восстановления, которая обеспечивает правомерность, целостность и сохранность качества данных.

      19. Обезличивание данных производится оператором при невозможности осуществления процедуры обезличивания данных самостоятельно поставщиком данных. Для обезличивания данных оператор предпринимает необходимые меры в соответствии с регламентом взаимодействия.

      20. Согласование, обезличивание и передача исторических персональных данных происходит следующим образом:

      1) оператор совместно с поставщиком данных определяет и согласовывает перечень данных, подлежащих обезличиванию;

      2) оператор предоставляет поставщику данных разработанные алгоритмы (последовательность действий) для одностороннего хеширования без возможности обратного восстановления, по типам БД и инструкцию по обезличиванию персональных данных;

      3) поставщик данных производит обезличивание и предоставляет оператору исторические данные;

      4) в случае, если поставщик данных не имеет возможности произвести обезличивание данных, оператор настраивает процедуру обезличивания через ETL-инструмент. При этом в ЕХД данные сохраняются в обезличенной форме;

      5) оператор проверяет корректность исторических данных, корректность обезличивания данных и загружает их в ЕХД.

Параграф 4. Передача, загрузка исторических данных и настройка автоматического регламентного обновления данных

      21. Поставщик данных передает оператору исторические данные на физическом носителе или иным согласованным способом. Оператор, после получения исторических данных от поставщика данных, через ETL-инструмент производит работы по подключению, преобразованию форматов и кодировок, выявлению и удалению ошибок и несоответствий в данных с целью улучшения их качества.

      22. Для выгрузки данных из БД поставщик данных осуществляет настройку сетевого доступа согласно регламенту взаимодействия.

      23. Поставщик данных создает учетную запись пользователя в БД для чтения определенных данных, открывает доступ на сервере для серверов "Информационно-аналитической системы "Smart Data Ukimet" по определенным портам.

      24. Оператор изучает структуру БД и переданные исторические данные от поставщика данных, формирует логику расчета обновленных данных, создает ETL-процессы для их обезличивания и загрузки и тестирует регламентную загрузку данных.

Глава 3. Порядок обработки электронных информационных ресурсов

      25. Оператор согласовывает с уполномоченным органом сроки и объем предоставления данных, полученных из различных БД ИС ГО и объединенных между собой, согласно направленного заказчиком аналитики уполномоченному органу запроса.

      26. Оператор в течение 45 (сорока пяти) рабочих дней предоставляет данные полученных из различных БД ИС ГО и объединенных между собой, согласно направленного заказчиком аналитики уполномоченному органу запроса для последующей аналитики.

Глава 4. Порядок хранения электронных информационных ресурсов

      27. Собранные данные (детальные данные, обработанные данные, результаты аналитических решений) подлежат хранению и обновлению в ЕХД оператора.

      28. Обновление данных осуществляется оператором в автоматическом режиме согласно регламенту взаимодействия.

Глава 5. Порядок передачи и осуществления аналитики электронных информационных ресурсов

      29. Оператор предоставляет доступ заказчику аналитики к подготовленным обработанным данным для проверки на соответствие запрашиваемых данных.

      30. Заказчик аналитики в течении 5 (пяти) рабочих дней дает информацию оператору о результатах проверки. В случае отрицательных результатов, в том числе отсутствия и (или) недостаточности необходимых данных, оператор осуществляет повторную обработку данных согласно пунктам 25 и 26 настоящих Правил.

      31. Положительные результаты проверки на соответствие запрашиваемых данных способствуют проведению аналитики данных, которая осуществляется заказчиком аналитики самостоятельно либо путем привлечения поставщика, за счет собственных финансовых средств.

  Приложение 1 к Правилам по
сбору, обработке, хранению,
передаче электронных информационных
ресурсов для осуществления
аналитики данных в целях
реализации функций
государственными органами

Анкета для сбора общих сведений о программно-телекоммуникационной среде государственного органа

      Введение

      Документ представляет собой анкету для сбора общих сведений о программно-телекоммуникационной среде в целях предварительного обследования возможности подключения к ИК - услуге "Информационно-аналитическая система "Smart Data Ukimet".

      Контакты ответственных лиц заказчика

      В данном разделе приведены контакты ответственных лиц, к которым возможно обращение для уточняющих вопросов при проведении анализа ответов на вопросы в настоящем Документе.

№ п.п.

ФИО сотрудника

Должность

Контактная информация (тел., e - mail)

Область ответственности

1.





2.





      Информация о государственном органе

Наименование организации


ФИО ответственного лица, заполнявшего анкету


Должность ответственного лица


Контактный телефон ответственного лица


Адрес e-mail ответственного лица


Адрес сайта в Интернете


      Сведения об информационных системах внедренных и эксплуатируемых.

      По каждой системе заполните анкету:

Название, год внедрения?


Используемая система управления базами данных (далее - СУБД)


Размещена ли СУБД в периметре единой транспортной среды государственных органов?


Где физически размещена СУБД (дата центр АО "Национальные информационные технологии", коммерческий дата центр, собственные серверные комнаты)?


С какого года ведется история?


Примерное количество таблиц?


Количество пользователей?


Имеются ли в Системе данные представляющие государственную или коммерческую тайну?


Объем чистых данных (за исключением системных полей, индексов, партиций и т.п.)


Общий объем базы, занимаемой на диске


Как происходит резервное копирование


Как часто обновляются данные, постоянно/ежечасно/ежедневно/ежемесячно/ежегодно.


Каков примерный прирост данных в день / месяц / квартал / год?


Какие виды манипуляции данных (операторы DML) заложены в информационную систему (ИС):
1) Данные только пополняются (insert), то есть в ИС всегда производится вставка данных;
2) Данные пополняются (insert) и/или обновляются (update), то есть в ИС производится вставка и обновление данных;
3) Данные пополняются (insert), обновляются (update) и удаляются (delete), то есть в ИС производится все виды манипуляции с данными.


Имеется ли временной период минимальной нагрузки на СУБД (например, с 02:00 до 05:00)?


Кто занимается сопровождением системы?


Имеются ли специалисты, способные создавать выборки данных средствами СУБД (язык SQL и т.п.)?


Насколько часто вносятся изменения в систему, влияющие на структуру данных? Документируются ли эти изменения?


Есть ли планы относительно замены данной системы на другую (в том числе переходе на новую версию)?


Приложить к анкете (обязательно):
1) Краткое описание системы – предназначение, наименование основных сущностей.
2) ER-диаграмму БД (диаграмма "сущность-связь"
3) Структуру БД с перечнем таблиц, полей, описанием.
4) Иную документацию к системе (руководства пользователя, техническое задание, описание программы, база знаний и т.д.)


  Приложение 2 к Правилам по
сбору, обработке, хранению,
передаче электронных информационных
ресурсов для осуществления
аналитики данных в целях
реализации функций
государственными органами

      Требования к описанию источников данных

      1. Архитектура данных:

      - Концептуальная модель данных – отображает предметную область государственного органа и объекты, используемые при работе.

      - Логическая модель данных – это подробное представление требований к данным и бизнес-правил, которые определяют качество данных, как правило, с уклоном на конкретный контекст использования. Логическая модель расширяет концептуальную путем определения для сущностей их атрибутов, описаний и ограничений, уточняет состав сущностей и взаимосвязи между ними.

      - Физическая модель данных – физическая модель данных реализует детальные требования к данным с учетом ограничений технологии используемых приложений, требований к производительности и стандартов моделирования. На данном этапе производится проектирование реляционных баз данных с учетом конкретных возможностей системы. Описание объектов данных (data object definition) определяет состав и форматы бизнес- и технических полей, их назначение, ссылки на проверочные таблицы, описывает правила валидации (например, обязательность заполнения). Обеспечивает управление требованиями к качеству данных, управление изменениями данных, интеграцию и миграцию.

      - Диаграмма жизненного цикла данных определяет этапы изменения/дополнения/обновления данных в шагах бизнес-процессов, в том числе поведения данных. Позволяет определить жизненный цикл записей, задать правила: кто и при каких событиях/обстоятельствах меняет статус записи и в какой последовательности.

      - Диаграмма интеграции данных – это артефакт архитектуры данных, который отображает интеграционные потоки данных между информационными системами. Ценность артефакта заключается в том, что с помощью него возможно оперативно выявить место возникновения объекта данных и пути распространения данных между системами.

On approval of the Rules for the collection, processing, storage, transfer of electronic information resources for the implementation of data analytics in order to implement functions by state bodies

Order of the Minister of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan dated October 21, 2020 No. 394 / НҚ. Registered with the Ministry of Justice of the Republic of Kazakhstan on October 23, 2020 No. 21495. Abolished by the Order of the Minister of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan dated March 20, 2023 No. 99/NK

      Unofficial translation

      Footnote. Abolished by the Order of the Minister of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan dated March 20, 2023 No. 99/NK (effective from 01.04.2023).

      In compliance with subparagraph 63-3) of article 7 of the Law of the Republic of Kazakhstan dated November 24, 2015 "On informatization", ORDER:

      1. To approve the attached Rules for the collection, processing, storage, transfer of electronic information resources for data analytics in order to implement the functions of state bodies.

      2. The Department of Digitalization of the Ministry of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan, in accordance with the established legislative procedure, shall ensure:

      1) state registration of this order with the Ministry of Justice of the Republic of Kazakhstan;

      2) posting this order on the Internet resource of the Ministry of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan after its official publication;

      3) within ten working days after the state registration of this order with the Ministry of Justice of the Republic of Kazakhstan, submission to the Legal Department of the Ministry of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan information on the implementation of the measures provided for in subparagraphs 1) and 2) of this paragraph.

      4. Control over the implementation of this order shall be entrusted to the supervising Vice-Minister of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan.

      5. This order shall be enforced upon the expiration of ten calendar days after the day of its first official publication.

      The Minister of Digital Development,
      Innovation and Aerospace Industry
      of the Republic of Kazakhstan       B. Mussin

  Approved by order
Minister of Digital Development,
innovation and aerospace
Republic of Kazakhstan
dated October 21, 2020 No. 394 / НҚ

Rules for the collection, processing, storage, transfer of electronic information resources for
the implementation of data analytics in order to implement the functions of state bodies

Chapter 1. General provisions

      1. These Rules for the collection, processing, storage, transfer of electronic information resources for the implementation of data analytics in order to implement the functions of state bodies (hereinafter referred to as the Rules), have been developed in accordance with subparagraph 63-3) of Article 7 of the Law of the Republic of Kazakhstan dated November 24, 2015 "On Informatization" (hereinafter referred to as the Law) and determine the procedure for the collection, processing, storage, transfer of electronic information resources for the implementation of data analytics in order to implement the functions of state bodies.

      2. These Rules do not apply to:

      1) relations arising from the implementation by the National Bank of the Republic of Kazakhstan and organizations that are part of its structure, work on the collection, processing, storage, transfer of electronic information resources for the implementation of data analytics in order to implement the functions of state bodies;

      2) electronic information resources containing information constituting state secrets and secrets protected by law;

      3) electronic information resources containing information about specific phenomena, processes and persons making up the data of the investigation and inquiry.

      4) confidential information of limited distribution.

      3. The following basic concepts and abbreviations are used in these Rules:

      1) the authorized body in the field of informatization (hereinafter referred to as the authorized body) - the central executive body that carries out management and cross-sectoral coordination in the field of informatization and "electronic government";

      2) information system (hereinafter - IS) - an organizationally ordered set of information and communication technologies, service personnel and technical documentation that implement certain technological actions through information interaction and are designed to solve specific functional tasks;

      3) information and communication service (hereinafter referred to as the IR service) - a service or a set of services for property lease (lease) and (or) placement of computing resources, provision of software, software products, service software products and hardware for use, including services links through which the functioning of these services is ensured;

      4) extraction, transformation and loading (hereinafter - ETL) - the process of extracting data from the database of the information system of state bodies, their transformation and loading into a single data warehouse;

      5) a unified data warehouse (hereinafter referred to as UDW) - a repository of large amounts of data, which are stored both in an unstructured and structured form, with specialized tools for accessing data;

      6) depersonalization of personal data - actions, as a result of which the determination of the ownership of personal data by the subject of personal data is impossible;

      7) database (hereinafter referred to as DB) is an organized structure designed for storing, changing and processing data;

      8) data provider - legal entities entrusted with the obligation to provide data for analytics in accordance with the Law;

      9) data analytics - the process of data processing in order to obtain information and conclusions for decision-making;

      10) database of the information system of state bodies (hereinafter - DB IS SB) - a set of data from the information system of state bodies;

      11) task - a situation requiring analysis and management decisions to optimize the activities of state bodies, as well as in order to implement strategic plans, state programs and development plans;

      12) request - a document that contains information regarding the description of the statement of the task being implemented, the calculation methodology, information about the data used from the source systems, the frequency of data updating, the names of the graphs and their description, the definition of the expected result;

      13) customer of analytics - a central executive body, a state body directly subordinate and accountable to the President of the Republic of Kazakhstan, a local executive body that needs processed data on a task in order to implement state functions;

      14) historical data - data contained in the database since its creation;

      15) interaction regulations - a document that establishes the rules, procedure and basic procedures for interaction between the operator and the data owner in terms of determining the responsibility of the participants in ensuring interaction, the list of information objects, the schedule and methods of organizing interaction related to the processes of receiving and transmitting information;

      16) electronic information resources - information provided in electronic digital form and contained on an electronic medium, an Internet resource and (or) in an information system;

      17) operator of the information and communication infrastructure of "electronic government" (hereinafter referred to as the operator) is a legal entity determined by the Government of the Republic of Kazakhstan, which is entrusted with ensuring the functioning of the information and communication infrastructure of "electronic government" assigned to it;

      18) ER-diagram - a diagram showing the structure of a database, indicating relationships between various entities (database tables);

      19) information and analytical system "Smart Data Ukimet" - an informatization object located on the information and communication platform of "electronic government" and designed to form a single data space for the purpose of providing analytical information on the activities of the Government of the Republic of Kazakhstan.

      4. When processing, storing, transferring electronic information resources for the implementation of data analytics in order to implement functions, state bodies take into account uniform requirements in the field of information and communication technologies and information security.

Chapter 2. The procedure for collecting electronic information resources

Paragraph 1. Initiating a request

      5. In the event of situations requiring analysis in order to make management decisions to optimize the activities of state bodies, as well as in order to implement strategic plans, government programs and development plans, the analytics customer sends a request for data analytics to the authorized body.

      6. The authorized body, within a period of not more than 5 (five) working days, considers the received request from the analyst's customer and, if the decision is positive, gives an order for execution to the operator.

      In the event of a negative decision, the authorized body sends the analytics customer a reasoned justification about the impossibility of conducting analytics.

      7. Reasons for refusal are:

      1) lack of digitized data for analytics;

      2) lack of social / economic effects;

      3) the need for analytics of confidential data, information constituting a state secret;

      3) the lack of a calculation methodology for conducting analytics;

      4) lack of logical architecture of the database (description of fields, tables and links in the database) required for analytics.

      8. The operator, within 10 (ten) business days from the date of receipt of the order, determines the availability of data in UDW, which is necessary for the implementation of data analytics as requested. In the absence of the necessary data for the implementation of analytics, the operator sends a request to the authorized body to connect DB IS SB to UDW.

      9. In the absence of DB IS SB in UDW, the authorized body, together with the operator, within a period of not more than 10 (ten) working days, coordinates with the data provider information regarding the data available in the IS, the physical and logical structure of DB IS SB, the connection method, the list of transmitted and anonymized data, deadlines.

Paragraph 2. Development and approval of interaction regulations

      10. The operator, within 10 (ten) working days, requests from the data provider a questionnaire to collect general information about the software and telecommunications environment of the state body in accordance with Appendix 1 to these Rules and technical documentation (ER-diagram, logical and physical data model, data architecture) ...

      11. The operator, within 20 (twenty) working days, develops the rules for interaction of the information-analytical system "Smart Data Ukimet" with IS SB together with the data provider. To develop the interaction regulations, the data provider transfers to the operator technical information in accordance with the requirements for the description of data sources in accordance with Appendix 2 to these Rules.

      12. The operator within 7 (seven) working days agrees, approves and sends to the data provider the rules of interaction.

      13. The data provider within 5 (five) working days agrees and approves the interaction regulations.

      14. If it is necessary to make changes to the interaction regulations, the data provider sends an official letter to the operator justifying the necessary changes.

      15. The operator within 10 (ten) working days agrees, approves and sends to the data provider the rules of interaction with the changes made.

      16. The data provider within 3 (three) working days agrees and approves the interaction regulations with the changes made.

Paragraph 3. Anonymization of data

      17. In accordance with article 17 of the Law of the Republic of Kazakhstan dated May 21, 2013 "On personal data and their protection", when transferring data, their mandatory depersonalization takes place in the manner determined by the Rules for the collection and processing of personal data.

      18. In order to depersonalize data, instructions are used to depersonalize personal data and a one-way hashing function without the possibility of reverse recovery, which ensures the legality, integrity and safety of data quality.

      19. Data depersonalization is performed by the operator if it is impossible to carry out the data depersonalization procedure independently by the data provider. To depersonalize data, the operator takes the necessary measures in accordance with the interaction regulations.

      20. Reconciliation, depersonalization and transfer of historical personal data occurs as follows:

      1) the operator, together with the data provider, determines and agrees the list of data to be depersonalized;

      2) the operator provides the data provider with the developed algorithms (sequence of actions) for one-way hashing without the possibility of reverse recovery, by database types and instructions for anonymizing personal data;

      3) the data provider performs anonymization and provides the operator with historical data;

      4) if the data provider is unable to depersonalize the data, the operator sets up the depersonalization procedure through the ETL tool. At the same time, the data is stored in the UDW in an impersonal form;

      5) the operator checks the correctness of historical data, the correctness of data depersonalization and loads them into the UDW.

Paragraph 4. Transfer, download of historical data and setup of automatic routine data update

      21. The data provider transfers historical data to the operator on a physical medium or in another agreed way. The operator, after receiving historical data from the data provider, through the ETL tool performs work on connecting, converting formats and encodings, identifying and removing errors and inconsistencies in the data in order to improve their quality.

      22. To unload data from the database, the data provider configures network access in accordance with the interaction rules.

      23. The data provider creates a user account in the database for reading certain data, opens access on the server for the servers of the Smart Data Ukimet Information and Analytical System on certain ports.

      24. The operator examines the database structure and the transmitted historical data from the data provider, forms the logic for calculating updated data, creates ETL processes for their depersonalization and loading, and tests the scheduled data loading.

Chapter 3. Procedure for processing electronic information resources

      25. The operator agrees with the authorized body the terms and volume of the provision of data received from various DB IS SB and combined with each other, in accordance with the request sent by the customer of the analytics to the authorized body.

      26. The Operator, within 45 (forty-five) working days, provides data obtained from various DB IS SB and combined with each other, according to the request sent by the analytics customer to the authorized body for subsequent analytics.

Chapter 4. The procedure for storing electronic information resources

      27. Collected data (detailed data, processed data, results of analytical solutions) are subject to storage and updating in the operator's UDW.

      28. Updating of data is carried out by the operator in automatic mode in accordance with the interaction regulations.

Chapter 5. The procedure for the transfer and implementation of analytics of electronic information resources

      29. The operator provides the analytics customer with access to the prepared processed data to check for compliance with the requested data.

      30. The customer of analytics within 5 (five) working days provides information to the operator about the results of the check. In case of negative results, including the absence and (or) insufficiency of the necessary data, the operator re-processes the data in accordance with paragraphs 25 and 26 of these Rules.

      31. The positive results of checking the compliance of the requested data contribute to the conduct of data analytics, which is carried out by the customer of the analytics independently or by attracting a supplier, at the expense of his own funds.

  Appendix 1 to the Rules for
collection, processing, storage,
transmission of electronic information
resources to implement
data analytics for
implementation of functions
government bodies

Questionnaire for collecting general information about the software and telecommunications environment of a state body

      Introduction

      The document is a questionnaire for collecting general information about the software and telecommunications environment for the purpose of preliminary examination of the possibility of connecting to the IC - service "Information and analytical system" Smart Data Ukimet ".

      Contacts of the responsible persons of the customer

      This section contains the contacts of the responsible persons who can be contacted for clarifying questions when analyzing the answers to questions in this Document.

№ п.п.

First and Last name of employee

Position

Contact information (tel., e - mail)

Responsibility area

1.





2.





      Information about the government agency

Name of company


Full name of the person in charge who filled out the questionnaire


Responsible person


Contact phone number of the responsible person


E-mail address of the person in charge


Internet site address


      Information about the information systems implemented and operated.

      For each system, fill out the questionnaire:

Name, year of introduction?


The database management system used (hereinafter referred to as the DBMS)


Is the DBMS located within the perimeter of the unified transport environment of government agencies?


Where is the DBMS physically located (data center of National Information Technologies JSC, commercial data center, own server rooms)?


From what year is history being conducted?


Approximate number of tables?


Number of users?


Does the System contain data representing state or commercial secrets?


The amount of raw data (excluding system fields, indexes, partitions, etc.)


The total size of the database occupied on disk


How the backup works


How often the data is updated, constantly / hourly / daily / monthly / yearly.


What is the approximate increase in data per day / month / quarter / year?


What types of data manipulation (DML operators) are embedded in the information system (IS):


1) Data is only replenished (insert), that is, data is always inserted into the IS;


2) The data is replenished (insert) and / or updated (update), that is, data is inserted and updated in the IS;


3) The data is replenished (insert), updated (update) and deleted (delete), that is, all types of data manipulation are performed in the IS.


Is there a minimum load time period for the DBMS (for example, from 02:00 to 05:00)?


Who maintains the system?


Are there specialists who are able to create data samples using the DBMS (SQL language, etc.)?


  Appendix 2 to the Rules for
collection, processing, storage,
transmission of electronic information
resources to implement
data analytics for
implementation of functions
government bodies

Requirements for describing data sources

      1. Data architecture:

      - Conceptual data model - displays the subject area of the state body and the objects used in the work.

      - A Logical Data Model is a detailed view of the data requirements and business rules that govern the quality of the data, usually with a focus on a specific context of use. The logical model expands the conceptual one by defining their attributes, descriptions and constraints for entities, specifies the composition of entities and the relationship between them.

      - Physical data model - the physical data model implements detailed data requirements, taking into account the limitations of the technology used by the applications, performance requirements and modeling standards. At this stage, relational databases are designed taking into account the specific capabilities of the system. Description of data objects (data object definition) defines the composition and formats of business and technical fields, their purpose, links to check tables, describes the rules of validation (for example, mandatory filling). Provides data quality requirements management, data change management, integration and migration.

      - The data life cycle diagram defines the stages of data change / addition / update in the steps of business processes, including data behavior. Allows you to define the life cycle of records, set the rules: who and under what events / circumstances changes the status of the record and in what sequence.

      - A data integration diagram is a data architecture artifact that displays integration flows of data between information systems. The value of the artifact lies in the fact that with the help of it is possible to quickly identify the place of origin of the data object and the path of data distribution between systems.