В соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре", а также подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, ПРИКАЗЫВАЮ:
1. Утвердить прилагаемые Правила формирования и ведения Национального словарного фонда казахского языка.
2. Комитету языковой политики Министерства науки и высшего образования Республики Казахстан в установленном законодательством порядке обеспечить:
1) государственную регистрацию настоящего приказа в Министерстве юстиции Республики Казахстан;
2) размещение настоящего приказа на официальном интернет-ресурсе Министерства науки и высшего образования Республики Казахстан.
3. Контроль за исполнением настоящего приказа возложить на курирующего вице-министра науки и высшего образования Республики Казахстан.
4. Настоящий приказ вводится в действие по истечении десяти календарных дней после дня его первого официального опубликования.
Министр науки и высшего образования Республики Казахстан |
С. Нурбек |
"СОГЛАСОВАНО"
Министерство культуры и информации
Республики Казахстан
"СОГЛАСОВАНО"
Министерство цифрового развития,
инноваций и аэрокосмической
промышленности Республики Казахстан
Утверждены приказом Министр науки и высшего образования Республики Казахстан от 30 апреля 2025 года № 226 |
Правила формирования и ведения Национального словарного фонда казахского языка
Глава 1. Общие положения
1. Правила формирования и ведения Национального словарного фонда казахского языка (далее – Правила) разработаны в соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре" (далее – Закон), подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, и определяют порядок формирования и ведения Национального словарного фонда казахского языка (далее – Национальный словарный фонд).
2. В настоящих Правилах используются следующие основные понятия:
1) генерация – процесс автоматического создания нового контента (текста, изображения, звука) на основе данных и заранее установленных правил;
2) модели искусственного интеллекта – процесс внедрения технологий и алгоритмов искусственного интеллекта для обработки данных на казахском языке в различные системы, приложения или платформы;
3) обработка естественного языка – технология машинного обучения, которая дает компьютерам возможность понимать, интерпретировать и обрабатывать человеческий язык.
3. Целями формирования Национального словарного фонда являются сохранение, защита и развитие казахского языка как культурной ценности, а также укрепление статуса государственного языка, накопление ресурсов, охватывающих все сферы применения казахского языка, упорядочение, цифровизация, генерация действующего лексического состава языка, адаптация его к искусственному интеллекту и современным технологиям, автоматизация процессов обработки.
Глава 2. Порядок формирования Национального словарного фонда
4. Формирование и ведение Национального словарного фонда осуществляется юридическим лицом, определенным уполномоченным органом в области развития языков, в соответствии с пунктом 4 статьи 24-4 Закона.
5. Формирование Национального словарного фонда предусматривает предоставление пользователям системы доступа к функциональным и информационным сервисам.
6. Национальный словарный фонд формируется на основании академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасета, который является совокупностью данных различных форматов.
7. Основными задачами формирования Национального словарного фонда являются:
1) формирование совокупности словарей, позволяющих получить пользователям комплексные сведения о словах;
2) обеспечение размещения, обновления и распространения информации о норме казахского литературного языка;
3) предоставление пользователям возможности пользоваться электронными версиями верифицированных словарей различного типа;
4) предоставление пользователям информации о динамике развития нормы казахского литературного языка.
8. Формирование Национального словарного фонда включает:
1) разработку поэтапного плана мероприятий по вопросам создания и развития Национального словарного фонда;
2) утверждение функциональных и технических требований к Национальному словарному фонду, графика оказания технических услуг и технических спецификаций информационной системы, предназначенной для сбора, обработки и систематизации данных;
3) обеспечение интерактивного пользовательского интерфейса, поисковой системы и возможности экспорта данных;
4) координацию действий субъектов в области создания и совершенствования Национального словарного фонда;
5) формирование списка информационных ресурсов, способных к интеграции с Национальным словарным фондом;
6) использование платформ открытых данных и обеспечение соответствия государственным стандартам в области информационных технологий и информационной безопасности.
9. При формировании Национального словарного фонда юридическое лицо, определенное уполномоченным органом в области развития языков, руководствуется следующими принципами:
1) научная обоснованность, необходимость опираться на научные исследования и фактические данные всех лексических единиц в области общественно-гуманитарных и естественно-математических наук;
2) систематичность, необходимость полного и дальнейшего совершенствования как уникальной системы;
3) обеспечение соблюдения нормы литературного языка;
4) сочетание традиций и новаторства, необходимость гармоничной адаптации и введения новых слов и терминов в соответствии с нормой лексики казахского языка и требованиями современности;
5) доступность и инклюзивность всех данных для пользователей языковых ресурсов.
Формирование Национального словарного фонда осуществляется с учетом публичного обсуждения предложений, касающихся создания и совершенствования данного фонда. Публичное обсуждение проводится через открытые онлайн-платформы или публичные мероприятия с возможностью внесения предложений и комментариев от всех заинтересованных сторон. К формированию и совершенствованию Национального словарного фонда привлекаются независимые эксперты в области общественно-гуманитарных и естественно-математических наук.
Глава 3. Порядок ведения Национального словарного фонда
10. Ведение Национального словарного фонда включает:
1) разработку базы словарей, включающих значение, этимологию и модели общего употребления слов;
2) создание централизованной системы языковых корпусов;
3) совершенствование терминологической базы казахского языка;
4) разработку технических требований для сбора датасетов, включающих все сферы применения казахского языка;
5) предоставление доступной платформы для научных исследований;
6) интеграцию моделей искусственного интеллекта, современных технологий на казахском языке;
7) разработку интерактивной поисковой системы;
8) осуществление сбора, обработки, хранения базы данных, вносимых в информационную систему;
9) наличие общедоступной информации в открытом пространстве Интернета;
10) информационный обмен данными между субъектами информационной системы;
11) предоставление текстовых материалов в цифровом формате;
12) обеспечение надежными и высокопроизводительными серверными программами;
13) создание реляционных и семантических связей языковых данных;
14) соблюдение мер информационной безопасности;
15) проведение работы по обновлению и совершенствованию информационной системы;
16) принятие мер по актуализации Национального словарного фонда по его тестированию и апробации;
17) разработку руководства для самостоятельного обучения информационной системы для пользователей;
18) обеспечение деятельности по сортировке и экспертизе слов, терминов и словосочетаний, соответствующих языковой норме, включаемых в Национальный словарный фонд;
19) координацию деятельности коллегиальных действий, осуществляемых вне системы по Национальному словарному фонду.