Об утверждении Правил формирования и ведения Национального словарного фонда казахского языка

Приказ Министра науки и высшего образования Республики Казахстан от 30 апреля 2025 года № 226. Зарегистрирован в Министерстве юстиции Республики Казахстан 6 мая 2025 года № 36081

      В соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре", а также подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, ПРИКАЗЫВАЮ:

      1. Утвердить прилагаемые Правила формирования и ведения Национального словарного фонда казахского языка.

      2. Комитету языковой политики Министерства науки и высшего образования Республики Казахстан в установленном законодательством порядке обеспечить:

      1) государственную регистрацию настоящего приказа в Министерстве юстиции Республики Казахстан;

      2) размещение настоящего приказа на официальном интернет-ресурсе Министерства науки и высшего образования Республики Казахстан.

      3. Контроль за исполнением настоящего приказа возложить на курирующего вице-министра науки и высшего образования Республики Казахстан.

      4. Настоящий приказ вводится в действие по истечении десяти календарных дней после дня его первого официального опубликования.

      Министр науки и высшего образования
Республики Казахстан
С. Нурбек

      "СОГЛАСОВАНО"

      Министерство культуры и информации

      Республики Казахстан

      "СОГЛАСОВАНО"

      Министерство цифрового развития,

      инноваций и аэрокосмической

      промышленности Республики Казахстан

  Утверждены приказом
Министр науки и
высшего образования
Республики Казахстан
от 30 апреля 2025 года
№ 226

Правила формирования и ведения Национального словарного фонда казахского языка

Глава 1. Общие положения

      1. Правила формирования и ведения Национального словарного фонда казахского языка (далее – Правила) разработаны в соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре" (далее – Закон), подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, и определяют порядок формирования и ведения Национального словарного фонда казахского языка (далее – Национальный словарный фонд).

      2. В настоящих Правилах используются следующие основные понятия:

      1) генерация – процесс автоматического создания нового контента (текста, изображения, звука) на основе данных и заранее установленных правил;

      2) модели искусственного интеллекта – процесс внедрения технологий и алгоритмов искусственного интеллекта для обработки данных на казахском языке в различные системы, приложения или платформы;

      3) обработка естественного языка – технология машинного обучения, которая дает компьютерам возможность понимать, интерпретировать и обрабатывать человеческий язык.

      3. Целями формирования Национального словарного фонда являются сохранение, защита и развитие казахского языка как культурной ценности, а также укрепление статуса государственного языка, накопление ресурсов, охватывающих все сферы применения казахского языка, упорядочение, цифровизация, генерация действующего лексического состава языка, адаптация его к искусственному интеллекту и современным технологиям, автоматизация процессов обработки.

Глава 2. Порядок формирования Национального словарного фонда

      4. Формирование и ведение Национального словарного фонда осуществляется юридическим лицом, определенным уполномоченным органом в области развития языков, в соответствии с пунктом 4 статьи 24-4 Закона.

      5. Формирование Национального словарного фонда предусматривает предоставление пользователям системы доступа к функциональным и информационным сервисам.

      6. Национальный словарный фонд формируется на основании академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасета, который является совокупностью данных различных форматов.

      7. Основными задачами формирования Национального словарного фонда являются:

      1) формирование совокупности словарей, позволяющих получить пользователям комплексные сведения о словах;

      2) обеспечение размещения, обновления и распространения информации о норме казахского литературного языка;

      3) предоставление пользователям возможности пользоваться электронными версиями верифицированных словарей различного типа;

      4) предоставление пользователям информации о динамике развития нормы казахского литературного языка.

      8. Формирование Национального словарного фонда включает:

      1) разработку поэтапного плана мероприятий по вопросам создания и развития Национального словарного фонда;

      2) утверждение функциональных и технических требований к Национальному словарному фонду, графика оказания технических услуг и технических спецификаций информационной системы, предназначенной для сбора, обработки и систематизации данных;

      3) обеспечение интерактивного пользовательского интерфейса, поисковой системы и возможности экспорта данных;

      4) координацию действий субъектов в области создания и совершенствования Национального словарного фонда;

      5) формирование списка информационных ресурсов, способных к интеграции с Национальным словарным фондом;

      6) использование платформ открытых данных и обеспечение соответствия государственным стандартам в области информационных технологий и информационной безопасности.

      9. При формировании Национального словарного фонда юридическое лицо, определенное уполномоченным органом в области развития языков, руководствуется следующими принципами:

      1) научная обоснованность, необходимость опираться на научные исследования и фактические данные всех лексических единиц в области общественно-гуманитарных и естественно-математических наук;

      2) систематичность, необходимость полного и дальнейшего совершенствования как уникальной системы;

      3) обеспечение соблюдения нормы литературного языка;

      4) сочетание традиций и новаторства, необходимость гармоничной адаптации и введения новых слов и терминов в соответствии с нормой лексики казахского языка и требованиями современности;

      5) доступность и инклюзивность всех данных для пользователей языковых ресурсов.

      Формирование Национального словарного фонда осуществляется с учетом публичного обсуждения предложений, касающихся создания и совершенствования данного фонда. Публичное обсуждение проводится через открытые онлайн-платформы или публичные мероприятия с возможностью внесения предложений и комментариев от всех заинтересованных сторон. К формированию и совершенствованию Национального словарного фонда привлекаются независимые эксперты в области общественно-гуманитарных и естественно-математических наук.

Глава 3. Порядок ведения Национального словарного фонда

      10. Ведение Национального словарного фонда включает:

      1) разработку базы словарей, включающих значение, этимологию и модели общего употребления слов;

      2) создание централизованной системы языковых корпусов;

      3) совершенствование терминологической базы казахского языка;

      4) разработку технических требований для сбора датасетов, включающих все сферы применения казахского языка;

      5) предоставление доступной платформы для научных исследований;

      6) интеграцию моделей искусственного интеллекта, современных технологий на казахском языке;

      7) разработку интерактивной поисковой системы;

      8) осуществление сбора, обработки, хранения базы данных, вносимых в информационную систему;

      9) наличие общедоступной информации в открытом пространстве Интернета;

      10) информационный обмен данными между субъектами информационной системы;

      11) предоставление текстовых материалов в цифровом формате;

      12) обеспечение надежными и высокопроизводительными серверными программами;

      13) создание реляционных и семантических связей языковых данных;

      14) соблюдение мер информационной безопасности;

      15) проведение работы по обновлению и совершенствованию информационной системы;

      16) принятие мер по актуализации Национального словарного фонда по его тестированию и апробации;

      17) разработку руководства для самостоятельного обучения информационной системы для пользователей;

      18) обеспечение деятельности по сортировке и экспертизе слов, терминов и словосочетаний, соответствующих языковой норме, включаемых в Национальный словарный фонд;

      19) координацию деятельности коллегиальных действий, осуществляемых вне системы по Национальному словарному фонду.

Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидаларын бекіту туралы

Қазақстан Республикасы Ғылым және жоғары білім министрінің 2025 жылғы 30 сәуірдегі № 226 бұйрығы. Қазақстан Республикасының Әділет министрлігінде 2025 жылғы 6 мамырда № 36081 болып тіркелді

      "Мәдениет туралы" Қазақстан Республикасы Заңының 24-4-бабы 4-тармағына, сондай-ақ Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес БҰЙЫРАМЫН:

      1. Қоса беріліп отырған Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары бекітілсін.

      2. Қазақстан Республикасы Ғылым және жоғары білім министрлігінің Тіл саясаты комитеті заңнамада белгіленген тәртіппен:

      1) осы бұйрықтың Қазақстан Республикасы Әділет министрлігінде мемлекеттік тіркелуін;

      2) осы бұйрықты Қазақстан Республикасы Ғылым және жоғары білім министрлігінің ресми интернет-ресурсына орналастыруды қамтамасыз етсін.

      3. Осы бұйрықтың орындалуын бақылау жетекшілік ететін Қазақстан Республикасы Ғылым және жоғары білім вице-министріне жүктелсін.

      4. Осы бұйрық алғашқы ресми жарияланған күнінен кейін күнтізбелік он күн өткен соң қолданысқа енгізіледі.

      Қазақстан Республикасының
Ғылым және жоғары білім министрі
С. Нурбек

      "КЕЛІСІЛДІ"

      Қазақстан Республикасы

      Мәдениет және ақпарат министрлігі

      "КЕЛІСІЛДІ"

      Қазақстан Республикасы

      Цифрлық даму, инновациялар және

      аэроғарыш өнеркәсібі министрлігі

  Қазақстан Республикасының
Ғылым және жоғары білім
министрі
2025 жылғы 30 сәуірдегі
№ 226 Бұйрығымен
бекітілген

Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары

1-тарау. Жалпы ережелер

      1. Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары (бұдан әрі – Қағидалар) "Мәдениет туралы" Қазақстан Республикасы Заңының (бұдан әрі – Заң) 24-4-бабы 4-тармағына, Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес әзірленді және Қазақ тілінің ұлттық сөздік қорын (бұдан әрі – Ұлттық сөздік қор) қалыптастыру мен жүргізу тәртібін айқындайды.

      2. Осы Қағидаларда мынадай негізгі ұғымдар пайдаланылады:

      1) генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контентті (мәтін, сурет, дыбыс) автоматты түрде құру процесі;

      2) жасанды интеллект модельдері – қазақ тіліндегі деректерді өңдеуге арналған жасанды интеллект технологияларын және алгоритмдерін әртүрлі жүйелерге, қосымшаларға немесе платформаларға енгізу процесі;

      3) табиғи тілді өңдеу – компьютерлерге адам тілін түсінуге, түсіндіруге және өңдеуге мүмкіндік беретін машиналық оқыту технологиясы.

      3. Ұлттық сөздік қорды құрудың мақсаты қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту, сондай-ақ мемлекеттік тіл мәртебесін нығайту, қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау, тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу, өңдеу процестерін автоматтандыру болып табылады.

2-тарау. Ұлттық сөздік қорды қалыптастыру тәртібі

      4. Заңның 24-4-бабының 4-тармағына сәйкес Ұлттық сөздік қорды қалыптастыруды және жүргізуді тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға іске асырады.

      5. Ұлттық сөздік қорды қалыптастыру жүйені пайдаланушыларға функционалдық және ақпараттық сервистерге қолжетімділік беруді көздейді.

      6. Ұлттық сөздік қор академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығы болып табылатын датасет негізінде қалыптастырылады.

      7. Ұлттық сөздік қорды қалыптастырудың негізгі міндеттері:

      1) пайдаланушыларға сөздер туралы кешенді мәліметтер алуға мүмкіндік беретін сөздіктер жиынтығын қалыптастыру;

      2) қазақ әдеби тілінің нормасы туралы ақпаратты орналастыруды, жаңартуды және таратуды қамтамасыз ету;

      3) пайдаланушыларға түрлі сипаттағы тексерілген сөздіктердің электрондық нұсқасын қолдануға мүмкіндік беру;

      4) пайдаланушыларға қазақ әдеби тілі нормасының даму динамикасы туралы ақпарат ұсыну.

      8. Ұлттық сөздік қорды қалыптастыру:

      1) Ұлттық сөздік қорды құру және дамыту мәселелері жөнінде кезеңдік іс-шаралар жоспарын әзірлеуді;

      2) Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамаларды бекітуді;

      3) интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз етуді;

      4) Ұлттық сөздік қорды құру және жетілдіру саласындағы субъектілердің іс-қимылын үйлестіруді;

      5) Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесін қалыптастыруды;

      6) ашық деректер платформаларын пайдалануды және ақпараттық технологиялар мен ақпараттық қауіпсіздік саласындағы мемлекеттік стандарттарға сәйкес келуін қамтамасыз етуді қамтиды.

      9. Ұлттық сөздік қорды қалыптастыру кезінде тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға:

      1) ғылыми негізділік, қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы барлық лексикалық бірліктердің ғылыми зерттеулер мен нақты деректерге негізделу қажеттілігі;

      2) жүйелілік, бірегей жүйе ретінде толық және әрі қарай жетілдірілу қажеттілігі;

      3) әдеби тіл нормасын сақтауды қамтамасыз ету;

      4) дәстүр мен жаңашылдықты үйлестіру, қазақ тілінің лексикалық нормасы мен қазіргі заман талаптарына сәйкес жаңа сөздер мен терминдерді үйлесімді түрде бейімдеу, енгізу қажеттілігі;

      5) барлық деректердің тілдік ресурстарды пайдаланушылар үшін қолжетімділігі және инклюзивтілігі принциптерін басшылыққа алады.

      Ұлттық сөздік қорды қалыптастыру аталған қорды құруға және жетілдіруге қатысты ұсыныстарды жария талқылауды ескере отырып жүзеге асырылады. Қоғамдық талқылау барлық мүдделі тараптардың ұсыныстары мен түсініктемелерін енгізу мүмкіндігімен ашық онлайн платформалар немесе қоғамдық іс-шаралар арқылы жүзеге асырылады. Ұлттық сөздік қорды қалыптастыруға және жетілдіруге қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы тәуелсіз сарапшылар тартылады.

3-тарау. Ұлттық сөздік қорды жүргізу тәртібі

      10. Ұлттық сөздік қорды жүргізу:

      1) сөздердің мағынасын, этимологиясын және жалпы қолдану үлгілерін қамтитын сөздіктер базасын әзірлеуді;

      2) тіл корпустарының орталықтандырылған жүйесін құруды;

      3) қазақ тілінің терминологиялық базасын жетілдіруді;

      4) қазақ тілін қолданудың барлық саласын қамтитын датасет жинауға арналған техникалық талаптарды әзірлеуді;

      5) ғылыми зерттеулер үшін қолжетімді платформа ұсынуды;

      6) қазақ тіліндегі жасанды интеллект модельдерін, заманауи технологияларды интеграциялауды;

      7) интерактивті іздеу жүйесін әзірлеуді;

      8) ақпараттық жүйеге енгізілетін деректер қорын жинауды, өңдеуді, сақтауды жүзеге асыруды;

      9) жалпыға қолжетімді ақпараттың Интернеттің ашық кеңістігінде болуын;

      10) ақпараттық жүйенің субъектілері арасында мәліметтермен ақпараттық алмасуды;

      11) мәтіндік материалдарды цифрлық форматта беруді;

      12) сенімді және жоғары өнімді бағдарламалармен қамтамасыз етілуді;

      13) тілдік деректердің реляциялық және семантикалық байланыстарын құруды;

      14) ақпараттық қауіпсіздік шараларын сақтауды;

      15) ақпараттық жүйені жаңарту және жетілдіру бойынша жұмыс жүргізуді;

      16) Ұлттық сөздік қорды өзектендіруде оны тестілеу және сынақтан өткізу бойынша шаралардың қабылдануын;

      17) пайдаланушылар үшін ақпараттық жүйені өздігінен оқуға арналған нұсқаулықтың әзірленуін;

      18) Ұлттық сөздік қорға енгізілетін тіл нормасына сәйкес келетін сөздерді, терминдер мен сөз тіркестерін сұрыптау және сараптау қызметін қамтамасыз етуді;

      19) Ұлттық сөздік қор бойынша жүйеден тыс жүзеге асырылатын алқалы әрекеттер қызметін үйлестіруді қамтиды.