"Мәдениет туралы" Қазақстан Республикасы Заңының 24-4-бабы 4-тармағына, сондай-ақ Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес БҰЙЫРАМЫН:
1. Қоса беріліп отырған Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары бекітілсін.
2. Қазақстан Республикасы Ғылым және жоғары білім министрлігінің Тіл саясаты комитеті заңнамада белгіленген тәртіппен:
1) осы бұйрықтың Қазақстан Республикасы Әділет министрлігінде мемлекеттік тіркелуін;
2) осы бұйрықты Қазақстан Республикасы Ғылым және жоғары білім министрлігінің ресми интернет-ресурсына орналастыруды қамтамасыз етсін.
3. Осы бұйрықтың орындалуын бақылау жетекшілік ететін Қазақстан Республикасы Ғылым және жоғары білім вице-министріне жүктелсін.
4. Осы бұйрық алғашқы ресми жарияланған күнінен кейін күнтізбелік он күн өткен соң қолданысқа енгізіледі.
Қазақстан Республикасының Ғылым және жоғары білім министрі |
С. Нурбек |
"КЕЛІСІЛДІ"
Қазақстан Республикасы
Мәдениет және ақпарат министрлігі
"КЕЛІСІЛДІ"
Қазақстан Республикасы
Цифрлық даму, инновациялар және
аэроғарыш өнеркәсібі министрлігі
Қазақстан Республикасының Ғылым және жоғары білім министрі 2025 жылғы 30 сәуірдегі № 226 Бұйрығымен бекітілген |
Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары
1-тарау. Жалпы ережелер
1. Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары (бұдан әрі – Қағидалар) "Мәдениет туралы" Қазақстан Республикасы Заңының (бұдан әрі – Заң) 24-4-бабы 4-тармағына, Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес әзірленді және Қазақ тілінің ұлттық сөздік қорын (бұдан әрі – Ұлттық сөздік қор) қалыптастыру мен жүргізу тәртібін айқындайды.
2. Осы Қағидаларда мынадай негізгі ұғымдар пайдаланылады:
1) генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контентті (мәтін, сурет, дыбыс) автоматты түрде құру процесі;
2) жасанды интеллект модельдері – қазақ тіліндегі деректерді өңдеуге арналған жасанды интеллект технологияларын және алгоритмдерін әртүрлі жүйелерге, қосымшаларға немесе платформаларға енгізу процесі;
3) табиғи тілді өңдеу – компьютерлерге адам тілін түсінуге, түсіндіруге және өңдеуге мүмкіндік беретін машиналық оқыту технологиясы.
3. Ұлттық сөздік қорды құрудың мақсаты қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту, сондай-ақ мемлекеттік тіл мәртебесін нығайту, қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау, тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу, өңдеу процестерін автоматтандыру болып табылады.
2-тарау. Ұлттық сөздік қорды қалыптастыру тәртібі
4. Заңның 24-4-бабының 4-тармағына сәйкес Ұлттық сөздік қорды қалыптастыруды және жүргізуді тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға іске асырады.
5. Ұлттық сөздік қорды қалыптастыру жүйені пайдаланушыларға функционалдық және ақпараттық сервистерге қолжетімділік беруді көздейді.
6. Ұлттық сөздік қор академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығы болып табылатын датасет негізінде қалыптастырылады.
7. Ұлттық сөздік қорды қалыптастырудың негізгі міндеттері:
1) пайдаланушыларға сөздер туралы кешенді мәліметтер алуға мүмкіндік беретін сөздіктер жиынтығын қалыптастыру;
2) қазақ әдеби тілінің нормасы туралы ақпаратты орналастыруды, жаңартуды және таратуды қамтамасыз ету;
3) пайдаланушыларға түрлі сипаттағы тексерілген сөздіктердің электрондық нұсқасын қолдануға мүмкіндік беру;
4) пайдаланушыларға қазақ әдеби тілі нормасының даму динамикасы туралы ақпарат ұсыну.
8. Ұлттық сөздік қорды қалыптастыру:
1) Ұлттық сөздік қорды құру және дамыту мәселелері жөнінде кезеңдік іс-шаралар жоспарын әзірлеуді;
2) Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамаларды бекітуді;
3) интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз етуді;
4) Ұлттық сөздік қорды құру және жетілдіру саласындағы субъектілердің іс-қимылын үйлестіруді;
5) Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесін қалыптастыруды;
6) ашық деректер платформаларын пайдалануды және ақпараттық технологиялар мен ақпараттық қауіпсіздік саласындағы мемлекеттік стандарттарға сәйкес келуін қамтамасыз етуді қамтиды.
9. Ұлттық сөздік қорды қалыптастыру кезінде тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға:
1) ғылыми негізділік, қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы барлық лексикалық бірліктердің ғылыми зерттеулер мен нақты деректерге негізделу қажеттілігі;
2) жүйелілік, бірегей жүйе ретінде толық және әрі қарай жетілдірілу қажеттілігі;
3) әдеби тіл нормасын сақтауды қамтамасыз ету;
4) дәстүр мен жаңашылдықты үйлестіру, қазақ тілінің лексикалық нормасы мен қазіргі заман талаптарына сәйкес жаңа сөздер мен терминдерді үйлесімді түрде бейімдеу, енгізу қажеттілігі;
5) барлық деректердің тілдік ресурстарды пайдаланушылар үшін қолжетімділігі және инклюзивтілігі принциптерін басшылыққа алады.
Ұлттық сөздік қорды қалыптастыру аталған қорды құруға және жетілдіруге қатысты ұсыныстарды жария талқылауды ескере отырып жүзеге асырылады. Қоғамдық талқылау барлық мүдделі тараптардың ұсыныстары мен түсініктемелерін енгізу мүмкіндігімен ашық онлайн платформалар немесе қоғамдық іс-шаралар арқылы жүзеге асырылады. Ұлттық сөздік қорды қалыптастыруға және жетілдіруге қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы тәуелсіз сарапшылар тартылады.
3-тарау. Ұлттық сөздік қорды жүргізу тәртібі
10. Ұлттық сөздік қорды жүргізу:
1) сөздердің мағынасын, этимологиясын және жалпы қолдану үлгілерін қамтитын сөздіктер базасын әзірлеуді;
2) тіл корпустарының орталықтандырылған жүйесін құруды;
3) қазақ тілінің терминологиялық базасын жетілдіруді;
4) қазақ тілін қолданудың барлық саласын қамтитын датасет жинауға арналған техникалық талаптарды әзірлеуді;
5) ғылыми зерттеулер үшін қолжетімді платформа ұсынуды;
6) қазақ тіліндегі жасанды интеллект модельдерін, заманауи технологияларды интеграциялауды;
7) интерактивті іздеу жүйесін әзірлеуді;
8) ақпараттық жүйеге енгізілетін деректер қорын жинауды, өңдеуді, сақтауды жүзеге асыруды;
9) жалпыға қолжетімді ақпараттың Интернеттің ашық кеңістігінде болуын;
10) ақпараттық жүйенің субъектілері арасында мәліметтермен ақпараттық алмасуды;
11) мәтіндік материалдарды цифрлық форматта беруді;
12) сенімді және жоғары өнімді бағдарламалармен қамтамасыз етілуді;
13) тілдік деректердің реляциялық және семантикалық байланыстарын құруды;
14) ақпараттық қауіпсіздік шараларын сақтауды;
15) ақпараттық жүйені жаңарту және жетілдіру бойынша жұмыс жүргізуді;
16) Ұлттық сөздік қорды өзектендіруде оны тестілеу және сынақтан өткізу бойынша шаралардың қабылдануын;
17) пайдаланушылар үшін ақпараттық жүйені өздігінен оқуға арналған нұсқаулықтың әзірленуін;
18) Ұлттық сөздік қорға енгізілетін тіл нормасына сәйкес келетін сөздерді, терминдер мен сөз тіркестерін сұрыптау және сараптау қызметін қамтамасыз етуді;
19) Ұлттық сөздік қор бойынша жүйеден тыс жүзеге асырылатын алқалы әрекеттер қызметін үйлестіруді қамтиды.