В соответствии с подпунктом 5) статьи 12 Закона Республики Казахстан от 19 марта 2010 года "О государственной статистике" и подпунктом 258) пункта 17 Положения о Министерстве национальной экономики Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 24 сентября 2014 года № 1011, ПРИКАЗЫВАЮ:
1. Утвердить прилагаемую Методику по формированию прогнозных показателей уровня жизни.
2. Управлению статистики труда и уровня жизни совместно с Юридическим управлением Комитета по статистике Министерства национальной экономики Республики Казахстан обеспечить в установленном законодательством порядке:
1) государственную регистрацию настоящего приказа в Министерстве юстиции Республики Казахстан;
2) в течение десяти календарных дней со дня государственной регистрации настоящего приказа направление его копии в бумажном и электронном виде на казахском и русском языках в Республиканское государственное предприятие на праве хозяйственного ведения "Республиканский центр правовой информации" для официального опубликования и включения в Эталонный контрольный банк нормативных правовых актов Республики Казахстан;
3) в течение десяти календарных дней после государственной регистрации настоящего приказа направление его копии на официальное опубликование в периодические печатные издания;
4) размещение настоящего приказа на интернет-ресурсе Комитета по статистике Министерства национальной экономики Республики Казахстан.
3. Контроль за исполнением настоящего приказа возложить на заместителя Председателя Комитета по статистике Министерства национальной экономики Республики Казахстан (Орунханов К.К.).
4. Настоящий приказ вводится в действие по истечении десяти календарных дней после дня его первого официального опубликования.
Председатель Комитета по статистике Министерства национальной экономики Республики Казахстан |
Н. Айдапкелов |
Утверждена приказом Председателя Комитета по статистике Министерства Национальной экономики Республики Казахстан от 24 ноября 2017 года № 185 |
Методика
по формированию прогнозных показателей уровня жизни
Глава 1. Общие положения
1. Настоящая Методика по формированию прогнозных показателей уровня жизни (далее – Методика) относится к статистической методологии, утверждаемой в соответствии с Законом Республики Казахстан от 19 марта 2010 года "О государственной статистике".
2. Целью Методики является определение основных аспектов формирования прогнозных показателей уровня жизни.
3. Методика предназначена для применения Комитетом по статистике Министерства национальной экономики Республики Казахстан.
4. Для прогнозирования уровня жизни используются следующие показатели: доля населения, имеющего доходы ниже величины прожиточного минимума и доходы населения, использованные на потребление.
5. В Методике используются следующие определения:
1) степень свободы – разность числа наблюдений и числа оцененных параметров;
2) коэффициент ковариации – средняя величина произведения отклонений переменных от своих средних и является мерой взаимосвязи между двумя переменными;
3) доля населения, имеющего доходы ниже величины прожиточного минимума – отношение численности населения, имеющего доходы ниже величины прожиточного минимума к общей численности населения в процентном измерении;
4) тренд – изменение, определяющее общее направление развития, основную тенденцию временного ряда;
5) временной ряд (динамический ряд) – последовательность значений показателя (признака), упорядоченная в хронологическом порядке, в порядке возрастания временного параметра;
6) выборочная дисперсия (вариация) – среднее арифметическое квадратов отклонения случайной величины от среднего значения.
Глава 2. Прогнозирование показателя доли населения, имеющего доходы ниже величины прожиточного минимума
Параграф 1. Использование корреляционного анализа
6. При построении прогноза уровня жизни определяется взаимосвязь между экономическими показателями: уровень безработицы (далее – x) и доля населения, имеющего доходы ниже величины прожиточного минимума (далее – y). Для определения формы связи между экономическими показателями применяется метод корреляционного анализа, рассчитывающий степень зависимости (коэффициент корреляции) двух рассматриваемых показателей.
7. Для расчета коэффициента корреляции используется метод наименьших квадратов, основанный на минимизации суммы квадратов остатков между фактическими и расчетными данными.
Порядок вычисления коэффициента корреляции
методом наименьших квадратов:1) построить вариационные ряды для каждого из сопоставляемых признаков, обозначив первый и второй ряд чисел соответственно х и у.
2) определить для каждого вариационного ряда х и у средние значения М
3) найти отклонения
каждого числового значения от среднего значения своего вариационного ряда;4) полученные отклонения перемножить
, каждое отклонение возвести в квадрат и суммировать по каждому ряду5) подставить полученные значения в формулу расчета коэффициента корреляции:
где:
– коэффициент корреляции;
– отклонение значения ряда x от своего среднего значения;
– отклонение значения ряда y от своего среднего значения;
– сумма квадратов отклонений по x;
– сумма квадратов отклонений по .
8. Величина коэффициента корреляции отражает силы связи между переменными (х, у). При оценке силы связи коэффициентов корреляции между переменными (х, у) используется шкала Чеддока (при коэффициенте корреляции равном 0,1-0,3 – взаимосвязь переменных слабая, 0,3-0,5 – умеренная, 0,5-0,7 – заметная, 0,7-0,9 – высокая, 0,9-0,99 – весьма высокая).
Коэффициент корреляции принимает значения от –1 до +1. Отрицательный коэффициент корреляции указывает на обратную связь показателей (х, у). При нулевой величине коэффициента корреляции переменные не имеют связи между собой.
Параграф 2. Построение регрессионной модели для прогнозирования
показателей уровня жизни
9. Уравнение регрессии отражает изменение средней величины одной переменной (у) в зависимости от второй (х).
10. Линейное уравнение регрессии используется для определения зависимости одной (зависимой) переменной у от другой или несколько других переменных (независимых переменных) х с линейной функцией зависимости:
y = bx + a,
где:
– зависимая переменная;
– оценки параметров регрессионной модели;
– независимая переменная.
11. Оценочное уравнение регрессии (построенное по выборочным значениям экономических показателей):
y = bx + a + e,
(3)
где:
e – случайная ошибка (отклонение);
а и b – оценки параметров регрессионной модели.
12. Для построения уравнения регрессии используются эмпирические коэффициенты регрессии (b):
где:
– коэффициент регрессии;
– среднее значение величины ху;
– среднее значение величины х;
– среднее значение величины у;
– выборочная дисперсия переменой х.
Эмпирические коэффициенты регрессии строятся по выборочным значениям экономических показателей (выборочная совокупность) и определяют зависимость средних значений признака-результата (по выборочной совокупности) от средних значений признака-фактора (по генеральной совокупности).
Оценка параметров регрессионной модели рассчитывается по следующей формуле:
где:
– оценка параметров регрессионной модели;
– среднее значение величины у;
– коэффициент регрессии;
– среднее значение величины х.
13. После определения коэффициентов уравнения регрессии определяется вспомогательный коэффициент
, показывающий тенденцию роста вариационного ряда переменной х:
где:
– вспомогательный коэффициент;
– покупательная способность за n-й год;
– покупательная способность за n-1 год;
– покупательная способность за n-2 год;
– последний год, от которого производится прогноз на будущий период.
Вспомогательный коэффициент l используется для расчета прогноза переменной х.
Покупательная способность определяется количеством товаров, приобретаемых на сумму среднедушевого денежного дохода обследуемых домашних хозяйств по средним ценам покупки. Покупательная способность также выражается через соотношение доходов с прожиточным минимумом.
Покупательная способность на следующий год после n-го расчитывается по следующей формуле:
где:
– покупательная способность за n+1 год;
– вспомогательный коэффициент;
– покупательная способность за n-й год.
Вычислив покупательную способность
на следующий год после n-го, производится прогноз и на переменной у (доля населения, имеющего доходы ниже прожиточного минимума):
где:
– доля населения, имеющего доходы ниже величины прожиточного минимума за n+1 год;
– оценка параметров регрессионной модели;
– коэффициент регрессии;
– покупательная способность за n+1 год.
14. Для определения точности уравнения регрессии производится расчет коэффициента детерминации по следующей формуле:
где:
– коэффициент детерминации;
– выборочная дисперсия значений х;
– выборочная дисперсия значений у.
Коэффициент детерминации показывает насколько вариация обусловлена различиями между признаками и другими факторами.
Вариация обозначается различием в значениях того или иного признака у отдельных единиц, входящих в данную совокупность.
Значение R2≥0,5 (критерий Фишера) показывает об обусловленности вариации влиянием других факторов. Критерий Фишера (F-статистика) является параметрическим критерием и используется для оценивания качества регрессионной модели в целом и по параметрам путем сравнения полученного значения критерия и табличного значения критерия Фишера.
15. Для оценки качества параметров регрессии выдвигаются следующие гипотезы:
1) при нулевой (основной) (H0) гипотезе rxy = 0 – нет линейной взаимосвязи между переменными;
2) при альтернативной (H1) гипотезе rxy ≠ 0 – есть линейная взаимосвязь между переменными.
В регрессионном анализе проверяется нулевая (основная) гипотеза H0 об отсутствии взаимосвязи между переменными. При отклонении нулевой гипотезы, принимается альтернативная гипотеза о существовании взаимосвязи между переменными. Альтернативная гипотеза – противоположность нулевой гипотезе.
Уровень значимости определяет вероятность принятия ошибочного решения при испытании нулевой гипотезы, отрицающей различия сравниваемых величин. Уровень значимости выбирается равным 0,05 или 0,01.
По заданному уровню значимости a проверяется нулевая гипотеза о равенстве коэффициента корреляции нулю, при альтернативной гипотезе H1 ≠ 0 вычисляется величина случайной ошибки по следующей формуле:
где:
– наблюдаемое значение критерия (величина случайной ошибки);
– коэффициент корреляции между переменными х и у;
– число степеней свободы;
– квадрат коэффициента корреляции между х и у.
Согласно таблице критических точек распределения t–критерий Стьюдента по заданному уровню значимости a и числу степеней свободы k=n–2 находится критическая точка tкрит.
t–критерий Стьюдента используется для проверки значимости каждого фактора регрессионной модели. При нулевой гипотезе предполагается, что средние равны (отрицание этого предположения называют гипотезой сдвига).
16. Интервальная оценка (доверительный интервал) для коэффициента корреляции определяется по следующей формуле:
где:
– коэффициент корреляции между переменными х и у;
– критическое значение при заданном уровне значимости и числе степеней свободы;
– квадрат коэффициента корреляции между переменными х и у;
– степень свободы;
– число наблюдений.
Доверительный интервал показывает в каком диапазоне расположатся результаты выборочных наблюдений и допустимое отклонение наблюдаемых значений от истинных.
17. Необъясненная (остаточная) дисперсия показывает вариацию результата под влиянием факторов, неучтенных регрессией и рассчитывается по следующей формуле:
где:
– необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии);
– сумма квадратов разницы величин ;
– число наблюдений;
m – число независимых переменных;
n–m–1 – степень свободы;
– значение выборочной величины у для каждого конкретного наблюдения i;
– значение выборочной величины у для наблюдения х.
18. Стандартная ошибка регрессии рассчитывается по следующей формуле:
где:
S – стандартная ошибка оценки (стандартная ошибка регрессии);
– необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
19. Ошибка прогноза для уравнения
вычисляется по следующей формуле:
где:
e – случайная ошибка для оценки у;
n – число наблюдений;
20. Ошибка прогноза для уравнения y = bx + a + e вычисляется по следующей формуле:
где:
e – независимая случайная ошибка;
n – число наблюдений;
21. Проверка гипотез производится относительно коэффициентов линейного уравнения регрессии. Оценка значимости линейной регрессии производится по следующему алгоритму: выдвигается нулевая гипотеза H0 о незначимости уравнения R2 = 0 по уровню значимости a.
В регрессионном анализе с помощью F–критерия Фишера оценивается значимость линейных регрессионных моделей. Для оценки значимости линейных регрессионных моделей выполняется сравнение полученного фактического значения Fфакт и табличного значения Fтабл F–критерия Фишера.
Фактическое значение F–критерия Фишера определяется по следующей формуле:
где:
– фактическое значение F – критерия Фишера;
– коэффициент детерминации;
n – 2 – степень свободы;
n – число наблюдений.
Фактическое значение Fфакт критерия Фишера сравнивается с табличным значением Fтабл по математической таблице критерия Фишера.
Fтабл – максимальное значение критерия Фишера под влиянием случайных факторов при текущих степенях свободы и уровне значимости a. При Fтабл>Fфакт уравнение регрессии считается незначимым.
22. Для анализа наличия автокорреляции остатков в регрессионных моделях используется критерий Дарбина-Уотсона.
Критерий Дарбина-Уотсона используется для сравнения фактической величины критерия Дарбина-Уотсона с теоретическими значениями для заданного числа наблюдений n, и уровня значимости a.
Автокорреляцией остатков модели регрессии (случайных ошибок регрессионной модели) называется корреляционная зависимость между настоящими и прошлыми значениями остатков.
Критерий Дарбина-Уотсона рассчитывается по следующей формуле:
где:
– критерий Дарбина-Уотсона;
– сумма квадратов разницы величин ;
– сумма квадратов остатка ;
– остаток в i-м наблюдении;
– квадрат остатка в i–м наблюдении;
– остаток в (i–1) –м наблюдении.
Для надежного вывода используются значения по математической таблице критерия Дарбина-Уотсона и следующие правила:
Глава 3. Определение прогнозного значения показателя доходы населения, использованные на потребление
23. Для определения прогнозного значения показателя доходы населения, использованные на потребление, используется метод экспоненциального сглаживания с учетом тренда и сезонности по методу Хольта-Винтерса.
Метод Хольта-Винтерса учитывает сезонность и тренд в прогнозе индикаторов за период меньше года (месячной, квартальной периодичностью) и используется для уменьшения ошибок прогнозирования при сезонных колебаниях. Для учета сезонных вариаций применяется дополнительное уравнение, и полностью метод Хольта-Винтерса описывается четырьмя уравнениями:
1) формула экспоненциально сглаженного ряда:
где:
– экспоненциальный сглаженный ряд в текущем моменте времени t;
– постоянная величина сглаживания;
– сезонность в исходных данных;
– длительность периода сезонного колебания;
– экспоненциальный сглаженный ряд в предыдущем моменте времени (t–1);
– тренд в предыдущем моменте времени (t–1).
Уравнение (18) корректирует сглаженные ряды.
2) оценка тренда
,где:
– тренд (основная тенденция ряда);
– постоянная величина сглаживания для тренда;
– экспоненциальный сглаженный ряд в текущем моменте времени t;
– экспоненциальный сглаженный ряд в предыдущем моменте времени (t–1);
– тренд в предыдущем моменте времени (t–1).
3) оценка сезонности
где:
– сезонное колебание ряда сезонности в текущем моменте времени t;
– постоянная величина сглаживания для сезонности;
– значение данных в текущем моменте времени t;
– экспоненциальный сглаженный ряд в текущем моменте времени t;
– сезонное колебание ряда сезонности в моменте времени (t–s).
4) прогноз на р периодов вперед
,где:
– значения прогнозных данных на p будущих периодов;
– экспоненциальный сглаженный ряд в текущем моменте времени t;
p – периоды;
– тренд в текущем моменте времени t;
– сезонное колебание ряда сезонности в моменте времени (t–s+p).
Начальное значение сглаженного ряда принимается равным первому наблюдению, а тренд берется со значением равным нулю. Оценки сезонности устанавливаются равными единице.
После определения начального значения сглаженного ряда, рассчитывается значение сглаженного ряда на следующий год – (t+1) и определяется значение тренда соответствующего периода (t+1).
После тренда вычисляется оценка сезонности. Оценка сезонности соответствующего периода рассчитывается начиная с периода (t+s). Первые оценки сезонности s используют равными единице. После расчета количества оценок n, рассчитываются прогнозные данные
на будущие периоды p (количество периодов p совпадает с длительностью периода сезонного колебания s) по формуле (21).В формуле (21) параметры
и используются как константы и не изменяются при их подсчете. Изменяемыми данными выступают параметр p (периоды), начиная с единицы, и оценки сезонности, начиная с периода (t-s+p).В результате формируются периоды p прогнозных данных по определенному показателю уровня жизни (например, квартальные показатели доходов населения, использованные на потребление).
24. Данная модель расчетов по формированию прогнозных показателей аналогично применяется относительно других показателей уровня жизни.