В стратегии развития Российской Федерации до 2030 года и на перспективу до 2036 года основными целями национального развития отечественной экономики являются «укрепление экономического суверенитета, увеличение численности населения страны и повышение уровня жизни граждан» [1, с. 1]. Авторы настоящей публикации в более ранних научных трудах исследовали динамику ряда показателей уровня развития ряда региональных субъектов [2, 3]. В ходе проведенных исследований с целью выявления тенденций развития хозяйствующих субъектов были построены математические модели, характеризующие особенности развития региональных субъектов. При этом систематически возникал вопрос об уровне надежности и достоверности построенных математических моделей и степени доверия к полученным результатам исследования.
Целями исследования являются обобщение и систематизация методологических подходов и методики оценки качества математических моделей для решения широкого круга прикладных задач с использованием современных цифровых технологий.
Материалы и методы исследования
При проведении исследования в качестве материалов использовались статистические данные по показателям социально-экономического развития региональных субъектов в интервале 2010–2022 гг.
Для получения достоверных результатов применялись методы математической статистики и теории вероятностей, метод статистических наблюдений и выборочных совокупностей, методы стохастического моделирования с использованием инструментария корреляционно-регрессионного анализа. Статистические расчеты и анализ полученных результатов осуществлялись в среде SPSS Statistics.
Результаты исследования и их обсуждение
Для построения математических моделей показателей социально-экономического развития региональных субъектов представляется целесообразным использование инструментария корреляционно-регрессионного анализа, базирующегося на методах математической статистики и теории вероятностей.
Для оценки уровня социально-экономического развития регионального субъекта может быть использована многофакторная регрессионная модель, которая может быть записана в общем виде:
, (1)
где y(t) – значение результативного признака, характеризующего уровень социально-экономического развития регионального субъекта;
f – функция зависимости результативного признака и экзогенных факторов-регрессоров;
– набор экзогенных факторов-регрессоров;
ε(t) – стохастическая компонента, характеризующая различного рода технические погрешности и влияние случайных факторов.
Определение параметров уравнения множественной линейной регрессии может быть осуществлено с использованием метода наименьших квадратов. Важным моментом при осуществлении спецификации модели является построение системы показателей для выбора факторов-регрессоров. При этом необходимо провести оценку корреляционных зависимостей между эндогенной переменной и экзогенными факторами-признаками.
Корреляционная матрица имеет вид:
, (2)
где ryxi – коэффициент корреляции, характеризующий влияние соответствующего фактора-регрессора на зависимую переменную;
rxixj – коэффициент парной корреляции между экзогенными переменными, рассматриваемыми в качестве факторов-регрессоров, оценивающий величину их взаимного влияния [4].
Для определения величины коэффициента парной корреляции между результативным признаком и фактором-регрессором может быть также использована формула:
, (3)
где – сумма квадратов отклонений моделируемых значений результативного признака, обусловленная влиянием фактора-регрессора, от среднего значения y, рассчитанного по эмпирическим данным;
– общая сумма квадратов отклонений эмпирических значений признака y относительно его среднего значения.
Метод наименьших квадратов позволяет определить параметры модели регрессии. В общем случае нахождение параметров множественной регрессии сводится к нахождению минимума функции G, характеризующей сумму отклонений эмпирических данных от моделируемых значений результативного признака с использованием регрессионной модели:
, (4)
где f – функция, характеризующая математическую форму измерения разброса эмпирических данных относительно моделируемых значений. В большинстве случаев в качестве математической формы используется квадрат разброса эмпирических и моделируемых значений результативного признака.
После осуществления этапа параметризации регрессионной модели необходимо осуществить исследование качества и достоверности разработанной регрессионной модели. С этой целью необходимо провести анализ ряда следующих характеристик.
Для оценки общего качества уравнения регрессии традиционно используется коэффициент детерминации, значение которого может быть определено по формуле:
, (5)
где
(6)
– величина дисперсии остатков, характеризующих отклонения фактических и расчетных (моделируемых) значений эндогенной переменной;
(7)
– величина общей дисперсии, характеризующей величину отклонений фактических значений признака-результата относительно среднего значения результативного признака.
Значение коэффициента детерминации может изменяться в пределах [0–1], и, чем ближе его значение к 1, то есть чем меньше соотношение остаточной и общей дисперсии, тем более высоким признается общее качество построенного уравнения регрессии.
Для оценки статистической значимости уравнения регрессии и достоверности полученных результатов рекомендуется использовать величину F-критерия Фишера, значение которого может быть рассчитано как отношение факторной и остаточной дисперсии результативного признака:
(8)
где
(9)
– факторная дисперсия.
Для оценки величины F-критерия Фишера также можно применить следующую формулу:
, (10)
где n – длина временного ряда результативного признака, отражающая количество исследуемых наблюдений,
m – количество факторных признаков, включенных в уравнение регрессии.
Полученное расчетным путем значение F-критерия Фишера соотносят с его критическим значением, при этом необходимо учесть заданный уровень значимости α(0,05 или 0,01) и число свободы , . Если Fфакт > Fтабл , то полученное уравнение регрессии признается статистически значимым, в противном случае уравнение регрессии признается статистически не значимым, и необходимо пересмотреть набор факторов-регрессоров [5].
Третьим направлением в оценке качества регрессионного уравнения является оценка статистической значимости факторов-регрессоров, которая может быть выполнена с использованием t-критерия Стьюдента по следующей формуле:
, (11)
где bi – коэффициенты регрессии при факторных признаках;
– величина стандартной ошибки коэффициента регрессии при соответствующем факторе-регрессоре.
Расчетное значение t-критерия Стьюдента сравнивается с критическим значением критерия, определенным с учетом степеней свободы n-m и заданной вероятности расчетов α (0,01; 0,05). Если расчетное значение t-критерия превышает критическое, то делается вывод о статистической значимости соответствующего параметра регрессии и статистической значимости фактора-регрессора и правомерности его включения в регрессионное уравнение [6].
Данный математический аппарат реализован в среде SPSS Statistics, которая была использована при анализе уровня социально-экономического развития Смоленской области в динамике за 2010–2022 годы. В качестве результативного признака Y(t) по усмотрению исследователей был выбран показатель «валовой региональный продукт на душу населения», характеризующий уровень развития региона в целом. В качестве факторов-регрессоров по усмотрению исследователей выбраны следующие экзогенные переменные: стоимость основных фондов (Х1, млн руб.), численность населения региона (Х2, тысяч), численность занятого населения (Х3, тысяч), средняя заработная плата по региону (Х4, тыс. руб.), инвестиции в основные фонды (Х5, млн руб.).
Для выявления корреляционной зависимости обозначенной системы показателей была использована функция «Корреляция» SPSS Statistics. Фрагмент реализации данной операции представлен следующим образом:
GET DATA
/TYPE=XLSX
/FILE=’C:\Users\Desktop\!2024\Стат данные.xlsx’
/SHEET=name ‘Лист1’
/CELLRANGE=FULL
/READNAMES=ON
/DATATYPEMIN PERCENTAGE=95.0
/HIDDEN IGNORE=YES.
EXECUTE.
DATASET NAME Наборданных2 WINDOW=FRONT.
CORRELATIONS
/VARIABLES=YВРП X1СОС X2ЧН X3ЧЗН X4СЗП X5ИОС
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Фрагмент полученной матрицы корреляционных зависимостей выбранной системы показателей представлен в таблице 1.
Таблица 1
Итоги расчетов корреляционных зависимостей системы показателей
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|
Y |
1 |
,955** |
-,993** |
-,880** |
,995** |
,814** |
X1 |
,955** |
1 |
-,961** |
-,872** |
,961** |
,767** |
X2 |
-,993** |
-,961** |
1 |
,917** |
-,995** |
-,829** |
X3 |
-,880** |
-,872** |
,917** |
1 |
-,903** |
-,855** |
X4 |
,995** |
,961** |
-,995** |
-,903** |
1 |
,828** |
X5 |
,814** |
,767** |
-,829** |
-,855** |
,828** |
1 |
Источник: составлено авторами по [7].
** – коэффициент корреляции признается значимым.
Таблица 2
Результаты построения многофакторной регрессии в SPSS Statistics
Сводка для модели |
||||||||
Модель |
R |
R-квадрат |
Скорректированный R-квадрат |
F |
||||
1 |
,996a |
,993 |
,989 |
267,900 |
||||
a. Предикторы: (константа), X5, X1, X3,X2 |
||||||||
Итоги регрессии |
||||||||
Коэффициенты |
Стандартная ошибка |
Бета- коэффициенты |
t-статистика |
Значимость |
||||
1 |
(Константа) |
3891,711 |
496,502 |
- |
7,838 |
,000 |
||
X1 |
-,001 |
,032 |
-,004 |
-,033 |
,975 |
|||
X2 |
-4,162 |
,505 |
-1,162 |
-8,248 |
,000 |
|||
X3 |
,721 |
,290 |
,210 |
2,488 |
,038 |
|||
X5 |
,001 |
,001 |
,033 |
,533 |
,608 |
|||
a. Зависимая переменная: Y, ВРП |
Источник: составлено авторами
По результатам расчетов можно утверждать, что все выбранные факторы-регрессоры имеют достаточно сильную корреляционную связь с результативным признаком, что подтверждается значением коэффициентов корреляционной связи в интервале (0,814–0,995). Следует отметить, что фактор-регрессор Х4 (средняя заработная плата по региону) по усмотрению исследователей, исходя из экономического смысла, из рассмотрения был исключен. С факторами-регрессорами Х2, Х3 (численность населения региона и численность занятого населения) наблюдается тесная отрицательная связь результативного признака Y (ВРП на душу населения), что свидетельствует об ориентированности экономики региона на интенсивный путь развития, связанный с внедрением инноваций и современных технологий. Показатели Х1 (стоимость основных фондов) и Х5 (инвестиции в основные фонды) имеют устойчивую положительную корреляцию с эндогенной переменной Y (величина ВРП на душу населения). Результаты регрессионной статистики по итогам построения многофакторной модели представлены в таблице 2.
На основании полученных результатов можно записать уравнение множественной регрессии:
Y = 3891,711 – 0,001*Х1 –
– 4,162*Х2+0,721*Х3 + 0,001*Х5 , (12)
которое по F-критерию Фишера, равному 267,9, признается статистически значимым и имеет высокое качество, что подтверждают такие характеристики, как коэффициент детерминации R-квадрат = 0,993, значение которого достаточно близко к 1, и достаточно высокое значение коэффициента R = 0,996 множественной корреляции, характеризующее тесноту связи факторов-регрессоров и эндогенной переменной.
В дополнение к данной модели множественной регрессии, исходя из целей и задачи исследования, могут быть построены следующие модели: многофакторная регрессия только со статистически значимыми факторами-регрессорами, модели парной регрессии от каждого из рассмотренных факторов, что позволит осуществить проведение более детального исследования каждой переменной, входящей в систему рассматриваемых показателей. В дополнение к этому может быть осуществлен трендовый анализ факторов-регрессоров, что позволит в автоматическом режиме в среде SPSS Statistics построить прогнозы по исследуемым показателям и таким способом определить прогнозные значения эндогенной переменной, формируемой под воздействием факторов-регрессоров. По усмотрению исследователей может быть определен другой набор экзогенных переменных для получения различных вариантов регрессионных моделей и повышения достоверности результатов. Выбор лучшей по качеству модели должен осуществляться на основании экономико-статистического анализа рассматриваемой системы показателей, но обязательно с учетом математических методов оценки качества регрессий.
Заключение
Рассмотренные методологические аспекты и методика оценки качества математических моделей актуальны и могут быть использованы для решения широкого круга прикладных задач, в том числе для моделирования и исследования динамики показателей, характеризующих уровень социально-экономического развития региональных субъектов.
Практическая значимость исследования заключается в том, что инвариантные многофакторные регрессионные модели могут быть применены для определения перспективных значений ряда показателей регионов, что актуально при разработке стратегий развития региональных субъектов на краткосрочную и долгосрочную перспективу с использованием математического моделирования и инструментария корреляционно-регрессионного анализа. Использование для построения математических моделей и проведения дальнейшего анализа среды SPSS Statistics, позволяющей автоматизировать большую часть статистических расчетов, отражает общую тенденцию расширения сфер применения цифровых технологий в научных исследованиях и практической деятельности.
Библиографическая ссылка
Гусарова О.М., Денисов Д.Э. ОЦЕНКА КАЧЕСТВА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ В СРЕДЕ SPSS STATISTICS // Современные наукоемкие технологии. – 2024. – № 6. – С. 20-24;URL: https://top-technologies.ru/ru/article/view?id=40058 (дата обращения: 10.12.2024).