Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

Adamadziev K.R.

Применение методов корреляционно-регрессионного анализа с выполнением расчетов на ПЭВМ позволяет выявить и оценить связи, зависимости и динамические тенденции между социально-экономическими показателями регионов. Данные в разрезе регионов за разные годы выступают как генеральная совокупность, компьютерный вариант которых можно рассматривать как базу данных.

Корреляционно-регрессионный анализ предусматривает, в первую очередь, выявление наличия корреляционной связи и определение ее уровня (степени). Наиболее простым, широко рассматриваемым и достаточно строго обоснованным для случая совместного нормального распределения является линейный вид. Показатель, выражающий уровень (степень) корреляционной зависимости в этом случае принято называть коэффициентом корреляции. Универсальные прикладные программы (например, MS Excel) позволяют рассчитывать коэффициенты корреляции как для каждой пары показателей (коэффициент парной корреляции), так и для всех пар показателей одновременно (корреляционная матрица).

По корреляционной матрице можно:

- оценить степень тесноты связи (зависимости) каждого показателя от каждого из остальных (как известно, коэффициент линейной парной корреляции может принимать значения от -1 до 1, т.е. -1< rij <1. При этом, чем ближе значение rij к единице или минус единице, тем степень тесноты связи выше, при rij=0 - корреляция отсутствует, а при rij=±1 - связь является полной или функциональной [2, с.30]);

- выявить направление связи, которое может быть положительным или отрицательным (если -1<rij<0, то с ростом значений одного из показателей значения другого уменьшаются; если же 0< rij <1, то с ростом значений одного из них значения другого тоже растут).

Важным вопросом корреляционного анализа является вопрос о характере или тесноте связи. В [2. c.30] приведены следующие четыре градации связи: до ±0,3 - отсутствует; от ±0,3 до ±0,5 - слабая; от ±0,5 до ±0,7 - умеренная; от ±0,7 до ±1,0 - сильная.

Нами предлагается градация из шести уровней: до ±0,17 - неудовлетворительная; от ±0,17 до ±0,34 - удовлетворительная; от ±0,34 до ±0,51 - нижесредняя; от ±0,51 до ±0,68 - средняя; от ±0,68 до ±0,85 - вышесредняя; ±0,85 и более - высокая. Почему именно на 0,17 отличаются уровни градации? Поскольку теснота линейного вида связи не зависит от знака коэффициента корреляции, а зависит только от его величины, то правомерно длину шкалы деления принять за единицу и разделить ее на число градаций (в нашем случае равной шести), т.е. 1:6≈0,17.

С помощью корреляционной матрицы можно проводить ряд видов оценок: определить и сравнить средние арифметические значения коэффициентов корреляции для каждого из показателей корреляционной матрицы; определить направления связей (положительных и отрицательных) и их количество; проранжировать показатели по степени корреляционной связи в порядке возрастания или убывания силы связи.

Методика построения корреляционной матрицы, расчета на ее основе средних арифметических значений коэффициентов корреляции и проведения других видов оценок не зависит от числа регионов, включаемых в исследуемую группу. Следовательно, при необходимости многократного выполнения расчетов целесообразно построить компьютерную модель корреляционной матрицы на примере любой одной группы регионов, а затем на ее основе выполнять аналитические расчеты для любых групп регионов.

Исходный вид компьютерной модели, созданной в MS Excel, для построения корреляционной матрицы, матрицы ее абсолютных значений, а также для расчета суммарных и средних значений коэффициентов корреляции иллюстрирует таблица 1. Ячейки со значениями 0,000 - это ячейки с формулами для расчетных столбцов и для расчетных строк.

Средние арифметические значения коэффициентов корреляции позволяют провести сравнительную оценку степени тесноты корреляционной связи каждого из показателей от совокупности всех остальных. Так, в соответствии с нашими расчетами по степени тесноты связи показатели регионов Южного федерального округа расположились в следующей последовательности (в порядке убывания средней величины коэффициента корреляции):

- ВРП, стоимость основных фондов, среднегодовая численность занятых в экономике, оборот розничной торговли, численность населения, объем продукции сельского хозяйства, инвестиции в основной капитал, сальдированный финансовый результат - от 0,85 до 0,80;

- объем продукции промышленности, ввод общей площади жилых домов, среднедушевые денежные расходы - от 0,80 до 0,75;

- среднедушевые денежные доходы, площадь территории, среднемесячная номинальная заработная плата - от 0,75 до 0,60;

- индекс потребительских цен - на предельно низком уровне 0,19.

Поскольку компьютерная модель предназначена для многоразового применения, то построенную для каждой группы регионов корреляционную матрицу с расчетными строками и столбцами по определению средних арифметических значений коэффициентов корреляции следует копировать и сохранять в MS Word для их последующего анализа и применения.

Таблица 1

Компьютерная модель для построения корреляционной матрицы и расчета средних арифметических значений коэффициентов корреляции для социально-экономических показателей регионов

 

Sтер

Чнас

 

 

...

зарп

врп

оф

 

 

...

Сумма строк

 Сумма строк и столбцов

Сред.

ариф

 

 

Корреляционная матрица

 

 

 

Sтер

 

 

 

 

 

 

 

 

 

 

Чнас

 

 

 

 

 

 

 

 

 

0,000

...

...

...

...

...

...

...

...

 

 

...

зарп

 

 

 

 

 

 

 

 

 

0,000

врп

 

 

 

 

 

 

 

 

 

0,000

оф

 

 

 

 

 

 

 

 

 

0,000

...

...

...

...

...

...

...

...

...

 

 

 Сред.ариф.

0,000

0,000

...

0,000

0,000

 0,000

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sтер

Чнас

...

зарп

врп

оф

 

 

 

 

 

Преобразование корреляционной матрицы с помощью функции «ABS»

 

 

 

Sтер

0

 

 

 

 

 

 

0,000

0,000

 

Чнас

0,000

0

 

 

 

 

 

0,000

0,000

 

...

...

...

...

...

...

...

...

...

...

 

зарп

0,000

0,000

...

0

 

 

 

0,000

0,000

 

врп

0,000

0,000

...

0,000

0

 

 

0,000

0,000

 

оф

0,000

0,000

...

0,000

0,0000

0

 

0,000

0,000

 

...

...

...

...

...

...

...

...

...

...

 

 Сумма столбцов

0,000

0,000

...

0,000

0,000

0,000

...

 

 

 

 Сумма столбцов и строк

0,000

0,000

...

0,000

0,000

0,000

...

 

 

 

Отличительной особенностью парной линейной корреляции является возможность определения направления связи по знакам коэффициентов корреляции. Процедура определения количества положительных и отрицательных связей существенно облегчается и упрощается, если к вышепостроенной компьютерной модели корреляционной матрицы добавить новый блок-модель по определению количества показателей, оказывающих положительное и отрицательное влияние. Блок-модель - аналог корреляционной матрицы, создаваемый на ее основе с помощью математической функции «знак» из MS Excel. Чтобы определить количество положительных и отрицательных коэффициентов в блок-модель вводятся две строки соответственно, ячейки которых заполняются с помощью встроенной математической функции «СУММЕСЛИ» MS Excel.

Анализ корреляционных связей существенно облегчается, если каждый показатель корреляционной матрицы проранжировать по степени корреляционной связи в порядке возрастания или убывания ее силы. Этот процесс является более трудоемким, чем выше выполненные расчеты, включая построение корреляционной матрицы. Во-первых, требуется корреляционную матрицу заполнить полностью (т.е. заполнить ее вторую часть). Во-вторых, ранжирование по уровню их корреляционной связи приходится выполнять для каждого показателя в отдельности.

Построить вторую часть корреляционной матрицы можно, используя формулы типа «содержимое ячейки на пересечении строки 1 и столбца 2 равно содержимому ячейки на пересечении строки 2 и столбца 1», т.е. r12=r21. Вторую часть корреляционной матрицы с формулами присвоения целесообразно сначала разместить под первой частью. Затем эта таблица копируется и сохраняется в MS Word. Поскольку в MS Word скопировались не формулы, а числа, то данные нижней части таблицы следует разместить в незаполненные ячейки корреляционной матрицы. Перекинув корреляционную матрицу из Word обратно в Excel, можно перейти к процедуре ранжирования. Ранжирование проводится по каждому показателю в отдельности. При этом требуется по два столбца: первый для наименований показателей, второй - для численных значений коэффициентов корреляции.

Для сравнительного анализа полученных результатов ранжирования их удобно свести в две таблицы. В 1-й из этих таблиц приводится последовательность расположения наименований показателей в порядке возрастания величин коэффициентов корреляции каждого из них с показателем, приведенным в шапке таблицы,
а во 2-й таблице - соответствующие численные значения коэффициентов корреляции.

В последней строке 2-й таблицы приводится также количество показателей, для которых уровень тесноты связи с показателем, приведенным в шапке таблицы, является значимым.

С помощью разработанной компьютерной модели нами построены корреляционные матрицы для регионов России в разрезе федеральных округов по данным за 2006 и2007 гг. Поскольку Уральский федеральный округ представлен всего 4-мя регионами (т.е. выборка мала по сравнению с другими округами), то дополнительно нами построены корреляционные матрицы, объединив регионы двух округов - Приволжского и Уральского, экономические условия и потенциалы которых наиболее близки друг другу.

Проанализируем особенности тесноты связи показателей по Южному федеральному округу. По средним значениям коэффициентов корреляции для «площади территории» и «численности населения» ЮФО занимает 1-2 места среды федеральных округов, а для «индекса потребительских цен» - предпоследнее.

По коэффициентам корреляции для объемных результативных показателей за оба года ЮФО занимал следующие места: «валовой региональный продукт» - 1-е, «продукции промышленности» - 4-е, «продукция сельского хозяйства» - 1-е, «оборот розничной торговли» - 1-е, «сальдированный финансовый результат» - 3-е.
В 2006 г. эти коэффи-циенты были в пределах от 0,718 («сальдированный финансовый результат») до 0,829 («валовой региональный продукт»), а в 2007 г. - от 0,791 («продукции промышленности») до 0,851 («валовой региональный продукт»). Следует особо отметить, что коэффициенты корреляции для показателя «продукция сельского хозяйства» являются для ЮФО самыми высокими среди всех федеральных округов (0,784 в 2006 г. и 0,808 в 2007 г.).

По уровню тесноты связи каждого из ресурсных показателей со всеми остальными ЮФО является абсолютным лидером: для показателей «среднегодовая численность занятых в экономике» и «среднегодовая стоимость основных фондов в экономике» оба года занимал 1-е места, а для показателя «инвестиции в основной капитал» - 3-и места. В 2006 г. численные значения коэффициентов корреляции для трех ресурсных показателей были в пределах 0,799-0,827, а в 2007 г. - 0,805-0,851.

Особенность регионов ЮФО - численные значения коэффициентов корреляции для объемных результативных и ресурсных показателей находились оба года практически в одних и тех же пределах. Значимость их по нашей градации - «вышесредняя».

По тесноте связи трех социальных показателей («среднедушевые денежные доходы», «среднедушевые денежные расходы», «среднемесячная номинальная заработная плата работников») ЮФО оба года уступал ЦФО, ПФО и УФО, а показателю «ввод в действие общей площади жилых домов» - занимал 2-е место после ЦФО. По тесноте связи социальные показатели ЮФО заметно уступают объемным результативным и ресурсным показателям.

Средние значения коэффициентов корреляции по группам объемных результативных
(5 показателей), ресурсных (3), социальных (4), а также средних по 12 и 15 показателям для страны в целом и в разрезе федеральных округов приведены в таблице 2. В этой таблице указаны также занимаемые федеральными округами места.

В соответствии с этими данными можно сделать следующие выводы:

- 1, 2 и 3 места для результативных и ресурсных показателей за оба года занимали соответственно ЮФО, ПФО и ЦФО; 7-е место по результативным, 6-е место по ресурсным - у СЗФО, 6-е место по результативным, 7-е место по ресурсным - у ДВФО;

- по усредненным коэффициентам корреляции для социальных показателей федеральные округа за оба года занимали одни и те же места;

- для всех округов, кроме ДВФО, усредненные коэффициенты корреляции для ресурсных показателей за оба рассматриваемых года больше, чем для объемных результативных. Коэффициенты корреляции для объемных резельтативных, в свою очередь, больше, чем для социальных показателей;

- по коэффициентам корреляции для 12 и 15 показателей картина примерно одна и та же за оба года; федеральные округа расположились в следующей последовательности: ПФО, ЮФО, ЦФО, УФО, СФО, ДВФО, СЗФО.

Таблица 2

Усредненные значения коэффициентов корреляции и места,
занимаемые федеральными округами по их величине

 

Усредненные величины
коэффициентов корреляции

Места по усредненным
коэффициентам

 

Рез (5)

Рес (3)

Соц (4)

 

По 12 показат

 

По 15 показат

рез

рес

соц

 

По 12 показат

 

По 15 показат

 2006

 

 

 

 

 

 

 

 

 

 

Россия

0,560

0,603

0,352

0,571

0,489

 

 

 

 

 

ЦФО

0,745

0,799

0,597

0,823

0,686

3

3

2

2

4

СЗФО

0,582

0,634

0,342

0,575

0,517

7

6

7

7

7

ЮФО

0,780

0,817

0,524

0,807

0,709

1

1

4

3

1

ПФО

0,772

0,806

0,583

0,827

0,707

2

2

3

1

2

УФО

0,675

0,725

0,621

0,787

0,690

5

5

1

4

3

СФО

0,691

0,762

0,503

0,745

0,662

4

4

5

5

5

ДВФО

0,623

0,557

0,397

0,587

0,539

6

7

6

6

6

ПФО+УФО

0,684

0,732

0,597

0,782

0,682

 

 

 

 

 

2007

 

 

 

 

 

 

 

 

 

 

Россия

0,571

0,602

0,361

0,581

0,497

 

 

 

 

 

ЦФО

0,752

0,805

0,619

0,838

0,686

3

3

2

3

4

СЗФО

0,521

0,598

0,324

0,533

0,482

7

6

7

7

7

ЮФО

0,814

0,832

0,566

0,846

0,735

1

1

4

2

1

ПФО

0,788

0,815

0,612

0,851

0,721

2

2

3

1

3

УФО

0,726

0,745

0,643

0,826

0,734

4

5

1

4

2

СФО

0,703

0,753

0,517

0,752

0,656

5

4

5

5

5

ДВФО

0,568

0,569

0,356

0,555

0,495

6

7

6

6

6

ПФО+УФО

0,713

0,744

0,615

0,806

0,708

 

 

 

 

 

В заключение перечислим элементы разработанного нами компьютерного модельного комплекса для анализа корреляционных связей между социально-экономическими показателями для различных групп регионов:

- базу данных социально-экономических показателей России в разрезе регионов за 2002-2007 гг., созданная нами в виде совокупности таблиц в MS Excel по принципу одна таблица для данных за один год;

- модель корреляционной матрицы, созданная, используя функцию «Корреляция» из инструментария «Анализ данных» MS Excel;

- модель для преобразования корреляционной матрицы в матрицу ее абсолютных значений, созданная, используя математическую функцию «ABS» «Мастера функций» из MS Excel;

- модель для расчета средних арифметических значений коэффициентов корреляции для каждого социально-экономического показателя от остальных, созданная, используя формулы расчета суммарных и средних значений для комбинаций строк и столбцов;

- модель для определения количества положительных и отрицательных значений коэффициентов корреляции в корреляционной матрице, созданная, используя математические функции «знак» и «СУММЕСЛИ» «Мастера функций» из MS Excel;

- модель формирования полной корреляционной матрицы, созданная, используя: а) формулу присвоения «содержимое ячеек строки i равно содержимому ячеек столбца j при i=j в MS Excel; б) процедуру экспорта-импорта из MS Excel в MS Word и обратно для преобразования формул в числовые значения, получаемые на их основе; в) процедуру «вырезать-вставить» числовых значений ячеек из одной строки в другую, которую можно выполнять как в MS Excel, так и в MS Word;

- модель ранжирования абсолютных значений коэффициентов корреляции в порядке их возрастания или убывания, созданная, используя процедуры: а) «Сортировка от А до Я» из инструментария «Данные» MS Excel; б) «вырезать-вставить» значений ячеек из одних столбцов в другие.

СПИСОК ЛИТЕРАТУРЫ

1. Россия в цифрах, 2004, 2005, 2006, 2007, 2008: Крат. Стат. Сб. / Росстат. - М., 2004. -
431 с., 2005. - 477 с., 2006. - 485 с., 2007. - 494 с., 2008. - 510 с.

2. Эконометрика: учебное пособие в схемах и таблицах / Н.М. Гореева, Л.Н. Демидова, Л.М. Клизогуб, С.А. Орехов, Н.А. Сердюкова, С.Т. Швецова; под ред.С.А. Орехова. -М.: Эксмо, 2008. -224с.