Корреляционный анализ экономических показателей
Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле: Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что коэффициенты — незначимы. Для их нахождения… Читать ещё >
Корреляционный анализ экономических показателей (реферат, курсовая, диплом, контрольная)
Построение матрицы парных коэффициентов корреляции
Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Отдельный выборочный коэффициент корреляции rij между двумя выбранными признаками Xi и Xj в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН. Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных. Елисеева И. И. Общая теория статистики: учебник для вузов / И. И. Елисеева, М. М. Юзбашев; под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2006. — с. 106.
Итак, получаем матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).
Таблица 2. Матрица парных коэффициентов корреляции исследуемых экономических показателей.
Y. | X8 | X10 | X15 | X16 | |
Y. | 0,688 511. | 0,450 862. | — 0,32 518. | — 0,21 266. | |
X8 | 0,688 511. | — 0,0929. | — 0,3302. | — 0,41 979. | |
X10 | 0,450 862. | — 0,0929. | 0,8 075. | 0,278 902. | |
X15 | — 0,32 518. | — 0,3302. | 0,8 075. | 0,206 628. | |
X16 | — 0,21 266. | — 0,41 979. | 0,278 902. | 0,206 628. |
Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таблица 3).
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.
Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50−2=48.
Можно найти значения tкр по таблицам математической статистики. Получаем tкр= 2,10 635.
Таблица 3. Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей.
tнабл | Y. | X8 | X10 | X15 | X16 |
Y. | 6,57 746. | 3,49 954. | — 2,38 235. | — 1,50 784. | |
X8 | 6,57 746. | — 0,64 641. | — 2,42 367. | — 3,20 439. | |
X10 | 3,49 954. | — 0,64 641. | 0,5 595. | 2,1 213. | |
X15 | — 2,3824. | — 2,42 367. | 0,5 595. | 1,46 313. | |
X16 | — 1,50 784. | — 3,20 439. | 2,1 213. | 1,46 313. |
По результатам, представленным в таблице 3, наблюдаемое значение t-статистики больше критического tкр по модулю для парных коэффициентов корреляции. Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.
Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что коэффициенты — незначимы.
Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50−2=48.
По таблице rкр (б=0,05; н=48)=0,273.
Если соответствующий коэффициент |rij|>rкр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые.
Таблица 4. Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05).
Y. | X8 | X10 | X15 | X16 | |
Y. | 0,688 511. | 0,45 086. | — 0,32 518. | — 0,21 266. | |
X8 | 0,688 511. | — 0,9 290. | — 0,3302. | — 0,41 979. | |
X10 | 0,450 862. | — 0,0929. | 0,8 075. | 0,278 902. | |
X15 | — 0,32 518. | — 0,3302. | 0,807. | 0,206 628. | |
X16 | — 0,21 266. | — 0,41 979. | 0,27 890. | 0,206 628. |
Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий: Елисеева И. И. Общая теория статистики: учебник для вузов / И. И. Елисеева, М. М. Юзбашев; под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2006. — с. 167.
1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr, являющееся гиперболическим арктангенсом r:
Для этого в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция — нечетная, т. е. Z (-r)= - Z®. Можно найти значение Zr и по таблице Z-преобразования Фишера.
2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. — значение функции Лапласа.
Для нахождения значения tг можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F (t):
.
Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в, а по этому значению уже вычислять t.
В нашем случае для надёжности г=0,95: F (t)=0,975; tг =1,959 964.
Находим.
3). Zmin и Zmax Теперь можно найти Zmin и Zmax:
Zmin = Zr — ДZ; Zmax= Zr + ДZ.
4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax, соответствующие Zmin и Zmax.
Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax:
.
Для их нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Zmin и Zmax. Можно найти значения сmin и сmax и по таблице Z-преобразования Фишера.
Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.
Таблица 5. Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95.
r. | Zr | Zmin | Zmax | сmin | сmax | |
yx8 | 0,688 511. | 0,845 119. | 0,559 229. | 1,131 009. | 0,507 405. | 0,811 364. |
yx10 | 0,450 862. | 0,485 782. | 0,199 891. | 0,771 672. | 0,197 271. | 0,6479. |
yx15 | — 0,32 518. | — 0,33 742. | — 0,62 331. | — 0,5 153. | — 0,55 343. | — 0,5 149. |
x8x15 | — 0,3302. | — 0,34 306. | — 0,62 895. | — 0,5 717. | — 0,55 733. | — 0,5 711. |
x8x16 | — 0,41 979. | — 0,44 744. | — 0,73 333. | — 0,16 155. | — 0,6251. | — 0,16 015. |
x10x16 | 0,278 902. | 0,286 491. | 0,601. | 0,572 381. | 0,601. | 0,517 106. |
Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:
P (-0,507 405? сYX8? 0,811 364)=0,95.
P (0,197 271? сYX10? 0,6479)=0,95.
P (-0,55 343? сYX15? -0,5 149)=0,95.
P (-0,55 733? сX8X15? -0,5 711)=0,95.
P (-0,6251? сX8X16? -0,16 015)=0,95.
P (0,601? сX10X16? 0,517 106)=0,95.
По полученным данным можно сделать следующие выводы:
Между исследуемыми показателями выявлены значимые корреляционные зависимости.
- 1) Значимая корреляционная прямая взаимосвязь обнаружена между изучаемым признаком Y — рентабельностью и факторными признаками X8 — премиями и вознаграждениями на одного работника и X10 — фондоотдачей.
- 2) Между рентабельностью (Y) и оборачиваемостью нормируемых оборотных средств (X15) существует обратная умеренная связь.
- 3) Более умеренная обратная связь существует между факторным признаком X8 — премиями и вознаграждениями на одного работника и факторными признаками X15 — оборачиваемостью нормируемых оборотных средств и X16 — оборачиваемостью ненормируемых оборотных средств.
- 4) Так же умеренная прямая взаимосвязь обнаружена между X10 — фондоотдачей и X16 — оборачиваемостью ненормируемых оборотных средств.