Оценка параметров уравнения регрессии
Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации меньше индекса детерминации. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Иначе обстоит дело, когда… Читать ещё >
Оценка параметров уравнения регрессии (реферат, курсовая, диплом, контрольная)
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции ryt. Существуют разные модификации формулы линейного коэффициента корреляции.
Следует иметь в виду, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых признаков в её линейной форме. Поэтому близость абсолютной величины линейного коэффициента корреляции к нулю ещё не означает отсутствия связи между признаками.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции ryt2, называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака уt, объясняемую регрессией, в общей дисперсии результативного признака.
Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции R.
Парабола второго порядка, как и полином более высокого порядка, при лианеризации принимает вид уравнения множественной регрессии. Если же нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадёт с индексом корреляции.
Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков даёт лишь приближённую оценку тесноты связи и численно не совпадает с индексом корреляции. Так, для степенной функции.
ух = ахb
после перехода к логарифмически линейному уравнению.
lny = lna + blnx.
может быть найден линейный коэффициент корреляции не для фактических значений переменных х и у, а для их логарифмов, то есть rlnylnx. Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для у, а для его логарифмов:
Между тем при расчёте индекса корреляции используются суммы квадратов отклонений признака у, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, то есть, как антилогарифм рассчитанной по уравнению величины и остаточная сумма квадратов как.
В знаменателе расчёта R2yx участвует общая сумма квадратов отклонений фактических значений у от их средней величины, а в расчёте r2lnxlny участвует. Соответственно различаются числители и знаменатели рассматриваемых показателей:
- — в индексе корреляции и
- — в коэффициенте корреляции.
Вследствие близости результатов и простоты расчётов с использованием компьютерных программ для характеристики тесноты связи по нелинейным функциям широко используется линейный коэффициент корреляции.
Несмотря на близость значений R и r или R и r в нелинейных функциях с преобразованием значения признака у, следует помнить, что если при линейной зависимости признаков один и тот же коэффициент корреляции характеризует регрессию, как следует помнить, что если при линейной зависимости признаков один и тот же коэффициент корреляции характеризует регрессию как, так и, так как, то при криволинейной зависимости для функции y=j (x) не равен для регрессии x=f (y).
Поскольку в расчёте индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину для нелинейных связей называют индексом детерминации.
Оценка существенности индекса корреляции проводится, так же как и оценка надёжности коэффициента корреляции.
Индекс корреляции используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера.
Величина m характеризует число степеней свободы для факторной суммы квадратов, а (n — m — 1) — число степеней свободы для остаточной суммы квадратов.
Для степенной функции m = 1 и формула F — критерия примет тот же вид, что и при линейной зависимости:
Для параболы второй степени.
y = a0 + a1 x + a2 x2 +еm = 2.
Расчёт F-критерия можно вести и в таблице дисперсионного анализа результатов регрессии, как это было показано для линейной функции.
Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации меньше индекса детерминации. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию.
Практически, если величина разности между индексом детерминации и коэффициентом детерминации не превышает 0,1, то предположение о линейной форме связи считается оправданным.
Если t факт >t табл, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Практически, если величина t < 2, то различия между Ryx и ryx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.