Идентификация формы распределения результата
Иногда вместо проверки с односторонней критической областью применяют проверки с двусторонними критическими областями. При этом оценивается вероятность P{qн2<2q2} = q находят 12 при уровне значимости q, и числе степеней свободы v и 22 уровня значимости 1 — q2 и том же n…
Читать ещё >
Идентификация формы распределения результата (реферат, курсовая, диплом, контрольная)
В качестве приближенного метода проверки нормальности распределения применяют метод, связанный с оценками центральных моментов третьего и четвертого порядков. В случае нормальности распределения должны выполняться приближенные равенства:
;
Для удобства сравнения подсчитывают безразмерные характеристики показатель асимметрии и эксцесс .
Обе эти характеристики должны быть малы, если распределение нормально. О малости этих характеристик обычно судят по сравнению с их средними квадратическими ошибками соответственно равными:
— для асимметрии,.
— для эксцесса.
Если хотя бы одна из указанных характеристик по абсолютной величине значительно (2−3 раза) превосходит свою среднюю квадратическую ошибку, то нормальность закона распределения следует подвергнуть сомнению и провести более тщательный анализ результатов наблюдений (например, с помощью критерия Пирсона).
В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия, предложенных разными авторами. Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределения, совпадение с которым определяется. Использование критерия Пирсона возможно при большом числе измерений (п>50) и заключается в вычислении величины 2 (хи-квадрат):
где ni, Ni — экспериментальные и теоретические значения частот в i-м интервале разбиения; m — число интервалов разбиения; Pi— значения вероятностей в том же интервале разбиения, соответствующие выбранной модели распределения; .
При n случайная величина 2 имеет распределение Пирсона с числом степеней свободы v = m — 1- r, где г — число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения г = 2, так как закон однозначно характеризуется указанием двух его параметров — математического ожидания и СКО. Если бы выбранная модель в центрах всех m столбцов совпадала с экспериментальными данными, то все m разностей (ni -Ni) были бы равны нулю, а следовательно, и значение критерия 2 также было бы равно нулю. Таким образом, 2 естьмера суммарного отклонения между моделью и экспериментальным распределением.
Критерий 2 не инвариантен к числу столбцов и существенно возрастает с увеличением их числа. Поэтому для использования его при разном числе столбцов составлены таблицы квантилей распределения 2, входом в которые служит так называемое число степеней свободы v = (m — 1 — r). Чтобы совместить модель, соответствующую нормальному закону, с гистограммой, необходимо совместить координату центра, а для того, чтобы ширина модели соответствовала ширине гистограммы, ее нужно задать как г = 2 и v = m-3.Часть квантилей распределения 2q приведена в таблице № 1.
Если вычисленная по опытным данным мера расхождения 2 меньше определенного из таблицы значения q2, то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т. е. она не противоречит опытным данным. Если же 2выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.
Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем:
* определяют оценки среднего арифметического значения х и СКО.
- * группируют результаты многократных наблюдений по интервалам длиной h, число которых определяют «так же, как и при построении гистограммы;
- * для каждого интервала разбиения определяют его центр xio и подсчитывают число наблюдений П|, попавших в каждый интервал;
- * вычисляют число наблюдений для каждого из интервалов, теоретически соответствующее выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов хi0 производят переход к нормированным серединам zi= (хi0 — x?)/. Затем для каждого значения zi с помощью аналитической модели находят значение функции плотности вероятностей f (zi). Например, для нормального закона
По найденному значению f (zi) определяют ту часть Niимеющихся наблюдений, которая теоретически должна быть в каждом из интервалов Ni = nhf (zi)/, где n — общее число наблюдений;
- * если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединяют с соседним интервалом. После этого определяют число степеней свободы v = m-1-r, где m — общее число интервалов. Если было произведено укрупнение, то m — число интервалов после укрупнения:
- * определяют показатель разности частот 2;
- * выбирают уровень значимости критерия q. Он должен быть небольшим, чтобы была мала вероятность совершить ошибку первого рода. По уровню значимости и числу степеней свободы v по таблице находят границу критической области q2, такую, что P{2>q2} = q. Вероятность того, что полученное значение 2 превышает q2, равна q и мала. Поэтому, если оказывается, что 2 >q2, то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же 2<q2, то гипотеза принимается.
Чем меньше q, тем больше значение q2 (при том же числе степеней свободы v), тем легче выполняется условие 2<q2и принимается проверяемая гипотеза. Но при этом увеличивается вероятность ошибки второго рода. В связи с этим нецелесообразно принимать 0,02.
Иногда вместо проверки с односторонней критической областью применяют проверки с двусторонними критическими областями. При этом оценивается вероятность P{qн2<2<qв2}.Уровень значимости критерия q делится на две части: q = q1 + q2. Как правило, принимают q1 = q2. По таблице № 1 для P{2>q2} = q находят 12 при уровне значимости q, и числе степеней свободы v и 22 уровня значимости 1 — q2 и том же n. Гипотеза о совпадении распределений принимается, если