Малая выборка.
Выборочные наблюдения
Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически нормальным. Необходимо также принимать во внимание и то, что точность результатов выборки малого объема все же ниже, чем при большой выборке. Вероятность выхода ошибки за определенные пределы оценивается на основе… Читать ещё >
Малая выборка. Выборочные наблюдения (реферат, курсовая, диплом, контрольная)
В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме выборочной совокупности .
От него зависит не только величина пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.
При большом числе единиц выборочной совокупности () распределение случайных ошибок выборочной средней в соответствии с теоремой Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.
Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа. Расчет ошибки выборки базируется на величине генеральной дисперсии, так как при больших коэффициент n/(n-1), на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.
В практике статистического исследования часто приходится сталкиваться с небольшими по объему так называемыми малыми выборками.
Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.
Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.
Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента, определяемым по формуле.
(3.1).
где — мера случайных колебаний выборочной средней в малой выборке.
Величина вычисляется на основе данных выборочного наблюдения:
. (3.2).
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки в генеральной совокупности.
При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.
Предельная ошибка малой выборки в зависимости от средней ошибки представлена как.
.
Но в данном случае величина иначе связана с вероятной оценкой, чем при большой выборке.
Согласно распределению Стьюдента, вероятная оценка зависит как от величины, так и от объема выборки в случае, если предельная ошибка не превысит среднюю ошибку в малых выборках.
Таблица 3.1 Распределение вероятности в малых выборках в зависимости от коэффициента доверия и объема выборки.
t. | ||||||||||
|
|
|
|
|
|
|
|
|
|
|
* При n=? в таблице даны вероятности нормального распределения. Для определения вероятности соответствующие табличные значения следует разделить на 1000. |
Как видно из табл. 3.1, при увеличении это распределение стремится к нормальному и при уже мало от него отличается.
Покажем, как пользоваться таблицей распределения Стьюдента.
Пример
Предположим, что выборочное обследование рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин.):. Найдем выборочные средние затраты:
.
Выборочная дисперсия.
.
Отсюда средняя ошибка малой выборки.
.
По табл. 3.1 находим, что для коэффициента доверия и объема малой выборки вероятность равна .
Таким образом, с вероятностью можно утверждать, что расхождение между выборкой и генеральной средней лежит в пределах от до, т. е. разность не превысит по абсолютной величине ().
Следовательно, средние затраты времени во всей совокупности будут находиться в пределах от до .
Вероятность того, что это предположение в действительности неверно и ошибка по случайным причинам будет больше, чем, равна: .
Таблица вероятностей Стьюдента часто приводится в иной форме, нежели в табл.3.1. Считается, что в ряде случаев такая форма более удобна для практического использования (табл. 3.2).
Из табл. 3.2 следует, что для каждого числа степеней свободы указана предельная величина, которая с данной вероятностью не будет превышена в силу случайных колебаний результатов выборки.
На основе указанной в табл. 3.2 величины определяются доверительные интервалы: и .
Это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность, равную:
.
В качестве доверительной вероятности при двусторонней проверке используют как правило, или, что не исключает, однако, выбора и других, не приведенных в табл. 3.2.
Таблица 3.2 Некоторые значенияраспределения Стьюдента.
Число степеней свободы. | tp | |||
Для одностороннего интервала. | Для двустороннего интервала. | |||
Р=0,95. | Р=0,99. | Р=0,95. | Р=0,99. | |
|
|
|
|
|
Вероятности случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут равны и, т. е. весьма малы.
Выбор между вероятностями и является до известной степени произвольным. Этот выбор во многом определяется содержанием тех задач, для решения которых применяется малая выборка.
В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений большой выборке. Различие заключается в том, что при малой выборки вероятность нашего утверждения несколько меньше, чем при больше выборке (в частности, в приведенном ранее примере и соответственно).
Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.
Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически нормальным. Необходимо также принимать во внимание и то, что точность результатов выборки малого объема все же ниже, чем при большой выборке.