Выборочное наблюдение


Выборочный метод наблюдения

Одним из наиболее распространенных в статистике методов, применяющих несплошное наблюдение, является выборочный метод. Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. Подлежащая изучению статистическая совокупность, из которой производится  отбор  части  единиц,  называется  генеральной  совокупностью.  Отобранная   из генеральной   совокупности  некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой. В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака — генеральной средней.

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается ω), а среднюю  величину в выборке—выборочной средней. Выборочная доля или частость ω, определяется из отношения единиц, обладающих изучаемым признаком (m), к общей численности единиц выборочной совокупности (n):

    \[\omega  = \frac{m}{n}\]

Задачей выборочного наблюдения является дача верных представлений о сводных показателях всей совокупности на основе некоторой их части, подвергнутой наблюдению.  Возможное отклонение выборочной доли и выборочной средней от доли и средней в генеральной совокупности называется ошибкой выборки или ошибкой репрезентативности.  Чем больше величина этой ошибки, тем больше показатели выборочного наблюдения отличаются от показателей генеральной совокупности.

Различаются:

  • ошибки выборки;
  • ошибки регистрации.

Ошибки регистрации возникают при неправильном установлении факта в процессе наблюдения. Они свойственны как сплошному наблюдению, так и выборочному, но в выборочном  их меньше.

В связи с тем, что признаки в изучаемой совокупности варьируют, то состав единиц, попавших в выборку, может не совпадать с составом единиц всей совокупности.  Это означает, что генеральная доля и генеральная средняя  не совпадают с выборочными долей и средней. Возможное расхождение между этими характеристиками определяется  ошибкой выборки.

Ошибка выборки—это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности (значимости) результатов исследования.

Определение ошибки выборочной средней

При случайном повторном отборе средняя ошибка выборочной средней рассчитывается по формуле:

    \[\mu  = \sqrt {\frac{{\sigma _0^2}}{n}} \;\; \to \;\;\sigma _0^2 = {\sigma ^2} \cdot \frac{n}{{n - 1}}\]

где σо2 ;  σ2- соответственно генеральная и выборочная дисперсии. Генеральная дисперсия отличается от выборочной дисперсии в n:(n-1)  раз.

Существует повторный и бесповторный отбор. Сущность повторного отбора состоит в том, что каждая, попавшая в выборку единица, после наблюдения возвращается в генеральную совокупность и может быть исследована повторно. На практике повторный отбор применяется редко. 

При повторном отборе  средняя ошибка выборки рассчитывается: 

    \[\mu  = \sqrt {\frac{{{\sigma ^2}}}{n}} \]

При бесповторном отборе, численность генеральной совокупности (N) в ходе выборки сокращается, формула средней ошибки выборки для количественного признака принимает следующий вид:

    \[{\mu _x} = \sqrt {\frac{{{\sigma ^2}}}{n} \cdot \left( {1 - \frac{n}{N}} \right)} \;\; \Rightarrow \;\;\bar x = \tilde x \pm {\mu _x}\]

 Определение ошибки выборочной доли  

При бесповторном отборе средняя ошибка выборочной доли рассчитывается по формуле:

    \[{\mu _\omega } = \sqrt {\frac{{\omega (1 - \omega )}}{n} \cdot \left( {1 - \frac{n}{N}} \right)} \]

μ ω - средняя ошибка выборки для доли альтернативного признака.

При повторном способе отбора средняя ошибка выборочной доли определяется по формуле:

    \[{\mu _\omega } = \sqrt {\frac{{\omega (1 - \omega )}}{n}} \]

Предельная ошибка выборки (Δ) связана со средней ошибкой выборки (μ) отношением: Δ=t*μ. При этом, t-как коэффициент кратности средней ошибки выборки, зависит от значения вероятности Р, с которой гарантируется величина предельной ошибки выборки. Коэффициент доверия позволяет вычислить предельную ошибку выборки. Интервал, в который с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительныма вероятность (Р) доверительной вероятностьюЧаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия t будет равен соответственно 1,96 и 2,58. Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю (генеральную долю). Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки.

Коэффициент доверия t и соответствующие уровни доверительной вероятности:

Смотри также по теме: