Имеются данные о возрастном составе группы студентов заочного отделения (лет):
18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28, 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.
Представьте выборку в виде вариационного ряда, определите моду, медиану. Постройте дискретный статистический ряд частот и относительных частот. Постройте полигон относительных частот. Найдите числовые характеристики статистического распределения: среднее выборочное, выборочную дисперсию, исправленную выборочную дисперсию, исправленное среднее квадратическое отклонение.
Решение:
Пусть для изучения количественного (дискретного или непрерывного) признака X из генеральной совокупности извлечена выборка x1, x2,…, xk объема n. Наблюдавшиеся значения xi признака X называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом.
Вариационный ряд, построенный по данной выборке, извлеченной из генеральной совокупности, включает 16 вариант:
18, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 38.
xi
ni
wi=nin
xi
ni
wi=nin
18 1 0,033 29 5 0,167
22 2 0,067 30 2 0,067
23 1 0,033 31 1 0,033
24 2 0,067 32 2 0,067
25 2 0,067 33 1 0,033
26 2 0,067 34 1 0,033
27 2 0,067 35 1 0,033
28 3 0,1 38 2 0,067
Объем выборки n=30. Относительная частота wi равна отношению частоты ni к объему выборки n.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1;w1), (x2;w2)… (xi;wi), где xi – варианты выборки и wi—соответствующие им относительные частоты.
Отложим на оси абсцисс варианты xi, а на оси ординат – соответствующие относительные частоты. Соединив точки (xi;wi) отрезками прямых, получим искомый полигон относительных частот.
Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя:
xв=i=1knixin
xв=i=1knixin=1*18+2*22+1*23+2*24+2*25+2*26+2*27+3*28+5*29+2*30+1*31+2*32+1*33+1*34+1*35+2*3830=85130=28,37
Выборочная дисперсия:
Dв=i=1kni(xi-xв)2n
Dв=i=1kni(xi-xв)2n=1(18-28,37)2+2(22-28,37)2+1(23-28,37)2+2(24-28,37)2+…+2(38-28,37)230=616,96730=20,57
Выборочное среднее квадратическое отклонение
σв=Dв=20,57≈4,535
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия:
S2=nn-1*Dв=ni(xi-xв)2n-1
S2=nn-1*Dв=ni(xi-xв)2n-1=616,96729=21,275
Исправленное среднее квадратическое отклонение
S=S2=21,275≈4,612
Модальная величина в дискретном ряду находится просто – по наибольшей частоте. Мода – варианта, у которой частота наибольшая.
M0=29
Медианой называется серединная варианта упорядоченного вариационного ряда, расположенного в возрастающем и убывающем порядке. Она является центральным членом и делит вариационный ряд пополам в тех случаях, когда ряд нечетный. Если ряд четный, то сумму двух средних значений делим пополам.
Mе=28+292=28,5