С целью изучения размера потребительских кредитов, выданных банком в одном из крупных магазинов электронной техники в течение последнего месяца, по схеме собственно-случайной бесповторной выборки было отобрано 180 кредитов из 2500 выданных. Величины сумм выданных кредитов (тыс. руб.) представлены в таблице:
Составить интервальный вариационный ряд. Записать эмпирическую функцию распределения и построить ее график. На одном чертеже изобразить гистограмму и полигон частот.
По сгруппированным данным вычислить выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
Найти:
а)вероятность того, что средняя величина всех выданных в течение месяца кредитов отличается от полученной по выборке не более чем на 250 руб.;
б)границы, в которых с вероятностью 0,95 заключена доля всех выданных кредитов, сумма которых не превышает 20 тыс. руб.;
в)объем бесповторной выборки, при котором границы для доли кредитов, полученные в п. б), можно гарантировать с вероятностью 0,98.
Решение:
Выпишем элементы данной выборки в порядке их возрастания:
8,3 9,9 10,5 11,2 11,2 11,5 11,9 11,9 12,2 12,6
12,7 12,7 12,9 13,0 13,0 13,5 13,5 13,8 13,8 13,9
14,0 14,0 14,0 14,0 14,1 14,1 14,5 14,7 14,8 14,9
15,0 15,1 15,2 15,3 15,5 15,6 15,7 15,8 16,0 16,1
16,3 16,3 16,6 16,8 17,0 17,0 17,1 17,2 17,3 17,3
17,4 17,5 17,5 17,5 17,6 17,6 17,8 17,8 17,9 17,9
18,0 18,0 18,1 18,1 18,2 18,2 18,3 18,5 18,6 18,6
18,6 18,6 18,7 18,9 18,9 18,9 19,0 19,0 19,1 19,2
19,2 19,2 19,3 19,5 19,5 19,5 19,5 19,6 19,6 19,6
19,7 19,9 19,9 20,0 20,1 20,1 20,1 20,2 20,2 20,2
20,2 20,3 20,5 20,7 20,7 20,7 20,8 20,9 21,0 21,1
21,1 21,2 21,3 21,3 21,8 21,8 21,8 21,9 21,9 22,0
22,0 22,1 22,1 22,2 22,2 22,2 22,3 22,3 22,4 22,4
22,5 22,7 22,7 22,7 22,9 23,1 23,2 23,3 23,4 23,4
23,6 23,8 23,9 24,1 24,2 24,2 24,2 24,4 24,6 24,7
24,7 24,9 24,9 25,2 25,2 25,3 25,5 25,6 25,6 25,8
25,8 26,1 26,4 26,6 26,7 26,7 26,8 27,5 27,6 27,9
27,9 28,0 28,0 28,0 28,8 28,9 29,7 30,3 31,6 32,4
Объем выборки . Для построения интервального вариационного ряда определим шаг выборки, воспользовавшись формулой Стерджесса:
.
Нижняя граница первого интервала определяется формулой:
.
Относительные частоты вычисляем по формуле:
.
Здесь – накопленные относительные частоты.
В результате получаем интервальный вариационный ряд:
Интервалы Середины интервалов,
6,9-9,7 8,3 1 0,006 0,006
9,7-12,5 11,1 8 0,044 0,05
12,5-15,3 13,9 24 0,133 0,183
15,3-18,1 16,7 29 0,161 0,344
18,1-20,9 19,5 45 0,25 0,594
20,9-23,7 22,3 34 0,189 0,783
23,7-26,5 25,1 22 0,122 0,905
26,5-29,3 27,9 13 0,072 0,977
29,3-32,1 30,7 3 0,017 0,994
32,1-34,9 33,5 1 0,006 1
180
Эмпирическая функция распределения в зависимости от значения вариант равна соответствующей накопленной относительной частоте . Тогда эмпирическая функция распределения имеет вид:
.
График эмпирической функции распределения имеет вид:
Построим на одном чертеже гистограмму и полигон частот:
Составим расчетную таблицу:
8,3 1 8,3 135,7225
11,1 8 88,8 626,58
13,9 24 333,6 878,46
16,7 29 484,3 306,3125
19,5 45 877,5 9,1125
22,3 34 758,2 187,765
25,1 22 552,2 583,495
27,9 13 362,7 821,6325
30,7 3 92,1 346,6875
33,5 1 33,5 183,6025
180 3591,2 4079,37
8,3 1 -1581,167125 18420,59700625
11,1 8 -5545,233 49075,31205
13,9 24 -5314,683 32153,83215
16,7 29 -995,515625 3235,42578125
19,5 45 -4,100625 1,84528125
22,3 34 441,24775 1036,9322125
25,1 22 3004,99925 15475,7461375
27,9 13 6531,978375 51929,22808125
30,7 3 3726,890625 40064,07421875
33,5 1 2487,813875 33709,87800625
180 2752,2305 245102,870925
Вычислим выборочное среднее по формуле:
.
Найдем выборочную исправленную дисперсию по формуле:
.
Найдем выборочное среднее квадратическое отклонение по формуле:
.
Коэффициент вариации определяется формулой:
%%%.
Коэффициент асимметрии определяется формулой:
.
Коэффициент эксцесса определяется формулой:
.
Мода – это наиболее часто повторяющееся значение признака, которое определяется формулой:
,
где – нижняя граница модального интервала, то есть интервала с наибольшей частотой, – частота в модальном интервале, – частота в предыдущем интервале, – частота в следующем интервале. Тогда получаем:
.
Медиана определяется формулой:
,
где – нижняя граница медианного интервала, – накопленная частота в предыдущем интервале, – частота в медианном интервале. Тогда получаем:
.
Найдем вероятность того, что средняя величина всех выданных в течение месяца кредитов отличается от полученной по выборке не более чем на 250 руб. Найдем среднюю квадратическую ошибку выборки по формуле:
.
Тогда получаем:
.
Найдем границы, в которых с вероятностью 0,95 заключена доля всех выданных кредитов, сумма которых не превышает 20 тыс. руб. Доля таких выданных кредитов составляет . Найдем среднюю квадратическую ошибку для доли таких выданных кредитов:
.
Искомые границы определяются формулой:
,
где предельная ошибка бесповторной выборки равна . Здесь определяется из соотношения: , откуда . Тогда получаем:
,
.
Найдем объем бесповторной выборки, при котором границы для доли кредитов, полученные в п. б), можно гарантировать с вероятностью 0,98. Искомый объем определяется формулой:
,,
где определяется из соотношения: , откуда . Тогда получаем:
,
.