Решим задачу за 30 минут!
Опубликуй вопрос и получи ответ со скидкой 20% по промокоду helpstat20

Представить данную выборку 55 наблюдений в виде таблицы частот группированной выборки. Построить гистограмму и полигон частот, а также график эмпирической функции распределения группированной выборки.
Определить выборочные математическое ожидание, дисперсию, медиану, коэффициенты асимметрии и эксцесса для данной выборки.
Определить 90% доверительный интервал для математического ожидания и дисперсии.
Проверить гипотезу о нормальном распределении выборки. Принять уровень значимости =0,1.
2,34 2,50 4,06 0,74 2,06 3,48
3,91 2,73 2,77 1,88 4,32 3,11
0,05 2,52 3,01 2,86 5,10 4,76
0,90 2,89 3,12 4,17 3,83 3,17
2,14 1,15 1,24 3,45 3,72 2,37
1,96 2,63 2,82 2,82 2,76
3,33 4,24 3,63 3,59 2,87
4,41 3,89 1,64 4,45 4,62
1,90 4,50 4,74 2,13 2,80
2,96 2,36 3,12 1,76 3,27

Решение:

Объем выборки . Находим оптимальное число интервалов группировки по формуле Стерджесса.
.
Группируем выборку по возрастанию, получаем полный вариационный ряд
(его можно посмотреть в Excel файле “расчеты”, Лист 1, столбец A ).
.
Размах вариации .
Длина интервала группировки .
Мы делили на , так как еще будут крайние интервалы и число увеличится на 1. Первый интервал берем и соответственно последний . Считаем по выборке число интервалов в каждой группе. Затем делим полученные частоты, получаем относительные частоты. Суммируем относительные частоты до каждого данного значения, получаем накопленные частоты.
интервал частота отн. Частота накопленная частота
(-0,455;0,555) 1 0,018 0,018
(0,555;1,565) 4 0,073 0,091
(1,565;2,575) 13 0,236 0,327
(2,575;3,585) 20 0,364 0,691
(3,585;4,595) 13 0,236 0,927
(4,595;5,605) 4 0,073 1,000

Гистограмма частот:

Чтобы построить полигон частот просто откладываем на оси абсцисс середины интервалов, а на оси ординат частоты и последовательно соединяем точки.

График эмпирической функции распределения строим по накопленным частотам:

Считаем выборочные характеристики:
Математическое ожидание:
;
Дисперсия

Медиана делит полный вариационный ряд пополам. У нас нечетное число испытаний поэтому получаем

Коэффициент ассиметрии
;
Коэффициент эксцесса:
.
Определяем 90% доверительный интервал
(доверительная вероятность ) для математического ожидания и дисперсии.
Для математического ожидания считаем с неизвестным средним.
Для этого используем центральную функцию
, где
– среднее; -исправленное выборочное среднеквадратическое отклонение.
Она имеет распределение Стьюдента с
степенями свободы. Потому
.
Где – процентная точка распределения Стьюдента с 54 степенями свободы уровня
. По таблицам находим . Половина интервала
;

;

В итоге доверительный интервал для среднего :
с вероятностью .

Строим доверительный интервал для дисперсии при неизвестном среднем.
Используем центральную функцию
. Здесь – то же что и в прошлом пункте.
Она имеет распределение с степенями свободы. Значит
с вероятностью , где ;.
И значит с вероятностью .
По таблицам находим
;;
;
.
Получили доверительный интервал для дисперсии:
c доверительной вероятностью .

Проверяем гипотезу о нормальном распределении выборки.
против альтернативы на уровне значимости =0,1.
Где берем параметры
– выборочное среднее
– несмещенное выборочное среднеквадратическое отклонение.
На основе критерия -Пирсона. Вычисляем для (правых) концов интервалов значения величин
.
0 1 2 3 4 5
-2,19311

-1,27743

-0,36174

0,553944

1,469628

2,385313

Находим теоретические относительные частоты для каждого из интервалов.
Для первого, для последующих интервалов получаем ; .
Для последнего (отнесли к нему и все большие)
Где – функция распределения стандартной нормальной случайной величины. Её значение можно посчитать, например с помощью функции “НОРМСТРАСП(.)” в Excel. Получаем (расчеты в Excel файле “расчеты”, Лист 2)

интервал частота отн. Частота Теор. Частота
(-0,455;0,555) 1 0,018 0,01415 0,001149
(0,555;1,565) 4 0,073 0,086576 0,002215
(1,565;2,575) 13 0,236 0,258047 0,001822
(2,575;3,585) 20 0,364 0,351418 0,000425
(3,585;4,595) 13 0,236 0,218977 0,00138
(4,595;5,605) 4 0,073 0,070831 5,08E-05

Всего у нас интервалов. Считаем наблюденное значение статистики критерия
.
Находим по таблицам критическое значение статистики. Нам нужен квантиль распределения с числом степеней свободы уровня .
.
В нашем случае (при том, сильно меньше)
Получаем, что у нас нет причин отвергать гипотезу о том, что распределение выборки нормальное. Гипотезу , что распределение является нормальным принимаем.

5.0
maschastern
Живу в Германи, преподаю математику, физику и астрофизику, стаж работы - 20 лет. Имею 2 высших образвания - техническое и гуманитарное. Преподаватель высшей категории. В идеале знаю русский, немецкий и английский языки. Рада помочь.