Решим задачу за 30 минут!
Опубликуй вопрос и получи ответ со скидкой 20% по промокоду helpstat20

Вариант 29
Проводится исследование о зависимости успеваемости студентов от текущей работы. По результатам 1 семестра получена выборка сведений о баллах за первую контрольную работу (X) и их оценок на экзамене (Y).
Таблица 1
X 5 1,9 0 2 4 2,3 3,3 2 3,6 2 5 3,1 1
Y 5 4 3 3 5 4 4 3 4 4 5 3 2
X 1,9 1,8 1,7 1,1 2,4 3,9 4 3 3,7 4,2 4 0 3,8
Y 4 4 3 2 5 5 5 4 5 4 4 3 4
По данным этой выборки:
выяснить, существует ли линейная корреляционная связь между X и Y; найти вид линии регрессии X на Y и Y на X, построить диаграмму рассеяния и их графики, оценить силу и тесноту связи, проверить гипотезу о значимости выборочного коэффициента корреляции на уровне значимости ; найти доверительные интервалы для параметров регрессии Y на X;
для признака X построить гистограмму распределения, найти равноотстоящие частоты, выравнивающие частоты, выдвинуть гипотезу о виде плотности распределения признака X и проверить её на уровне значимости ;
найти доверительные интервалы для оценки математического ожидания и генерального СКО признака X, предполагая, что признак распределён нормально;
найти моду и медиану признака X;
построить эмпирическую функцию распределения признака X.

Решение:

Составим двумерное распределение.
Таблица 2
X
Y 0 – 1 1 – 2 2 – 3 3 – 4 4 – 5 ny
2
2

2
3 2 1 2 1
6
4
3 2 4 2 11
5

1 2 4 7
nx
2 6 5 7 6 n = 26
1. Выясним, существует ли линейная корреляционная связь между X и Y, вычислив коэффициент корреляции:
,
Вычислим средние:

Вычислим дисперсии:

Тогда средние квадратические отклонения составят:
,
Тогда коэффициент корреляции составит:

Так как коэффициент регрессии лежит в интервале 0,5 – 0,7, согласно шкале Чеддока, между X и Y существует заметная линейная связь.
Найти уравнение регрессии X на Y в виде:

Подставляя данные, получаем:

Упрощая, получаем:

Найдем уравнение регрессии Y на X в виде:

Подставляя данные, получаем:

Упрощая, получаем:

Построим диаграмму рассеяния и графики линий регрессии.

Проверим гипотезу о значимости выборочного коэффициента корреляции на уровне значимости . Наблюдаемое значение признака определим по формуле:

Подставляя данные, получим:

Критическое значение находим по таблице Стьюдента на уровне значимости с уровнем свободы :

Поскольку , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически значим.
Найдем доверительные интервалы для параметров регрессии Y на X по формуле:

Вычислим среднее квадратическое отклонение остатков:

Вспомогательные расчеты проведем в таблице.
Таблица 3
№ п/п X Y X 2 YX (Y – YX)2
1 5 5 25 4,864 0,0186
2 1,9 4 3,61 3,455 0,2975
3 0 3 0 2,591 0,1674
4 2 3 4 3,500 0,2500
5 4 5 16 4,409 0,3492
6 2,3 4 5,29 3,636 0,1322
7 3,3 4 10,89 4,091 0,0083
8 2 3 4 3,500 0,2500
9 3,6 4 12,96 4,227 0,0517
10 2 4 4 3,500 0,2500
11 5 5 25 4,864 0,0186
12 3,1 3 9,61 4,000 1,0000
13 1 2 1 3,045 1,0930
14 1,9 4 3,61 3,455 0,2975
15 1,8 4 3,24 3,409 0,3492
16 1,7 3 2,89 3,364 0,1322
17 1,1 2 1,21 3,091 1,1901
18 2,4 5 5,76 3,682 1,7376
19 3,9 5 15,21 4,364 0,4050
20 4 5 16 4,409 0,3492
21 3 4 9 3,955 0,0021
22 3,7 5 13,69 4,273 0,5289
23 4,2 4 17,64 4,500 0,2500
24 4 4 16 4,409 0,1674
25 0 3 0 2,591 0,1674
26 3,8 4 14,44 4,318 0,1012
Сумма 70,7 101 240,05 99,5 9,5640
По данным таблицы 3 получаем:

Вычислим средние квадратические отклонения коэффициентов:
,
По таблице Стьюдента на уровне значимости с уровнем свободы находим значение t:

Тогда доверительный интервал для свободного коэффициента составит:

Тогда доверительный интервал для коэффициента при переменной X составит:

2. Для признака X построим гистограмму распределения.

По виду гистограммы можно предположить нормальное распределение. Проверим гипотезу о нормальном распределении с помощью критерия Пирсона:
,
где – теоретическая частота i-го интервала,
– вероятность попадания в интервал:
.
Вспомогательные расчеты проведем в таблице.
Таблица 4
Вспомогательные расчеты критерия Пирсона

1 0 1 -2,2424 -1,4545 -0,4875 -0,4271 1,5712 0,0919
2 1 2 -1,4545 -0,6667 -0,4271 -0,2475 4,6695 0,2951
3 2 3 -0,6667 0,1212 -0,2475 0,0482 7,6894 1,4466
4 3 4 0,1212 0,9091 0,0482 0,3183 7,0229 0,0001
5 4 5 0,9091 1,6970 0,3183 0,4551 3,5568 0,9949
Сумма 2,8285
По таблице квантилей χ2 находим критическое значение на уровне значимости с степенями свободы: .
Так как гипотезу о нормальном распределении генеральной совокупности принимается.
3. Построим доверительные интервал для истинного значения измеряемой величины на уровне значимости по формуле:

Определяем значение t по таблицам функции Лапласа. В данном случае

По таблице функции Лапласа найдем, при каком t значение , получаем .
Найдем исправленную дисперсию для дискретного ряда:

Тогда исправленное среднее квадратическое отклонение составит:

Подставляя данные в формулу, получаем:
или
Доверительный интервал среднего квадратического отклонения генеральной совокупности определяется по формуле:

По таблице квантилей χ2 находим:
, .
Подставляя данные, получаем:
или
4. Мода – это наиболее часто встречающийся вариант ряда. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем – значение модальной величины признака по формуле:
,
где – нижняя граница модального интервала;
h – величина интервала;
, , – частота модального интервала, предшествующего ему и следующего за ним соответственно.
В данном случае модальным является четвертый интервал 3 – 4, т.к. он имеет наибольшую частоту. По данным таблицы 2 получаем:

Медиана – это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части. Для определения медианы вычислим полусумму частот: .
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем – значение медианы по формуле:
,
где – нижняя граница медианного интервала;
h – величина интервала;
– сумма частот или число членов ряда;
– сумма накопленных частот интервалов, предшествующих медианному;
– частота медианного интервала.
В данном случае для интервального ряда медианным является третий интервал 2 – 3, т.к. в данном интервале накопленная частота достигает 13 единиц (2 + 6 + 5), тогда медиана будет равна:

5. Построим эмпирическую функцию распределения признака X:
при : ;
при : ;
при : ;
при : ;
при : ;
при : .
Получаем функцию распределения:

4.97
Elena2008
Тесты на сайтах дистанционного обучения: ТОГУ, ТПУ, ТУСУР, система "Прометей","КОСМОС", i-exam и т.п. Выполняю контрольные и лабораторные работы по физико-математическим предметам.