Статистические гипотезы. Критерии согласия. параметрические критерии.

Генеральная
совокупность

Множество всех объектов, обладающих изучаемым признаком

Объем генеральной
совокупности -число
объектов генеральной
совокупности

Выборочная
совокупность или
выборка

Множество объектов, отобранных случайным образом из генеральной совокупности для изучения

объем выборки - количество
объектов в выборке

репрезентативность
(представительность) -
показатель того, насколько
хорошо выборка отражает
основные свойства той
генеральной совокупности,
частью которой является

выборка репрезентативна, если
она сделана случайным образом

Статистическая
гипотеза

Предположение о виде
неизвестного
распределения или об
его параметрах

Статистическая ошибка

статистическая ошибка I рода -
нулевая гипотеза верна, но
отвергается

Вероятность ошибки обозначают α и
называют уровнем значимости

статистическая ошибка II рода -
нулевая гипотеза не верна, но
не отвергается

Вероятность ошибки обозначают β.
Величина 1 - β называется
мощностью критерия - способность
выявлять различия или отклонять
нулевую гипотезу, если она не
верна

При проверке выдвигаются 2
гипотезы:

Нулевая (или основная) –
гипотеза о сходстве (H0)

Для проверки используется
специально подобранная случайная
величина К - статистический
критерий :

должна являться функцией выборочных
данных

характеризовать меру расхождения
выборочных данных сосновной гипотезой

ее закон распределения в случае
истинности гипотезы должен быть известен

Альтернативная (или
конкурирующая) – гипотеза о
различиях (H1)

направленная

ненаправленная

Основной принцип принятия
решения при проверке:
гипотез а отвергается, если
наблюдаемое значение
критерия, принадлежит
критической области, и не
отвергается, если
наблюдаемое значение
принадлежит допустимой
области

Критерии согласия

Критерии,
позволяющие оценить
степень согласия
наблюдаемого
статистического
распределения
выборки с
гипотетическим
распределением

Критерий Колмогорова
(Колмогорова-Смирнова)
В качестве величины, которая
характеризует согласие
распределения изучаемой
величины с теоретическим
распределением
используется разность между
эмпирической и
гипотетической функцией
распределения.

Критерий Шапиро - Уилка W
Основан на отношении
оптимальной оценки
дисперсии к ее обычной
оценке.

Нормальный закон распределения

а – математическое ожидание
(характеризует центр
распределения, в статистике
– это среднее значение
параметра в генеральной
совокупности, примерно
равно выборочной средней)

σ – среднеквадратическое
отклонение (характеризует
разброс, примерно равно
стандартному отклонению,
полученному по выборке)

«правило трех сигм»:
вероятность того, что
значение нормально
распределенной случайной
величины отклонится от
математического ож идания не
б олее чем на 3σ, примерно
равна единице

Совпадение величин средней
арифметической, моды и
медианы

Чем больше величина
признака отклоняется от
среднего значения, тем
меньше будет частота
встречаемости (вероятности)
этого признака в распределении

Тип организации эксперимента

Независимые (несвязные)
выборки -процедура
эксперимента и результаты
измерения, полученные на
одной из выборок, не
оказывают влияния на
особенности протекания
эксперимента и результаты
измерения у другой выборки

Зависимые (связные)
выборки -процедура
эксперимента и результаты
измерения, полученные на
одной выборке, оказывают
влияние на особенности
протекания эксперимента и
результаты измерения у
другой выборки

Параметрические критерии

Основаны на конкретном виде распределения изучаемой случайной величины и используют числовые характеристики выборочной совокупности

Критерий Фишера -
Снедекора: F равна
отношению большей из
исправленных выборочных
дисперсий к меньшей

H0 - генеральные дисперсии
равны

H1 - генеральные дисперсии не
равны

Критерий Стюдента

H0 - генеральные средние равны

H1 - генеральные средние не
равны

t-критерий Стьюдента для
независимых выборок

t-критерий Стьюдента для
зависимых выборок

Непараметрические критерии

Не базируются на
предположении о виде распределения
изучаемой величины и используют
непосредственно выборочные данные , а
не параметры выборки