Учебник по промышленной статистике


Непараметрическая статистика и подгонка распределения


Непараметрическая статистика и подгонка распределения

  • Основная цель
  • Краткий обзор непараметрических процедур
  • Какой метод использовать
  • Подгонка распределения


  • Основная цель
  • Краткий обзор непараметрических процедур
  • Какой метод использовать
  • Подгонка распределения



Основная цель

Основная цель

Краткий обзор понятия "критерий значимости".
Краткий обзор понятия "критерий значимости".

Для того чтобы понять идеи непараметрической статистики (термин был впервые введен Wolfowitz, 1942), следует познакомиться с идеями параметрической статистики. Глава Элементарные понятия статистики знакомит с понятием статистической значимости критерия, основанного на выборочном распределении определенной статистики (вы можете просмотреть эту главу, прежде чем продолжить чтение). Говоря кратко, если вы знаете распределение наблюдаемой переменной, то можете предсказать, как в повторных выборках равного объема будет "вести себя" используемая статистика - т.е. каким образом она будет распределена. Пусть, например, имеется 100 случайных выборок, из одной популяции по 100 взрослых человек в каждой. Вычислим средний рост субъектов в каждой выборке, т.е. построим выборочное среднее. Тогда распределение выборочных средних можно хорошо аппроксимировать нормальным распределением (более точно, t распределением Стьюдента с 99 степенями свободы). Теперь представьте, что случайным образом извлечена еще одна выборка из жителей некоего города ("Вышгород"), где, по вашим представлениям, проживают люди с ростом выше среднего. Если средний рост людей в этой выборке попадает в верхнюю 95% критическую область tраспределения, то можно сделать обоснованный вывод, что жители Вышгорода, действительно, в среднем более высокие (чем в целом в популяции), т.е. что это действительно город высоких людей.

Действительно ли большинство переменных имеют нормальное распределение?
Действительно ли большинство переменных имеют нормальное распределение?

В рассмотренном примере использовался тот факт, что в повторных выборках равного объемы средние значения (роста людей) будут иметь t распределение (с определенным средним и дисперсией).


Начало  Назад  Вперед