Критерий Фишера
F-тест или критерий Фишера (F-критерий, φ*-критерий) — статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).
Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.
Тест проводится путём сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если , то . Кроме того, квантили распределения Фишера обладают свойством . Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе — меньшая и сравнение осуществляется с «правой» квантилью распределения. Тем не менее тест может быть и двусторонним, и односторонним. В первом случае при уровне значимости используется квантиль , а при одностороннем тесте — .
Более удобный способ проверки гипотез — с помощью p-значения — вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если (для двустороннего теста — )) меньше уровня значимости , то нулевая гипотеза отвергается, в противном случае принимается.
Примеры F-тестов
F-тест на равенство дисперсий
Две выборки
Пусть имеются две выборки объёмом m и n соответственно случайных величин X и Y, имеющих нормальное распределение. Необходимо проверить равенство их дисперсий. Статистика теста
где — выборочная дисперсия.
Если статистика больше критического значения, соответствующего выбранному уровню значимости, то дисперсии случайных величин признаются не одинаковыми.
Несколько выборок
Пусть выборка объёмом N случайной величины X разделена на k групп с количеством наблюдений в i-ой группе.
Межгрупповая («объяснённая») дисперсия:
Внутригрупповая («необъяснённая») дисперсия:
Данный тест можно свести к тестированию значимости регрессии переменной X на фиктивные переменные-индикаторы групп. Если статистика превышает критическое значение, то гипотеза о равенстве средних в выборках отвергается, в противном случае средние можно считать одинаковыми.
Проверка ограничений на параметры регрессии
Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:
где -количество ограничений, n-объём выборки, k-количество параметров модели, RSS-сумма квадратов остатков модели,
-коэффициент детерминации, индексы S и L относятся соответственно к короткой и длинной модели (модели с ограничениями и модели без ограничений).
Замечание
Описанный выше F-тест является точным в случае нормального распределения случайных ошибок модели. Однако F-тест можно применить и в более общем случае. В этом случае он является асимптотическим. Соответствующую F-статистику можно рассчитать на основе статистик других асимптотических тестов — теста Вальда (W), теста множителей Лагранжа(LM) и теста отношения правдоподобия (LR) — следующим образом:
Все эти статистики асимптотически имеют распределение F(q, n-k), несмотря на то, что их значения на малых выборках могут различаться.
Проверка значимости линейной регрессии
Данный тест очень важен в регрессионном анализе и по существу является частным случаем проверки ограничений. В данном случае нулевая гипотеза — об одновременном равенстве нулю всех коэффициентов при факторах регрессионной модели (то есть всего ограничений k-1). В данном случае короткая модель — это просто константа в качестве фактора, то есть коэффициент детерминации короткой модели равен нулю. Статистика теста равна:
Соответственно, если значение этой статистики больше критического значения при данном уровне значимости, то нулевая гипотеза отвергается, что означает статистическую значимость регрессии. В противном случае модель признается незначимой.
Пример
Пусть оценивается линейная регрессия доли расходов на питание в общей сумме расходов на константу, логарифм совокупных расходов, количество взрослых членов семьи и количество детей до 11 лет. То есть всего в модели 4 оцениваемых параметра (k=4). Пусть по результатам оценки регрессии получен коэффициент детерминации . По вышеприведенной формуле рассчитаем значение F-статистики в случае, если регрессия оценена по данным 34 наблюдений и по данным 64 наблюдений:
Критическое значение статистики при 1 % уровне значимости (в Excel функция FРАСПОБР) в первом случае равно , а во втором случае
. В обоих случаях регрессия признается значимой при заданном уровне значимости. В первом случае P-значение равно 0,1 %, а во втором — 0,00005 %. Таким образом, во втором случае уверенность в значимости регрессии существенно выше (существенно меньше вероятность ошибки в случае признания модели значимой).
Проверка гетероскедастичности
См. Тест Голдфелда-Куандта
См. также
- Проверка статистических гипотез
- Статистический критерий
- Тест Вальда
- Тест отношения правдоподобия
- Тест множителей Лагранжа
- Тест Голдфелда-Куандта
- t-критерий Стьюдента
Примечания
- F-Test for Equality of Two Variances (англ.). NIST. Дата обращения: 29 марта 2017. Архивировано 9 марта 2017 года.
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Критерий Фишера, Что такое Критерий Фишера? Что означает Критерий Фишера?
Ne sleduet putat s tochnym testom Fishera testom statisticheskoj znachimosti ispolzuemym v analize tablic sopryazhyonnosti F test ili kriterij Fishera F kriterij f kriterij statisticheskij kriterij testovaya statistika kotorogo pri vypolnenii nulevoj gipotezy imeet raspredelenie Fishera F raspredelenie Statistika testa tak ili inache svoditsya k otnosheniyu vyborochnyh dispersij summ kvadratov delennyh na stepeni svobody Chtoby statistika imela raspredelenie Fishera neobhodimo chtoby chislitel i znamenatel byli nezavisimymi sluchajnymi velichinami i sootvetstvuyushie summy kvadratov imeli raspredelenie Hi kvadrat Dlya etogo trebuetsya chtoby dannye imeli normalnoe raspredelenie Krome togo predpolagaetsya chto dispersiya sluchajnyh velichin kvadraty kotoryh summiruyutsya odinakova Test provoditsya putyom sravneniya znacheniya statistiki s kriticheskim znacheniem sootvetstvuyushego raspredeleniya Fishera pri zadannom urovne znachimosti Izvestno chto esli F F m n displaystyle F sim F m n to 1 F F n m displaystyle 1 F sim F n m Krome togo kvantili raspredeleniya Fishera obladayut svojstvom F1 a 1 Fa displaystyle F 1 alpha 1 F alpha Poetomu obychno na praktike v chislitele uchastvuet potencialno bolshaya velichina v znamenatele menshaya i sravnenie osushestvlyaetsya s pravoj kvantilyu raspredeleniya Tem ne menee test mozhet byt i dvustoronnim i odnostoronnim V pervom sluchae pri urovne znachimosti a displaystyle alpha ispolzuetsya kvantil Fa 2 displaystyle F alpha 2 a pri odnostoronnem teste Fa displaystyle F alpha Bolee udobnyj sposob proverki gipotez s pomoshyu p znacheniya p F displaystyle p F veroyatnostyu togo chto sluchajnaya velichina s dannym raspredeleniem Fishera prevysit dannoe znachenie statistiki Esli p F displaystyle p F dlya dvustoronnego testa 2p F displaystyle 2p F menshe urovnya znachimosti a displaystyle alpha to nulevaya gipoteza otvergaetsya v protivnom sluchae prinimaetsya Primery F testovF test na ravenstvo dispersij Dve vyborki Pust imeyutsya dve vyborki obyomom m i n sootvetstvenno sluchajnyh velichin X i Y imeyushih normalnoe raspredelenie Neobhodimo proverit ravenstvo ih dispersij Statistika testa F s X2s Y2 F m 1 n 1 displaystyle F frac hat sigma X 2 hat sigma Y 2 sim F m 1 n 1 gde s 2 displaystyle hat sigma 2 vyborochnaya dispersiya Esli statistika bolshe kriticheskogo znacheniya sootvetstvuyushego vybrannomu urovnyu znachimosti to dispersii sluchajnyh velichin priznayutsya ne odinakovymi Neskolko vyborok Pust vyborka obyomom N sluchajnoj velichiny X razdelena na k grupp s kolichestvom nablyudenij ni displaystyle n i v i oj gruppe Mezhgruppovaya obyasnyonnaya dispersiya s BG2 i 1kni xi x 2 k 1 displaystyle hat sigma BG 2 sum i 1 k n i overline x i overline x 2 k 1 Vnutrigruppovaya neobyasnyonnaya dispersiya s WG2 i 1k j 1ni xij x i 2 N k displaystyle hat sigma WG 2 sum i 1 k sum j 1 n i x ij overline x i 2 N k F s BG2s WG2 F k 1 N k displaystyle F frac hat sigma BG 2 hat sigma WG 2 sim F k 1 N k Dannyj test mozhno svesti k testirovaniyu znachimosti regressii peremennoj X na fiktivnye peremennye indikatory grupp Esli statistika prevyshaet kriticheskoe znachenie to gipoteza o ravenstve srednih v vyborkah otvergaetsya v protivnom sluchae srednie mozhno schitat odinakovymi Proverka ogranichenij na parametry regressii Statistika testa dlya proverki linejnyh ogranichenij na parametry klassicheskoj normalnoj linejnoj regressii opredelyaetsya po formule F RSSS RSSL qRSSL n kL RL2 RS2 q 1 RL2 n kL F q n kL displaystyle F frac RSS S RSS L q RSS L n k L frac R L 2 R S 2 q 1 R L 2 n k L sim F q n k L gde q kL kS displaystyle q k L k S kolichestvo ogranichenij n obyom vyborki k kolichestvo parametrov modeli RSS summa kvadratov ostatkov modeli R2 displaystyle R 2 koefficient determinacii indeksy S i L otnosyatsya sootvetstvenno k korotkoj i dlinnoj modeli modeli s ogranicheniyami i modeli bez ogranichenij Zamechanie Opisannyj vyshe F test yavlyaetsya tochnym v sluchae normalnogo raspredeleniya sluchajnyh oshibok modeli Odnako F test mozhno primenit i v bolee obshem sluchae V etom sluchae on yavlyaetsya asimptoticheskim Sootvetstvuyushuyu F statistiku mozhno rasschitat na osnove statistik drugih asimptoticheskih testov testa Valda W testa mnozhitelej Lagranzha LM i testa otnosheniya pravdopodobiya LR sleduyushim obrazom F n kqW n F n kqLMn LM F n kq eLR n 1 displaystyle F frac n k q W n F frac n k q frac LM n LM F frac n k q e LR n 1 Vse eti statistiki asimptoticheski imeyut raspredelenie F q n k nesmotrya na to chto ih znacheniya na malyh vyborkah mogut razlichatsya Proverka znachimosti linejnoj regressii Dannyj test ochen vazhen v regressionnom analize i po sushestvu yavlyaetsya chastnym sluchaem proverki ogranichenij V dannom sluchae nulevaya gipoteza ob odnovremennom ravenstve nulyu vseh koefficientov pri faktorah regressionnoj modeli to est vsego ogranichenij k 1 V dannom sluchae korotkaya model eto prosto konstanta v kachestve faktora to est koefficient determinacii korotkoj modeli raven nulyu Statistika testa ravna F R2 k 1 1 R2 n k F k 1 n k displaystyle F frac R 2 k 1 1 R 2 n k sim F k 1 n k Sootvetstvenno esli znachenie etoj statistiki bolshe kriticheskogo znacheniya pri dannom urovne znachimosti to nulevaya gipoteza otvergaetsya chto oznachaet statisticheskuyu znachimost regressii V protivnom sluchae model priznaetsya neznachimoj Primer Pust ocenivaetsya linejnaya regressiya doli rashodov na pitanie v obshej summe rashodov na konstantu logarifm sovokupnyh rashodov kolichestvo vzroslyh chlenov semi i kolichestvo detej do 11 let To est vsego v modeli 4 ocenivaemyh parametra k 4 Pust po rezultatam ocenki regressii poluchen koefficient determinacii R2 41 2366 displaystyle R 2 41 2366 Po vysheprivedennoj formule rasschitaem znachenie F statistiki v sluchae esli regressiya ocenena po dannym 34 nablyudenij i po dannym 64 nablyudenij F1 0 412366 4 1 1 0 412366 34 4 0 70174 10 7 02 displaystyle F 1 frac 0 412366 4 1 1 0 412366 34 4 0 70174 10 7 02 F2 0 412366 4 1 1 0 412366 64 4 0 70174 20 14 04 displaystyle F 2 frac 0 412366 4 1 1 0 412366 64 4 0 70174 20 14 04 Kriticheskoe znachenie statistiki pri 1 urovne znachimosti v Excel funkciya FRASPOBR v pervom sluchae ravno F1 3 30 4 51 displaystyle F 1 3 30 4 51 a vo vtorom sluchae F1 3 60 4 13 displaystyle F 1 3 60 4 13 V oboih sluchayah regressiya priznaetsya znachimoj pri zadannom urovne znachimosti V pervom sluchae P znachenie ravno 0 1 a vo vtorom 0 00005 Takim obrazom vo vtorom sluchae uverennost v znachimosti regressii sushestvenno vyshe sushestvenno menshe veroyatnost oshibki v sluchae priznaniya modeli znachimoj Proverka geteroskedastichnosti Sm Test Goldfelda KuandtaSm takzheProverka statisticheskih gipotez Statisticheskij kriterij Test Valda Test otnosheniya pravdopodobiya Test mnozhitelej Lagranzha Test Goldfelda Kuandta t kriterij StyudentaPrimechaniyaF Test for Equality of Two Variances angl NIST Data obrasheniya 29 marta 2017 Arhivirovano 9 marta 2017 goda
