Статистическая значимость
В статистике величину (значение) переменной называют статисти́чески зна́чимой, если мала вероятность случайного возникновения этой или ещё более крайних величин. Здесь под крайностью понимается степень отклонения тестовой статистики от нуль-гипотезы.
Разница называется статистически значимой, если появление имеющихся данных (или ещё более крайних данных) было бы маловероятно, если предположить, что эта разница отсутствует; это выражение не означает, что данная разница должна быть велика, важна, или значима в общем смысле этого слова.
Общая картина проблемы такова: дана выборка из некоторого пространства элементарных событий (например, список пациентов, прошедших обследование на некоторую болезнь) и, возможно, значения на этой выборке некоторых переменных (функций от , например — возраст пациента, интенсивность курения, количество часов физических упражнений и т. п.). Вероятностное распределение на не известно, а, наоборот, является здесь главным объектом поиска.
Различные гипотезы соответствуют различным возможным вероятностным распределениям на . Точный смысл термина «гипотеза» — набор утверждений, который содержит полное описание некоторого вероятностного распределения.
Проверка гипотезы
Проверка гипотезы (задающей вероятностное распределение ) состоит в следующем. Выбирается событие (называемое статистическим критерием), которое (по каким-либо соображениям) «почти несовместимо» с гипотезой в том смысле, что условная вероятность события (при условии, что гипотеза верна) не превышает какого-то малого (по сравнению с единицей) числа , называемого уровнем значимости: . Затем проводится опыт. Если событие происходит, то гипотеза отвергается (говорят, что наблюдается отклонение от гипотезы на уровне значимости ). В противном случае, гипотеза не отвергается (однако никакой метод статистики, ни даже науки в целом, не может «окончательно доказать» гипотезу).
Таким образом, уровень значимости теста — вероятность отклонить гипотезу , если на самом деле она верна (решение известное как ошибка первого рода, или ложноположительное решение).
Популярными уровнями значимости являются 10 %, 5 %, 1 %, и 0,1 %.
Различные значения α-уровня имеют свои достоинства и недостатки. Меньшие α-уровни дают бо́льшую уверенность в том, что уже установленная альтернативная гипотеза значима, но при этом есть больший риск не отвергнуть ложную нулевую (или отвергнуть истинную альтернативную) гипотезу (ошибка второго рода, или «ложноотрицательное решение»), и таким образом меньшая статистическая мощность. Выбор α-уровня неизбежно требует компромисса между значимостью и мощностью, и следовательно между вероятностями ошибок первого и второго рода.
При использовании тестов на статистическую значимость нужно иметь в виду, что тест вовсе не дает оснований для принятия гипотезы.
См. также
- Мощность критерия
- P-значение
Примечания
- Keith M. Bower and James A. Colton. Why We Don’t «Accept» the Null Hypothesis Архивная копия от 22 декабря 2015 на Wayback Machine // American Society for Quality, Six Sigma Forum, July 2003.
Литература
- Значимости уровень : [арх. 15 июня 2022] // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
- Тутубалин В. Н. Глава 1, параграф 7. // Теория вероятностей и случайных процессов. — 1992. Архивная копия от 5 ноября 2015 на Wayback Machine
- George Casella, Roger L. Berger. Hypothesis Testing // Statistical Inference. — Second Edition. — Pacific Grove, CA: Duxbury, 2002. — С. 397. — 660 с. — ISBN 0-534-24312-6.
Ссылки
- О неправильном употреблении термина «достоверность» в российских научных психиатрических и общемедицинских статьях
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Статистическая значимость, Что такое Статистическая значимость? Что означает Статистическая значимость?
V statistike velichinu znachenie peremennoj nazyvayut statisti cheski zna chimoj esli mala veroyatnost sluchajnogo vozniknoveniya etoj ili eshyo bolee krajnih velichin Zdes pod krajnostyu ponimaetsya stepen otkloneniya testovoj statistiki ot nul gipotezy Raznicanazyvaetsya statisticheski znachimoj esli poyavlenie imeyushihsya dannyh ili eshyo bolee krajnih dannyh bylo by maloveroyatno esli predpolozhit chto eta raznica otsutstvuet eto vyrazhenie ne oznachaet chto dannaya raznica dolzhna byt velika vazhna ili znachima v obshem smysle etogo slova Obshaya kartina problemy takova dana vyborka iz nekotorogo prostranstva W displaystyle Omega elementarnyh sobytij naprimer spisok pacientov proshedshih obsledovanie na nekotoruyu bolezn i vozmozhno znacheniya na etoj vyborke nekotoryh peremennyh funkcij ot w W displaystyle omega in Omega naprimer vozrast pacienta intensivnost kureniya kolichestvo chasov fizicheskih uprazhnenij i t p Veroyatnostnoe raspredelenie na W displaystyle Omega ne izvestno a naoborot yavlyaetsya zdes glavnym obektom poiska Razlichnye gipotezy sootvetstvuyut razlichnym vozmozhnym veroyatnostnym raspredeleniyam na W displaystyle Omega Tochnyj smysl termina gipoteza nabor utverzhdenij kotoryj soderzhit polnoe opisanie nekotorogo veroyatnostnogo raspredeleniya Proverka gipotezy Proverka gipotezy H displaystyle H zadayushej veroyatnostnoe raspredelenie PH displaystyle P H sostoit v sleduyushem Vybiraetsya sobytie S W displaystyle S subset Omega nazyvaemoe statisticheskim kriteriem kotoroe po kakim libo soobrazheniyam pochti nesovmestimo s gipotezoj H displaystyle H v tom smysle chto uslovnaya veroyatnost PH S displaystyle P H S sobytiya S displaystyle S pri uslovii chto gipoteza H displaystyle H verna ne prevyshaet kakogo to malogo po sravneniyu s edinicej chisla a displaystyle alpha nazyvaemogo urovnem znachimosti PH S a displaystyle P H S leq alpha Zatem provoditsya opyt Esli sobytie S displaystyle S proishodit to gipoteza H displaystyle H otvergaetsya govoryat chto nablyudaetsya otklonenie ot gipotezy na urovne znachimosti a displaystyle alpha V protivnom sluchae gipoteza ne otvergaetsya odnako nikakoj metod statistiki ni dazhe nauki v celom ne mozhet okonchatelno dokazat gipotezu Takim obrazom uroven a displaystyle alpha znachimosti testa veroyatnost otklonit gipotezu H displaystyle H esli na samom dele ona verna reshenie izvestnoe kak oshibka pervogo roda ili lozhnopolozhitelnoe reshenie Populyarnymi urovnyami znachimosti yavlyayutsya 10 5 1 i 0 1 Razlichnye znacheniya a urovnya imeyut svoi dostoinstva i nedostatki Menshie a urovni dayut bo lshuyu uverennost v tom chto uzhe ustanovlennaya alternativnaya gipoteza znachima no pri etom est bolshij risk ne otvergnut lozhnuyu nulevuyu ili otvergnut istinnuyu alternativnuyu gipotezu oshibka vtorogo roda ili lozhnootricatelnoe reshenie i takim obrazom menshaya statisticheskaya moshnost Vybor a urovnya neizbezhno trebuet kompromissa mezhdu znachimostyu i moshnostyu i sledovatelno mezhdu veroyatnostyami oshibok pervogo i vtorogo roda Pri ispolzovanii testov na statisticheskuyu znachimost nuzhno imet v vidu chto test vovse ne daet osnovanij dlya prinyatiya gipotezy Sm takzheMoshnost kriteriya P znacheniePrimechaniyaKeith M Bower and James A Colton Why We Don t Accept the Null Hypothesis Arhivnaya kopiya ot 22 dekabrya 2015 na Wayback Machine American Society for Quality Six Sigma Forum July 2003 LiteraturaZnachimosti uroven arh 15 iyunya 2022 Bolshaya rossijskaya enciklopediya v 35 t gl red Yu S Osipov M Bolshaya rossijskaya enciklopediya 2004 2017 Tutubalin V N Glava 1 paragraf 7 Teoriya veroyatnostej i sluchajnyh processov 1992 Arhivnaya kopiya ot 5 noyabrya 2015 na Wayback Machine George Casella Roger L Berger Hypothesis Testing Statistical Inference Second Edition Pacific Grove CA Duxbury 2002 S 397 660 s ISBN 0 534 24312 6 SsylkiO nepravilnom upotreblenii termina dostovernost v rossijskih nauchnyh psihiatricheskih i obshemedicinskih statyah
