add notes about hypothesis-test

This commit is contained in:
falsycat 2023-06-18 16:32:59 +09:00
parent 9e1d7049a2
commit ee705aa8be
3 changed files with 75 additions and 1 deletions

View File

@ -0,0 +1,38 @@
---
title: 仮説検定の多重性問題
tags: [note, study, statistics]
---
## 概要
- 結論に複数の[仮設検定](note/study/statistics/hypothesis-test.md)の結果が影響している時,その結論は検定の多重性問題を孕んでいる可能性がある
- 問題を回避するためにはHolm法などで有意水準を下げる必要があるが完璧ではない
## 不確実な情報による結論の不確実性
- **第一種の過誤のみを考慮した場合**,有意水準$x$で得られた検定の結果$n$個から導き出された結論は,最大で確率$1-(1-x)^n$で誤りである
- $P_1\cup P_2\cup \dots \cup P_n\implies Q$であるとき,$P_i$それぞれについて偽である確率が$e$ならば,$\overline{Q}$である確率は$1-(1-e)^n$である
- 故に有意水準を小さくすることで,結論が誤りである可能性を小さくすることができる
- ただし,実際には**第二種の過誤も存在する**
- 有意水準を小さくすれば結論が第二種の過誤である確率は増加する
- 以上より,多重検定は非常によろしくない
- 有意水準を何らかの方法で小さくした上で,全ての検定の帰無仮説が棄却であった場合のみ,統計的に有意な結論を導ける
- 帰無仮説が棄却された場合,それが第二種の過誤であることはありえないから
## Holm法による有意水準の調整
多重検定を構成する一つ一つの検定の有意水準を小さくする方法の一つがHolm法である他の方法も存在するがHolmが一番バランスがとれてる棄却/受容しすぎない)方法だと思う.
### 手法
$N$個の検定による多重検定の有意水準を$\alpha$としたときHolm法による有意水準の調整を次のように行う
1. 各検定の有意確率をソート
2. $i=0$とする
3. 結論が未確定の検定のうち,最も有意確率が小さいものについて,その有意確率を$x$としたとき,
- $x < \frac{\alpha}{N-i}$ ならばその検定を棄却
- $x > p$ ならば,結論が未確定の検定すべて(その検定を含む)を受容し,終了
4. $i$に1を足して
- $i<N$ ならば3へ戻る
- それ以外ならば,終了
## まとめ
- 多重検定は避けるべき
- どうしても必要なら有意水準の補正が必要
- 有意水準の補正にはHolm法が有効

View File

@ -0,0 +1,36 @@
---
title: パラメトリック検定とノンパラメトリック検定
tags: [note, study, statistics]
---
## 概要
- [仮設検定](note/study/statistics/hypothesis-test.md)におけるパラメトリック検定とは,母集団のサンプルに対する検定のうち,母集団の分布を事前に仮定する検定である
- 母集団のサンプルに対する検定のうち,パラメトリック検定でないものはノンパラメトリック検定である
## パラメトリック検定
- 母集団がある特定の分布であると事前に仮定する検定
- ノンパラメトリック検定に比べて,計算が楽
- 手計算はこっちの方が嬉しい
- 母集団が仮定と異なる分布を持つ場合,検定の結論に意味は無い
- 事前検定で母集団の仮定を検証するのはやめた方がいい(後述)
## ノンパラメトリック検定
- 母集団の分布を仮定しない検定
- 計算がめんどくさい
- サンプルサイズが頭おかしいほど大きくない限り,コンピュータなら一瞬
- 仮定に沿うパラメトリック検定が存在する場合,それよりも精度は落ちるが,実用的な問題はない
## 事前検定
- 欲しい結果を得る検定の前に行われる検定のこと
- [多重検定](note/study/statistics/hypothesis-test-multiplicity.md)の問題を孕む
- 個人的には,大抵の場合において事前検定は愚行だと思っている
- 母集団の正規性を仮定するパラメトリック検定を使いたいがために,事前検定として正規性の検定(Shapiro-wilk test)をする人がいる
- 個人的には多重検定問題沼に足を突っ込むぐらいなら,そこまでしてパラメトリック検定を使う必要はないと思う
- 大人しくノンパラメトリック検定を使うべき
- そもそもコンピュータ使えば計算コストは無視できる
## まとめ
- 仮設検定は2つに分けられる
- パラメトリック検定: 母集団の分布になんらかの仮定が必要な検定
- ノンパラメトリック検定: それ以外の検定
- パラメトリック検定をしたいがために多重検定を使うぐらいならば,ノンパラメトリック検定を使うべき

View File

@ -25,7 +25,7 @@ tags: [note, study, statistics]
- 第一種の誤りが許されない場面医療などでは1%
## 例
- コイントスを10回て7回表が出たコイントスは公平か
- コイントスを10回やって7回表が出たコイントスは公平か
- 7回表が出る確率は$\frac{1}{2^{10}} \cdot {}_{10} \mathrm{C}_7=0.12$
- $0.12>0.10$より有意水準10%で帰無仮説は棄却されない
- コイントスは**公平である**