いろいろつれづれ

当面は統計検定2級の統計学入門・統計学基礎的な内容を記載しよかなと思ってます。

「母分散未知の小標本」⇒「母平均の差」の区間推定~自分の復習のために~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したのですが、もう忘れかけてるので復習をしています。備忘録として記事にしますね。

 

復習に用いた書籍3冊を以下にご紹介します。

↓↓↓

  

紹介書籍

紹介書籍①:

【リンク】⇒Amazon/通販/商品紹介ページ;東京大学教養学部統計学教室(編)(1991年) 『統計学 基礎統計学Ⅰ』 一般財団法人東京大学出版会

  

紹介書籍②:

【リンク】⇒Amazon/通販/商品紹介ページ;日本統計学会(編)(2015年) 『改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎』 東京図書株式会社

 

紹介書籍③:

【リンク】⇒Amazon/通販/商品紹介ページ;栗原伸一 (2011年) 『入門 統計学 -検定から多変量解析・実験計画法まで-』 株式会社オーム社

  

↓↓↓

今回の復習内容は、

 

「母分散未知の小標本」での「母平均の差」の区間推定

※今回は、独立な2つの標本、つまり、対応のない2つの標本、対応のない2群についての話です。

 

 です。

記号・数式の表記ルールは、別途まとめている記事のリンクをを貼っておきたいと思います。

 

www.my-iroiro-my-tsurezure.jp

 

それでは、数式をまとめたいと思います。統計検定の試験の時には、数式を覚えて解いた、という記憶があります。

「母分散未知の小標本」の「母分散が未知」というのはまず良いとして、「小標本」というのは、標本の大きさ・標本サイズであるnが小さいときということです。具体的数値としては、書籍によってn<30だったり、n<100だったりします。

 

標本分布

正規分布に従う2つの母集団それぞれから抽出したと考え、独立な2つの標本、つまり、対応のない2つの標本、対応のない2群を次のように表現しておきます。

 

独立な2つの標本、対応のない2つの標本、対応のない2群


 

それぞれの標本についての標本分布については以下のように表現しておきます。

 

標本分布としての正規分布1

 

標本分布としての正規分布2

 

(参考に過去の記事2つのリンクを貼っておきます)

 

www.my-iroiro-my-tsurezure.jp

 

 

www.my-iroiro-my-tsurezure.jp

 

 

続きを記載します。

「母分散未知の小標本」であり、かつ「独立な2つの標本」(つまり「対応のない2つの標本」、「対応のない2群」)のときは、さらに2つの場合を想定します。

「母分散は未知」とはいえ「母分散が等しいと分かっている場合」と「母分散が等しくないと分かっている場合(母分散が等しいと仮定できない場合)」の2つに分かれます後者では「ウェルチの近似法(Welchの近似法)」を用います。

 

[母分散が等しいと分かっている場合]

母分散が等しいとき、 f:id:one_of_ippanpeople:20210227062149p:plain と「共通の母分散」を f:id:one_of_ippanpeople:20210227062345p:plain とし、共通の母分散に対する推定値を f:id:one_of_ippanpeople:20210227064636p:plain とする。第1の標本、第2の標本それぞれで不偏分散を求めることができ、それぞれを f:id:one_of_ippanpeople:20210227064703p:plain 、 f:id:one_of_ippanpeople:20210227064723p:plain とすると、

 

f:id:one_of_ippanpeople:20210227190013p:plain  、  f:id:one_of_ippanpeople:20210227190946p:plain

 

である。共通の母分散 f:id:one_of_ippanpeople:20210227062345p:plain は、2つの標本を合併した分散で推定する。共通の母分散  f:id:one_of_ippanpeople:20210227062345p:plain の推定値 f:id:one_of_ippanpeople:20210227064636p:plain は、

 

f:id:one_of_ippanpeople:20210227191114p:plain

 

であり、これも不偏推定量である。これを、「合併した分散」、「併合した分散」、「プールした分散」、「こみにした分散」、「合併された分散」、「併合された分散」、「プールされた分散」、「こみにされた分散」などの言い方で呼ぶ。英語では、「pooled estimator」や「pooled variance」と呼ぶ。第1の標本の不偏分散 f:id:one_of_ippanpeople:20210227064703p:plain 、第2の標本の不偏分散 f:id:one_of_ippanpeople:20210227064723p:plain は、

 

f:id:one_of_ippanpeople:20210227190013p:plain  より、  f:id:one_of_ippanpeople:20210227191024p:plain

 

f:id:one_of_ippanpeople:20210227190946p:plain  より、  f:id:one_of_ippanpeople:20210227191302p:plain

 

 なので、

 

f:id:one_of_ippanpeople:20210227191114p:plain  より、  f:id:one_of_ippanpeople:20210227191336p:plain

 

となる。これは、2つの標本のそれぞれの自由度を重みとしたときの、2つの標本の不偏分散の加重平均でもある。

 

f:id:one_of_ippanpeople:20210227193058p:plain

 

ここで、

平均の差の分布

 

t分布に従う

よって、

 

  より、

 

(下のように書いたりもします)

 

より、

 

となります。

 

「母分散未知の小標本」であり、かつ「独立な2つの標本」(つまり「対応のない2つの標本」、「対応のない2群」)のときは、さらに2つの場合を想定します。一方の場合についてここまで記載しました。さあ、次は、もう一つの場合についてです。

 

[母分散が等しくないと分かっている場合(母分散が等しいと仮定できない場合)]

 母分散は等くなく、  である。第1の標本、第2の標本それぞれで不偏分散をそれぞれを f:id:one_of_ippanpeople:20210227064703p:plain 、 f:id:one_of_ippanpeople:20210227064723p:plain とすると、

 

f:id:one_of_ippanpeople:20210227190013p:plain  、  f:id:one_of_ippanpeople:20210227190946p:plain

 

である。ここで、

平均の差の分布

 

ウェルチの近似法(Welchの近似法)

 

よって、

(式の変形の過程は割愛します)

 

(下のように書いたりもします)

 

[補足]

 今回の記事の2つの場合のどちらを使うかの判断についてですが、2つの母分散が等しいかどうかを「母分散の比の検定(等分散の検定)」を行い、その結果によって判断することになります。

 この検定では、帰無仮説が棄却されると「等分散でなく、等分散である確率は有意水準α以下である」となり、帰無仮説が棄却されないと「等分散でないとははっきり言えない」となります。

 「等分散でないとははっきり言えない」というのは、つまり「必ずしも等分散であるとは言えない」ということですが、「母分散の比の検定(等分散の検定)」で棄却されない程度の違いであれば許容される、という考えなのだそうです。

 まとめますと、「母分散の比の検定(等分散の検定)」で帰無仮説が棄却されなかったときは「等分散である」とみなして「母分散が等しいと分かっている場合」を選択し、「母分散の比の検定(等分散の検定)」で帰無仮説が棄却されたときは「等分散でない」として「母分散が等しくないと分かっている場合(母分散が等しいと仮定できない場合)」を選択します。

 

↓↓↓

ふう。f(^^;)

記事にまとめることができました~!

\(^^)/

ではでは~!

\(^o^)/

本ブログ中で商品の紹介をする場合は広告として記載することにしました