いろいろつれづれ

当面は統計検定2級の統計学入門・統計学基礎的な内容を記載しよかなと思ってます。

「母分散既知」or「母分散未知の大標本」⇒母平均の区間推定~自分、復習しとかなくては(汗)~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

統計検定2級に合格はしましたけど、あれからずいぶん時間が経ってしまって忘れがちなのです(汗)。統計学入門的内容を復習がてら備忘録として記事にしたいと思います!

参考とした書籍2つを下にご紹介しておきます。

↓↓↓

 

紹介書籍

紹介書籍①:

【リンク】⇒Amazon/通販/商品紹介ページ;東京大学教養学部統計学教室(編)(1991年) 『統計学 基礎統計学Ⅰ』 一般財団法人東京大学出版会

 

紹介書籍②:

【リンク】⇒Amazon/通販/商品紹介ページ;栗原伸一 (2011年) 『入門 統計学 -検定から多変量解析・実験計画法まで-』 株式会社オーム社

 

↓↓↓

今日の復習内容は、

 

「母分散既知」or「母分散未知の大標本」での母平均の区間推定

 

です。数式を復習します。検定試験の時に数式を覚えておいて解いた、という記憶があります。

記号・数式の表記ルールは、別途まとめている記事のリンクを貼っておきたいと思います。

 ↓ 

www.my-iroiro-my-tsurezure.jp

 

 母分散が既知のときは正規分布に基づいて計算します。

標本の大きさ・標本サイズであるnが大きいとき、つまり大標本のときは、近似的に正規分布に基づいて計算することができます。nが大きいときというのは、書籍によってn>30だったりn≧100だったりです。

 

 では、数式を以下にまとめます。

 標本平均 標本平均 は正規分布  に従う。

標準化すると、


Z値は標準正規分布  に従う。よって、

 

f:id:one_of_ippanpeople:20210216053114p:plain

f:id:one_of_ippanpeople:20210216053127p:plain

f:id:one_of_ippanpeople:20210216053140p:plain

よって、母平均μの信頼係数1-αの信頼区間は、

f:id:one_of_ippanpeople:20210216053156p:plain

 

(下のように書くこともあります)

f:id:one_of_ippanpeople:20210216053222p:plain

 

  αとZ値を具体的数値にした例を以下に示します。

 

95%信頼区間ならα=0.5なので  。よって、

 

90%信頼区間ならα=0.1なので  。よって、

 

↓↓↓

 こんな感じだったなあ、と思い出しました。自分にとってはまとめて良かったです!

(*^^)v

 では~!

(*^-^*) 

記号・数式の表記ルール~自分の復習のためにまとめます~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したんですが、だいぶ忘れてます。統計学入門的な内容から勉強し直してます。

備忘録として、記号・数式の表記ルールをまとめておこうと思います。

こちらの記事は、気が付いたものを随時加筆訂正していこうと思います。

 

参考とした書籍を下にご紹介しておきます。

↓↓↓

 

紹介書籍

紹介書籍①:

【リンク】⇒Amazon/通販/商品紹介ページ;東京大学教養学部統計学教室(編)(1991年) 『統計学 基礎統計学Ⅰ』 一般財団法人東京大学出版会

 

紹介書籍②:

【リンク】⇒Amazon/通販/商品紹介ページ;日本統計学会(編)(2015年) 『改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎』 東京図書株式会社

 

↓↓↓

 

記号・数式の表記

 

確率変数 標本 標本平均

 

(確率変数とは、事象において取りうる各値に対し、それぞれ確率が与えられている変数のこと。)

 

  

正規分布と分布に従う記号



↓↓↓

では~!

(*^-^*)

 

 

統計学のざっくり全体像~世界地図みたいなのを手に入れた心持ちだった~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したんですが、だいぶ忘れてます。統計学入門的な内容から勉強し直してます。

統計学」を勉強するぞ!と昔に思ったときに、全体として一体どんな感じの内容があるのかをふんわりとでも知りたいなあと思っていました。

統計学についての世界地図的な全体像を把握できた書籍が手に入ったとき、「おお!全体としてはこんな感じなのか!」と、頭の中がスッキリとしたのを覚えています。

その書籍を紹介させていただきますね。

↓↓↓

 

紹介書籍

【リンク】⇒Amazon/通販/商品紹介ページ;栗原伸一・丸山敦史(共著)/ジーグレイプ(制作)(2017年) 『統計学図鑑』 株式会社オーム社

 

↓↓↓

 

統計学のざっくり全体像【備忘録として】

 

「記述統計学がまずあります(多分、統計検定3級とかの範囲なのでは?)。

そして、「確率分布」を基に母集団の特徴を「推定」したりする「推測統計学があります(点推定や区間推定)。

「推定」と表裏一体と言われている「検定(仮説検定)」もあります。

複数のデータを比較解析できる「分散分析」「多重比較」もあります。

「確率分布」を基にした解析はパラメトリック手法」と言いますが、「確率分布」を基にできないときは「ノンパラメトリック手法」というもので解析します。

その他、「実験計画法」「回帰分析」「多変量解析」ベイズ統計学というものがあります。

 

こんな表現になりましたが、私の中ではこのような感じです。

 

↓↓↓

機械学習とか他にもあるのかもしれませんが、そこまではまだ自分では把握しきれていません。

f(^^;)

これらの全体像の肝心の中身ですが、私にはまだ理解できてないことが山ほどあります。

(+_+)

ちょっとずつになってしまうかもしれないですが、精進いたします。。。

(^▽^;)

「尺度」を復習しておこうっと!~大事なことなんだけど自分の中でなあなあになりがちなので~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したんですが、だいぶ忘れてます。統計学入門的な内容から勉強し直してます。

「尺度」って大事なことで基本的なことなんですけど、自分の中であんまり意識しないことがあるので、復習がてら備忘録として記載したいと思います。

「尺度」について記載のある書籍を一つご紹介しておきます。

↓↓↓

 

紹介書籍

【リンク】⇒Amazon/通販/商品紹介ページ;東京大学教養学部統計学教室(編)(1991年) 『統計学 基礎統計学Ⅰ』 一般財団法人東京大学出版会

 

↓↓↓

 

尺度4つ

尺度は4つに分類されます。

 

①名義尺度(名目尺度) nominal scale

②順序尺度 ordinal scale

③間隔尺度 interval scale

④比尺度 ratio scale

 

( ↑ 番号は便宜上の番号です。)

 

①名義尺度(名目尺度)・・・アンケートなどで尋ねられる性別や職業など。他と異なるか同一かという判断をするタイプのデータ

 

②順序尺度・・・アンケートなどで尋ねられるお店の雰囲気などについて非常に良い・良い・中程度・悪い・非常に悪いなど。大きい小さい、良い悪いなど、程度を判断するタイプのデータ

 

①と②は質的な尺度であり、和・差・積・商を計算することは(基本的に)ない。

 

③間隔尺度・・・時刻、摂氏温度、華氏温度など。間隔のみが意味を持つ量的なデータ。和・差は計算できるが、積・商は計算できない。(時刻は時間の流れのある時点を表す値。摂氏温度や華氏温度は温度の相対的な大小を表す値。「20℃の気温の日は10℃の気温の2倍暖かい」などとは言わない。「20℃の気温の日は10℃の気温の日より10℃暖かい」とは言う。)

 

④比尺度・・・絶対温度、身長、長さ、体重、重さ、経過時間(ある時刻からある時刻の間で経過した時間)、価格、年齢など。比が計算できて、それが意味を持つという量的なデータ。和・差・積・商を計算することができる。

 

↓↓↓

4つの尺度への分類ができないということは、和・差・積・商を計算していいのかの判断ができないということなんじゃないかと思うので、4つの尺度の理解は重要ですね、きっと。

私の中ではですが、「時刻は間隔尺度だけど経過時間は比尺度」というところと、「摂氏温度と華氏温度は間隔尺度だけど絶対温度は比尺度」というところがオモシロポイントです。

(*^^*)

〖追記①②あり〗正規分布の縦軸や標準正規分布の縦軸って何?そういえば~一時期気になってた~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したんですが、だいぶ忘れてます。統計学入門的な内容から勉強し直してます。

正規分布や標準正規分布の図はおなじみの物だと思いますが、縦軸を省略しているものが多く、そういや縦軸を省略せずに表すとするとどんな表記になるんだろ?と思ってたことがあります。自分の備忘録として記載したいと思います。

表題について解決に導いてくれた3冊の書籍を紹介させていただきます。

↓↓↓

 

紹介書籍

紹介書籍①:

【リンク】⇒Amazon/通販/商品紹介ページ;大村 平(改訂版2002年) 『統計のはなし-基礎・応用・娯楽-【改訂版】』 株式会社日科技連出版社

 

紹介書籍②:

【リンク】⇒Amazon/通販/商品紹介ページ;東京大学教養学部統計学教室(編)(1991年) 『統計学 基礎統計学Ⅰ』 一般財団法人東京大学出版会

 

紹介書籍③:

【リンク】⇒Amazon/通販/商品紹介ページ;日本統計学会(編)(2013年) 『日本統計学会公式認定 統計検定1級対応 統計学』 東京図書株式会社

 

↓↓↓

 

紹介書籍①では、正規分布や標準正規分布の縦軸をyとして解説してくださっているページがあります。(因みに、正規分布の横軸はx、標準正規分布の横軸はZです。)

紹介書籍②では、正規分布の縦軸をf(x)として表記しています。

紹介書籍③では、正規分布に限らず確率密度関数の縦軸をfx(x)として表記しています。

 

紹介書籍①~③より学んだ正規分布と標準正規分布の関数を記載しておきます。

 

正規分布・・・連続型確率変数を持つ確率分布の一つ。英語ではnormal distributionであり、「ありふれた分布」とか「通常の分布」という雰囲気なのだそう。

 

確率密度関数・・・連続型確率変数を持つ確率分布の曲線自体を表す関数。

 

「累積分布関数(分布関数)」・・・連続型確率変数を持つ確率分布曲線下の面積を表す関数。つまり、「確率密度関数」を積分している形となっている。

 

「標準正規分布・・・標準化された正規分布。英語ではstandard normal distribution。

 

 

正規分布や標準正規分布の縦軸

これは、そのxという事象が起こる度数みたいなものだと思います。

曲線下面積は、ご存知「確率」を表しています。

数式は下の2つの図に書き込みました。

〖追記①:2021/9/1追記

正規分布f(x)におけるxのときの縦軸はxという事象の相対度数、標準正規分布f(Z)における標準化変数Zのときの縦軸は、xという事象に対応する標準化変数Zの相対度数と思っています。※明示されている資料がまだ見つかっていないので、これは今後確認が必要です。

正規分布のf(x)の曲線下面積の総面積を1にするため、に「1/σ(2π)^(1/2)」という係数をネイピア数の累乗項に掛けているのだそうです。正規分布でも標準正規分布でも曲線下面積は確率を表しており、それぞれその総面積が1です。よって、正規分布f(x)におけるxのときの縦軸はxという事象の相対度数、標準正規分布f(Z)における標準化変数Zのときの縦軸は、xという事象に対応する標準化変数Zの相対度数なのではないかと思っています。

〖追記②:2021/9/3追記

ネットサーフィンしていたら「確率密度」という語があることを知りました。ほへ~!関数名は「確率密度関数」なので「確率密度」の関数ですよ、ということなのですね、きっと。リンクを貼るべきなのかちょっと分からずに記載してしまい大変恐縮なのですが、そのサイトさんによると、「確率密度」とは「相対的な出やすさ」なのだそうです。おお!ということは、私の2021/9/1の追加訂正で記載した「縦軸は『相対度数』」は当たらずしも遠からず、という感じでしょうか?(←違うかf(^^;))

相対的な出やすさ、ということは「相対的な確率」という感じなのでしょうかねえ。「相対度数」は「相対的な事象の数」だから「相対的確率」とは異なるものですが、似ているイメージを持ってしまいます、わたくし。とりあえず「相対」というところまではばっちり合ってた、ということで大目にみていただけないものでしょうか(><)。(←もちろん、厳密にはダメ~!!)

今回の情報源はネットサーフィンなので、今後、明示されている書籍などの資料が見つかったら追記したいと思います。(`・ω・´)ゞ

正規分布の確率密度関数と曲線下面積_横軸と縦軸_図

( ↑ 正規分布の曲線下面積については、これを累積分布関数として定義している書籍を今のところみかけてないので、このような表記としました。)

 

標準正規分布の確率密度関数と累積分布関数_横軸と縦軸_図

↓↓↓

備忘録としてですが、ブログにまとめていると、自分の学習・復習・勉強にも良いような気がしました。

('◇')ゞ

(#^^#)

「信頼区間」の意味~自分の中でたまにこんがらがってた~【備忘録】

ーーーーーーーー

主要内容

ーーーーーーーー

 

昔、統計検定2級に合格したんですが、だいぶ忘れてますね。統計学入門的な内容から勉強し直してます。

「信頼区間」の意味、自分の中でたまにこんがらがってましたので、備忘録として記載しときます。f(^^;)

表題の件について参考にさせていただいた書籍を紹介させていただきます。

↓↓↓

 

紹介書籍

【リンク】⇒Amazon/通販/商品紹介ページ;涌井良幸・涌井貞美(2015年) 『まなびのずかん 統計学の図鑑』 技術評論社

 

↓↓↓

 

用語

この書籍の中に「95%信頼区間」を求める方法を記載している箇所があります。そこに「信頼区間」の意味を記載してくださってますので、引用させていただきます。

この例で求めた推定区間を信頼度95%の母平均μの「信頼区間」と呼びます。注意すべきことは、この式の意味は「母平均μが95%の確率で上に示した区間に入る」ことを意味しているわけではありません。上の式が95%の確率で成立する、ということだけを意味しているのです。 

 だそうです。(因みに、「信頼度95%」の「信頼度」は、他の書籍等では「信頼係数」「信頼水準」とも言ったりするようです。)

 

信頼区間の意味の図示

「信頼区間の意味」を図示すると以下のようになると思います。

「信頼区間の意味」を示した図

 

信頼区間の間違った意味の図示

間違った「信頼区間の意味」の自分のイメージを図示すると以下のような感じです。

間違った「信頼区間の意味」を示した図(間違った「信頼区間の意味」についての自分の中のイメージ)

母平均μは一つしかないはずなのに、この図にはたくさんあります。変な図です。

この変な図はあくまで自分なりのイメージ図ではありますが、このイメージができてからは自分はこんがらがらなくなりました!ちゃんちゃん!\(^^)/

↓↓↓

拙いイメージですが、もし、もし何らかのご参考になりましたら幸いです。

(*^-^*)

フィッシャーの三原則~これをちゃんと書いてある本は少ないって昔チラッと聞いたので~【備忘録】

ーーーーーーーー
主要内容

ーーーーーーーー

昔、統計検定2級に合格したんですが、だいぶ忘れてますね。統計学入門的な内容から勉強し直してます。
その昔、統計学セミナーに参加させていただいたとき講師の方が、
「『フィッシャーの三原則(フィッシャーの3原則)』は教科書にもなかなか書かれていない、いろんな本にもなかなか書かれていない。」
というようなことをおっしゃっておられました。
今は記載されている本は増えたのかなあ?そこは今のところ私には分かりません。
ただ、そのセミナー参加の後に、「フィッシャーの三原則」を記載してくださっている書籍を一つ見つけたのでご紹介しますね。

↓↓↓

「フィッシャーの三原則」の概要

「フィッシャーの三原則」の概要を、自分の備忘録として記載しておきます。
自分の中での疑問点は【】で括って記載しておきます。

「フィッシャーの三原則」・・・「実験研究」を成功させるための大原則

●無作為化(ランダム化)
●繰り返し(反復)
●局所管理(小分け)

用語

上記3点の説明をするための用語を下に示します。

「実験研究」・・・ここでいう「実験研究」とは、「実験計画法」にに基づき実験を行い、その実験結果を「分散分析法」で解析するものを指します。

「実験計画法」・・・実験において実施すべきルール

「分散分析法」・・・「とある何かが効果があるのかないのか」の実験をしたその実験結果について、を分析し、判定をする方法。「とある何か」という、効果の原因になるものを「要因(因子)」と呼び、「とある何かが効果があるのかないのか調べる」のが実験の目的でなので、ここにおける「とある何か」を「目的要因」という。

「目的要因」と「誤差要因」・・・「目的要因」は前述の「分散分析法」の説明文を参照のこと。「分散分析法」においては、実験結果に対するあらゆる何かによる効果のうちの「目的要因」による効果以外による効果を全て「誤差」として分離させることにしている。効果の原因になるものを「要因(因子)」と呼び、誤差としての効果の原因になるものを「誤差要因」という。

目的効果」と「誤差効果」・・・「目的要因」による効果と「誤差要因」による効果。(「目的要因」が2つあるときは、その2つの相乗効果を「交互作用」と呼ぶ。今回の記事内では、一旦、目的要因を一つとしておく。)

「偏差」・・・各値の平均値との差の事。(余談ですが「平均偏差」や「標準偏差」はデータ全体の偏差を表すものの例ということだと思います。「平均偏差」という値はあんまり使われない値なのだそう。)

「変動」・・効果の原因になるものを「要因(因子)」と呼ぶが、要因により効果がでれば実験結果の値は変動する。その効果の程度を「変動」と呼ぶ。「変動」を表すのに「偏差」を用いる。

「総変動」・・・データ全体の各値の変動のこと、つまり、データ全体の各値の偏差。「目的効果」による変動と「誤差効果」による変動から成る。つまり、「群間変動」と「郡内変動」から成る。

「群間変動」・・・「目的効果」の程度。つまり、「目的効果」の変動。

「郡内変動」・・・「誤差効果」の程度。つまり、「誤差効果」の変動。

「交絡」・・・2つの「要因(因子)」の効果が絡み合って分離できない状況

「検出力」・・・分析精度のこと。「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)を基に算出する(「誤差効果」の変動の分散の方が分母)。その比(F値)が高い方が「検出力」も高くなる。「検出力」が高いということは、分析精度が高いということ。

「フィッシャーの三原則」

これら上記の用語を使用して、「フィッシャーの三原則」についてまとめてみます。

●無作為化(ランダム化)・・・偏り防止。「誤差効果」の変動(「郡内変動」)の中に、「目的効果」の変動(「群間変動」)が絡み合っていて分離できないという「交絡」がある恐れがあるので、区画や順番を無作為(ランダム)に並べ替えて実験を行うことにより、「郡内変動」の中の「一部の群間変動」が確率的に相殺されるように均一に入り込むだけ、という状態にできる。つまり、「郡内変動」中の「一部の群間変動」を「郡内変動」へと転化することができる、ということ。【[ということは、「郡内変動」の分散(「誤差効果」の変動の分散)が本来の値より不当に大きくなったり不当に小さくなったりしない、ということになる。「目的効果」の変動の分散との比を算出して「検出力」を算出するときに、不当な結果が出ることがなくなる、ということであり、分析結果を誤ることがなくなる、ということ。]だと今のところ思っています。書籍の中では

「・・・F値の分子が実際よりも大きくなってしまい、・・・(その逆の場合もあります)・・・」

という記載がありますが、ここが良く理解できないでいます。(疑問点①)】

●繰り返し(反復)・・・繰り返し数(反復数)を多くすると、自由度が大きくなるので「誤差効果」の変動の分散が小さくなる。ということは、「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)が大きくなり、「検出力」(分析精度)が高くなる。

●局所管理(小分け)・・・小区画(ブロック)に小分けする。つまりブロック化する。そのブロックの中で実験を管理する。つまり局所的に実験を管理する。一つのブロック内で得られたデータを一つの標本とみなす。ブロック(標本)を要因(因子)の一つとし、つまり「ブロック因子」とし、「ブロック間変動(標本間変動)」として抽出する。【[もともとは「目的要因」による効果以外による効果を全て「誤差」として分離させていたので、その時は「ブロック因子」は誤差の中に含まれていたことになる。つまり、「ブロック間変動(標本間変動)」を抽出する際は「誤差効果」の変動の中から抽出されることになる。となると、「誤差効果」の変動が小さくなり、「誤差効果」の変動の分散も「ブロック間変動(標本間変動)」を抽出する前よりも小さくなる。ということは、「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)が大きくなり、「検出力」(分析精度)が高くなる。]だと今のところ思っています。この考えで合ってます?(疑問点②)】

↓↓↓

今のところ自分の中で疑問点①~②があります。
いつか疑問が解消されたりしたら追記していきたいと思います。
(*^-^*)

〖修正版の表2つ追記〗「標準偏差」「標準誤差」「標本誤差」?ほへ?!【備忘録】

ーーーーーーーー
主要内容

ーーーーーーーー

昔、統計検定2級に合格したんですが、だいぶ忘れてますね。統計学入門的な内容から勉強し直してます。
標準偏差」「標準誤差」「標本誤差」がごっちゃになるので、自分の頭を整理し、備忘録として記事にしますね。

勉強に使用した書籍を下に紹介します。

↓↓↓

紹介書籍

【リンク】⇒Amazon/通販/商品紹介ページ;栗原伸一 (2011年) 『入門 統計学 -検定から多変量解析・実験計画法まで-』 株式会社オーム社

↓↓↓

表題に関して今の私が分かっていることと分かっていないことを明記しておきたいと思います。
分かってないことは【】で括っておきます。


〖2021/2/20 追記;【】で括っておいた疑問点①~⑥について。

疑問点①は、一旦、合っているとしたいと思います。

疑問点②~⑥については、2021/2/20に記載した下の記事をまとめることにより解決しました。

www.my-iroiro-my-tsurezure.jp

用語の表(その1)及び(その2)の修正版

〖2021/8/31 追記;

表「本記事のまとめ表(その1):母集団と標本」及び「本記事のまとめ表(その2):標本誤差」の修正版を載せます。

修正版(2021年8月31日):本記事のまとめ表(その1):母集団と標本

修正版(2021年8月31日-2):本記事のまとめ表(その2):標本誤差
※括弧[ ]の中は私の推測です。

〖2021/8/31 追記;下の2つの表の修正版を上に示しました〗
本記事のまとめ表(その1):母集団と標本

本記事のまとめ表(その2):標本誤差

「母集団」・・・調べたい対象のこと

「母平均」・・・「母集団」の平均

「母分散」・・・「母集団」の分散

「母標準偏差・・・「母集団」の標準偏差

「標本」・・・「母集団」を調べるためにランダムに取り出した検査対象・調査対象のこと【で合ってるかな?(疑問点①)】

「標本サイズ」・・・とある「標本」の大きさ(いわゆるn数)

「標本平均」・・・とある「標本」の平均(検査・調査における観測値。「標本サイズ」が大きい「標本」の平均は「母平均」の推定値となりうる。)

「標本分散」・・・とある「標本」の分散(検査・調査における観測値。「標本サイズ」が大きい「標本」の分散は「母分散」の推定値となりうる。)

「標本標準偏差・・・とある「標本」の標準偏差(検査・調査における観測値。「標本サイズ」が大きい「標本」の標準偏差は「母標準偏差」の推定値となりうる。)

「不偏平均」・・・「標本サイズ」が小さい「標本」の平均。小さい「標本サイズ」の「標本」から「母平均」を推定した値。だが、平均は「標本サイズ」のばらつきには左右されないので、実質として「標本平均」=「不偏平均」。

「不偏分散」・・・「標本サイズ」が小さい「標本」の分散。小さい「標本サイズ」の「標本」から「母分散」を推定した値。

「不偏標準偏差・・・「標本サイズ」が小さい「標本」の標準偏差。小さい「標本サイズ」の「標本」から「母標準偏差」を推定した値。

標本誤差・・・「標本平均」から「母平均」を推定するときなど、「標本」データを使って「母集団」の統計量を推定するときに発生する誤差

「標本数」・・・「標本」の数

「標本分布」・・・複数ある「標本平均」の分布【とある「標本」の分布を、複数ある「標本平均」の分布とみなすってこと?(疑問点②)】

「標本平均の平均」・・・【というのがあるということで良いのか?(疑問点③)】

「標本誤差分散」・・・「(複数ある)標本平均の分散(n≧30という風に標本サイズが大きい場合の概念)」【つまり、とある一つの「標本」データから「母集団」を推定する際のその誤差は、標本が複数ある場合とみなしたときのその分散がそれに当たる、ということ?そしてそれが「標本誤差」ってこと?(疑問点④)】

「母誤差分散」・・・「(複数ある)標本平均の分散(母分散が既に分かっている場合の概念)」

「誤差分散」・・・「標本誤差分散」や「母誤差分散」のこと。【これも「標本誤差」を表すものの一つということで合ってる?(疑問点⑤)】

「標本標準誤差・・・「(複数ある)標本平均の標準偏差(n≧30という風に標本サイズが大きい場合の概念)」【つまり、とある一つの「標本」データから「母集団」を推定する際のその誤差は、標本が複数ある場合とみなしたときのその標準偏差がそれに当たる、ということ?そしてそれが「標本誤差」ってこと?(疑問点⑥)】

「母標準誤差・・・「(複数ある)標本平均の標準偏差(母分散が既に分かっている場合の概念)」

標準誤差・・・「標本標準誤差」や「母標準誤差」のこと。「標本誤差」の大きさを表すものの一つ。

「不偏誤差分散」・・・「(n<30という風に)標本サイズが小さい場合の誤差分散」

「不偏標準誤差・・・「(n<30という風に)標本サイズが小さい場合の標準誤差


〈誤差という概念がない場合とは〉
その1:
「標本サイズ」がn=1のとき。これは一個体を表しているので、平均もばらつきも関係なしなのだそう。「標本サイズ」がn=1という「標本」が複数有って分布を作っても「平均の分布」ではなく、「個体別の度数分布」ということになるのだそう。

その2:
「標本サイズ」がn=全数のとき。平均は出るけどばらつきは関係なしなのだそう。「標本サイズ」がn=全数という「標本」をいくら複数作っても平均の値はひとつしかないので、ばらつきなんて発生しない、ということなんだと思う。

↓↓↓

今回の記事では疑問点が①~⑥ありました。
なんか分かったら、都度追記しようかと思ってます。
( =^ω^)

本ブログ中で商品の紹介をする場合は広告として記載することにしました