いろいろつれづれ

当面は統計検定2級の統計学入門・統計学基礎的な内容を記載しよかなと思ってます。

フィッシャーの三原則~これをちゃんと書いてある本は少ないって昔チラッと聞いたので~【備忘録】

昔、統計検定2級に合格したんですが、だいぶ忘れてますね。統計学入門的な内容から勉強し直してます。
その昔、統計学セミナーに参加させていただいたとき講師の方が、
「『フィッシャーの三原則(フィッシャーの3原則)』は教科書にもなかなか書かれていない、いろんな本にもなかなか書かれていない。」
というようなことをおっしゃっておられました。
今は記載されている本は増えたのかなあ?そこは今のところ私には分かりません。
ただ、そのセミナー参加の後に、「フィッシャーの三原則」を記載してくださっている書籍を一つ見つけたのでご紹介しますね。

↓↓↓

【リンク】⇒Amazon/通販/商品紹介ページ;栗原伸一 (2011年) 『入門 統計学 -検定から多変量解析・実験計画法まで-』 株式会社オーム社

↓↓↓

「フィッシャーの三原則」の概要を、自分の備忘録として記載しておきます。
自分の中での疑問点は【】で括って記載しておきます。

「フィッシャーの三原則」・・・「実験研究」を成功させるための大原則

●無作為化(ランダム化)
●繰り返し(反復)
●局所管理(小分け)


上記3点の説明をするための用語を下に示します。

「実験研究」・・・ここでいう「実験研究」とは、「実験計画法」にに基づき実験を行い、その実験結果を「分散分析法」で解析するものを指します。

「実験計画法」・・・実験において実施すべきルール

「分散分析法」・・・「とある何かが効果があるのかないのか」の実験をしたその実験結果について、を分析し、判定をする方法。「とある何か」という、効果の原因になるものを「要因(因子)」と呼び、「とある何かが効果があるのかないのか調べる」のが実験の目的でなので、ここにおける「とある何か」を「目的要因」という。

「目的要因」と「誤差要因」・・・「目的要因」は前述の「分散分析法」の説明文を参照のこと。「分散分析法」においては、実験結果に対するあらゆる何かによる効果のうちの「目的要因」による効果以外による効果を全て「誤差」として分離させることにしている。効果の原因になるものを「要因(因子)」と呼び、誤差としての効果の原因になるものを「誤差要因」という。

目的効果」と「誤差効果」・・・「目的要因」による効果と「誤差要因」による効果。(「目的要因」が2つあるときは、その2つの相乗効果を「交互作用」と呼ぶ。今回の記事内では、一旦、目的要因を一つとしておく。)

「偏差」・・・各値の平均値との差の事。(余談ですが「平均偏差」や「標準偏差」はデータ全体の偏差を表すものの例ということだと思います。「平均偏差」という値はあんまり使われない値なのだそう。)

「変動」・・効果の原因になるものを「要因(因子)」と呼ぶが、要因により効果がでれば実験結果の値は変動する。その効果の程度を「変動」と呼ぶ。「変動」を表すのに「偏差」を用いる。

「総変動」・・・データ全体の各値の変動のこと、つまり、データ全体の各値の偏差。「目的効果」による変動と「誤差効果」による変動から成る。つまり、「群間変動」と「郡内変動」から成る。

「群間変動」・・・「目的効果」の程度。つまり、「目的効果」の変動。

「郡内変動」・・・「誤差効果」の程度。つまり、「誤差効果」の変動。

「交絡」・・・2つの「要因(因子)」の効果が絡み合って分離できない状況

「検出力」・・・分析精度のこと。「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)を基に算出する(「誤差効果」の変動の分散の方が分母)。その比(F値)が高い方が「検出力」も高くなる。「検出力」が高いということは、分析精度が高いということ。


これら上記の用語を使用して、「フィッシャーの三原則」についてまとめてみます。

●無作為化(ランダム化)・・・偏り防止。「誤差効果」の変動(「郡内変動」)の中に、「目的効果」の変動(「群間変動」)が絡み合っていて分離できないという「交絡」がある恐れがあるので、区画や順番を無作為(ランダム)に並べ替えて実験を行うことにより、「郡内変動」の中の「一部の群間変動」が確率的に相殺されるように均一に入り込むだけ、という状態にできる。つまり、「郡内変動」中の「一部の群間変動」を「郡内変動」へと転化することができる、ということ。【[ということは、「郡内変動」の分散(「誤差効果」の変動の分散)が本来の値より不当に大きくなったり不当に小さくなったりしない、ということになる。「目的効果」の変動の分散との比を算出して「検出力」を算出するときに、不当な結果が出ることがなくなる、ということであり、分析結果を誤ることがなくなる、ということ。]だと今のところ思っています。書籍の中では

「・・・F値の分子が実際よりも大きくなってしまい、・・・(その逆の場合もあります)・・・」

という記載がありますが、ここが良く理解できないでいます。(疑問点①)】

●繰り返し(反復)・・・繰り返し数(反復数)を多くすると、自由度が大きくなるので「誤差効果」の変動の分散が小さくなる。ということは、「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)が大きくなり、「検出力」(分析精度)が高くなる。

●局所管理(小分け)・・・小区画(ブロック)に小分けする。つまりブロック化する。そのブロックの中で実験を管理する。つまり局所的に実験を管理する。一つのブロック内で得られたデータを一つの標本とみなす。ブロック(標本)を要因(因子)の一つとし、つまり「ブロック因子」とし、「ブロック間変動(標本間変動)」として抽出する。【[もともとは「目的要因」による効果以外による効果を全て「誤差」として分離させていたので、その時は「ブロック因子」は誤差の中に含まれていたことになる。つまり、「ブロック間変動(標本間変動)」を抽出する際は「誤差効果」の変動の中から抽出されることになる。となると、「誤差効果」の変動が小さくなり、「誤差効果」の変動の分散も「ブロック間変動(標本間変動)」を抽出する前よりも小さくなる。ということは、「誤差効果」の変動の分散と「目的効果」の変動の分散の比(F値)が大きくなり、「検出力」(分析精度)が高くなる。]だと今のところ思っています。この考えで合ってます?(疑問点②)】

↓↓↓

今のところ自分の中で疑問点①~②があります。
いつか疑問が解消されたりしたら追記していきたいと思います。
(*^-^*)

本ブログ中で商品の紹介をする場合は広告として記載することにしました