2014年5月10日土曜日

ウェルチ検定の意図とは: 標本サイズの誤解とExcel計算の話題も含めて


ウェルチ検定(Welch test)の意図とは,とタイトルに書いたが,正確には,Welch, B. L. (1938)の意図と言うべき話題である。

Yahoo!知恵ノートに,等分散検定から t検定・分散分析(ANOVA)・ウェルチ(Welch)検定への問題点を書いたが,ウェルチ検定と頻繁に言う割には,その出典に触れられていないことが多い。それゆえ,ここで改めて,それについて考察する。

まずは,ウェルチ検定の概要。

2標本問題を考え,それぞれの標本平均を XY,標本分散(母分散の不偏推定量)を s12s22,標本サイズを n1n2 とする。

そのとき,以下のような統計量 T

ウェルチ検定(Welch test)

および ν

ウェルチ検定(Welch test)自由度

を考えると,統計量 T は,近似的に,自由度 ν の t 分布に従うことを利用したのが,ウェルチ検定である。

少し回り道になるが,ここで用語の問題点を指摘しておきたい。何度も繰り返し指摘してきたが,標本サイズ(sample size,サンプルサイズ,標本の大きさ)と標本数(the number of samples, サンプル数)を混同する人が非常に多い。一部の大学教員でさえ,そうなのである。

上記の問題は,2群の問題であるが,この群数と呼ばれるのが,標本数なのである。

そして,n1n2 のことは,標本サイズ(sample size,標本の大きさ)と言うのである。ところが,この n の部分を誤って標本数またはサンプル数と呼ぶ人が非常に多い。

例えば,間淵領吾氏の奈良大学社会学部(当時の所属,現在,関西大学社会学部所属らしい)での講義「調査結果を吟味する」は,その誤りの典型例である。

一方で,正しく注意を促す教員もいる。例えば,富山大学の唐渡広志氏の 統計学講義 第3回 母集団と標本 p.5 の解説のように,n を「標本数とはよばない!」と,!を付けてまで指摘している。あるいは,神戸大学の羽森茂之氏も, 「標本の大きさ(サンプルサイズ:sample size)と標本数」について という pdf で,両者を混同しないように注意を促している。

統計学における教員の誤解は,決定係数R2においても見られる。大学の教員なら,正しく学生に教えてほしいものである。

再び,ウェルチ検定の話題に戻る。

上記のような,面倒な自由度 ν は小数値とさえなりうるが,それは,Welch (1938) の式(9)に見られる。


興味があれば,リンク先のPDFを読んでほしい。

ウェルチ検定という割には,この文献に触れられることは少ない。ウィキペディアのウェルチのt検定の項目でも,この文献が挙がっていなかったので,追記しておいた(ウェルチのt検定の変更履歴,Iguchi-Y)。

今,この文献があまり触れられないと述べたが,三重大学・奥村晴彦氏の t 検定の解説では,きちんとこの文献が挙がっている。たとえ学術論文でなくても,大学教員なら,こうでありたいと思う。

この Welch (1938) の論文を読むと,ウェルチ検定というのが,非等分散のときに,特にそのときだけに,使われるとは書いてないことが分かる。これも流布している誤解のひとつであろう。

Microsoftによる,Excel 分析ツールの説明でも, ウェルチ検定を,分散が等しくないと仮定した 2 標本による検定と説明をしているが,これも正確ではない。

なお,Excel の ウェルチ検定に関連した問題と言えば,TTEST関数を使うときと,分析ツールを使うときでは,計算結果が異なることである。これは前者では,自由度 ν が小数値であっても,それを使って計算するが,後者では,整数値に四捨五入して使うからである。少なくと,Excel2003まではそうであった。この計算上の違いは,上記の Microsoftによる説明に書いてあるが,案外読んでない人,知らない人も多いようである。

ウェルチ検定の利用条件の話に戻ると,Welch (1938) の最初の1,2ページ(p.350-351)に,等分散であると仮定せずに検定する方法を考えようとしているのが分かる。特に,p.351の15行目
it is reasonable to test whether α1 = α2, whatever the ratio of σ1 to σ2.
という部分,この whatever が,分散比が何であっても,平均が等しいかどうかを検定することを目指していると分かる。

つまり,分散が異なる場合に適用されるのがウェルチ検定なのではなく,等分散かどうか仮定しない場合に適用されるのがウェルチ検定なのである。この点は,竹内啓・大橋靖雄(1981) 入門・現代の数学11「統計的推測」(日本評論社)にも,きちんと書かれている。

もちろん, Welch (1938) は,その検定が通常の t 検定より優れている,ということを示したわけではない。しかしながら,等分散を仮定しないという検定が,いつのまにか,非等分散である場合の検定,と理解されている感がある。

Welch (1938) の論文の最初の部分だけでも読むと,彼が何を意図して,この検定を考え出したかが理解できる,統計学の発展の歴史を考える上でも重要な論文と言える。

なお,統計解析ソフト R には,多重比較を行なうのに便利な関数 pairwise.t.test がある。これは,デフォルトでは等分散を仮定した t 検定を行い,オプションを指定するとウェルチ(Welch)検定を行なう。これに関しては,次の Yahoo! 知恵袋を参照。

ウェルチ多重検定と2群の分散分析 t検定,Rのpairwise.t.testを利用

関連ページ

2014年5月3日土曜日

辰野ほたる祭り,今年も外来種を隠したまま,環境破壊の町の姿


2014年 第66回信州辰野ほたる祭り,6月14日開催。しかし,松尾峡のゲンジボタルは,観光用に移入された外来種である。今年も,それを隠してホタル保護育成協力金300円,さらに駐車場料金を別途徴収。

ほたる祭り期間中,ホタル発生数や発生状況を伝える辰野町観光サイト,その中の「ほたるの名所 松尾峡・ほたる童謡公園」を見ても,「ホタル保護の歴史」を見ても,観光用に外来種ゲンジボタルを放流し増やしてきたことは,今なお全く触れられていない。

これらのウェブページでは,外来種移入を隠して,あたかも,天然の(在来の)ホタルを保護してきたかのような美談ばかり記述している。このような美談は,全くのウソ,デタラメである。食品と異なり,外来種を在来種のように宣伝しても処罰されないので,それを巧妙に利用している。

外来種を何年も繰り返し移入して増やしたことは,全く書かれていないのである。私の論文(井口, 2003: 長野県辰野町松尾峡におけるゲンジボタル移入の歴史について)に書いたように,県外の業者から買ったり,もらったりしたゲンジボタルを放流・養殖して増やしたのである。しかも,その外来種の大量放流・大量養殖の結果,地元に本来住んでいた天然記念物指定当時のゲンジボタルを絶滅させてしまったのである(参照:辰野の移入(外来)ホタル 生物多様性の喪失へ)。

それどころか,辰野町役場のホタル担当者には,観光客はホタルを見にきているので、全体としてホタルが増えればいいのであって、仮に、在来ホタルが減っても構わない,という発言さえもあったのである(参照:「ホタル保護条例」が問いかけるもの

このような姿勢で,ホタル保護などと,よく言えたものである。呆れて,開いた口が塞がらない。考え方からして,環境破壊の町・辰野なのである。

同じ長野県内では,やはり県外から外来種ゲンジボタルが移入された上高地で,環境省は,それを有害種として駆除する計画を示している(朝日新聞 2014年4月10日; 信濃毎日新聞 2014年04月09日)。

上高地のゲンジボタルについても,以前から,私や福井工大グループの研究で,外来種であることが指摘されていた(参照:辰野町と上高地の移入ホタル問題)。しかし,少なくとも,辰野の外来種ホタルに関して,私や福井工大・草桶秀夫教授は,駆除を求めてはいない。駆除によって新たな生態破壊が起きる可能性もあるし,コストもかかると考えられるからである。

私たちが辰野町に要望してきたのは,外来種であることをきちんと町内外の人々に説明し,その問題点を一緒に考えてもらうこと,やみくもに外来種ホタルの数を増やすのをやめること,外来種ホタルの拡散状況を調査し,残された在来種ホタルを区別して保護すること,などである(参照:辰野の移入(外来)ホタル 生物多様性の喪失へ)。

ところが,そんなことはしたくないし,検討もしない,そもそも観光客に外来種ホタルであることを言いたくない,というのが辰野町役場の主張なのである(参照:長野県辰野のホタル再考:観光用の移入蛍で絶滅した地元蛍 松尾峡ほたる祭りの背景にあるもの)。

今年のほたる祭りでも,ホタル保護育成協力金の名の下に,300円が徴収される。この有料で見られるのが外来種ゲンジボタルであり,周辺地域に残される天然のゲンジボタルは無料で見られる。しかし,辰野町役場は,そのことには一切触れない。

かつて,辰野町観光協会の公式ツイッターでは,こんなことも言っていた。

 辰野町観光協会 (‏@tatsunomachi) (2012年6月26日18:37)

繰り返すが,辰野町では,県外業者から買ったりもらったりしたゲンジボタルを放流・養殖して増やしてきたのである。もちろん,以前は,その問題点が分からなかったという意見も聞いた,しかし,在来生態系に悪影響を与えてきたという問題が明らかとなった現在でも,何ら対策を採らずに,しかも外来種であることを隠して,有料でホタル鑑賞をさせているのである。そんな偽のホタル名所・松尾峡は,辰野町の汚点であり,恥ずべき観光地であると言える。

問題を引き起こしてきた外来種ホタル移入養殖を隠したまま,もっともらしい名前をつけたホタル保護育成協力金(300円)を徴収する辰野町役場は,生物多様性保全の観点から見れば,悪質な行政組織であると私は思っている。

*******************
追記
辰野町に悪しき伝統として根付いた外来種商法(儲かれば外来種でも良いというホタル観光事業)に対して,文化昆虫学的(cultural entomology)観点も含めて論じたのが,以下のウェブページである。

Tatsuno, an ecologically polluted town, defiled Matsuo-kyo Sanctuary for fireflies
*******************
追記

国が年内(2014年)にも,ゲンジボタル,メダカ,カブトムシなどで,国内外来種となっている場合の対策強化を検討し始めた(毎日新聞 2014年05月12日)。辰野町の外来種ゲンジボタル養殖についても規制してほしいところである。
*******************
追記

2015年10月10日に,滋賀県・守山市ほたるの森資料館に私が招かれ,辰野町が守山市で購入した観光用ホタルの移入養殖の実態,辰野から他県への移出の歴史,および天竜川上流のホタルの生息変化などについて講演した。それについては,以下のブログを参照。

辰野のホタル 町おこしと保護の課題 - 滋賀県守山市・環境学習会

辰野町では,養殖した外来種ホタルが増えたからということで,新潟県南魚沼市「大月ホタルの里」に移出もしている。