統計学なんでもスレッド6

統計学なんでもスレッド6 at MATH

1:１３２人目の素数さん
07/01/27 03:31:38
前スレ
統計学なんでもスレッド5
ｽﾚﾘﾝｸ(math板)
統計学なんでもスレッド4
ｽﾚﾘﾝｸ(math板)
統計学なんでもスレッド3
ｽﾚﾘﾝｸ(math板)
統計学なんでもスレッド2
ｽﾚﾘﾝｸ(math板)
統計学なんでもスレッド
ｽﾚﾘﾝｸ(math板)

関連スレ
＝　統計解析フリーソフト　Ｒ　＝
ｽﾚﾘﾝｸ(math板)

2:にょにょ ◆yxpks8XH5Y
07/01/27 09:23:35

今だ！2ゲットォォｫｫ！！
￣￣∨￣￣￣￣￣￣￣￣
　　　 ∩ ∩
　　～| ∪ |　　　　　　　　　(´´
　　ﾍﾉ　　ﾉ　　　　　　　(´⌒(´
　　(（つ　ﾉ⊃≡≡≡(´⌒;;;≡≡≡
　　￣￣￣(´⌒(´⌒;;
　　　ｽﾞｽﾞｽﾞｽﾞｽﾞ

3: ◆TuTO3UJe2Y
07/01/27 14:15:57
新スレでは答えます

4:１３２人目の素数さん
07/01/27 16:28:28
くんまー拡大！

5:１３２人目の素数さん
07/01/27 21:03:43
レポートで回帰分析の結果書くんだけど回帰分析にも帰無仮説ってあるの？
あれば書いた方がいいですか？

6: ◆TuTO3UJe2Y
07/01/27 21:53:16
>>5
場合による
あれば勿論書いた方がいいっていうか書かなきゃダメ

7:１３２人目の素数さん
07/01/28 05:47:59
【統計を】理系に多い血液型は何？？【取ろう】
ｽﾚﾘﾝｸ(rikei板)
◆統計学について語るスレ
ｽﾚﾘﾝｸ(sim板)
【製薬企業】 ☆統計解析スレッド其の壱☆ 【CRO】
ｽﾚﾘﾝｸ(doctor板)
＝　統計解析フリーソフト　Ｒ　【第２章】　＝
ｽﾚﾘﾝｸ(math板)
【●】　文部科学省　統計数理研究所　part2
ｽﾚﾘﾝｸ(math板)
統計ソフト統合スレッド－SPSS・SAS以外
ｽﾚﾘﾝｸ(psycho板)
心理統計スレッド３
ｽﾚﾘﾝｸ(psycho板)
統計学
ｽﾚﾘﾝｸ(sociology板)

8:１３２人目の素数さん
07/01/28 05:49:05
えらそうな住人～経済学的統計と解析～社会学板
ｽﾚﾘﾝｸ(sociology板)
なんで統計学者って経済学部出身者が多いの？
ｽﾚﾘﾝｸ(economics板)
統計・計量分析で一番使われてるソフトは？
ｽﾚﾘﾝｸ(economics板)
経済学で使う統計学スレッド
ｽﾚﾘﾝｸ(economics板)
統計・解析ソフトについて
ｽﾚﾘﾝｸ(bsoft板)
Data Mining (データマイニング) part 1
ｽﾚﾘﾝｸ(sim板)
【金鉱脈】データマイニングのスレ【発見】
ｽﾚﾘﾝｸ(linux板)
☆統計学が出来ないマーケティング学者☆
ｽﾚﾘﾝｸ(manage板)

9:１３２人目の素数さん
07/01/29 22:57:45
VARモデルについて、わかりやすく解説してある本などご存知でしたら教えていただけないですか？

10:１３２人目の素数さん
07/02/01 11:17:47
レポートの提出期限が過ぎたからか、静かだな…

11:１３２人目の素数さん
07/02/02 13:57:37
よく文章にでてくる

~ ind

の ind ってどんな意味?

Y(i) ~ ind Poisson(mu(i))みたいな

12:１３２人目の素数さん
07/02/02 15:25:03
independently

independently
identically
distributed
も
i.i.d.
と略して使うよ。

13:１３２人目の素数さん
07/02/02 15:56:54
independently了解です。助かります。
independent か induction かなーとか勝手におもってました。

14:１３２人目の素数さん
07/02/03 02:29:42
多変量T分布の分散と、
ウィシャート分布（多変量カイ２乗分布）の平均の求め方が載っている参考書か、
サイトしりませんか？
全くできません・・・

15:１３２人目の素数さん
07/02/03 03:19:54
統計学が科目としてある資格を教えてちょんまげ

16:１３２人目の素数さん
07/02/03 10:43:57
アクチュアリーとか統計士とか臭気判定士とかぐらいしか思いつかん。
公認会計士など選択に入っているのはまだまだあるやろな。

17:１３２人目の素数さん
07/02/04 01:11:29
離散型でも連続型でも、どんな分布だろうと、
確率分布関数は存在するけど
確率密度関数はあるとは限らない

これは正しいですか？

18:１３２人目の素数さん
07/02/04 01:31:45
正しいです。

19:１３２人目の素数さん
07/02/04 02:20:21
F分布で、F(m,n,α)=1/F(n,m,α)と本には書いてあるのに、F(m,n,α)=1/F(m,n,α)として例題は解いてます
どちらが正しいんですか？

20:１３２人目の素数さん
07/02/04 06:25:25
>>19
正しいのはF(m,n,α) = 1/F(n,m,1-α)
密度関数を適当に変数変換すれば簡単に証明できるよ

21:19
07/02/05 03:16:17
>>20
THANX

22:１３２人目の素数さん
07/02/07 15:28:51
最小二乗法の重みづけの計算方法がどうしてもわかりません
URLﾘﾝｸ(homepage3.nifty.com)
上のサイトに詳しく説明が書かれているのですが、計算部分がどうしてもうまくいきません。
ソフトを使った結果と全く違う結果になってしまいます。
問題は単純に(x，y)のデータ群があってこれに対応するｙ＝ax+bの係数を導きたいです。

23:１３２人目の素数さん
07/02/07 21:58:27
丁寧ねえ……。思うとだろうとかはずとかが目立つページですな。

> 全体を通じて乱文となってしまいましたので、不明の点、不適切な表現等
> ございましたら掲示版又はメールにてお知らせください。

って書いてあるんだから著者に尋ねたら?

24:１３２人目の素数さん
07/02/08 11:37:28
>>22
そのサイトの公式間違ってない？
記号の定義を俺が勘違いしたのかもしれないけど
書いてある通りに計算するとxの3次の項が出てくるんだが…

回帰式を y_{i} = ax_{i}+bとして、二乗誤差
f = \sum_{i=1}^{n} (y_{i} - ax_{i}-b)^{2}
の最小化を考える

これをa,bで偏微分して0とおくと
df/da = \sum_{i=1}^{n} -x_{i} * 2(y_{i} - ax_{i}-b) = 0
df/db = \sum_{i=1}^{n} -2(y_{i} - ax_{i}-b) = 0
となるから、これをa,bについて解く

すると
a = S_{xy} / S_{x}
b = \bar{y} - a\bar{x}
となる。
ただし、\bar{x},\bar{y}はそれぞれx,yの平均
S_{x}はxの分散、S_{xy}はxとyの共分散である。

こんな感じか？TeX使えないと数式書くの面倒だな

25:１３２人目の素数さん
07/02/08 18:40:49
はじめまして。生物板から来ました。

あっちの板でちょっとお祭りになっています。
前スレｽﾚﾘﾝｸ(life板:179-番)
今スレｽﾚﾘﾝｸ(life板)

最近世間をにぎわした灯台工学研究科の捏造事件がありましたが、実は２ちゃんではあの事件と同じぐらいの有名な捏造疑惑が知られていました。
この捏造王子が当時いつお縄になるかとみなﾜｸﾃｶしてたけど、長く海外逃亡していて忘れちゃってました。
ところが最近この捏造王子がテニュアトラック教員として帰国することになり、お祭りになったという次第です。
現在、この捏造王子の過去の仕事のあやしさを住人たちが検証している最中といったところです。

そこでそのあやしいデータのひとつとして以下のページにでてくるグラフが話題になっています。
URLﾘﾝｸ(www.brain.riken.go.jp)
培養した細胞に３種類のタンパク質を組み合わせを作って導入しその効果を見たというものです。
ところがこのグラフが我々ナマモノ屋から見てきれい過ぎるのです。
特に５％程度の差が矛盾なく観察されるためには膨大な観察数が必要だと考えます。
ただ生データが示されておらず、簡単な検証方法を思いつきません。
そこでこのスレの専門家の方にひとつご助力を賜りに参りました。
どうかよろしくお願い申し上げます。mOm

参考レスｽﾚﾘﾝｸ(life板:50番)

長文陳謝 orz

26:１３２人目の素数さん
07/02/08 21:00:08
この↑問題、なにとぞ統計スレの先生方のお力をお貸しくださいOrz
このままでは日本は捏造大国になってしまいます。

27:１３２人目の素数さん
07/02/08 22:44:25
ローリング相関ってなんですか？

28:１３２人目の素数さん
07/02/08 23:06:07
データの捏造方法
１　べつのサンプルのデータにするかえる
２　自分で数字をいじる
３　統計資料から拝借してラベルを付け替える

29:１３２人目の素数さん
07/02/08 23:23:29
>>28
すいませんがよくわからないのでもう少し具体的に説明していただけませんか?

30:１３２人目の素数さん
07/02/08 23:27:42
>>29
いや>>28さんは質問してるんじゃない？
捏造王子は間違いなく２をやってます。
何とか検証する方法は無いでしょうか？

31:１３２人目の素数さん
07/02/08 23:45:19
出現する数字の分布が正規分布でない

32:１３２人目の素数さん
07/02/08 23:52:12
データの中に自分のサインを残している

33:１３２人目の素数さん
07/02/09 00:00:47
>>25
データ数が分からないことには何とでも言えそう。
回帰分析でそれぞれの効果を推定するときれいに出るが、
それを仮に真値としたとき偶然このデータが得られる確率は
データ数に依存します。最も無理のない結果のための
データ数は各群350ぐらいと出ました。
（そのときの確率は0.11ぐらい。当てはまり過ぎと言われない確率0.05を
超えるのは大体データ数150以上が必要です。）
細胞のデータと言うことですからこのぐらいの数は取っているのでは？

34:１３２人目の素数さん
07/02/09 00:20:21
>>33
ありがとうございます。
データ数を何に相当すると考えるかで少し違いますが、通常は培養皿ごとに計数して、
複数の培養皿からの数値で平均を取って検定します。
つまりデータ数は培養皿数に相当すると考えられます。
そして１５０も３５０もほぼ不可能な培養皿の数（通常は多くて１０）です！！

35:１３２人目の素数さん
07/02/09 00:51:57
統計量Sn、Tnは漸近的に同値であり、また、Snは分布関数Fに分布収束するとする。
このときTnもFに分布収束する。

という命題を証明したいのですが、糸口がつかめません。
どなたかヒントだけでもいいので教えていただけませんでしょうか?

36:１３２人目の素数さん
07/02/09 00:53:44
>>28,>>31-33
皆様さきほどは急いでいて御礼が不充分で申し訳ありませんでした。本当に感謝しております。m0m
現在、頂いた回答を向こうのスレに貼って、向こうで実験系に詳しい人たちとの議論待ちです。
その結果また何か分からないことや私の事実誤認があったらお手数をおかけして恐縮ですが
再度ご相談に参ります。よろしくお願いいたします。

37:１３２人目の素数さん
07/02/09 01:17:27
>>34
また見に来るだろうから書いておくが、そんなに少ないならこんな感じ。
各群10個：p=0.00005530468
各群20個：p=0.0004044062
各群30個：p=0.001247549
各群40個：p=0.002702961
各群50個：p=0.004825427
もちろん推定された効果通りにきれいな真値であるわけではない可能性も
あるので上記のp値の計算は額面通りには受け取れません。
ただし、交互作用まで分散分析をかけると各効果はp=0.05ぐらいで
効いているのに対して交互作用はどれもp=0.2ぐらいできれいに
効いていないと出るので線形性は抜群なのですけどね。

38:１３２人目の素数さん
07/02/09 01:21:58
>>37
自己レス。
培養皿の効果が0, 1ならその通りなのだが、
それをある程度の細かさで分類しているならデータ数は培養皿数とは
言えないだろう。皿が10個としてその程度が1/15区切りでつけられるのなら
ぎりぎりOKとなるかな。

39:１３２人目の素数さん
07/02/09 05:44:51
>>35

xをTnの連続点とすし、εを任意の整数とする。
Pr{Tn<=x}=Pr{Tn<=x, |Sn-Tn|<ε}+Pr{Tn<=x, |Sn-Tn|>=ε}

40:35
07/02/09 08:37:20
>>39
ありがとうございます。
それを参考にして考えてみます。

41:１３２人目の素数さん
07/02/09 21:15:02
>>33,37
自己レス。
計算を間違ってた。＿|￣|○
n=350のときのp値は0.385だった。0.5までいくにはn=400ぐらい必要。
0.05を超えるのはn=150過ぎだが、小さいときの表は次のように修正。
各群10個：p=0.000002530724
各群20個：p=0.00003769463
各群30個：p=0.0001776871
各群40個：p=0.000523022
各群50個：p=0.001189512
結局一つの皿でどのぐらいの精度の結果を得ているか次第です。
10個だとやはり5%刻みぐらいのデータが得られていないと
だめでしょう。

42:１３２人目の素数さん
07/02/09 21:36:35
SPSSやJMPを使った集統計が三度の飯の次くらいに好きなんだが、
こんなオイラを雇ってくれる奇特な研究室はないかな。

43:１３２人目の素数さん
07/02/09 22:03:29
>>42
おしい！三度のメシより、だったら家で雇ったのに。
あとRな。

44:１３２人目の素数さん
07/02/10 22:31:00
集統計屋さん、うちの研究室にはいるよ＠年収６００マン・ポスドク・野心なしの主婦。
さくさくやってくれるんで、ボス以下全員すごく助かってる。
売り込んでみたら？

45:１３２人目の素数さん
07/02/10 23:22:31
>>41
統計スレの神

本当にありがとうございます。みな深く感謝しています。

ちょっと若干１名場外乱闘で粘着があり、とばっちりで不快な思いをさ
せたかも知れず申し訳ありません。

向こうはダミーで、こちらに書き込みさせてください。

ご指摘の件はもういちど良く考えて見ます。捏造王子たちが適当に
直線を引いた可能性が高くなってきたと思っています。

もひとつ質問なのですが、捏造王子たちはこのグラフの隣り合う区画
同士の平均値の差が統計的に有為である、としているようです。これ
はt検定ですが、この隣り合う二群間での平均値の差の検定に必要な
サンプル数を彼らは満たせているでしょうか？

誤解があったら申し訳ありません。

よろしくお願いします。

46:１３２人目の素数さん
07/02/10 23:23:55
葛西そこそこでヴィドはヴィドったｗｗｗ

47:46
07/02/10 23:24:42
すいません、誤爆しました

48:１３２人目の素数さん
07/02/11 00:34:07
>>45
せっかく作ったのでこちらに載せときます。
乱数で見るデータの例です。
1500個を150個ずつ群にまとめた場合
0.427 0.387 0.367 0.433 0.420 0.380 0.380 0.393 0.360 0.313
300個を30個ずつ群にまとめた場合
0.633 0.500 0.333 0.367 0.567 0.467 0.467 0.300 0.333 0.367
もしデータが入手できて各群300個ぐらいしかないのに挙動が1500個のときと
同じ程度なら（そうでないと棄却はできないはず）
二項分布の方に疑いが行きます。

49:１３２人目の素数さん
07/02/11 05:46:32
国立医学部一年の般教で統計やってます
圧倒的に意味が不明
母比率とか意味不明
なんで偏差平方和をnで割ったら分散じゃないの？

50:１３２人目の素数さん
07/02/11 11:00:42
それじゃ一昔前の高卒にも劣るよ

51:１３２人目の素数さん
07/02/11 12:52:52
>>50
だって授業なんて聞いてないし笑
説明ヨロ☆

52:１３２人目の素数さん
07/02/11 13:35:14
>>51
聞いてなくても本読めばわかるだろ笑

53:１３２人目の素数さん
07/02/11 14:02:02
>>52
大学の過去問しかない…笑

54:１３２人目の素数さん
07/02/11 14:24:29
>>49
授業で使ってる教科書に書いてあるんじゃね？

宿題の答え聞かれてる気がするからあまり詳しく答えたくないけど…
nでなくn-1で割るのは推定値の不偏性(推定値の平均が真の値になるという性質)を満たすため
偏差平方和の平均値出してみな

55:１３２人目の素数さん
07/02/11 14:39:25
URLﾘﾝｸ(phi.ypu.jp)

56:１３２人目の素数さん
07/02/11 15:12:14
>>54
ありがとう！
教科書はないんだ。
授業中にもらうしょぼいプリントだけ。当然どっかいった笑
宿題じゃなくて後期試験の科目なんだよね
友達からプリント借りて調べてみよう。
統計を勉強する上でコツみたいなの教えてください笑

57:１３２人目の素数さん
07/02/11 20:19:44
平均と期待値の違いってなんですか？

58:１３２人目の素数さん
07/02/11 23:03:43
完備十分統計量は最小十分統計量であるということを証明したいんですが、なかなか証明ができません。
証明の道筋をどなたか教えてください。

59:質問です。
07/02/15 19:57:02

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%～15%
>様々。ここでは一般的と思われる値を挙げた。

（Wikipedia項目ﾘﾝｸ）より転載。

ということは、スロットマシンの腕がどんなに良い人でも、控除率を3%～15%より下げるのは無理だということですか？
また、ヘタクソな人がやれば、控除率は3%～15%よりかなり上がるということでしょうか？

あと基本的な質問ですが、控除率が２%のギャンブルというのは、簡単に言えば
１００円を元手に無限回挑戦し続けると、元手が９８円に減るということですか？

60:１３２人目の素数さん
07/02/16 00:30:33
>>59
控除率が正のものを無限回やったら破産しますがな。ｗ

61:１３２人目の素数さん
07/02/16 00:34:01
人が無限回できることって無限小の距離を移動することとかですか

62:質問です。
07/02/16 20:45:00
>>60
どうも根本的なところを勘違いしていたようですね。

ではこういうことでしょうか？

控除率が２％のギャンブルを一回やると、当然、元手が増える人も減る人もいるが、
参加した全員の平均をとってみると、元手の９８％に減ったという結果になるということですか？

また、控除率が２％のギャンブルというのは、参加した全員の掛けた金の合計の２％が確実に親のポッポに入るということでいいの
でしょうか？

また変な勘違いをしていたら教えてください。

63:１３２人目の素数さん
07/02/16 21:18:32
>>62
手数料という表現からすると概ねそれでよいのでしょう。
ただし、なんらかの必要経費が生じるものだとそれがそのまま利益という
訳ではないのでしょうが。

64:１３２人目の素数さん
07/02/16 21:31:29
文鳥が好きで煙草を吸わない３０代独身男性は、
日本国内に何人くらいいると考えられますか？

65:質問です。
07/02/18 11:55:27
>>63
レスありがとうございます。
だいたい分かりかけてきました。最後の質問にしたいと思いますが、

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%～15%
>様々。ここでは一般的と思われる値を挙げた。

（Wikipedia項目ﾘﾝｸ）より転載。

”プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
ミスのない完全なプレーを行うことを前提とする。 ”

と、いうことは、スロットの腕がどんなに良い人でも控除率を３％以下に下げるのは不可能であり、
素人がやると、もちろん控除率は腕の良い人より上がるということでしょうか？

66:１３２人目の素数さん
07/02/18 21:17:26
>>65
まだ勘違いしてますよ。
控除率はどのプレーヤーに対しても一律で貸せられる場所代や税金のようなものです。
どんなに上手にプレーをしても、控除率は変わりません。
ただ、上手にプレーすれば、下手くそにプレーするよりも、最終的に手元に残る金額は多くなりますが。しかしこれは控除率とは何ら関係のないものです。

67:１３２人目の素数さん
07/02/20 16:08:47
統計学って

ある確率が1%以下であるなら、それは絶対におかしいと決めるような学問なの？

68:１３２人目の素数さん
07/02/20 16:54:05
ベータ分布のパーセント点を求める近似式をcで作らなきゃいかんのだが
どうやるんだ？

69:１３２人目の素数さん
07/02/20 21:01:57
>>68 数値計算のアルゴリズム本(e.g. 奥村さんのアルゴリズム事典 URLﾘﾝｸ(oku.edu.mie-u.ac.jp))を探すか、フリーの有り物(e.g. dcdflib.c)を使う。

70:１３２人目の素数さん
07/02/20 22:24:04
分らない問題スレで核心にせまるレスが付かなかったため、
統計スレの皆様、お力添えくださいm(_ _)m

■問題
A君とB君は互いに相手よりもテニスが強いと言い張ります。
そこで、10試合をして勝敗によりどちらのほうが強いか決めようということになりました。
統計学的に有意に強いと認められるには、どちらかが何勝すれば良いでしょうか。
ただし、引き分けは無いものとする。

■自分で考えた答え（合っていますか？）
A君とB君の勝敗の組み合わせ数は2^10=1024通り
10試合のうちA君が8勝する組み合わせ数は10!/(8!2!)=45通り
10試合のうちA君が9勝する組み合わせ数は10!/(9!1!)=10通り
10試合のうちA君が10勝する組み合わせ数は10!/(10!0!)=1通り

従ってA君とB君が互角と仮定すると
A君が8勝以上する確率は(45+10+1)/1024≒0.055
A君が9勝以上する確率は(10+1)/1024≒0.011

統計学的に有意に強いと認められるには、互角となりうる危険率を5%以下にする必要があるから 9勝以上しないといけない。

この解答は合っていますか？

71:１３２人目の素数さん
07/02/20 22:36:56
>>69
ありがとう。やっぱり不完全ベータ関数を計算してニュートンで求めるしかないのかな？

72:１３２人目の素数さん
07/02/20 23:08:18
>>71
Handbook of Mathematical functions には近似式載ってる。
けど、精度書いてない。

dcdflib.c の cdfbet() は、逆分布関数も計算できる。

73:１３２人目の素数さん
07/02/20 23:38:15
統計超・超初心者のとっちょです。

ある生産工程の不良率（良品率）を調査するために製品を10個抜き取り、寸法を
測定しました。結果は以下の通りです（単位：mm）。

2,2,2,2,2,3,3,3,4,5　平均：2.8　標準偏差：1.0

製品規格は下限規格のみで1mm以上です。上限規格はありません。
分布の形状は右側（値の大きい）に裾野の広い分布であり、工程の設備能力からも
合点のいくところで、偏ったサンプリングをしているとは考えにくいです。

こんな分布をしている場合の工程不良率を算出しようとした場合、どのように算出
したら良いのでしょうか？当HPのポアソン分布等を拝見したのですが、初心者の私
には、ポアソン分布を使って良いものか否か分からない状況です。

こんな私にご教授頂ければ幸いです。よろしくお願いします。

74:１３２人目の素数さん
07/02/20 23:50:26
>>72
サンクス。これはつかえそう！

75:１３２人目の素数さん
07/02/22 20:59:46
>>73
ポアソン分布はサッカーの得点みたく離散型データの場合。
その場合は、測定精度が粗くて値の種類が少ないから、
データの相対度数分布をそのまま確率分布（の推定値）として使うのが吉。
つまり理論分布なんぞイラネ。

76:１３２人目の素数さん
07/02/22 21:38:27
いきなりすいません。必死で探してるんですが正確度の計算方法が
わかりません。
今まで人の目で数えていたものを機械で数えようとしています。
人の目で数えたものと機械で数えた数字の正確さを表す数値として
正確度というのがあるのことまではこぎつけたのですが、その計算式が
わかりません。
どなたか教えていただけませんか？

77:１３２人目の素数さん
07/02/23 05:01:21
すいません。統計学初学者です。
正規分布の加法性でわからないことがございます。

１．N(u1, σ1^2) + N(u2, σ2^2) →　N(u1 + u2, σ1^2+σ2^2)
２．N(u1, σ1^2) - N(u2, σ2^2) →　N(u1 - u2, σ1^2+σ2^2)

正規分布を足しても引いても、
平均はそれぞれ、足されるあるいは引かれますが、
なぜ、分散だけはどちらも足されるのでしょうか？
分散は引くことは出来ないものなのでしょうか？

よろしくお願いいたします。

78:１３２人目の素数さん
07/02/23 11:42:23
>>76
統計学全体で通じる「正確度」なんてありません。応用している各分野で
系統誤差を使いやすいように数値化しています。例えば、測定値の平均を
から実際の値を引いたものなどを使います。

関係している工学の人に「正確度」「精密度」についてきいてください。

79:１３２人目の素数さん
07/02/23 11:59:52
>>77
式のイメージではなく、分散とはどういう数かをまず考えてみてください。
2つの正規分布は無相関なので、定義にしたがって分散を計算すると和に
なります。

2つの確率変数の間に相関があれば、分散は和にはなりません。例えば、
極端な場合で u2 = - u1 という関係があるとすると、分散は 0 になっ
てしまいます。この場合でも、分散を引いている訳ではありません。
教科書で「共分散」というのを調べてみてください。

80:77
07/02/24 05:20:39
>>79
ありがとうございました。
共分散勉強します。

81:１３２人目の素数さん
07/02/27 18:54:14
院に行って統計勉強する場合どこがおすすめ？学部は早慶です。

82:１３２人目の素数さん
07/02/28 18:15:46
>>81
やりたい専門決めている？
それに合った教員が居るところにすれば…
無ければ、そのまま上に行った方がいいかもね。

83:１３２人目の素数さん
07/03/04 19:27:17
お前ら、Zipの法則について語れ

84:１３２人目の素数さん
07/03/04 20:00:47
zipか、なつかしいなあ。100MBでも文書ファイルだけなら充分大容量だったのだが。

Zipf?
それは語れない。

85:83
07/03/05 13:39:43
>>84
細かいこと気にする奴だなｗまぁ、いいさ。
で、俺は勉強中なんだけど、世界の人口や日本の人口で試してみた
（計算はExcelね）。

興味深い結果が得られているけど、面倒くさいので報告しない。
まずは計算して見れ～

86:１３２人目の素数さん
07/03/05 16:07:27
>>85
あれは経験則ではないの？
ビジネス書なんかによくある80-20の法則なんかと同類の話ではないの？

87:83
07/03/05 17:04:06
>>86

よくわからん。俺は単にExcelで計算して遊んでいるだけ（笑

88:よろしく。
07/03/06 04:34:29
ベイズの定理の重要性について、
できましたら、短文にてご説明願えたらと思います。

89:１３２人目の素数さん
07/03/06 09:56:24
　　　　　　　　　　　,,,--─＝==─ヽ/へ　
　　　　　　／iiiiiiiiiiiiii彡≡≡≡|≡ヾ　ヽ　
　　　　　iiiiiiiiiiiiiiiiiii彡≡≡≡≡|≡ミミヾ丶　
　　　　iiiiiiiiiiiiiiiiiiii／￣￣￣￣￣￣＼ミiiiiiヽ　
　　　iiiiiiiiiiiiiiiiii／　　　　　　　　　　　　　＼iiiiiiiゞ　
　　　iiiiiiiiiiii／　　　　　　　　　　　　　　　　＼iiヽ　
　　iiiiiiiiiiiiiii《　　　　━━'/　　ヽ━━　ヽミヽ　
　...iiiiiiiiii彡/　　　　　　＿＿,.::　　::　＿＿　　ヽiiiii|　
　..iiiiiiiiiiiii》|　　　　　　　　　　　　　:::　　　　　　|iiiii|　
　iiiiiiiiiiiiiiii|,　　　　　　　　　　　　　　　　　　　　　|iii|　
..iiiiiiiiiiiiiiiiii,　　　　　　　　　（　●　●　）　　　　　　.|iiii|　
iiiiiiiiiiiiiiiiiiiiiii　　　　　　　》━━《　　　　　　　|iiiii|　Bayesなんて、プッ
iiiiiiiiiiiiiii《《《ヽ　　　　　》　／￣￣＼　《　　　　　|iiiiiiii|　　
iiiiiiiii《《《《《《《《　　　　《《　＼￣￣／　》》　　　|iiiiiiiiiii|　
iiiiiiiiiiii《《《《《《《《《《《　》》　　￣￣　　《《　》》》》》iiiii|　
iiiiiiiiii《《《《《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》iii|　
iiiiiiiiiiiiiii巛巛巛巛巛巛巛巛巛》》》》》》》》》》》》》》IIII　
iiiiiiiiiiiiiiiiiiiiii巛巛巛巛巛巛巛巛》》》》》》》》》》》》iiiiiii　

90:１３２人目の素数さん
07/03/06 14:57:51
>>86
ランダムネットワークを仮定すると、ネットワーク上の簡単な値が
Zipf分布に従うことが理論的に証明されている。

ただ、とてもランダムネットワークとは思えないようなものや、
複雑な値についてもZipfの法則が成立するのは興味深いところ。

くりこみみたいな手法でなんか議論できないかなあとは思ってる。

91:１３２人目の素数さん
07/03/06 16:25:48
cross-validation法は、残差を用いた推定より、
どういった点で優れているのでしょうか？

92:１３２人目の素数さん
07/03/07 15:10:54
お願いします！

1、800人の学生のうち、622人がカメラ付き携帯電話を所持していました。
この結果から実際に全学生中75%以上の学生がカメラ付き携帯を所持しているという仮説を
有意水準0.05で検定せよ。
2、次の値は、48年と88年における小1身長のデータから計算されたものである。等分散が仮定できるものとして、
２群の母平均に差があるかいなかを有意水準0.05で検定せよ。
48年→　データ数30、標本平均108、標本分散15
88年→　データ数30、標本平均117、標本分散21
計算途中の結果付きで回答してもらえると嬉しいです。

93:１３２人目の素数さん
07/03/07 15:16:29
>>92はマルチ

だいたい数字が違うだけの同じ練習問題が普通に載ってると思うが。

94:１３２人目の素数さん
07/03/07 15:21:20
今時分にレポート提出の大学もあるんだね。

95:１３２人目の素数さん
07/03/08 15:55:17
今日成績を受け取りに言ったのですが、
　卒業するのに単位がどうしてもあと1教科分2単位必要なのです。
　　　
　　3月中にレポートでもなんでもします。
　　単位を取得させてもらえないでしょうか。　
　　　
　　ご検討のほど、どうかよろしくおねがいします。

96:１３２人目の素数さん
07/03/08 16:36:09
最近では、レポートの主要部分をネットからのコピペした場合、
不正行為とみなすところが増えている。不正行為の場合、その
期の全単位消失といった処分が多いはず。

だから、ここに答えを書くと卒業がより遠くなって、かわいそ
うなので、みんな書いちゃだめだよ。

ということで、教科書をよく読んで、自力でがんばってね。

97:１３２人目の素数さん：
07/03/08 17:50:20
基本的な質問かと思いますが、本などに解説がないのでお聞きしたいです。
尺度水準の説明で、名義尺度は名前や職業など任意に割り振られたデータで
和を計算したり平均を出しても意味がないとの説明が多いのですが、
例えば携帯のアンケート調査で、機種を選ぶ際に重視した機能をひとつお選びください
で、1.ﾃﾞｨｽﾌﾟﾚｲの大きさ　2.カメラの画素数　3.文字変換機能　4.ｾｷｭﾘﾃｨ機能
5.その他　があり、その結果、1が40％、2が25％、3が20％、4が10％、その他が5％
という結果となった場合、選択肢は名義尺度なので、解釈時に
ユーザが機種選びに重視した項目の順位は1位ﾃﾞｨｽﾌﾟﾚｲ、2位カメラの画素数といった
表現やﾃﾞｨｽﾌﾟﾚｲの大きさは文字変換機能の2倍重視されている、といった
表現が間違いということになるのでしょうか？
どなたかご教授ください

98:１３２人目の素数さん
07/03/08 18:49:31
>>97
平均を求めるとはその例だと
1*0.4+2*0.25+3*0.2+4*0.1+5*0.05=2.15
と計算し、カメラの画素数と文字機能変換の
間辺りを重視していますというようなとんちんかんなことを
することです。
単なる順位付けや比較は名義尺度で行っても全然
問題ありません。

99:１３２人目の素数さん
07/03/08 22:10:43
経済分析のための統計的方法　岩田暁一

と

確率・統計入門小針あき宏

ってどっちがいいですか？

100:１３２人目の素数さん
07/03/08 22:33:35
>>99
まず、目的を書いてくれ。教科書としてのタイプがちがうから、
答えようがない。

101:１３２人目の素数さん
07/03/08 23:01:18
経済学部です。それを考えると最初のがいいんですけど、
ファイナンスやりたくて数学の勉強もしてるから、下のほうがいいのかぁと

102:１３２人目の素数さん
07/03/09 10:02:39
両方やるってどうだろう。とりあえず最初に少しぐらい分からなくてもいいやって方針で小針ワールドを味合ってから、岩田でゴチゴチと。

103:１３２人目の素数さん：
07/03/09 17:21:51
>>98
ご回答ありがとうございます。
胸のつかえが取れました。

104:１３２人目の素数さん
07/03/11 21:48:04
369

105:１３２人目の素数さん
07/03/12 19:08:45
変数ｘおよびｙが
それぞれ平均値３０および２０、
標準偏差が１０および６、をもつ確率変数である場合、
x=x+2y　の標準偏差を求めよ。ただし、ｘとｙの相関係数は0とする。

ってあるんだが、どう解いていけばいいかわからねぇ・・・
解く方向性だけ教えてくれ。

106:１３２人目の素数さん
07/03/13 02:51:57
x,yの相関係数は0ってことはx,yは独立ってこと。
だから、確率変数の和の分散を求めるにはそれぞれの分散を足せば出る。
それぞれの分散は平均値と標準偏差から出る(2yの方は係数が絡むことをお忘れなく)。
x+2yの分散が得られたらあとはそれを元に求める標準偏差を計算すればよい。

107:１３２人目の素数さん
07/03/13 09:58:33
>>106
相関係数０だからって独立とは限らんのだが…。
計算上は独立であることは使わないので同じになるけど。

108:１３２人目の素数さん
07/03/14 02:00:44
＞x=x+2y　の標準偏差を求めよ。

両辺から x を引き
　0 = 2y
両辺を 2 で割ると
　y = 0
故に、確率変数 y が 0 の時の標準偏差を求めれば良い。
y の値としてゼロのみを考える条件付き分布問題だから、、、

Ans, 標準偏差ゼロ

109:105
07/03/14 13:15:43
そう解くだったんだ。教科書見てもわからなかったから悶えてたｗ
Thanks!

110:１３２人目の素数さん
07/03/14 19:49:31
マジで信じたんかよ。ｗ

111:１３２人目の素数さん
07/03/19 22:13:22
誤差と残差の違いって何ですか？

112:１３２人目の素数さん
07/03/20 12:59:29
残差(residual)は、測定値と推定値の差で、説明できない残り。

誤差(error)は、真の値と推定値や測定値の差が本来なのだけど、
真の値なんか分からないから統計使うので、
(とりあえず値)±(統計誤差)の範囲に真の値が入る確率が95%に
なるように計算した「統計誤差」か、「とりあえずの値の標準
偏差」かどちらかを言うことが多い。

113:１３２人目の素数さん
07/03/24 08:02:50
別スレ
ｽﾚﾘﾝｸ(math板)
で、
統計学＝Kolmogorovの確率論＋Fisherの最尤法
と言い切っているんですが、これって普通ですか？
そうでないなら、別の言い方ってありますか？

114:KingOfUniverse ◇667la1PjK2 ◆OYFsVKEYdw
07/03/24 08:08:45
ないね。

115:１３２人目の素数さん
07/03/24 09:39:17
>>113
そんな単純でないのは確かだな。多変量解析は別と言っている時点で
今の統計学の半分は捨ててるし。
また、少なくとも「Neyman, Pearsonの基準」がないと検定ができない。

116:１３２人目の素数さん
07/03/24 09:56:13
>>113
無理は承知で一言で答えよ。
と言うことならば、「なるほど」と思う。
対案を言えと言われれば困るので。

117:１３２人目の素数さん
07/03/24 14:20:39
>>115
すまんが、良く分からん。もう少しkwsk。

118:１３２人目の素数さん
07/03/24 17:22:09
>>117
Wikipediaの「ネイマン・ピアソンの補題」を見よ。

119:１３２人目の素数さん
07/03/25 05:19:14
>>115 「Neyman, Pearsonの基準」がないと検定ができない？　　最尤比検定

>>113
オレなら
統計学＝Fisherの最尤法　　＋　回帰分析
これなら
ニュートン力学＝慣性系　+　「f=ma」　＋作用反作用
と比較できる。
統計学に「Kolmogorovの確率論」を加えるのは、
ニュートン力学に「微分方程式論」を加えるのと同じで、不要。

120:１３２人目の素数さん
07/03/25 11:03:12
>>115
Neyman-Pearson は単なる補題だしこれを統計学の前提条件のように
扱うのはおかしいのでは？Uniformly Most Powerful test（一様最強力
検定）を最良のテストとみなしていること自体は、前提条件と言えない
こともない。もっとも、Decision theoryの一般的な枠組みを統計学の
基礎と考えた方がすっきりするように思う。

Kolmogorovは、統計学の数学的基礎として必要だろう。少なくとも
収束概念を数学的に扱うためには必要。Fisherの最尤法は、確かに
統計学の非常に多くの場所で使われているのは事実だが、あくまで
それは統計学の一部分であって、最尤法なしに統計学が全く成り立
たないわけではないのではない。

121:１３２人目の素数さん
07/03/25 11:05:14
>>14
了解です。

122:１３２人目の素数さん
07/03/25 12:54:52
>>113～>>120
今のところ>>119に賛成するが、すこし勉強してから、その理由を言いたい。
「統計学の公理的アプローチ」
というような内容の本があれば、どなたか教えてくれませんか？
（物理のたいていの本は「法則」が最初に宣言されていて、公理的である）
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白い。

123:１３２人目の素数さん
07/03/25 13:03:48
いまのところ>>119に賛成だが、もうすこししっかり考えたい。
どなたか
「統計学の公理的アプローチ」
というような内容の本を知っているなら、教えてくれませんか？
（物理の本はたいていは「法則」が最初に宣言されていて、公理的といえる）
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白いと思う。

124:１３２人目の素数さん
07/03/25 13:05:50
122=123　誤操作で、すみません。

125:120
07/03/25 13:34:13
誤>>全く成り立たないわけではないのではない。
正>>全く成り立たないわけではない。

すまそ。

126:１３２人目の素数さん
07/03/25 15:28:36
>>119 最尤比検定　→　尤度比検定　　スマソ

127:１３２人目の素数さん
07/03/25 23:00:45
初学者なんですが
回帰分析、分散分析、多変量解析について
理解しやすい本て何かありますか？

128:１３２人目の素数さん
07/03/25 23:58:14
この話題でこんなに盛り上がるとはな。
「Neyman, Pearsonの基準」をあげたのは検定の基礎だからで、
元の>>113の考えが純粋数学のように公理として必要なものを
あげる立場と考えたから。
統計学は記述統計と推測統計に分かれ、推測統計が推定と検定で
成り立っていることに異論はないだろう。その中で記述統計は
データの整理であり、公理といったものとなじまない。
そうすると推定の基礎が最尤法で、検定の基礎がネイマン・ピアソンと
するとなんとなくよさそうに思った。（尤度比検定でも実際棄却域をどう取るかは
それと無縁ではいられない。>>120の言うように広く言えばDecision theoryを
取り入れるべきということだ。）

>>119のような考えは公理としてではなく統計学の中心的な方法は何？
というコンセプトであろう。公理よりこの方がすっきりするように感じるのは
統計学がやはり応用数学だからなんだろうか。

129:１３２人目の素数さん
07/03/26 04:49:12
Decision theoryでは一般的すぎると思うが。
もうすこし具体的に、「Decision theory の中の○○」と言わなければ(ry

130:１３２人目の素数さん
07/03/26 11:02:20
同意
「Decision theoryの一般的な枠組み」＝「統計学の一般的な枠組み」
じゃあ意味ないからね。
また、違うとしても
Decision theory＝　○○　+　△△
と答えないと、言葉のすり替えになってしうのでは？

131:１３２人目の素数さん
07/03/26 11:11:29
○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○
このﾚｽをみたあなたは･･･3日から7日に
ﾗｯｷｰなことが起きるでしょう｡片思いの人と両思いになったり
成績や順位が上ったりetc...でもこのﾚｽをｺﾋﾟﾍﾟして別々のｽﾚに
5個貼り付けてください｡貼り付けなかったら今あなたが1番起きてほしくないことが起きてしまうでしょう｡
ｺﾋﾟﾍﾟするかしないかはあなた次第...
○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○｡･｡○

132:１３２人目の素数さん
07/03/26 15:45:06
>>129, >>130
確かにそうだな。それでは、
統計学＝Kolmogorovの確率論＋リスクの最小化原理
では、どうだろう。

仮説検定に関しては、Neyman-Pearson Lemma がUMP test
がリスク最小化の十分条件であることから必然的に導けるし、
推定に関しては、不偏性、有効性に関しては直接的に定式化できる。
漸近的性質に関しても、リスクのsequenceを考えることでほぼ解決できるように思う。
（自分は、漸近正規性とかに関してそういう枠組みで考えたことはないけど。。。）
最尤法に関しても、推定値の近傍があるリスクを最小化する統計量として
位置づけられるのでは？

思いつきで書いてるので、どこまで正しいか分からん。

133:１３２人目の素数さん
07/03/27 01:04:00
>>132
すごいな。推定も検定も一緒に処理しようというわけか。
それだと多変量解析も範疇に入れられそうだ。
数学的にリスク最小化原理の一般化ができれば
統計学も公理系の上に乗っていると主張できるかな？

134:１３２人目の素数さん
07/03/27 06:01:20
>>132はノーベル賞だね。

135:１３２人目の素数さん
07/03/27 06:30:17
>>132
すげぇ～。　Fisherの再来だぁ～。

136:１３２人目の素数さん
07/03/27 08:31:20
統計学のパラダイムシフト

137:１３２人目の素数さん
07/03/27 18:45:36
>>132
統計学最大の問題（統計学の公理化）が２ちゃんねるで解かれるとは・・・

138:１３２人目の素数さん
07/03/28 03:24:33
>>132
リスク関数の決め方に恣意性が・・・

139:132
07/03/28 15:48:49
>>138
残るね。
ただ私が思ったのは、もうちょっとDecision Theoryの立場から
様々な統計学の手法をまとめれば、数学的にすっきりするし、
各手法の位置づけや関係が整理できるんじゃないかということ。

140:１３２人目の素数さん
07/03/28 22:49:03
>>139
同意
そんな本があったら買うね。
言いだしっぺの君が書いてよ。

141:１３２人目の素数さん
07/03/29 07:53:41
>>140　書けねーよ

142:１３２人目の素数さん
07/03/29 08:39:02
.　　　　　　　　　　　　　　　　　　　 ,ｲ/〃　　　　　　　　ヾ= 、
　　　　　　　　　_,,r-‐''"´　＾　｀N /l/　　　　　　　　　　　　　　｀ヽ
　　　　　　　　彡　　法学部　 N! l　　　　　　　　　　　　　　　　　　｀､
　　　,, -‐- ,,-彡　　　　　　　l ヽ　　　　　　　　　医学部　　　　　　 l｀ ´ ｀`‐ ､
　彡´　　　　　　|　　　　,,w,,wヽヽ　　　　　　　　　　　　　　,,　　　　 |　薬学部　｀ヽ
_彡　政経部　|　 //ﾚ/ﾊl/ﾊ＼ヾｰ　　　　　　　　_,,　,,r,,/lヾ　　　　|　　　　　　 }
ﾊl/　　 ,/ﾊlヾヾ,l､ /三f､,,_　　 _,ヾニ＿＿＿＿_彡ﾉノﾉノﾉ_ヾヾ　　 | ,l､､　　　　 l＿＿_
/ﾚ　 /l,,_/＿_ヽ lヾ　ヽﾓ-ヽl ´fﾓﾁ7ヽ={　r‐ｨｯヾヽ-r'´〒fデF｀lｪr‐､ﾊlヽヽヽ　　　哲学＼_
　l｀=l　fﾓﾁ）_{´ヽl!l　　　　 :l　　　 l ll !l　 `┴ｰ/ｿl⌒ｯ`┴┴'　}//l l､ ,,､ｧtｯﾋヽ､rｩ　／　＼　　
　ヾ}弋＿シl弋　ヽl　　　　ヽ-　　ヽl　lゝ＿＿,ノ |　ゞ_＿＿ノl/l /　l　｀~ﾞ´　 lｧﾉ　（●
）　＼
　　ヾl　　　`'　 `''´lヽ　　─　　 /l＼l　　　　 l､,　　　　　　l_ノ　〈 _　　　　 l!ﾉ_人__）　　　 |　
　　　}＼　￣￣　,ｨl　＼　￣　／　l　 l　　　　＿＿＿　　　　/　　─　　　丿　⌒´　　　 ,／　
　　,/＼＼＿_／/ ＼　＼___／　,,-''＼|＼　　　　＿　　　 /|＼　 -　　　／ |､　　　　／ ,|､
-‐'　　　＼_,,-‐'＼　　｀ヽ､　　,,r'　　　/|　＼　　　　　　　／　.|　＼＿_／　 ,,rヽ‐-‐ ''　／ l｀ヽ
　　　,,-‐'' 　　　＼　　/＼/＼　／　＼.　＼＿＿__／　　／＼　　　 ,,-‐''　　/＼ ,／　　l　　ヽ
-‐''´　　　　　　　　　＼/　 }ﾞ　_,,,‐''＼　　＼　　　　　　　／　　 /l＼‐''　　　／　　｀ヽ､_　l

143:132
07/03/29 14:23:29
書けないですね。
とりあえず、過去にそんなこと試みた人はいないのかな？
ちょっと、まわりに聞いてみよう。。。

144:１３２人目の素数さん
07/03/29 14:58:29
.　　　　　　　　　　　　　　　　　　　 ,ｲ/〃　　　　　　　　ヾ= 、
　　　　　　　　　_,,r-‐''"´　＾　｀N /l/　　　　　　　　　　　　　　｀ヽ
　　　　　　　　彡　　法学部　 N! l　　　　　　　　　　　　　　　　　　｀､
　　　,, -‐- ,,-彡　　　　　　　l ヽ　　　　　　　　　医学部　　　　　　 l｀ ´ ｀`‐ ､
　彡´　　　　　　|　　　　,,w,,wヽヽ　　　　　　　　　　　　　　,,　　　　 |　薬学部　｀ヽ
_彡　政経部　|　 //ﾚ/ﾊl/ﾊ＼ヾｰ　　　　　　　　_,,　,,r,,/lヾ　　　　|　　　　　　 }
ﾊl/　　 ,/ﾊlヾヾ,l､ /三f､,,_　　 _,ヾニ＿＿＿＿_彡ﾉノﾉノﾉ_ヾヾ　　 | ,l､､　　　　 l＿＿_
/ﾚ　 /l,,_/＿_ヽ lヾ　ヽﾓ-ヽl ´fﾓﾁ7ヽ={　r‐ｨｯヾヽ-r'´〒fデF｀lｪr‐､ﾊlヽヽヽほっ統計学＼_
　l｀=l　fﾓﾁ）_{´ヽl!l　　　　 :l　　　 l ll !l　 `┴ｰ/ｿl⌒ｯ`┴┴'　}//l l､ ,,､ｧtｯﾋヽ､rｩ　／　＼　　
　ヾ}弋＿シl弋　ヽl　　　　ヽ-　　ヽl　lゝ＿＿,ノ |　ゞ_＿＿ノl/l /　l　｀~ﾞ´　 lｧﾉ　（● ）　＼
　　ヾl　　　`'　 `''´lヽ　　─　　 /l＼l　　　　 l､,　　　　　　l_ノ　〈 _　　　　 l!ﾉ_人__）　　　 |　
　　　}＼　￣￣　,ｨl　＼　￣　／　l　 l　　　　＿＿＿　　　　/　　─　　　丿　⌒´　　　 ,／　
　　,/＼＼＿_／/ ＼　＼___／　,,-''＼|＼　　　　＿　　　 /|＼　 -　　　／ |､　　　　／ ,|､
-‐'　　　＼_,,-‐'＼　　｀ヽ､　　,,r'　　　/|　＼　　　　　　　／　.|　＼＿_／　 ,,rヽ‐-‐ ''　／ l｀ヽ
　　　,,-‐'' 　　　＼　　/＼/＼　／　＼.　＼＿＿__／　　／＼　　　 ,,-‐''　　/＼ ,／　　l　　ヽ
-‐''´　　　　　　　　　＼/　 }ﾞ　_,,,‐''＼　　＼　　　　　　　／　　 /l＼‐''　　　／　　｀ヽ､_　l

145:１３２人目の素数さん
07/03/30 08:12:50
>>143
「統計学の公理的構成」が統計学最大の問題であることを、
非専門家たちに知らしめただけでも君の功績は学位論文以上だよ。
この辺りを読んで、君を乗り越える若い才能が出てくることを期待しよう。

146:１３２人目の素数さん
07/03/30 19:50:26
t検定でふたつの集合の平均値が同じかどうか調べる時、
同じだという帰無仮説を危険率5%で棄却されなかった事をもって
「同じだ」と言っていいんでしょうか？なんかやり方が逆のような気が

147:１３２人目の素数さん
07/03/30 22:05:34
>>146
同等性検定でぐぐれ

148:１３２人目の素数さん
07/03/31 05:32:17
>>146
帰無仮説が棄却されないとほんとは何も言えないんだけど、
しばしばそのように解釈されてしまう。

149:KingOfUniverse ◆667la1PjK2
07/03/31 09:56:31
対立仮説が棄却されるかどうか。

150:１３２人目の素数さん
07/03/31 14:14:36
一般には対立仮説は棄却されうるが、>>146のケースでは無理。

151:１３２人目の素数さん
07/03/31 22:49:41
>>112
>誤差(error)は・・「とりあえずの値の標準偏差」かどちらかを言う・・・
「とりあえずの値の標準偏差」って、標準誤差のことですか？

152:１３２人目の素数さん
07/04/01 02:44:49
>>148
Neyman-Pearson Lemma の方の検定なら、パラメータに関する「仮説」と「対立仮説」しかないので
「採択」と「棄却」が明確に成立する。
Neyman-Pearson検定論やWaldのDecision Theory は、「帰無仮説」という考え方を捨てて初めて成立する。
この立場での検定なら >>149が正しい。

帰無仮説を重視するのは Fisher流の有意性検定で、逆にこちらは明確な対立仮説を設定しない。
パラメータだけでなく、検定時の確率モデル全体が「帰無仮説」に含まれているためだ。
例えば、散開星団が「星団」であることを統計的に検証するために、「天空上に星が一様に分布する」
という帰無仮説を立てる。そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」
であり、このような広いモデル選択は、Neyman-Pearson検定論では記述できない。

いまの統計学のテキストは、この辺の区別が無く、グッチャグチャに書かれているのがほとんど。

次ページ