- 1 名前: ◆OHr6mNLYV6 [03/11/08 19:44]
- (´Д`;三;´Д`)
語って下さい.偉大な統計学を... 質問にはやさしいお兄さんが答えてくれます. 前スレ science.2ch.net/test/read.cgi/math/1012782106/ 関連スレ 【 確率論・統計学の実用の仕方 】 science.2ch.net/test/read.cgi/math/1041865872/ こんな確率もとめてみたい その1/2 science.2ch.net/test/read.cgi/math/1029400897/ ■確率制御■ science.2ch.net/test/read.cgi/math/1017042903/
- 54 名前:53 mailto:sage [03/12/05 02:43]
- ごめん、寝惚けてた。
公式は、 r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2y^2)) か r_s = ((n^3 - n) - 6Σd^2 - (T_x + T_y) / 2) / √((n^3 - n)^2 - (T_x + T_y)(n^3 - n) + T_xT_y) だった。ノンパラ久しぶりだから…。
- 55 名前:53 mailto:sage [03/12/05 02:59]
- ごめん、完全に寝惚けてる。
上の公式は、 r_s = (Σx^2 + Σy^2 - Σd^2) / (2√(Σx^2Σy^2)) 下の公式は多分、大丈夫だけど、まぎらわしいから S_x = Σ(t_i^3 - t_i) (t_i はタイの数) と書き直そう。 r_s = ((n^3 - n) - 6Σd^2 - (S_x + S_y) / 2) / √((n^3 - n)^2 - (S_x + S_y)(n^3 - n) + S_xS_y) 君のは、下の式の別ヴァージョンだけど T_x = (n^3 - n) - S_x を使ってるようだから、 Σd^2 の係数が落ちていると思う。
- 56 名前:51=52 [03/12/05 12:50]
- >>53-55
ありがとうございます。 教えて下さった式に値を放り込んでみたのですが、 どうしても0.9490・・・になりません(T_T) たぶん私が根本的なところで間違ってる(代入間違い?)のだと思うのですが、 よろしければ>>51から計算した具体的な数字を入れた式を書いていただけませんでしょうか。 これは学校で出た問題なのですが、青木先生の所の式を使うように 言われてしまっていて、つらいです・・・
- 57 名前:51=52 mailto:sage [03/12/05 15:29]
- すいません、試行錯誤してるうちに解けてしまったようです(?)
>>51のデータだと、 同順位は11位だけだからn_x=1 で、11位は2個あるからT1=2 っていうことでいいんでしょうか・・・数字はあったのでこういう事かしら(?_?
- 58 名前:132人目の素数さん [03/12/08 20:16]
- ある集団の比率を求めるのに必要な最低限の人数は?
…って問題なんですが、是非解説をお願いします じぇんじぇん分かりません…
- 59 名前:132人目の素数さん mailto:age [03/12/08 20:57]
- ↑
正確には、ある制度の比率を推定するのに必要な最低人数を求めよ です 誰か分かる方いらっしゃいませんか???
- 60 名前:132人目の素数さん [03/12/11 01:32]
- >>59
有意水準が与えられないと求められません。 その問題解くには、二項分布とか中心極限定理とか知ってる必要があるけど 君、知ってるの? と、遅レスしてみた。
- 61 名前:132人目の素数さん [03/12/16 22:51]
- 下がりすぎ
- 62 名前:132人目の素数さん [03/12/18 19:55]
- 標本抽出の偏向を修正する方法・技術について説明しているお勧めの書籍などありましたら教えてください。
- 63 名前:132人目の素数さん mailto:sage [03/12/24 00:49]
- >>62
競馬?
- 64 名前:麻雀偏差 [03/12/26 21:02]
- 麻雀でじぶんの実力をはかるために平均順位というものがあります。
麻雀は4人でやりますので、1位、2位、3位、4位をとる可能性があります。 少ない試合数だと実力を測定するには偏りがあると思うのですが、何試合うてばまず誤差のない自分の平均順位を知ることができるのでしょうか? 数学でこれを求めることはできるのでしょうか?
- 65 名前:132人目の素数さん [03/12/28 16:06]
- 無限区間で一様分布は定義できないんですか?
また、そういう試みって無いんでしょうか? 無限倍したら1になる数、っていうのを 作ったらなんとかできそうな気がしますが。
- 66 名前:132人目の素数さん [03/12/28 20:08]
- >>64
1着から4着までをとる確率をp1,p2,p3,p4(p1+p2+p3+p4=1)とする。 今n回麻雀をやって、各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とすると、 平均着順の推定値は、(n1+2*n2+3*n3+4*n4)/n これの分散を求めて正規近似して条件を求めればいいよ。 平均は p1+2*p2+3*p3+4*p4。分散はちょっとややこしいな。 (p1*(1-p1)+4*p2*(1-p2)+9*p3*(1-p3)+16*p4*(1-p4)-2*(2*p1*p2+3*p1*p3+4*p1*p4+6*p2*p3+8*p2*p4+12*p3*p4))/n かな?まちがってるかもしれんけど。 で、この分散をVとすると、たとえば確率99%で誤差が上下0.1以内、とかなら、 2.58*V^0.5<=0.1なんで、 n>665.64×(上の分散の分子)になる。 2.58が正規分布の0.005%点。有意水準を変えたきゃここを変えればいい。 p1〜p4はわからんから、p1+p2+p3+p4=1、各pi>=0の条件の下での(上の分散の分子)の最大値を求めて、これを mとでもすれば、 n>665.64×mが答えになる。 >>65 一様の意味を、同じ長さの区間内の値を取る確率はすべて等しい、という 普通の意味で考えると無理だね、やっぱり。確率の定義を根本から変える 必要があるし、そんなのが仮にできても現在の測度論は使えないし、意味 のあるものにはならないんじゃないかな。
- 67 名前:麻雀偏差 [03/12/29 02:44]
- >>66
詳細なレスありがとうございます 私確率についていまいちわかっていないので、レスについてじっくり考えさせていただきます。 質問があるのですが、n回麻雀をやって各着順の実現値がn1,n2,n3,n4(n1+n2+n3+n4=n)とあります。 この実際のデータがなければ、誤差は求めることは出来ないのでしょうか? また正規分布ではなくて、2項分布を使うことは可能なのでしょうか?
- 68 名前:132人目の素数さん mailto:sage [03/12/29 11:07]
- >>67
いや、実現値って書いちゃったけど、n1,n2,n3,n4は確率変数と見て条件は出してるよ。 最後のnの条件にはn1,n2,n3,n4がいくらかって条件は使ってないでしょ。 実際のデータは実際に自分の着順の平均の推定値を求めるのには当然必要。 あと、2項分布じゃなくて正確にはこれは多項分布。だから分散の形が複雑になってる。 そのまま多項分布としてみても条件は出せるかもしれないけど、普通は回数多くなると 正規近似してしまう。2項分布の場合ですら計算が非常にめんどくさいから。 あと、誤差を求める、ってのはあんまり言い方が正しくない。あくまで確率・統計の世界 だから、誤差が〜以内になる確率が〜%以下になる、という言い方をする。
- 69 名前:132人目の素数さん mailto:sage [03/12/30 12:59]
- 標準正規分布から無作為に5個の標本Z1,・・・,Z5を抽出するとき((Z1+Z5)^2)/2の分布はどんな分布に従うか
という問題が分かりません 感覚的にはカイ二乗分布だと思うのですが・・・
- 70 名前:132人目の素数さん [03/12/31 05:29]
- 良スレage
- 71 名前:132人目の素数さん mailto:sage [03/12/31 07:44]
- >>69
自由度1のカイ二乗分布であってるよ。 Z1+Z5がN(0,2)に従う→(Z1+Z5)/√2がN(0,1)に従う→((Z1+Z5)/√2))^2はχ^2(1)に従う という具合。
- 72 名前:132人目の素数さん mailto:sage [03/12/31 11:19]
- >>71
ありがとうございます
- 73 名前:132人目の素数さん [04/01/06 23:26]
- 「仮説検定とは何か」についてレポートを出されて、今仮説検定を勉強しています。有意水準は0.1、0.05、0.01などの値に事前に定めると教科書には書いてありますが、1%と10%では全然ちがうものだと思うのですが、どのように有意水準を決めるべきでしょうか?
- 74 名前:132人目の素数さん mailto:sage [04/01/06 23:48]
- 有意水準っていうのは、仮説が正しいけど間違った決定をする(第1種の過誤)確率。
だから小さい方がいいに決まっている。 だけど、間違い方にはもうひとつあって、仮説が間違ってるけど、正しいと決定してしまう場合(第2種の過誤)もあって、 これは同じ標本数なら有意水準が小さいほどその確率が大きくなってしまう。 だから、第1種の過誤、第2種の過誤のどちらの確率を小さくしたいか、とり得る標本数はどの程度か等を総合的に判断して 有意水準を決定するのが望ましい。 でも一般には教科書に書いてあるとおり、有意水準を1%か5%にすることが多い。
- 75 名前:132人目の素数さん [04/01/07 01:31]
- 統計初心者です
わからないので教えてください!!!! Zが標準分布に従うときE〔Z^k〕(k=1.2.3・・・)を求めよ
- 76 名前:132人目の素数さん [04/01/07 01:44]
- >>75
標準分布というのは 標準正規分布のことかな? f(Z)を確率分布として 期待値の定義から E[Z^k]=∫Z^k f(Z)dZ
- 77 名前:132人目の素数さん [04/01/07 01:50]
- 76さん本当にありがとうございました^0^
わかりました!!!!
- 78 名前:132人目の素数さん [04/01/07 01:59]
- XとYは独立でE〔X^2〕<∞、E〔Y^〕<∞とする。
このとき VAR〔aX+bY〕=a^2VAR〔X〕+b^2VAR〔Y〕 ってどうやるの?
- 79 名前:132人目の素数さん [04/01/07 02:02]
- >>78
分散の定義通り計算
- 80 名前:132人目の素数さん mailto:sage [04/01/07 02:03]
- plimについてよくわからないのですが、
試行回数n、成功確率pの確率分布があるとき、 成功した回数Xについて、 plim[n→∞](X/n)=p は正しくて、 plim[n→∞](X-np)=0 は正しくないというのを説明せよという問題を出されたのですが、 plimの定義の式で、 plim[n→∞]Xバー=μ とあったので、 plimというのは期待値に収束するのだと思い、 E(X)=npより、 E(X/n)=p E(X-np)=0となるからどちらも正しいのではと思ったのですが、 どこが間違っているのでしょうか?
- 81 名前:132人目の素数さん [04/01/07 02:11]
- >>80
plimを普通のlimと同じだと思っている時点で間違い >plimの定義の式で、 >plim[n→∞]Xバー=μ とあったので 何をこのように書くと定義されているのか? その元の命題を無視して 表現だけをみて期待値に収束だのなんだのいうのが間違い。
- 82 名前:まお [04/01/07 02:13]
- X=σZ+μとおく。ただしZは標準正規分布に従い−∞<μ<∞、σ>0のとき
cov(X,X^2) VAR(x^2)を求めよ をすいませんが教えてください。
- 83 名前:132人目の素数さん [04/01/07 02:16]
- >>80
∀ε>0, lim P(|X~(n) -μ|<ε) =1 (n→∞) に X~(n) =X/n μ=p X~(n) =X-np μ=0 をそれぞれいれたら明らか。
- 84 名前:132人目の素数さん [04/01/07 02:20]
- >>82
μとσって何かの期待値と標準偏差か?
- 85 名前:まお [04/01/07 02:21]
- これ以外何もかいてないんです。。
すいません、お手数おかけして、、
- 86 名前:132人目の素数さん mailto:sage [04/01/07 02:22]
- >>84
ただの実定数じゃないの?
- 87 名前:132人目の素数さん mailto:sage [04/01/07 02:28]
- >>82
定義どおり計算してみな。 Cov(X,Y)=E(XY)-E(X)E(Y) Var(X)=E(X^2)-(E(X))^2
- 88 名前:まお [04/01/07 02:31]
- ごめんなさい、ありがとうございます
詳しい計算方法を教えていただけますと 本当に嬉しいのですが!!!! すいません。。
- 89 名前:132人目の素数さん mailto:sage [04/01/07 02:37]
- 何故自分の手を動かそうとしないんだ
- 90 名前:私も初心者 [04/01/07 02:38]
- Φ(x)を標準正規分布の分布関数とする。
すなわち Φ(x)=∫xから−∞ (1/√2π)e^-t^/2dtである。ただしxは実数。 このときG(x)=Φ(ax)は正規分布N(0.1/a^2) の分布関数となることを示せ。a>0 の解法おしえてくれませんか?
- 91 名前:まお [04/01/07 02:39]
- すいません、ご親切にありがとうございます
統計全くやったことなくて 今日だされた課題に困っていまして。。、
- 92 名前:まお [04/01/07 02:39]
- ご面倒じゃなかったらやり方少しでよいのでお願いします
- 93 名前:80 mailto:sage [04/01/07 02:44]
- >>81
>>83のlim P(|X~(n) -μ|<ε) =1 (n→∞) という式は書いてあったのですが、 実際これを問題でどう使っていいのかわからず、 plimの見た感じの意味で解こうとしていました。 >>83 解説どうもありがとうございます。 plimの定義の式の使い方がわかりました。 それに代入すると明らかというのが 今考えていてまだ少しわからないのですが、 もう少し考えてみます。
- 94 名前:132人目の素数さん mailto:sage [04/01/07 02:45]
- >>92
Zの確率密度関数はf(t)=1/√(2π)exp(-t^2/2)なんだから E(X・X^2)=∫[-∞,∞](σt+μ)・(σt+μ)^2f(t)dt E(X)=∫[-∞,∞](σt+μ)f(t)dt E(X^2)=∫[-∞,∞](σt+μ)^2f(t)dt などを計算すればいいのでは?積分域を[0,∞)と(-∞,0]にわけてそれぞれの領域で t=+√(2u)、t=-√(2u)などと変換すればΓ関数の値をもとめる問題に帰着できるハズ。 やってないから自信ないけど。
- 95 名前:私も初心者 [04/01/07 02:50]
- んー
場合分けするってことですか?
- 96 名前:132人目の素数さん mailto:sage [04/01/07 02:52]
- 標準正規分布については、
E(Z)=0,E(Z^2)=1,E(Z^3)=0,E(Z^4)=3 となる。3次、4次はモーメント母関数とかキュムラント母関数を知っていれば簡単に求まるし、 4次ぐらいまでは覚えていてもいいぐらい。 これから、 E(X)〜E(X^4)までも求まるよね? 例えば、 E(X^3)=E(σ^3*X^3+3μ*σ^2*X^2+3μ^2*σX+μ^3) =σ^3*E(X^3)+3μ*σ^2*E(X^2)+3μ^2*σ*E(X)+μ^3 =3μ*σ^2+μ^3 ってかんじ。もちろん、ZがN(μ,σ^2)に従うことからいきなり求めてもいい。 で、 Cov(X,X^2)=E(X^3)-E(X)E(X^2) Var(X^2)=E(X^4)-(E(X^2))^2 に代入すれば答えが出る。 前者が2μ*σ^2、後者が4μ^2*σ^2+2σ^4になると思う。
- 97 名前:132人目の素数さん mailto:sage [04/01/07 02:54]
- >>96
ZがN(μ,σ^2)に従うことから→XがN(μ,σ^2)に従うことから の間違い
- 98 名前:まお [04/01/07 02:59]
- すっごい感謝です!
本当に本当にありがとうございました!!! 恩義を忘れません!
- 99 名前:132人目の素数さん [04/01/07 03:05]
- Xは平均λのポアゾン分布
f(x|λ)λ^x*e^−λ/x! x=0.1.2.3... に従うとする。 λ>0は未知 このとき指数分布族に従うことを示せ また自然母数自然母数空間を明示せよ を詳しく教えてください 期末試験対策で勉強してますが よくわかってません。 上のかたがた同様初心者ですので できるだけ詳しく教えていただけると 助かります よろしくおねがいします
- 100 名前:132人目の素数さん [04/01/07 03:41]
- >>75
標準正規分布の密度関数に関する式 (1/√(2π))∫[-∞,∞]e^(-z^2/2)dz=1 においてαを正数としてz=(√α)xと置換して (1/√(2π))∫[-∞,∞]e^(-αx^2/2)dx=α^(-1/2) が成り立つ。 両辺をαでn回微分し、α=1を代入すると (1/√(2π))∫[-∞,∞](-x^2/2)^n * e^(-x^2/2)dx=(-1/2)(-3/2)・・・{-(2n-1)/2} (1/√(2π))∫[-∞,∞]x^(2n) * e^(-x^2/2)dx=(2n-1)!! 標準正規分布の密度関数は偶関数なのでkが奇数のときE[z^k]=0 よって E[z^k] = 0(kが奇数のとき) 、 (k-1)!! (kが偶数のとき)
- 101 名前:132人目の素数さん mailto:sage [04/01/07 03:49]
- >>99
なんか問題が変だけど、ポアソン分布が指数分布族の形になることを言えばいいんだったら 1/x!*exp(xlogλ-λ) ってかけるから明らか。 自然母数空間は、expの中のxの係数を母数と見たとき、そいつが取る範囲。 (-∞,∞)でよいよ。
- 102 名前:132人目の素数さん [04/01/07 03:55]
- >>100
本当にありがとうございました! 感激しました!!!!!
- 103 名前:おしえてちゃん [04/01/07 04:14]
- X1、X2、X3・・・Xnをベルヌーイ分布
fθ(x|θ)=θ^x(1-θ)^1-x x=0.1 θ∈(0.1) からのランダム標本として X={X1、X2...Xn}とし S(X)=Σnからi=1とする S=sがあたえられたときXの条件付確立 P(X=x|S=s)がθに依存しないことを 示すことにより Sがθの十分統計量であることを確認せよ おしえてください! おねがいします
- 104 名前:132人目の素数さん [04/01/07 05:15]
- >>74 ありがとうございます!何となくわかりました。
- 105 名前:132人目の素数さん [04/01/07 12:12]
- すごく根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたんですが、うまくまとめられません…
- 106 名前:132人目の素数さん [04/01/07 12:29]
- >>105
教科書を読め
- 107 名前:132人目の素数さん [04/01/07 17:25]
- 根本的な質問ですみませんが、仮説検定をすることで一体何がわかるのでしょうか?レポートの問題に出されたのですが、よくわかりません…
- 108 名前:132人目の素数さん mailto:sage [04/01/07 18:05]
- 「指数分布の原点周りの3次積率と平均値周りの3次積率を求めよ」という問題なのですが、
原点周りのやり方はどうにかできるのですが、平均値周りの積率が上手く求められません。 よろしくお願いします・・
- 109 名前:132人目の素数さん mailto:sage [04/01/07 20:57]
- >>103
問題を修正 > X1、X2、X3・・・Xnがベルヌーイ分布 > fθ(x|θ)=θ^x(1-θ)^1-x > x=0, 1 > θ∈(0, 1) > に従う独立な確率変数とする。 > Y={X1、X2...Xn}とし > S(Y)=ΣXi(i=1 to n)とする > S=sがあたえられたときYの条件付確率 > P(Y=y|S=s)がθに依存しないことを示すことにより > Sがθの十分統計量であることを確認せよ 位にしておかないとNotationが混乱しててよくわかりません。
- 110 名前:132人目の素数さん mailto:sage [04/01/07 21:02]
- >>107
仮説を検定することができます。 検定結果を見て意思決定等を行います。
- 111 名前:132人目の素数さん mailto:sage [04/01/07 21:02]
- 統計のエロイ人がいるみたいだ。勉強なるな。
- 112 名前:132人目の素数さん [04/01/08 01:09]
- こんなん聞いてもいいんですかね・・・
分散(Sx^2)というものがありますよね。 あれは、平均偏差を2乗した総和を平均して求めるのですが、 なぜ2乗するのかについては、本によると符号を統一するため、 とあります。 しかし、符号を統一するなら絶対値を取ればいいじゃないかと 思うのですが、なぜわざわざ2乗するんでしょうか。そのあと ルートに放り込んで標準偏差を出すなら最初から平均偏差の 絶対値を取って、それらを平均した数値を標準偏差とすれば 簡単な気がするのですが。 共分散を求めるときに変数X、Yの平均偏差を掛け合わせますが、 それと合わせるためなのでしょうか。
- 113 名前:132人目の素数さん mailto:sage [04/01/08 01:42]
- >>112
絶対偏差の概念もないわけではないですし、時々使われます。ただ、 ∫|x|dxと∫x^2dxなら、どちらが数学的に扱いやすいか、というと断然後者です。 もし、あなたが、「標準」として∫|x|dxか√∫x^2dxのどちらかに決めなければいけない としたら当然後者にしますよね? しない、というのなら基礎から積分なりを勉強しなおすべきです。 絶対値の平均よりは2乗の平均の方が断然(数学的には)簡単かつ応用が利くものなのです。 絶対偏差の平均より2乗の平均の方がよく使われるのは数学的な有用度故と思っていただいて かまいません。
- 114 名前:132人目の素数さん mailto:sage [04/01/08 01:56]
- よくわかりました。後者の方が明らかに平易で扱いやすいですね。
結局、標準偏差を単独でポンと求める程度の段階では有用性は あまりわからないが、もっと深い部分まで勉強していき複雑な数式を 駆使する段になると有用性が分かってくるのかもしれません。
- 115 名前:132人目の素数さん mailto:sage [04/01/08 01:59]
- >>114
その通り。共分散との整合性もその一例です。
- 116 名前:132人目の素数さん [04/01/08 02:05]
- ごめんなさい統計の途中の
決定係数が上昇するとt値の絶対値も上昇するという 証明にでてくるのですが 0<(A^2/B)<(C^2/D)<1 ならば |(A/B)|<|(C/D)| ということはいえるのでしょうか?
- 117 名前:質問をかえます。 [04/01/08 02:17]
- 単純回帰分析でX値を変化させて
決定係数をあげたとき かならず回帰係数のスチューデントのt値の絶対値は前回と比べて おおきくなるのでしょうか?
- 118 名前:>117 [04/01/08 13:42]
- なるなり。
回帰係数を固定して、xの変動幅を大きくすると回帰係数の標準誤差が小さくなるので(x^2が分母にくるから)、回帰係数をその標準誤差で割ることによって作られるt統計量はかならず大きくなるなり。
- 119 名前:カイ2乗検定 [04/01/08 15:46]
- カイ2乗検定についてお訊ねします。いわゆる多項分布の検定(与えられた観測個数
がある比率に従っているかどうか)の場合に、 χ^2=Σ(観測個数-期待値)^2/期待値 が公式として本に載っているのですが、自分としては何故期待値で割るのかが納得 できません。カイ2乗分布の定義からすると、例えば2項分布の時はサンプル数が十 分に大きいとき(np,np(1-p))の正規分布に近似できるので、 χ^2=Σ(観測個数-np(=期待値))^2/np(1-p) ではないかと思うのです。先ほどの式と比べると分母部分が明らかに違います。 公式の証明をネット上で探したのですが、高度な数学知識が要求されるのでここで は証明をとばす、という表現があったりして、なかなか見つかりません。 初歩的な質問かも知れませんが、どなたか分かる方がいらっしゃいましたら、よろ しくお願いします。
- 120 名前:132人目の素数さん mailto:sage [04/01/08 18:42]
- >>119
ほかに詳しい人がカキコしてくれるかもしれませんが、 手元にある統計の本を見てみたら、 ・「確率・統計入門」小針あき宏著 岩波書店 ・「確率・統計」篠原昌彦著 朝倉書店 に書いてありました。小針の本から引用すると、次のようになります。 p.191命題7.11 母集団Eが、互いに共通部分のないn個のグループE_iから構成されており、 ランダムに選んだ一つの個体がE_iに属する確率がp_iであるとする。 いまその手段からランダムにN個の個体を選び、そのうちE_iに属するものが x_i個であったとすると、Nが十分大きいとき χ^2=Σ[i=1,n] (x_i-p_iN)^2/p_iN は自由度がn-1のχ^2分布に従う。 証明は5ページにわたっていて難解ですが、丁寧に書いてあるので 一度目を通してはどうでしょうか。
- 121 名前:カイ2乗検定 [04/01/08 19:30]
- >>120
ご返答ありがとうございます!今度探して読んでみます。しかし、証明に5ペ ージ!やはり難解な証明だったんですね。それにしても、 χ^2=Σ(xi-p_iN)^2/p_iN がカイ2乗分布に従うのは分かったのですが、前述の χ^2=Σ(xi-p_iN)^2/p_iN(1-p_i) もカイ2乗分布にしたがうような気がします。でも値は違うし、数学的な意味 の違いは何なんですかね?上の方は適合度をみるわけだから、期待値からのず れを表しているというのは何となく分かるのですが...。 最近統計学の基礎を勉強し直し始めたのですが、統計学ってごく基礎的なこと でも深く考えると、意味がイメージできなかったり、証明ができなかったりし て奥が深いですね。使うだけなら、プログラムや例題に当てはめるだけでもで きるんでしょうけど。もっと勉強せねば。
- 122 名前:132人目の素数さん mailto:sage [04/01/08 21:33]
- >>121
たとえば、n=2の時で、E1の確率がp、E2の確率がqとして、N回試行したときのそれぞれの回数がX1回、X2回とすれば、 (X1-Np)^2/(Npq)=(X2-Nq)^2/(Npq) (p+q=1、X1+X2=Nより) は、自由度1のχ^2分布に(近似的に)したがうよ。でも当然足すとダメ。 (X1-Np)^2/Np+(X2-Nq)^2/Nqを上の関係式(p+q=1、X1+X2=N)に注意して計算したら、(X1-Np)^2/(Npq)になることは すぐわかると思う。 これを一般のnに拡張したと思えばいい。っていってもそう簡単ではないが…。
- 123 名前:おしえてちゃん [04/01/08 22:58]
- X1、X2、X3・・・Xnがベルヌーイ分布
fθ(x|θ)=θ^x(1-θ)^1-x x=0, 1 θ∈(0, 1) に従う独立な確率変数とする。 Y={X1、X2...Xn}とし S(Y)=ΣXi(i=1 to n)とする S=sがあたえられたときYの条件付確率 P(Y=y|S=s)がθに依存しないことを示すことにより Sがθの十分統計量であることを確認せよ 何度もごめんなさい 教えてください・・・・・!!!
- 124 名前:132人目の素数さん mailto:sage [04/01/08 23:34]
- >>123
y=(y1,y2,…yn)とすると、 P(S=s)=nCsθ^s*(1-θ)^(n-s) (足してsってことはX1,…,Xnのどれかn個がs) P(Y=y,S=s)=θ^s*(1-θ)^(n-s) (y1+…+yn=sのとき) =0 (その他) よって、 P(Y=y|S=s)=1/nCs (y1+…+yn=sのとき) =0 (その他) だから、これはθに依存しないんで、Sはθの十分統計量といえる。 例えばn=3で、合計が2になる確率は3θ^2*(1-θ) で、これを別々に分解しても、(1,1,0),(1,0,1),(0,1,1)それぞれをとる確率はθ^2*(1-θ)。 形が定数倍の差だけだから、合計が2である確率が分かってしまえば、個々の確率もわかってしまう。 これが、合計2だけじゃなくどんな状況でも起こるから、合計が分かってしまえば、それ以上どんな に細かいことがわかってもθについて新しい情報は得られない、ってことになる。 これがθについて十分だ、充足だ、っていう意味。
- 125 名前:カイ2乗検定 [04/01/09 00:42]
- >>122
おお、なるほど!Σ(xi-p_i*N)^2/p_i*Nというのは、Σの中の一つ一つの成分が カイ二乗分布に従うのではなくて、すべての場合が足された状態で初めてカイ 2乗分布に近似されるということですね。勘違いしていました。 二項分布の場合はたまたま Σ(xi-p_i*N)^2/p_i*N の合計が近似された正規分布からの値である (xi-Np)^2/Np(1-p) と同じになるけれど、多項の場合は独立性の問題から、個々にこの値を だして計算できないというところに期待値で割るという、この公式の 意味がある訳なんでしょうか。うーん、間違えているかもしれませんが、 自分的にはかなり納得です。皆さんどうもありがとうございました。
- 126 名前:132人目の素数さん mailto:sage [04/01/09 01:12]
- >>125
うーん、まだちょっと勘違いしてるところもあるかな…。 この検定の意味は、各iの要素の確率(p1,p2,…、p_n)が全体として適正かどうかを検出するもの。 各piだけを検定したいんだったら、出た個数Xiっていうのは2項分布Bin(N,p_i)に従う(p_iの確率で1か0か、 っていうN個の独立な確率変数の和だから。)から、近似的にXiがN(Np_i,Npi*(1-p_i))に従うとして検定した らいい。 XiがN(Np_i,Npi*(1-p_i))に従う、ってことは(Xi-Np_i)^2/Np_i*(1-p_i)は自由度1のχ^2分布にしたがっている のと同じこと。N(0,1)に従うものの2乗が自由度1のχ^2分布に従うから。 おっしゃるとおり、これらは独立じゃないからそのまま分母が分散のまま足してもχ^2分布になってくれない。 だけど、分母を期待値にして和をとったもの=χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)が自由度n-1のχ^2分布 になってくれる(ややこしい証明がいるとこ)。これを使って、(p1,p2,…、p_n)が全体として適正かどう かを調べられる、ということ。 >>122は要素が2個しかないから、(p1,p2)が適正かどうか、っていうのは片方どちらかが適正かどうかが分かれば いいわけで、結局、χ^2和(Σ(xi-p_i*N)^2/p_i*Nのこと)の形が、どちらか1個のp_iについてのχ^2検定の形に なってしまう、というお話。
- 127 名前:おしえてちゃん [04/01/09 01:47]
- >>124
ほんとにありがとうございます! わかりやすかったです! ためになりました!
- 128 名前:132人目の素数さん [04/01/09 02:01]
- これおしえてください!
X1.X2.....Xnは母数p(0<x<1)の ベルヌーイ分布に従うとする すなわち P(X1=0)=1-p P(X1=1)=p ことのき Un^2=1/n−1煤ii=1,n)(Xi−Xn)^2 →a.s p(1-p) ↑バーがついてる ただし Xn=1/nXi ↑これもバーがついてる が成立することをしめせ (大数の強法則を用いて) おねがいします!
- 129 名前:カイ2乗検定 [04/01/09 02:27]
- >>126
要は各piを個別に見るときは、正規近似した分散で割ることによって、 χ^2分布から適合度を見ることができるけれど、独立性の問題から、 個々の各piの、分散で割ったχ^2の値を足すことで全体の適合度を見る ことはできない。そこで期待値で分母を期待値にしたものの総和がχ^2 分布に従うという性質を利用して全体の適合度を見るということですね。 納得いたしました。ありがとうございます。
- 130 名前:129 [04/01/09 02:44]
- すいません、文章変ですね。そこで、のあとの、期待値で、はいりません。
申し訳ないです。
- 131 名前:132人目の素数さん [04/01/09 03:26]
- 128です
すいません、どなたか教えていただけないでしょうか。。。。 よろしくおねがいします
- 132 名前:132人目の素数さん mailto:sage [04/01/09 03:28]
- 単回帰分析をして、R2、パラメータの値、パラメータのt値を読み取り各国別に結果からどんなことがわかるか考察しろって問題をだされたんだけど。助けて。
個人消費(constant_1987_US$)に対するGDPの変動 y=a+bx y=GDP_at_market_prices_(constant_1987_US$) x=Private_consumption__etc._(constant_1987_US$) 個人消費(constant_1987_US$)に対するGDPの変動 日本 豪州 サモア インドネシア R2 0.99 0.99 0.369 0.965 個人消費 1.762 1.588 0.7331 1.85 t値 100.53 70.27 3.747 26.07 っつか、質問分自体に間違ってるとことかある? 自分じゃわからん。 一応自分の精一杯の考察(になってない?) →R2は1に近いほど 信頼性がある、t値は絶対値2より上ってことから サモアを除く2ヶ国のデータは信頼性が高い?
- 133 名前:132人目の素数さん mailto:sage [04/01/09 13:46]
- >>128
Un^2=1/(n-1)*(Xi-Xn(バー))^2 (普偏分散という)の平均は E(Un^2)=V(Xi)=p(1-p) このことは普通の統計の教科書なら絶対載ってる。 大数の強法則は、各Xiが独立同分布で、平均μなら、 1/n*(X1+…Xn)→μ (a.s) ってことだから題意は明らかだよね。 大体想像はつくけど、もうすこしきちんと数式書いた方がいいよ。
- 134 名前:132人目の素数さん mailto:sage [04/01/09 13:48]
- 普偏分散→不偏分散の間違い
- 135 名前:132人目の素数さん mailto:sage [04/01/09 13:54]
- >>133
やっぱりあんまり明らかじゃないな。 もっと詳しい人の書き込みキボン。
- 136 名前:132人目の素数さん mailto:sage [04/01/10 02:58]
- >>128
1/n*(Xi-Xn(バー))^2=1/n*((Xi-E(Xi))^2-(Xn(バー)-E(Xi))^2) =1/n*(Xi-p)^2-(Xn(バー)-p)^2 =1/n*(Xi-p)^2-(1/n*嚢i-p)^2 これはよく使われる式変形。 (Xi-p)^2、Xiはそれぞれ独立同分布確率変数列で、E((Xi-p)^2)=p(1-p)、E(Xi)=pだから、大数の強法則より、 1/n*(Xi-p)^2→p(1-p) a.s. 1/n*嚢i→p a.s. よって、1/n*(Xi-Xn(バー))^2→p(1-p) a.s. よって、1/(n-1)*(Xi-Xn(バー))^2→p(1-p) a.s. n-1で割ってるのは不偏分散を意識したもんでしょう。nをとばせば当然どちらでも分散に概収束する。
- 137 名前:132人目の素数さん mailto:sage [04/01/10 03:28]
- >>132
パラメータについての説明もいれなきゃだめだよ。 個人消費の行は多分、係数bのことだよね? R2、t値から見て日本、豪州は個人消費とGDPに相関があり(t値による検定)かつ、この回帰直線でうまく 関係が説明されている(R2の1に対する近さ)ことがわかる。インドネシアもまずまず。 よって、この回帰直線で各国のGDPの個人消費に対する感応度が比較でき、インドネシア、日本、豪州の 順に感応度が高いことがわかる、というようなことを書けばいい。
- 138 名前:132人目の素数さん [04/01/10 05:31]
- 良スレage
- 139 名前:132人目の素数さん [04/01/10 16:03]
- 確率変数Yが母数λの指数分布
fY(y|λ)=λe^(-λy)*T(0.∞) に従うとする ただしλ>0 ことのきYの期待値E[Y]を求めよ をおしえてください お願いします
- 140 名前:132人目の素数さん mailto:sage [04/01/10 16:14]
- >>139
1/λ。普通に積分しなさい。
- 141 名前:おしえてちゃん [04/01/11 01:58]
- X1.X2....Xn(n≧2)を正規分布N(μ、σ^2)からの
大きさnのランダム標本とし X(1)、X(2)、、、X(n) (X(1)≦X(2)≦、、、≦X(n))を その順序統計量とする mn=(n+1)/2 (nが奇数) =n/2 (nが偶数) とおきZn=X(mn)を標本メデアンとする X1のメデアンはμとなることを示せ 更に√n*(Zn-μ)はどのような分布に収束するか答えよ って解説回答いただけないでしょうか
- 142 名前:132 mailto:sage [04/01/11 14:04]
- >>137
レスありがとう。大学、一般教養の授業の宿題だったんだけど、授業あんまり まじめに聞いてなかったんで。137さんの指摘を参考にしてやりました。 ありがとう
- 143 名前:132人目の素数さん mailto:sage [04/01/11 15:13]
- >>141
>X1のメデアンはμとなることを示せ は意味不明だよ。X(2n+1)の平均がμになることなら、X(2n+1)-μの密度関数を書いてやれば偶関数になるから平均ゼロはほぼ明らか。 √n*(Zn-μ)の極限分布は、結論だけ言えばN(μ,(π/2)*σ^2)。 一般に、uをF(u)=1/2なる点とすれば、√n*(Zn-u)の極限分布はN(0,1/(4*f(u)^2))になる。 証明はスターリングの公式とかを使えばできる。(そう難しくはない。) 今は、元の分布がN(μ,σ^2)だから、u=μで、f(μ)=1/(√(2π)*σ)を代入して答え。
- 144 名前:132人目の素数さん [04/01/12 14:49]
- 143サマありがとうです! でもまだちょっとわからないんでさらに 詳しくお願いできませんか!? すいません、お手数かけます
- 145 名前:132人目の素数さん mailto:sage [04/01/12 17:02]
- >>144
どこがどう分からないのか書いてくれなきゃ答えようがないよ。 っていうかこの説明で全体的に何がなんだか、ってんなら今のあなたに理解できる問題じゃないよ。 順序統計量ってどんなものか知ってる? そもそも問題文はあってるの?
- 146 名前:132人目の素数さん [04/01/12 21:30]
- 重回帰分析の寄与率って、どういうデータだったら低くなっちゃうの?
- 147 名前:132人目の素数さん [04/01/13 19:09]
- 上で一度聞いたかもしれないのですが
Zが標準分布に従うとき E[Z^k](k=1.2.3.4)を求めよ を詳しくもう一度教えてもらえませんか よろしくお願いいたします
- 148 名前:132人目の素数さん mailto:sage [04/01/13 19:35]
- >>147
>>100見れ。
- 149 名前:132人目の素数さん [04/01/13 19:46]
- !
ありがとうございます!!!!
- 150 名前:132人目の素数さん [04/01/13 20:01]
- X1、X2....Xn(n≧2)をコーシー分布
f(x)=1/πσ*1/1+[(x-μ)/σ]^2*I(-∞.∞) からの大きさnのランダム標本とし X(1).X(2)...X(n) (X(1)≦X(2)...≦X(n)) をその順序統計量とする mn=(n+1)/2・・・nが奇数 =n/2・・・・・偶数 とおいて Zn=X(mn)を標本メデアンとする X1のメデアンはμになることを示せ 更に√n*(Znーμ)はどのような分布に収束するか をできるだけ詳しく教えてください よろしくおねがいいたします お手数おかけしてすいません
- 151 名前:132人目の素数さん mailto:sage [04/01/13 20:47]
- >>150
極限分布は、N(0,(πσ)^2/4)。>>143で、f(μ)=1/(πσ)になるから。 問題があってるなら、X1のメジアンってのは、分布関数をF(x)として、F(u)=1/2となる点uのことのようだね。 よって、F(μ)=1/2になることを示せばいいんだけど、これは密度関数の形を見れば明らかでしょ? きちんと示すなら、∫[-∞,μ]f(x)dx=∫[μ,∞]f(x)dxとなることを示せばよく、 Y=X-μと変数変換すれば簡単に示せる。>>141も同じね。
- 152 名前:132人目の素数さん [04/01/14 00:55]
- メデアン
初めて聞いた メデアン いい響きだ。 ちなみに、carvatureを カーベイチャーと書いている本があった。 これまた感動。
- 153 名前:132人目の素数さん [04/01/14 03:06]
- >>146
どういうデータってのは・・・たとえば、あまり相関のないデータ同士とか、そういう感じか? それなら・・・ >>147以降に期待(藁
- 154 名前:132人目の素数さん [04/01/14 03:18]
- 151さま
ありがとうございました 本当に感謝してます!!!!!
|

|