[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 12/23 01:43 / Filesize : 243 KB / Number-of Response : 874
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド 13



1 名前:132人目の素数さん [2011/02/11(金) 01:51:36 ]
2010.9上旬のkamomeサーバ霧散スレッド全損事件から5ヶ月、
運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。
引き続き、質問等どうぞ。

前スレ
統計学なんでもスレッド12
kamome.2ch.net/test/read.cgi/math/1283521346/

73 名前:132人目の素数さん [2011/04/09(土) 14:30:26.09 ]
統計解析についての質問。
企業がエクセルを導入したことによって、どのような統計解析が可能になったのか?
質問が雑であまりうまくまとめられてないので、すいません。
友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。

74 名前:132人目の素数さん [2011/04/09(土) 17:34:27.66 ]
お断りします。

75 名前:132人目の素数さん mailto:sage [2011/04/11(月) 19:11:17.73 ]
>>73
エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。

76 名前:132人目の素数さん mailto:sage [2011/04/11(月) 20:49:10.68 ]
1)が偽だったら何の意味もない議論だなw

77 名前:132人目の素数さん mailto:sage [2011/04/12(火) 18:15:07.51 ]
>>73
こういう本見て、そこの仕事と関係ある部分を箇条書きにすれば良いと思う。
www.amazon.co.jp/gp/product/479811958X/

78 名前:132人目の素数さん [2011/04/16(土) 22:29:22.99 ]
>>46
妥当ではないとは具体的に?

79 名前:132人目の素数さん [2011/04/16(土) 22:36:56.43 ]
非線形回帰モデル
y = a*x1 + a*b*x2 + u
において、y、x1、x2のデータがあるときにaとbの推定を考えます。
その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、
u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして
求める方法はどちらがいいのでしょうか?


80 名前:132人目の素数さん [2011/04/17(日) 00:31:45.15 ]
>>79
それ非線形なの?
線型にしか見えないけど?


81 名前:132人目の素数さん [2011/04/17(日) 02:11:01.55 ]
>>80
パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。



82 名前:132人目の素数さん [2011/04/17(日) 03:41:54.70 ]
>>81
両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの?


83 名前:132人目の素数さん [2011/04/17(日) 03:59:01.87 ]
>>82
でもa自体が未知なので変換は不可能じゃない?

84 名前:132人目の素数さん [2011/04/17(日) 15:07:32.72 ]
y = a*x1 + a*b*x2 + u

のa*b = cとおいて、

y = a*x1 + c*x2 + u

とすれば普通の回帰分析と同じ。
そして、aとcを求めてから、
cをaで割るとbが求まります。
よって線型と同じです。


85 名前:79 [2011/04/17(日) 15:51:49.81 ]
すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。
実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような
簡単な方法では扱えないモデルです。
問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。

86 名前:132人目の素数さん mailto:sage [2011/04/17(日) 16:44:18.49 ]
>>84
そのように置いたらaとcは独立ではないよね。

87 名前:132人目の素数さん [2011/04/17(日) 18:51:01.98 ]
>>86
ええ。そうしなくても独立ではないですよね?

>>85
こういうのをやりたいということですか?
www.cs.osakafu-u.ac.jp/hi/honda/mathematics2.htm


88 名前: 忍法帖【Lv=19,xxxPT】 mailto:sage [2011/04/17(日) 19:46:06.04 ]
通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。
ベイズ統計学はどういうところで使われているんですか?
普通の統計学にたいして利点と欠点とかってあるんでしょうか?

89 名前:79 [2011/04/17(日) 20:12:17.21 ]
具体的に言うと
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
という回帰モデルでa,b_1,...b_kの推定を考えています。


90 名前:132人目の素数さん [2011/04/17(日) 23:02:45.42 ]
>>88
ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。

利点はベイズの公式を利用できることですかね?
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。


91 名前:132人目の素数さん mailto:sage [2011/04/17(日) 23:17:48.07 ]
>>90
>欠点はないです。
ベイズは概して計算量が増えます。



92 名前:132人目の素数さん [2011/04/17(日) 23:37:54.83 ]
>>89
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u

これを書き換えると

y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u

x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。

93 名前:132人目の素数さん [2011/04/17(日) 23:40:48.41 ]
あ、ごめん、見間違ってた。

94 名前:132人目の素数さん [2011/04/18(月) 02:18:12.99 ]
計量経済で言うコクランオーカット法の推定と同じような問題かな?

95 名前:132人目の素数さん mailto:sage [2011/04/18(月) 18:11:22.42 ]
CRFってわざわざ名前つけるほど特別な方法でもないじゃん
なんで騒がれてんのか不明だわ

96 名前:132人目の素数さん mailto:sage [2011/04/18(月) 23:31:50.66 ]
>>87
aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。

97 名前:132人目の素数さん [2011/04/22(金) 09:25:33.58 ]
データが「正規分布に従う」と言うためには何をすれば(何を示せば)いいですか?

98 名前:132人目の素数さん mailto:sage [2011/04/22(金) 16:27:42.03 ]
>>97
宿題?それとも試験中?

99 名前:97 [2011/04/22(金) 19:36:59.20 ]
>>98
工学系の論文です。

100 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:51:27.25 ]
論文なのにこんなところで聞くのかw
参考文献に2chと書くのか?w

101 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:54:52.25 ]
胸が熱くなるな…



102 名前:97 [2011/04/22(金) 20:37:35.46 ]
>>100
ここで概要を聞いた後に文献を引いて詳細を調べようと思います。

103 名前:132人目の素数さん mailto:sage [2011/04/22(金) 21:34:04.74 ]
>>102
データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…

104 名前:97 [2011/04/22(金) 23:16:49.37 ]
>>103
正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか?
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test

105 名前:132人目の素数さん mailto:sage [2011/04/22(金) 23:18:35.61 ]
>>104
概要を聞いたら、詳細に調べるんじゃなかったっけ。

106 名前:97 [2011/04/23(土) 01:20:54.07 ]
>>105
はい、それぞれの手法の詳細は現在調べているところです。

最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。

107 名前:132人目の素数さん mailto:sage [2011/04/23(土) 08:13:17.77 ]
>>106
統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。

108 名前:97 [2011/04/23(土) 10:11:01.86 ]
>>107
ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。

>>98, 103
お礼が遅くなりましたが、ありがとうございます。>>107と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。

109 名前:132人目の素数さん [2011/04/24(日) 21:20:58.83 ]
ベキ分布でリスク管理のすすめ
f.blogos.livedoor.com/opinion/article/5513200/

110 名前:132人目の素数さん [2011/04/24(日) 22:09:22.10 ]
>>108
データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。

棄却されないために、わざと検定しない奴多いんですよ。(爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも?


111 名前:132人目の素数さん [2011/04/27(水) 13:01:13.59 ]
小説に歴史上の数学者を登場させたくて、
確率論、特に正規分布などの歴史について調べています。

Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。



112 名前:132人目の素数さん mailto:sage [2011/04/28(木) 13:24:03.84 ]
物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた

113 名前:132人目の素数さん mailto:sage [2011/04/28(木) 14:49:13.68 ]
>>112
ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。

114 名前:132人目の素数さん mailto:sage [2011/04/28(木) 21:49:10.37 ]
>>113
ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。

115 名前:132人目の素数さん mailto:sage [2011/04/28(木) 22:38:47.02 ]
>>114
おおっ。良くまとまっていますね!thanks!

116 名前:132人目の素数さん mailto:sage [2011/05/04(水) 20:17:27.97 ]
この問題はカイ二乗分布の表を使って解くのでしょうか?
どなたか詳しい解き方を教えて頂けたら嬉しいです。
なんかいまいち参考書を読んでも解き方がわからない...


正規分布に従う母集団から次の標本が存在する
66.303、15.102、84.942、53.234、93.443、63.132、45.295
この時、母集団の平均と分散を信頼係数95%で区間推定せよ。
(解答は小数点以下第4位まで求めよ)

117 名前:132人目の素数さん mailto:sage [2011/05/05(木) 01:07:45.13 ]
>>116
サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。

118 名前:132人目の素数さん [2011/05/05(木) 06:36:06.04 ]
平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。
統計表のどこを見ればわかるものなのでしょうか?

ttp://www.mext.go.jp/b_menu/houdou/21/11/__icsFiles/afieldfile/2009/11/30/1287227_1_1.pdf

119 名前:132人目の素数さん mailto:sage [2011/05/05(木) 07:21:36.82 ]
>>118
pdfは見ないで書くけど、ないなら他から探して持ってくる。

120 名前:132人目の素数さん mailto:sage [2011/05/05(木) 11:45:02.47 ]
>>116
平均の推定はt分布
分散の推定はχ二乗分布

121 名前:132人目の素数さん mailto:sage [2011/05/05(木) 15:44:47.42 ]
>>118
表の中に38698校とあるやつではないわけ?



122 名前:132人目の素数さん [2011/05/05(木) 16:58:23.57 ]
>>121
でも、(2ー1)では総数40285校なんですよね。
こういう調査って総数は一致しないものなのですね.


123 名前:132人目の素数さん [2011/05/06(金) 19:58:32.59 ]
>>122

>>119だけど、なんか適当なこと書いてるのでpdfを読んでみた。
とりあえず、統計資料使う時は「注」を読もうね。

私の学生が「こういう調査って総数は一致しないものなのですね」って
言ったら叱ってるw

まず、「(1−1)暴力行為の発生状況」と「(2−1)いじめの認知
学校数・認知件数」をみると(1−1)には特別支援学校が含まれていない
のでその分(2−1)が多い。

(2−1)の注を見ると「注3)学校総数のうち、高等学校の全定併置校は
全日制、定時制をそれぞれ1校(計2校)として計上しているため、学校基
本調査の数値と一致しない。」と一致しない理由が書いてある。

(1−1)では国立170、公立36242、私立2286で、(2−1)の数字から
特別支援学校を除くと、国立が170(=215-45)、公立36775(=37741-966)、
私立2314(=2329-15)となっていて、国立以外は(2−1)の数字が大きい
ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と
してデータを処理してるのがわかる。

また、(2−1)の注を見ると「(注4)休校等の学校があるため、認知した
学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、
学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082
と小さくなっているので、(1−1)を見るときも休校などが考慮されていない
と予想できる。

124 名前:れが [2011/05/06(金) 21:56:57.84 ]
問題:
三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y:Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、
1) P(Y>=1)=□、P(X^2+Y^2>=1)=□、

2) Xの確率密度関数f(X)はf(X)=□、E[X]=□、
   Yの確率密度関数g(y)はg(y)=□、E[Y]=□、

□を求める問題です。
図がなくて申し訳ありません。X座標が1、Y座標が2の三角形Ωです。
分かるかた教えてください。
よろしくお願いします。


125 名前:132人目の素数さん mailto:sage [2011/05/06(金) 22:09:34.67 ]
>>124
すぐに答える気はないんだけど

とりあえず、三角形の頂点の座標が
(0,0)、(1,0)、(0,2)
ってことかな?

126 名前:れが [2011/05/06(金) 22:10:37.07 ]
>>125
そうです。

127 名前:132人目の素数さん mailto:sage [2011/05/07(土) 14:24:10.69 ]
>>124
携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。

1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。

2→三角形の斜辺をxの式で書く。その式が答え。
でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。
正確には「0>x,x>1のとき」はf(x)=0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。
小さい解答欄にそれかくと空気読めてないと思われるかも。

同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。


128 名前:132人目の素数さん mailto:sage [2011/05/07(土) 14:57:56.77 ]
>>127
>>125だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。

129 名前:132人目の素数さん mailto:sage [2011/05/07(土) 20:42:58.13 ]
>>117
>>120
ありがとうございます。

この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、
という認識で正しいでしょうか?

130 名前:132人目の素数さん mailto:sage [2011/05/08(日) 23:35:11.89 ]
どうしてそんな認識になるのか僕にはわけがわからないよ。

131 名前:132人目の素数さん mailto:sage [2011/05/09(月) 01:48:21.68 ]
>>130
多分、信頼区間ってものが全然わかってないんだと思う。



132 名前:132人目の素数さん mailto:sage [2011/05/09(月) 11:37:29.77 ]
こりゃ毎回生徒をいびりにくる先生から説教してもらわなな

133 名前:132人目の素数さん mailto:age [2011/05/09(月) 12:10:04.32 ]
>>130 >>131 >>132

カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。

これはやはり誤りでしょうか?
教科書を読んでもこの程度しか理解できませんでした・・・

どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。

134 名前:132人目の素数さん mailto:sage [2011/05/09(月) 12:39:27.96 ]
>>133
ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を2乗すれば分散になる。

でも君のデータはχ二乗分布なの?

平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。

分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。
その時に、信頼区間の設定(90%とか95%とか)に対応したχ二乗分布の値を使う。

135 名前:132人目の素数さん mailto:sage [2011/05/09(月) 12:45:08.00 ]
ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。

とりあえず、分散の信頼区間の式をよく見るんだ!

136 名前:132人目の素数さん mailto:sage [2011/05/09(月) 13:25:32.52 ]
>>133
ストーリーがわかってないような気がした
分かっていたらすまん
数学的な話を抜きにして、発想の話

例えば、池の中の魚の身長の平均や分散を知りたい
→全部調べるのむり
→とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった
→ひょっとして、池の魚の平均身長は10センチ?(点推定)
→でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな
→でかいのが10匹とれたり、小さいのが10匹とれたりするかも
→サンプル平均は大小さまざまな値をとるな
→池全体の平均を10センチとドンピシャでよそうするのは怖い
→平均は8センチ〜12センチにあるとか幅もたせて予想するか
→これが区間推定

サンプル平均やサンプル分散はどのような大小さまざまな値をとる
しかし、実はそれぞれ工夫をすれば特徴的な分布に従う
そして、その分布を見ながら95%の確率まであたるように予想範囲を広げる

137 名前:132人目の素数さん mailto:sage [2011/05/10(火) 18:04:02.52 ]
大数の法則のおかげでこんだけサンプルとれば
信頼に足る母集団の情報が得られますよって判るのか!

138 名前:132人目の素数さん mailto:sage [2011/05/10(火) 18:26:25.60 ]
>>137
んだ

139 名前:132人目の素数さん mailto:sage [2011/05/11(水) 19:03:04.39 ]
区間推定の信頼率って、本来は極限とった先での値だよね
有限の場合で考えても、極限にどれだけ近いか(オーダーじゃなくて、正確に数値で)わからないと、
95%なんて具体的な値を引き合いに出しても意味なくね?

140 名前:132人目の素数さん mailto:sage [2011/05/11(水) 19:04:45.90 ]
訂正

"(オーダーじゃなくて、正確に数値で)"は削除


141 名前:132人目の素数さん mailto:sage [2011/05/11(水) 22:29:30.52 ]
>>139
小標本特性についてはわかっていない場合が多いが、例えはt分布については特性が数学的にわかってる。
その代わり、母集団の分布に制限がある。

中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)

で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。

ということで、全く意味がないわけではない。



142 名前:132人目の素数さん [2011/05/11(水) 22:50:42.61 ]
>>139
まず、>>141に追加

>中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)
その代り、サンプル数が大きくないといけない。
ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル
があれば実用上はそれほど問題がないこともわかっている。
t分布表と標準分布の表を比べてみるとわかるよ。

次にちょっと補足しておくと、小標本の場合は数学的(解析的)にサンプル
の分布の状態が求まらない。これは式で表せないということであって、少ない
サンプル数での分布は存在する。

なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から
10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、
10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。

143 名前:132人目の素数さん [2011/05/12(木) 13:22:18.88 ]
(平均,分散)=(0,1)から10個取り出した10個の平均値は、
0±10なら、確率100% 、
0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。

ところで、その逆(のようなこと)である、
10個の平均値が、zeroの場合の
元の分布(これが正規分布で分散1であると仮定し)
元の分布の平均(つまり母平均)の確率分布を求めたい。
どうもなんだか、すっきりしないから。

144 名前:132人目の素数さん [2011/05/14(土) 09:55:16.63 ]
ttp://up3.viploader.net/ippan/src/vlippan207769.jpg

145 名前:132人目の素数さん mailto:sage [2011/05/14(土) 21:05:24.91 ]
>>144
距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた
時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。

146 名前:132人目の素数さん [2011/05/15(日) 10:52:52.19 ]
【統計】女子大生の性体験率は62% 女子高生は30%でともに肉食化
toki.2ch.net/test/read.cgi/dqnplus/1304856492/

147 名前:132人目の素数さん [2011/05/16(月) 23:18:20.94 ]
すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか(実験誤差は正規分布に従うと仮定)
(1)条件A B Cで各条件10サンプルを並行して行いデータを取った。
(2)上記の実験を三回繰り返した(各条件10*3のデータ数)
二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。

148 名前:132人目の素数さん [2011/05/17(火) 10:31:45.76 ]
>>147
ABCで10サンプルx3なら
それぞれ30サンプルということでいいじゃん?

30サンプルのが3つある、ということで
ABCを比較すればいい。
条件は同じなんでしょ?


149 名前:132人目の素数さん mailto:sage [2011/05/18(水) 23:43:29.31 ]
>148 レスありがとうございます。はい。条件は同じです。

150 名前:132人目の素数さん mailto:sage [2011/05/19(木) 20:23:43.52 ]
質問があるのですが、どなたかご回答をお願いします。

平均点が58、分散16のとき、得点が65の人の偏差値はいくであるか?

自分の考えでは、10・(65-58)/16+50=54.357になりました。

分散と標準偏差値を同じように扱ってしまっています。
どなたかご教授お願いします。

151 名前:132人目の素数さん mailto:sage [2011/05/19(木) 20:29:18.28 ]
>>150
分散は標準偏差の二乗。
標準偏差は分散をルートしたもの。



152 名前:132人目の素数さん mailto:sage [2011/05/20(金) 01:36:12.31 ]
>>150
分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。

バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。
で平均から離れてた点数を合計して人数(もしくは人数−1)で割ったら大体のバラツキが分かりそうやろ。

でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。
2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。
前者のほうが、実力バラついてるやろ。
だから平均から離れてた点数を2乗して合計してから人数(もしくは人数−1)で割るんや。それが分散。

でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。
2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。

さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。
当たり前やけど、引かれた点数をもとに平均点を出すと0点になるやろ。
さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。
(100点満点のテストを10点満点にした感じ)

この発想が
(点数−平均)/標準偏差

みんなの点数をこの式にいれて、これを点数にしたら平均0で大体±1に収まるのではないかと発想したくなる。
その発想をもとに、偏差値はどういう指標なのかを考えてみては。
平均点とれば偏差値50とかの意味もわかると思う。

153 名前:132人目の素数さん mailto:sage [2011/05/20(金) 02:06:38.32 ]
その関西弁イラつくからやめて下さい

154 名前:132人目の素数さん [2011/05/20(金) 08:33:36.99 ]
というか、10・(65-58)/16+50=54.357 の式を書いてる段階でそれなりに
勉強はしてる。

>>152の説明だとかえってわからない、混乱させるよ。w

155 名前:132人目の素数さん mailto:sage [2011/05/20(金) 10:21:36.72 ]
>>152
自分は納得できました。
たまにくる教員の方?より分かりやすいです。

156 名前:132人目の素数さん mailto:sage [2011/05/20(金) 11:07:32.00 ]
>>155みたいに教科書を読んでも理解できないのが、
「マンガでわかる統計学」の購買層なんだろうなw

157 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:04:01.23 ]
>>154
あなたも理解が足りてませんね。
基準化するのに分散で割ってる人を学習が進んでると判断するあたり。
似てる式ですが意味が全く違いますよ。単位が違いますから。

標準正規分布を利用した検定推定。特に区間推定と基準化の関係。
さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。

式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。

158 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:13:35.42 ]
156は教員で悔しかったのかなw
ひさびさにワロタ

159 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:46:50.63 ]
いや、たまにくる教員は俺(>>154)だ。w

>>157
当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。

宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。

160 名前:132人目の素数さん mailto:sage [2011/05/20(金) 14:08:02.72 ]
先生!
宿題ききにきて挙げ句ケンカする大学生をなんとかしてください!
ここはもはや動物園です
でも好きです

161 名前:132人目の素数さん mailto:sage [2011/05/20(金) 15:14:25.55 ]
私も好きなので、止める気はありません。
授業評価もないので、静かにさせなくても問題ないし。w



162 名前:132人目の素数さん mailto:sage [2011/05/21(土) 00:45:12.43 ]
すんません。
X〜x^2(n)のとき
a*X〜a*x^2(n) になりますか?

163 名前:132人目の素数さん mailto:sage [2011/05/21(土) 09:57:37.52 ]
x^2(n) って何?

164 名前:132人目の素数さん mailto:sage [2011/05/21(土) 10:56:55.70 ]
カイ二乗じゃないかな

165 名前:132人目の素数さん mailto:sage [2011/05/21(土) 20:57:19.16 ]
>>162です
そうですカイ二乗分布です
説明不足ですいません

166 名前:132人目の素数さん mailto:sage [2011/05/22(日) 01:40:50.58 ]
>>165
ならない。

χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。
綺麗な形にならないと思う。

167 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:12:13.11 ]
a*x^2(n)って何?カイ二乗分布のa倍?

168 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:41:15.19 ]
分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。

169 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:46:47.72 ]
xがn(μ,σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0,1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。


170 名前:132人目の素数さん mailto:sage [2011/05/22(日) 07:42:10.64 ]
>>169
y=(x-μ)/σ^2 じゃなくて、y=(x-μ)/σ に修正。

171 名前:132人目の素数さん mailto:sage [2011/05/22(日) 13:43:58.12 ]
>>168
それってa倍したものが再生性があるとか考えなくてよいなら
どんな分布でもそうなんじゃない?
>>169は再生性の話だよね。



172 名前:132人目の素数さん mailto:sage [2011/05/22(日) 15:10:49.05 ]
>>168
a倍した変数が従う分布「〜a*x^2(n)」と書いてるので、
a倍した新しい変数の確率を考えるとこれはおかしい。
全ての確率が1になってない。

全ての確率が1になるような分布関数の形状の話ではなく、
対応関係だけを考えているなら、>>171のコメントもありかな。

Y=aX ってのは、新しい変数Yの分布を考えた時に、その値が
aXと等しければ、元の分布のXの時の確率が与えられる。

例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで
新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。
(ここまでならあり)

ただ、普通は変数変換して、y=φ(x)という変換をした場合、
元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y)
として、g(y)=f(ξ(y))|dξ(y)/dy| となる。

χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても
X^(m/2-1)*e^(-X/2) という項があって、ここのXをY/aに置き換え
た物が出てくるので、積分して分布を考えても元のa倍にはならない。

173 名前:132人目の素数さん mailto:sage [2011/05/22(日) 15:13:45.92 ]
>>171
あ、肝心なことを答えてなかった。

>>168、169で書いたのは、再生性というよりも、変数変換した後の
分布の形状の話で、それは元の分布にaを掛けたものにはならない
ってことです。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<243KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef