統計学なんでもスレッド　13

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 12/23 01:43 / Filesize : 243 KB / Number-of Response : 874
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド　13

1 名前：１３２人目の素数さん [2011/02/11(金) 01:51:36 ]: 2010.9上旬のkamomeサーバ霧散スレッド全損事件から５ヶ月、
運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。
引き続き、質問等どうぞ。

前スレ
統計学なんでもスレッド12
kamome.2ch.net/test/read.cgi/math/1283521346/
73 名前：１３２人目の素数さん [2011/04/09(土) 14:30:26.09 ]: 統計解析についての質問。
企業がエクセルを導入したことによって、どのような統計解析が可能になったのか？
質問が雑であまりうまくまとめられてないので、すいません。
友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。
74 名前：１３２人目の素数さん [2011/04/09(土) 17:34:27.66 ]: お断りします。
75 名前：１３２人目の素数さん mailto:sage [2011/04/11(月) 19:11:17.73 ]: >>73
エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。
76 名前：１３２人目の素数さん mailto:sage [2011/04/11(月) 20:49:10.68 ]: 1)が偽だったら何の意味もない議論だなｗ
77 名前：１３２人目の素数さん mailto:sage [2011/04/12(火) 18:15:07.51 ]: >>73
こういう本見て、そこの仕事と関係ある部分を箇条書きにすれば良いと思う。
www.amazon.co.jp/gp/product/479811958X/
78 名前：１３２人目の素数さん [2011/04/16(土) 22:29:22.99 ]: >>46
妥当ではないとは具体的に？
79 名前：１３２人目の素数さん [2011/04/16(土) 22:36:56.43 ]: 非線形回帰モデル
y = a*x1 + a*b*x2 + u
において、y、x1、x2のデータがあるときにaとbの推定を考えます。
その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、
u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして
求める方法はどちらがいいのでしょうか？
80 名前：１３２人目の素数さん [2011/04/17(日) 00:31:45.15 ]: >>79
それ非線形なの？
線型にしか見えないけど？
81 名前：１３２人目の素数さん [2011/04/17(日) 02:11:01.55 ]: >>80
パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。
82 名前：１３２人目の素数さん [2011/04/17(日) 03:41:54.70 ]: >>81
両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの？
83 名前：１３２人目の素数さん [2011/04/17(日) 03:59:01.87 ]: >>82
でもa自体が未知なので変換は不可能じゃない？
84 名前：１３２人目の素数さん [2011/04/17(日) 15:07:32.72 ]: y = a*x1 + a*b*x2 + u

のa*b = cとおいて、

y = a*x1 + c*x2 + u

とすれば普通の回帰分析と同じ。
そして、aとcを求めてから、
cをaで割るとbが求まります。
よって線型と同じです。
85 名前：79 [2011/04/17(日) 15:51:49.81 ]: すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。
実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような
簡単な方法では扱えないモデルです。
問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。
86 名前：１３２人目の素数さん mailto:sage [2011/04/17(日) 16:44:18.49 ]: >>84
そのように置いたらaとcは独立ではないよね。
87 名前：１３２人目の素数さん [2011/04/17(日) 18:51:01.98 ]: >>86
ええ。そうしなくても独立ではないですよね？

>>85
こういうのをやりたいということですか？
www.cs.osakafu-u.ac.jp/hi/honda/mathematics2.htm
88 名前：忍法帖【Lv=19,xxxPT】 mailto:sage [2011/04/17(日) 19:46:06.04 ]: 通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。
ベイズ統計学はどういうところで使われているんですか？
普通の統計学にたいして利点と欠点とかってあるんでしょうか？
89 名前：79 [2011/04/17(日) 20:12:17.21 ]: 具体的に言うと
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
という回帰モデルでa,b_1,...b_kの推定を考えています。
90 名前：１３２人目の素数さん [2011/04/17(日) 23:02:45.42 ]: >>88
ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。

利点はベイズの公式を利用できることですかね？
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。
91 名前：１３２人目の素数さん mailto:sage [2011/04/17(日) 23:17:48.07 ]: >>90
>欠点はないです。
ベイズは概して計算量が増えます。
92 名前：１３２人目の素数さん [2011/04/17(日) 23:37:54.83 ]: >>89
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u

これを書き換えると

y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u

x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。
93 名前：１３２人目の素数さん [2011/04/17(日) 23:40:48.41 ]: あ、ごめん、見間違ってた。
94 名前：１３２人目の素数さん [2011/04/18(月) 02:18:12.99 ]: 計量経済で言うコクランオーカット法の推定と同じような問題かな？
95 名前：１３２人目の素数さん mailto:sage [2011/04/18(月) 18:11:22.42 ]: ＣＲＦってわざわざ名前つけるほど特別な方法でもないじゃん
なんで騒がれてんのか不明だわ
96 名前：１３２人目の素数さん mailto:sage [2011/04/18(月) 23:31:50.66 ]: >>87
aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。
97 名前：１３２人目の素数さん [2011/04/22(金) 09:25:33.58 ]: データが「正規分布に従う」と言うためには何をすれば（何を示せば）いいですか？
98 名前：１３２人目の素数さん mailto:sage [2011/04/22(金) 16:27:42.03 ]: >>97
宿題？それとも試験中？
99 名前：97 [2011/04/22(金) 19:36:59.20 ]: >>98
工学系の論文です。
100 名前：１３２人目の素数さん mailto:sage [2011/04/22(金) 19:51:27.25 ]: 論文なのにこんなところで聞くのかｗ
参考文献に2chと書くのか？ｗ
101 名前：１３２人目の素数さん mailto:sage [2011/04/22(金) 19:54:52.25 ]: 胸が熱くなるな…
102 名前：97 [2011/04/22(金) 20:37:35.46 ]: >>100
ここで概要を聞いた後に文献を引いて詳細を調べようと思います。
103 名前：１３２人目の素数さん mailto:sage [2011/04/22(金) 21:34:04.74 ]: >>102
データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…
104 名前：97 [2011/04/22(金) 23:16:49.37 ]: >>103
正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか？
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test
105 名前：１３２人目の素数さん mailto:sage [2011/04/22(金) 23:18:35.61 ]: >>104
概要を聞いたら、詳細に調べるんじゃなかったっけ。
106 名前：97 [2011/04/23(土) 01:20:54.07 ]: >>105
はい、それぞれの手法の詳細は現在調べているところです。

最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。
107 名前：１３２人目の素数さん mailto:sage [2011/04/23(土) 08:13:17.77 ]: >>106
統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。
108 名前：97 [2011/04/23(土) 10:11:01.86 ]: >>107
ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。

>>98, 103
お礼が遅くなりましたが、ありがとうございます。>>107と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。
109 名前：１３２人目の素数さん [2011/04/24(日) 21:20:58.83 ]: ベキ分布でリスク管理のすすめ
f.blogos.livedoor.com/opinion/article/5513200/
110 名前：１３２人目の素数さん [2011/04/24(日) 22:09:22.10 ]: >>108
データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。

棄却されないために、わざと検定しない奴多いんですよ。（爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも？
111 名前：１３２人目の素数さん [2011/04/27(水) 13:01:13.59 ]: 小説に歴史上の数学者を登場させたくて、
確率論、特に正規分布などの歴史について調べています。

Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。
112 名前：１３２人目の素数さん mailto:sage [2011/04/28(木) 13:24:03.84 ]: 物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた
113 名前：１３２人目の素数さん mailto:sage [2011/04/28(木) 14:49:13.68 ]: >>112
ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。
114 名前：１３２人目の素数さん mailto:sage [2011/04/28(木) 21:49:10.37 ]: >>113
ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。
115 名前：１３２人目の素数さん mailto:sage [2011/04/28(木) 22:38:47.02 ]: >>114
おおっ。良くまとまっていますね！thanks！
116 名前：１３２人目の素数さん mailto:sage [2011/05/04(水) 20:17:27.97 ]: この問題はカイ二乗分布の表を使って解くのでしょうか？
どなたか詳しい解き方を教えて頂けたら嬉しいです。
なんかいまいち参考書を読んでも解き方がわからない...

正規分布に従う母集団から次の標本が存在する
66.303、15.102、84.942、53.234、93.443、63.132、45.295
この時、母集団の平均と分散を信頼係数95％で区間推定せよ。
(解答は小数点以下第４位まで求めよ)
117 名前：１３２人目の素数さん mailto:sage [2011/05/05(木) 01:07:45.13 ]: >>116
サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。
118 名前：１３２人目の素数さん [2011/05/05(木) 06:36:06.04 ]: 平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。
統計表のどこを見ればわかるものなのでしょうか?

ttp://www.mext.go.jp/b_menu/houdou/21/11/__icsFiles/afieldfile/2009/11/30/1287227_1_1.pdf
119 名前：１３２人目の素数さん mailto:sage [2011/05/05(木) 07:21:36.82 ]: >>118
ｐｄｆは見ないで書くけど、ないなら他から探して持ってくる。
120 名前：１３２人目の素数さん mailto:sage [2011/05/05(木) 11:45:02.47 ]: >>116
平均の推定はt分布
分散の推定はχ二乗分布
121 名前：１３２人目の素数さん mailto:sage [2011/05/05(木) 15:44:47.42 ]: >>118
表の中に38698校とあるやつではないわけ？
122 名前：１３２人目の素数さん [2011/05/05(木) 16:58:23.57 ]: >>121
でも、(2ー1)では総数40285校なんですよね。
こういう調査って総数は一致しないものなのですね.
123 名前：１３２人目の素数さん [2011/05/06(金) 19:58:32.59 ]: >>122

>>119だけど、なんか適当なこと書いてるのでpdfを読んでみた。
とりあえず、統計資料使う時は「注」を読もうね。

私の学生が「こういう調査って総数は一致しないものなのですね」って
言ったら叱ってるｗ

まず、「（１－１）暴力行為の発生状況」と「（２－１）いじめの認知
学校数・認知件数」をみると（１－１）には特別支援学校が含まれていない
のでその分（２－１）が多い。

（２－１）の注を見ると「注３）学校総数のうち、高等学校の全定併置校は
全日制、定時制をそれぞれ１校（計２校）として計上しているため、学校基
本調査の数値と一致しない。」と一致しない理由が書いてある。

（１－１）では国立170、公立36242、私立2286で、（２－１）の数字から
特別支援学校を除くと、国立が170（＝215-45）、公立36775（＝37741-966）、
私立2314（＝2329-15）となっていて、国立以外は（２－１）の数字が大きい
ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と
してデータを処理してるのがわかる。

また、（２－１）の注を見ると「（注４）休校等の学校があるため、認知した
学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、
学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082
と小さくなっているので、（１－１）を見るときも休校などが考慮されていない
と予想できる。
124 名前：れが [2011/05/06(金) 21:56:57.84 ]: 問題：
三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y：Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、
１)　P(Y>=1)=□、P(X^2+Y^2>=1)=□、

２） Xの確率密度関数f(X)はf(X)=□、E[X]=□、
　　 Yの確率密度関数g(y)はg(y)=□、E[Y]=□、

□を求める問題です。
図がなくて申し訳ありません。X座標が１、Y座標が２の三角形Ωです。
分かるかた教えてください。
よろしくお願いします。
125 名前：１３２人目の素数さん mailto:sage [2011/05/06(金) 22:09:34.67 ]: >>124
すぐに答える気はないんだけど

とりあえず、三角形の頂点の座標が
(0,0)、(1,0)、(0,2)
ってことかな？
126 名前：れが [2011/05/06(金) 22:10:37.07 ]: >>125
そうです。
127 名前：１３２人目の素数さん mailto:sage [2011/05/07(土) 14:24:10.69 ]: >>124
携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。

1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。

2→三角形の斜辺をxの式で書く。その式が答え。
でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。
正確には「0>x，x>1のとき」はf(x)＝0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。
小さい解答欄にそれかくと空気読めてないと思われるかも。

同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。
128 名前：１３２人目の素数さん mailto:sage [2011/05/07(土) 14:57:56.77 ]: >>127
>>125だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。
129 名前：１３２人目の素数さん mailto:sage [2011/05/07(土) 20:42:58.13 ]: >>117
>>120
ありがとうございます。

この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、
という認識で正しいでしょうか？
130 名前：１３２人目の素数さん mailto:sage [2011/05/08(日) 23:35:11.89 ]: どうしてそんな認識になるのか僕にはわけがわからないよ。
131 名前：１３２人目の素数さん mailto:sage [2011/05/09(月) 01:48:21.68 ]: >>130
多分、信頼区間ってものが全然わかってないんだと思う。
132 名前：１３２人目の素数さん mailto:sage [2011/05/09(月) 11:37:29.77 ]: こりゃ毎回生徒をいびりにくる先生から説教してもらわなな
133 名前：１３２人目の素数さん mailto:age [2011/05/09(月) 12:10:04.32 ]: >>130 >>131 >>132

カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。

これはやはり誤りでしょうか？
教科書を読んでもこの程度しか理解できませんでした･･･

どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。
134 名前：１３２人目の素数さん mailto:sage [2011/05/09(月) 12:39:27.96 ]: >>133
ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を２乗すれば分散になる。

でも君のデータはχ二乗分布なの？

平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。

分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。
その時に、信頼区間の設定（90%とか95%とか）に対応したχ二乗分布の値を使う。
135 名前：１３２人目の素数さん mailto:sage [2011/05/09(月) 12:45:08.00 ]: ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。

とりあえず、分散の信頼区間の式をよく見るんだ！
136 名前：１３２人目の素数さん mailto:sage [2011/05/09(月) 13:25:32.52 ]: >>133
ストーリーがわかってないような気がした
分かっていたらすまん
数学的な話を抜きにして、発想の話

例えば、池の中の魚の身長の平均や分散を知りたい
→全部調べるのむり
→とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった
→ひょっとして、池の魚の平均身長は10センチ？(点推定)
→でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな
→でかいのが10匹とれたり、小さいのが10匹とれたりするかも
→サンプル平均は大小さまざまな値をとるな
→池全体の平均を10センチとドンピシャでよそうするのは怖い
→平均は8センチ～12センチにあるとか幅もたせて予想するか
→これが区間推定

サンプル平均やサンプル分散はどのような大小さまざまな値をとる
しかし、実はそれぞれ工夫をすれば特徴的な分布に従う
そして、その分布を見ながら95％の確率まであたるように予想範囲を広げる
137 名前：１３２人目の素数さん mailto:sage [2011/05/10(火) 18:04:02.52 ]: 大数の法則のおかげでこんだけサンプルとれば
信頼に足る母集団の情報が得られますよって判るのか！
138 名前：１３２人目の素数さん mailto:sage [2011/05/10(火) 18:26:25.60 ]: >>137
んだ
139 名前：１３２人目の素数さん mailto:sage [2011/05/11(水) 19:03:04.39 ]: 区間推定の信頼率って、本来は極限とった先での値だよね
有限の場合で考えても、極限にどれだけ近いか（オーダーじゃなくて、正確に数値で）わからないと、
95％なんて具体的な値を引き合いに出しても意味なくね？
140 名前：１３２人目の素数さん mailto:sage [2011/05/11(水) 19:04:45.90 ]: 訂正

"（オーダーじゃなくて、正確に数値で）"は削除
141 名前：１３２人目の素数さん mailto:sage [2011/05/11(水) 22:29:30.52 ]: >>139
小標本特性についてはわかっていない場合が多いが、例えはｔ分布については特性が数学的にわかってる。
その代わり、母集団の分布に制限がある。

中心極限定理は、母集団に制限がないから凄いわけ。（特殊な分布を除く）

で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。

ということで、全く意味がないわけではない。
142 名前：１３２人目の素数さん [2011/05/11(水) 22:50:42.61 ]: >>139
まず、>>141に追加

>中心極限定理は、母集団に制限がないから凄いわけ。（特殊な分布を除く）
その代り、サンプル数が大きくないといけない。
ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル
があれば実用上はそれほど問題がないこともわかっている。
t分布表と標準分布の表を比べてみるとわかるよ。

次にちょっと補足しておくと、小標本の場合は数学的（解析的）にサンプル
の分布の状態が求まらない。これは式で表せないということであって、少ない
サンプル数での分布は存在する。

なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から
10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、
10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。
143 名前：１３２人目の素数さん [2011/05/12(木) 13:22:18.88 ]: (平均,分散)=(0,1)から10個取り出した10個の平均値は、
0±10なら、確率100% 、
0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。

ところで、その逆(のようなこと）である、
10個の平均値が、zeroの場合の
元の分布（これが正規分布で分散１であると仮定し）
元の分布の平均（つまり母平均）の確率分布を求めたい。
どうもなんだか、すっきりしないから。
144 名前：１３２人目の素数さん [2011/05/14(土) 09:55:16.63 ]: ttp://up3.viploader.net/ippan/src/vlippan207769.jpg
145 名前：１３２人目の素数さん mailto:sage [2011/05/14(土) 21:05:24.91 ]: >>144
距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた
時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。
146 名前：１３２人目の素数さん [2011/05/15(日) 10:52:52.19 ]: 【統計】女子大生の性体験率は62% 女子高生は30%でともに肉食化
toki.2ch.net/test/read.cgi/dqnplus/1304856492/
147 名前：１３２人目の素数さん [2011/05/16(月) 23:18:20.94 ]: すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか（実験誤差は正規分布に従うと仮定）
（１）条件A　B　Cで各条件10サンプルを並行して行いデータを取った。
（２）上記の実験を三回繰り返した（各条件10*3のデータ数）
二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。
148 名前：１３２人目の素数さん [2011/05/17(火) 10:31:45.76 ]: >>147
ABCで１０サンプルｘ３なら
それぞれ３０サンプルということでいいじゃん？

３０サンプルのが３つある、ということで
ABCを比較すればいい。
条件は同じなんでしょ？
149 名前：１３２人目の素数さん mailto:sage [2011/05/18(水) 23:43:29.31 ]: >148　レスありがとうございます。はい。条件は同じです。
150 名前：１３２人目の素数さん mailto:sage [2011/05/19(木) 20:23:43.52 ]: 質問があるのですが、どなたかご回答をお願いします。

平均点が５８、分散１６のとき、得点が６５の人の偏差値はいくであるか？

自分の考えでは、10・(65-58)/16+50=54.357になりました。

分散と標準偏差値を同じように扱ってしまっています。
どなたかご教授お願いします。
151 名前：１３２人目の素数さん mailto:sage [2011/05/19(木) 20:29:18.28 ]: >>150
分散は標準偏差の二乗。
標準偏差は分散をルートしたもの。
152 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 01:36:12.31 ]: >>150
分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。

バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。
で平均から離れてた点数を合計して人数(もしくは人数－1)で割ったら大体のバラツキが分かりそうやろ。

でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。
2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。
前者のほうが、実力バラついてるやろ。
だから平均から離れてた点数を2乗して合計してから人数(もしくは人数－1)で割るんや。それが分散。

でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。
2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。

さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。
当たり前やけど、引かれた点数をもとに平均点を出すと０点になるやろ。
さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。
(100点満点のテストを10点満点にした感じ)

この発想が
(点数－平均)/標準偏差

みんなの点数をこの式にいれて、これを点数にしたら平均０で大体±1に収まるのではないかと発想したくなる。
その発想をもとに、偏差値はどういう指標なのかを考えてみては。
平均点とれば偏差値50とかの意味もわかると思う。
153 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 02:06:38.32 ]: その関西弁イラつくからやめて下さい
154 名前：１３２人目の素数さん [2011/05/20(金) 08:33:36.99 ]: というか、10・(65-58)/16+50=54.357　の式を書いてる段階でそれなりに
勉強はしてる。

>>152の説明だとかえってわからない、混乱させるよ。ｗ
155 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 10:21:36.72 ]: >>152
自分は納得できました。
たまにくる教員の方？より分かりやすいです。
156 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 11:07:32.00 ]: >>155みたいに教科書を読んでも理解できないのが、
「マンガでわかる統計学」の購買層なんだろうなw
157 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 12:04:01.23 ]: >>154
あなたも理解が足りてませんね。
基準化するのに分散で割ってる人を学習が進んでると判断するあたり。
似てる式ですが意味が全く違いますよ。単位が違いますから。

標準正規分布を利用した検定推定。特に区間推定と基準化の関係。
さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。

式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。
158 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 12:13:35.42 ]: 156は教員で悔しかったのかなw
ひさびさにﾜﾛﾀ
159 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 12:46:50.63 ]: いや、たまにくる教員は俺（>>154）だ。w

>>157
当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。

宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。
160 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 14:08:02.72 ]: 先生！
宿題ききにきて挙げ句ケンカする大学生をなんとかしてください！
ここはもはや動物園です
でも好きです
161 名前：１３２人目の素数さん mailto:sage [2011/05/20(金) 15:14:25.55 ]: 私も好きなので、止める気はありません。
授業評価もないので、静かにさせなくても問題ないし。w
162 名前：１３２人目の素数さん mailto:sage [2011/05/21(土) 00:45:12.43 ]: すんません。
X～x^2(n)のとき
a*X～a*x^2(n) になりますか？
163 名前：１３２人目の素数さん mailto:sage [2011/05/21(土) 09:57:37.52 ]: x^2(n) って何？
164 名前：１３２人目の素数さん mailto:sage [2011/05/21(土) 10:56:55.70 ]: カイ二乗じゃないかな
165 名前：１３２人目の素数さん mailto:sage [2011/05/21(土) 20:57:19.16 ]: >>162です
そうですカイ二乗分布です
説明不足ですいません
166 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 01:40:50.58 ]: >>165
ならない。

χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。
綺麗な形にならないと思う。
167 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 02:12:13.11 ]: a*x^2(n)って何？カイ二乗分布のa倍？
168 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 02:41:15.19 ]: 分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。
169 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 02:46:47.72 ]: xがn(μ，σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0，1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。
170 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 07:42:10.64 ]: >>169
y=(x-μ)/σ^2　じゃなくて、y=(x-μ)/σ　に修正。
171 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 13:43:58.12 ]: >>168
それってa倍したものが再生性があるとか考えなくてよいなら
どんな分布でもそうなんじゃない？
>>169は再生性の話だよね。
172 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 15:10:49.05 ]: >>168
a倍した変数が従う分布「～a*x^2(n)」と書いてるので、
a倍した新しい変数の確率を考えるとこれはおかしい。
全ての確率が１になってない。

全ての確率が１になるような分布関数の形状の話ではなく、
対応関係だけを考えているなら、>>171のコメントもありかな。

Y=aX　ってのは、新しい変数Yの分布を考えた時に、その値が
aXと等しければ、元の分布のXの時の確率が与えられる。

例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで
新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。
（ここまでならあり）

ただ、普通は変数変換して、y=φ(x)という変換をした場合、
元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y)
として、g(y)=f(ξ(y))|dξ(y)/dy|　となる。

χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても
X^(m/2-1)*e^(-X/2)　という項があって、ここのXをY/aに置き換え
た物が出てくるので、積分して分布を考えても元のa倍にはならない。
173 名前：１３２人目の素数さん mailto:sage [2011/05/22(日) 15:13:45.92 ]: >>171
あ、肝心なことを答えてなかった。

>>168、169で書いたのは、再生性というよりも、変数変換した後の
分布の形状の話で、それは元の分布にaを掛けたものにはならない
ってことです。

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef