[表示 : 全て 最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 11/25 00:14 / Filesize : 90 KB / Number-of Response : 277
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド7



1 名前:132人目の素数さん [2007/10/24(水) 08:52:19 ]
理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。

前スレ:
統計学なんでもスレッド6
science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
science.2ch.net/test/read.cgi/math/1012782106/
関連スレ:
統計学なんて数学じゃないだろ
science6.2ch.net/test/read.cgi/math/1173876727/
= 統計解析フリーソフト R 【第2章】 =
science6.2ch.net/test/read.cgi/math/1152449095/
=統計解析= SASプログラミング
science6.2ch.net/test/read.cgi/math/1184762259/

161 名前:132人目の素数さん mailto:sage [2007/12/29(土) 12:38:08 ]
>>160
Rのスレで質問したほうがすぐに答えてくれると思う

162 名前:160 mailto:sage [2007/12/30(日) 09:04:36 ]
了解です。

163 名前:132人目の素数さん mailto:sage [2007/12/30(日) 21:27:39 ]
信頼区間の信頼率と被覆確率について教えてください。

信頼率というのは、
例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは
「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか?

また、被覆確率というのは、
ある文献では信頼率と同じことと説明されていて、
他所では「作られた信頼区間の中に母数の推定量が入る確率」である、
と説明されていました。
これはどちらが正しいのでしょうか?

164 名前:132人目の素数さん mailto:sage [2007/12/30(日) 23:22:22 ]
「信頼率」は「信頼係数」のことかな?
だと本来は同じ。
しかし二項分布とかポアソン分布などの離散型確率変数の場合、
正確な信頼区間は作れない。
よって名目上の信頼係数と実際の被覆確率とが違うのは普通。

165 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:37:27 ]
正規分布の問題で
高1男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。
このとき、無作為に男と女を1人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。
(実際の問題には平均、分散の具体的数字が入ってます)
というのがあって、解き方がわからないんですけど
どなたかアドバイスお願いします。

166 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:52:21 ]
ヒント:差 Y-X の分布

167 名前:132人目の素数さん mailto:sage [2007/12/31(月) 01:14:52 ]
>>166
アドバイスありがとうございます。
Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。
行き詰まったのでまた明日考えることにします。

168 名前:132人目の素数さん mailto:sage [2007/12/31(月) 10:30:51 ]
>>165
Xとなる確率はわかる。
YがX以上となる確率もわかる。
最後にXで積分すると全体の確率がでる。


169 名前:132人目の素数さん [2007/12/31(月) 19:36:35 ]
>>168
で、正規分布の密度関数の二重積分まで行って、
お手上げになる。
それが解けるようなヤシは、そもそも質問しないから。



170 名前:132人目の素数さん mailto:? [2007/12/31(月) 19:43:09 ]
>>167
Ganbarin sai yoh !

171 名前:132人目の素数さん mailto:sage [2007/12/31(月) 20:13:07 ]
べき分布について詳しく書いてあるようなページはないですかね?
もしくは本でも良いんですが

172 名前:132人目の素数さん mailto:sage [2008/01/01(火) 16:38:29 ]
>>169
> で、正規分布の密度関数の二重積分まで行って、
> お手上げになる。
つまり、その二重積分のやり方を教えればいいということか。

173 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:24:41 ]
統計学を独学するのにいいテキストを探しています
候補としては東大出版の基礎統計学I 統計学入門か
統計学のための数学入門30講を考えているのですが
評判というか使い勝手はどうなのか教えていただけないでしょうか?
上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです
よろしくお願いします

174 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:49:02 ]
後者は統計を学ぶためのあくまで「数学」の本だよ
数学がわかるなら必要なし

175 名前:132人目の素数さん [2008/01/01(火) 22:52:51 ]
>>173
候補としてあがっているテキストが全くオススメでないことだけ教えておく。


176 名前: [2008/01/01(火) 23:09:35 ]
〉173
学部はどこなの?
数学はどのていどわかるの?
いままで読んだ統計学の本は?
統計学を学ぶ目的は?

いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。


177 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:31:40 ]
173です 説明不足だったことを反省しています
>>176
経済学部なので数学は半端に知っているという程度です(問題演習はそこそこできるが、証明はできません)
統計の本は読んだことがありません
授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています
最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました

>>175
上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした

>>174
統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました

178 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:35:47 ]
173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。

専門分野 教育学
数学理解 高校のころ2Bやって以来数年間触ってないので、ところどころ忘れている(3Cは未履修)。
既読書籍 「社会の見方、測り方―計量社会学への招待」
       「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹
       あとは、講義等で講師が自前で作成した教材等。
学ぶ目的 数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。

お手数しますが、何かお勧め頂けると有難いです。
宜しくお願いします。

179 名前:132人目の素数さん [2008/01/01(火) 23:49:10 ]
>>177
統計学を勉強する目的は何ですか?
研究、資格試験などありますが。



180 名前:132人目の素数さん mailto:sage [2008/01/02(水) 00:34:18 ]
私は最近統計の勉強を始めた者です。
テキストは東大出版会の統計学入門を使ってます。
この本に書いてることで疑問があるのですが、
『母平均を推定する問題では、母分散が既知なら正規分布、
母分散が未知ならt分布を使う。
母分散を推定する問題ではカイ二乗分布を使う。』
という理解でよいでしょうか?
この理解ではダメな問題があったので、理解が正しいか教えてください。

181 名前: [2008/01/02(水) 01:23:11 ]
〉177
困りましたね。
本来、統計学は独学の困難な学問ですからね。
文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。
面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。
だれか先生につかないと。

182 名前:132人目の素数さん [2008/01/02(水) 01:43:14 ]
>>180
正規分布ならOK.
推定の一般論について読めばそれの理解がよくないことがわかる。

183 名前:132人目の素数さん [2008/01/02(水) 02:58:44 ]
>>177
東大の統計学入門は、初心者向けの商品カタログみたいな感じだから
独学には向かないと思うよ。そのレベルなら
 蓑谷 千凰彦「統計学入門」東京図書
がいいかも。もっと数学的でも良ければ、
 竹村 彰通「現代数理統計学」創文社
とか。

184 名前:132人目の素数さん [2008/01/02(水) 06:43:36 ]
統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。


185 名前:132人目の素数さん [2008/01/02(水) 07:56:36 ]
>>177

統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。
統計は確率論の1つの応用分野である。で、確率論をやるのなら線型代数、微積分
及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。1)線型代数:岩波基礎
数学講座の線型空間、2)微積分:岩波基礎数学講座の解析入門1〜4、3)集合と
位相:岩波の現代数学概説1、2。その中でとりわけ重要なのは微積分、集合と位相
である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、
「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概
説2」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。
これとほぼ並行して、次のことをやる。

1:線型代数の穴埋め。
これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「2次形式」で十分。
2:少々の抽象代数。現代数学概説1の群、環、体あたりを読んでみよう。
3:複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき
或いは必要になったときに読んでいけばよい。
4:関数解析。お勧めは「岩波基礎数学講座の関数解析」。
5:Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門5」。
6:微分方程式。お勧めは岩波講座の現代数学への入門の
「力学と微分方程式」、「熱・波動と微分方程式」    あたり。
7:岩波講座応用数学。色々読んでみるとよい。役に立つ筈。

ついでに言えば、腕力も鍛えておいた方がよい。

186 名前:132人目の素数さん mailto:sage [2008/01/02(水) 12:17:30 ]
>>182 教えてもらってありがとうございます。

とりあえず今の理解でおおまかには大丈夫なら、
まず先に全体を終わらせるよう先に進めます。

187 名前:132人目の素数さん [2008/01/02(水) 13:29:57 ]
>>186
大丈夫なのは正規分布の母平均の推定の場合に限ります。

東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。
漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの
統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。


188 名前:132人目の素数さん mailto:sage [2008/01/02(水) 14:10:47 ]
東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。
噛めば分かるのだが、すっと理解できるようには書いてない。
内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。

189 名前:132人目の素数さん [2008/01/02(水) 14:50:15 ]
系列範疇法について質問があります。
各カテゴリーの相対頻度と等しい面積を持つように
正規分布を分割したいのですが、
具体的にどうすればどうすればよいのでしょうか。



190 名前:132人目の素数さん mailto:sage [2008/01/02(水) 19:32:13 ]
>>180って他のスレで酷い質問しててワロタんだがw

191 名前:132人目の素数さん [2008/01/03(木) 03:15:42 ]
移動平均の最適パラメータってどうやって求めるんですか?

192 名前:132人目の素数さん mailto:sage [2008/01/03(木) 06:24:38 ]
変数XがA-B群間のt検定では有意差が出ないのに
判別分析(ステップワイズ法)ではA-B群の判別に寄与する変数として投入される

ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ,なんだかしっくりこない

193 名前:132人目の素数さん mailto:sage [2008/01/03(木) 18:32:56 ]
コーシー分布の平均値って事実上ゼロでしょ?

194 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:37:43 ]
>>193
「事実上」ってなんだ

195 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:50:06 ]
>>192
散布図を描くとするでしょ
右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。
横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。
こういうのでどうでしょうか

196 名前:132人目の素数さん [2008/01/03(木) 22:52:06 ]
>>193
左右対称な分布なら 平均 = 中央値 と定義すればそう。

197 名前:132人目の素数さん [2008/01/03(木) 23:01:51 ]
>>193
平均と中央値をごちゃごちゃにしてはだめです。
平均と中央値は中心という概念では同じですが、定義は全く違います。

198 名前:132人目の素数さん mailto:sage [2008/01/04(金) 13:15:44 ]
コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない?

199 名前:132人目の素数さん mailto:sage [2008/01/04(金) 14:47:30 ]
>>195
あー,なるほど,そう言われるとよく分かる.



200 名前:132人目の素数さん mailto:sage [2008/01/04(金) 17:16:13 ]
>>198
コーシー分布にしたがってランダムに数を生成させる方法を述べよ
仮にそのような標本が取得できたとして母平均を推定する方法を述べよ

201 名前:132人目の素数さん [2008/01/04(金) 18:42:25 ]
>>198 >>200
コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。

あと位置と尺度を一般化したコーシー分布、例えば
ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%82%B7%E3%83%BC%E5%88%86%E5%B8%83
の母数は、「母平均」や「母標準偏差」ではない。
母平均も母分散も存在しないからね。

また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。
というか、そもそも推定している対象が存在しない。
コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。

つまり、裾長分布の兆候を持つデータの位置母数推定で、
標本平均を使うのは危険。経験的には、外れ値を除外したり、
両端を一定率で除外した調整平均が使われている。
一方、正規分布など特定の分布では少し効率が悪いが、
「標本中央値なら常に安全」という教訓になるのがコーシー。

202 名前:132人目の素数さん mailto:sage [2008/01/04(金) 18:49:11 ]
コーシー分布にしたがってランダムに数を生成させる方法はある。
まず、(-∞, +∞)の一様分布の確率変数p(x)を用意する(ただし、厳密な意味ではこれが一番難しい)。
あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、
q(y)=Σp(φ(y))・dφ(y)/dy
で定義されるq(y)で数を生成すればOK。ただし、x=φ(y)は二価関数なので、単調増加の領域と
単調減少の領域に分けてΣを計算すれば良い。

203 名前:132人目の素数さん [2008/01/04(金) 18:55:38 ]
>>202
それ合ってんの?

204 名前:202 mailto:sage [2008/01/04(金) 18:57:21 ]
>>203
知らんw

205 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:00:33 ]
(-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか?

206 名前:132人目の素数さん [2008/01/04(金) 19:00:37 ]
>>204
何だ知ったかか

207 名前:132人目の素数さん [2008/01/04(金) 19:07:15 ]
何で無駄に(-∞, +∞)で考えてんだよ
もっと効率よくしろ

208 名前:202 mailto:sage [2008/01/04(金) 19:09:23 ]
>>206
小針の確率・統計入門のP49§3確率変数の変換に書いてある

209 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:12:22 ]
標準正規の比や一様分布のtanで生成するだけだろ



210 名前:201 mailto:sage [2008/01/04(金) 19:20:40 ]
訂正
×arctan 変換で作れるよ。
○ tan 変換で作れるよ。

スマソ。逆が2回出てくる関係なので、書く時に確かめずに勘違いした;



211 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:33:57 ]
理論的に生成可能かどうかは問題ではない
問題は生成した数からどうやって>>198の言う平均を計算するかだ
そもそもこの計算自体が既に不可能だろうという話

212 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:48:33 ]
実測値の算術平均なら何の問題もなく計算できます

213 名前:132人目の素数さん mailto:sage [2008/01/04(金) 21:27:51 ]
>>212
>>198の検証をたのむ

214 名前:132人目の素数さん mailto:sage [2008/01/04(金) 23:59:26 ]
だーかーらー
コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。
どれだけ大標本でもだ。つまり平均取っても無意味。

>>198は「標本平均は必ず確率収束する」と思ってる厨房w

215 名前:132人目の素数さん mailto:sage [2008/01/05(土) 07:16:26 ]
「事実上の平均」に面白い定義を与えられるかどうかだな。

乱数を[-d,d]にtruncateした上で平均を取って極限をとり、
最後にd→∞にしてみるとか?

216 名前:132人目の素数さん [2008/01/05(土) 10:53:42 ]
クイズ問題のサイトを作ろうと思っているのですが、
1万のクイズを、複数の人に自由に解かせるとして、
(クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、
一度、解くのをやめ、後でまた解いても良い。)
どのような公式で、ランキングをつけたら良いのでしょうか。
例えば、単純確率だと10問中5問正解した人と、
100問中50問正解した人は、同じランクになりますが、
果たして、これは、同じランクで良いのでしょうか。
そうすると、1問中1問正解した人は、いつも1位となってしまいます。
何か、良い公式がないでしょうか。

よろしくお願いします。

217 名前:132人目の素数さん mailto:sage [2008/01/05(土) 13:20:23 ]
単純に
正解数−不正解数
じゃダメ?

218 名前:132人目の素数さん mailto:sage [2008/01/05(土) 15:16:41 ]
>>216
検定の考え方を使えば多少は重み付けも出来るが
明確に順序をつけるのは無理だろう

ゲームとして割りきるなら
 正答率*正答率*回答数
くらいで良いんじゃないかと思う。
理論的根拠は無い。

219 名前:132人目の素数さん mailto:sage [2008/01/05(土) 18:26:36 ]
>>216
乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の
事象を n 回独立に繰り返した時の二項分布になるとする。
この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。
仮に1問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。

正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、
マハラノビス距離空間上のランキングが得られる。

p の推定値は、参加者全員の 正解数合計 / 解いた問題数合計
が良いけど、それだと毎回ランキングが変化する。
問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。



220 名前:132人目の素数さん mailto:sage [2008/01/05(土) 20:20:15 ]
>>215
コーシーの主値

221 名前:219 [2008/01/06(日) 18:34:11 ]
>>216
数値例が無かったので補足。

選択式の回答方式だと思うので、すべて「4択」だとしよう。
そうすると、「でたらめに答えて」当たる確率は p=1/4。
この時 μ = n/4、σ = (√n√3 )/ 4。
z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。

n      x       z      D(偏差値)
1      1      1.22     62  … 1問中 1問
10      5      0.65     56  … 10問中 5問
100     50     2.04     70  … 100問中 50問
1000    500     6.45     115 … 1000問中 500問

・正規分布近似を使っていることになるので、精度条件として
 だいたい np≧5 (p≦1/2) または n(1-p)≧5 (p>1/2) が必要。
 よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。
・偏差値 D が使用する有効精度内で同じ場合には、問題数 n
 の大きい方を上位とする。

※1次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。

222 名前:132人目の素数さん [2008/01/06(日) 19:18:40 ]
くだらん。
正解数−不正解数の方がよっぽど役にたつ。

223 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:47:21 ]
>>222
Aは、100問全問正解(正解率100%)で 100 − 0 = 100。
Bは、200問中151問正解(正解率75.5%)で 151 − 49 = 102。
B > A でいいのか?

224 名前:132人目の素数さん [2008/01/06(日) 19:53:31 ]
いい。
100問正解の時点で、Aは残りの49問を正解する確証がどこにもないから、
ランキングとしては151問正解のBよりも低くランキングされるのが妥当。

225 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:54:36 ]
上位一割くらいしか表示しないなら>>218がシンプルでいい
>>219みたいになると仮定の妥当性とかいろいろ面倒だからな

226 名前:132人目の素数さん [2008/01/06(日) 19:55:45 ]
ただし、問題文ごとに独立性がないのなら話は別。
過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら
単純な正答率によるランキングが妥当。

227 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:05:22 ]
224=226です。

228 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:07:18 ]
俺が野球チームの監督なら、200打席151安打のバッターと、
100打席全安打のバッターなら後者を使うけどな

229 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:14:35 ]
何が正しい計量と判断できるかは、問題文(群)の構成に強く依存する。
問題文の独立性が保障される様な理想的な構成なら、正解数−不正解数が正しい計量となる。
が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。



230 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:27:48 ]
>>226, >>229 が言ってるのは、「独立性」ではなく「異質性」だな。
つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。
量子力学の問題の次は文学の問題とか、、、
しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ

231 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:31:06 ]
クイズという問題をどうとらえるかだが、
あらかじめ確定した操作をランダムな順序で対象に実行して
その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。
と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。

232 名前:132人目の素数さん [2008/01/06(日) 20:33:04 ]
こういう話題が出てきてwktkしてきた
>>180-215のような低レベルな話より断然興味深い

233 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:54:08 ]
出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。
ネイマン・ピアソンの考え方に従うか
ベイズの考え方に従うか
両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって
どういう統計量で判断するかが決まる。

234 名前:219=221 mailto:sage [2008/01/07(月) 00:52:43 ]
>>225
「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの
回答方式なら、>>218 でも良いよ。なぜなら

 z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p))

において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、

 y = x/√n - np

で回答者同士を比較しているのと同じ。この値は p → 0 の時

 y → x/√n = (√n) (x/n) = (√回答数)・正答率

なので、自乗すれば >>218 の指標になる。

※知能や知識は、完全不確実状態(混沌)からどれだけ確実状態(秩序)
に近づいたかで計るのが、情報量的な考え方。
ただし、誤知能や誤知識という方向への脳内秩序もアリなので、
「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。

235 名前:234 mailto:sage [2008/01/07(月) 00:59:44 ]
× y = x/√n - np
○ y = x/√n - (√n)p

236 名前:132人目の素数さん mailto:sage [2008/01/07(月) 18:36:12 ]
>>234
それが>>225でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。
そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、
結局のところ意味があるのはpに依存しない部分だけというわけだ。

お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ

237 名前:132人目の素数さん mailto:sage [2008/01/07(月) 21:24:23 ]
すみません、お教えください。4群の共分散分析をやっていて、
回帰直線の傾きが有意に違う、という結果を得ています。
で、1つのグループAを除いて3群で検定すると傾きに有意差は見られません。
グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、
ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか?


238 名前:234 [2008/01/07(月) 21:36:34 ]
>>236
まあまあ抑えてw、たかがクイズのランキングの話。
で、(初等教科書的な)二項分布モデルが気に入らないようだけど、
こう考えればどうかな?

クイズの回答はすべて選択式で、選択肢の数は常にM個とする。
また出題時に、選択肢の順序は乱数でかき混ぜる。

別室に居る見えない回答者にクイズを出題して、その答えのみから
回答者がサイコロのような乱数器(完全無知脳)を使っているか、自分自身
(幾分の知能を保有)でマジに答えているかを判定する。
もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、
記述言語は HTML+Javascript で十分だろう。OSは何でも良いw

この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。
したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、
>>219, >>234-235 の尺度を使うことなる。

つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。
不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。

239 名前:238=234 mailto:sage [2008/01/07(月) 21:47:00 ]
× 使うことなる。 ○ 使うことになる。



240 名前:132人目の素数さん mailto:sage [2008/01/07(月) 22:11:03 ]
>>237
ボンフェローニでAと他の群がすべて棄却され、
他の群同士は棄却されないならそれでいいんじゃない?
(ボンフェローニだと補正がきつすぎてAと他の群で
棄却されないものが出てくるのなら問題だが。)


241 名前:237 mailto:sage [2008/01/07(月) 23:39:27 ]
>>240
ありがとうございます。方法としては間違ってないと知り、安心しました。
仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、
ttp://www.human.tsukuba.ac.jp/~percept/index.php?ANOVA%B7%AF%2F%C2%BF%BD%C5%C8%E6%B3%D3%A4%CE%CA%FD%CB%A1
を見つけました。群馬大の青木先生の掲示板では、シダックの方法?というのが出ていたのですが、
解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。
もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。
1−(1−α)^(1/k)がシダックの不等式なんでしょうか?

242 名前:132人目の素数さん [2008/01/08(火) 01:41:49 ]
連続型確率関数Xの確率密度関数が
f(x)=1 (0≦x≦1)
の場合で
X=e^-Y/2
とするときのYの確率密度関数の求め方ってどうすればいいですか?

243 名前:132人目の素数さん [2008/01/08(火) 01:45:01 ]
変数変換の公式を調べてそれを使うだけだろ
別に何も変わったところがない

244 名前:132人目の素数さん [2008/01/08(火) 01:49:00 ]
>>242まで辿り着いてここでつまってしまったんです

245 名前:132人目の素数さん mailto:sage [2008/01/08(火) 01:50:00 ]
>>243で書いてある通り、調べればすぐわかることだから自分で解決してみな

246 名前:242 [2008/01/08(火) 02:06:12 ]
何か勘違いしてたみたいで簡単にできました
お騒がせしてすいませんでした

247 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:06:18 ]
また試験のシーズンか、、、

248 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:17:51 ]
試験に囚われてはならない。
自分のペースで学習することが大切だ。

試験で良い点を取ったからと言って
本当の実力が付いているとは限らない。

249 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:35:10 ]
>>241
シダックは使える条件があるからいいのかな?
大体4群だとボンフェローニで0.0125で
シダックで0.012741だからあまり大差ないね。
そのページのHolmの方法なんかいいんじゃない?
Shafferの方法は表がいるしね。




250 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:45:15 ]
    2007年11月のウェブサイト利用統計
--------------------------------------------------
        順位  延べ利用時間 利用者数
             (万時間)   (万人)
--------------------------------------------------
某Yahoo!    1位→1位  12549
某楽天市場   3位→2位  2164
某ミクシィ   2位→3位  1669
某YouTube   4位→4位  1495      動画投稿
某ニコニコ動画  ?→5位  1249    386 動画投稿
某FC2     9位→6位   960      ブログ制作支援
某Google    7位→7位   794  >2000
2ちゃんねる  5位→8位   751      掲示板
某goo     8位→9位   645   1800
某msn     6位→10位  628
---------------------------------------------------

251 名前:237, 241 mailto:sage [2008/01/09(水) 18:38:41 ]
>>249
レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、
という状態だったので、それを参考にすすめる事にしました。
ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。
その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、
という事でしょうか?
(後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです)

252 名前:132人目の素数さん mailto:sage [2008/01/09(水) 22:49:14 ]
>>251
シダックの不等式は書かれてないが、それに基づく有意水準の調整は
>>241で合ってるよ。>>249もそれで計算しただけだしね。
ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を
使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど
確信はないなあ。
>>249で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで
進めないと効果はないかもね。

253 名前:132人目の素数さん mailto:sage [2008/01/10(木) 00:24:36 ]
鼻の炎症はビエン、では耳の炎症は?

254 名前:132人目の素数さん mailto:sage [2008/01/10(木) 01:10:26 ]
 ━━━━━┓                          ____
           ┃                        /      \
           ┃┏┳┛┃┃┃       ,,..--――--/         \
 ━━━━━┛  ┃    ┏┛       |  ヾ==___ ヽ         \
   ┏┻━                   ヾ    :::::::::::::====\        |
   ┃┣┓┣┓   ━━┓╋    ┣    `ー--/       ミ(⌒)     /
 ┏┛  ╋  ━┓   ┏┛┃━┏╋   _  ヽ, )       ミノ ~レ-r -‐、/
     ━┻━  ┛   ┗━  ━┗┛  /  ヽ. <_       ノ__  i i i〉 〉
     ━                 /ヽ   }<´      / ヽ、 /_/_/レ′
┏━━╋                ,.-、/  ,.>-‐'" { _.......:::::::: ヽ、)ト´ ´ ヽ:;ヽ:;:-:;:-、.
┃ ━ ┃    ┃┃      ,,..‐'ヾ_j  ,..<     `ー、::::::::  /;: ̄:;i     ヽ、;:_;:;:;:;:;;:
┃┏┓╋    ┃      ,.-'"、 ヽ、 |::::/ /      /;:;:ヽ  ノ;:;:;:;:;:;:i      \ ヽ
┛┗┛┗┃┃┃      i./ヽ ヽ |ノ  !´      /;:;:;:;:;|  (;;/j;:;:;:;:;ヽ_   ノ  |
 ┛┗━┛   ┗━┛   (__/ヽjノ /      /;:;:;:;:;:;|、  (;:;ノ;:;:;:;:;:;:/\    |
  ┳━┳         /ヽ    / ┏━━┓ |;:;:;:;:;;/ ヽー'/;:;ノ;:;:;:;:/  |\   |
┏╋━╋┓    ┏┛    |   |         ┃ );:);/     ||(;:;:;:;/|  ヽ、\ |
┗╋━╋┛  ┏┛   ╋  ┃ ┃ ┃       ┃ ;:;::;:ヽ     |: ヽ;:;:ヾ    ヽ__ノ
  ┻━┻┃┃┗┓   ┃     ┃ ┃   ┏━┛
 ┛┗━┛     ┗┓ ┏╋   ┗      ┃
                   ┗┛       ┏┓
                        ┗┛

255 名前:251 mailto:sage [2008/01/10(木) 01:31:44 ]
>>252
>共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない
なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。

256 名前:32と35 [2008/01/10(木) 02:04:32 ]
コックス比例ハザードモデルについてお教えください。

予後推定因子を解析する際の事ですが
単変量解析をする際に、交互作用のある因子は除こうと思うのですが
SPSS でその因子の抽出の仕方を教えてください。

イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む
必要があると思います。

もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか?

257 名前:132人目の素数さん [2008/01/11(金) 19:59:43 ]
「絶対計算」という本を図書館で借りて読んだ。

要点は、絶対計算したほうが良い、という感じで
なかなかいい本だった。

258 名前:統計 [2008/01/11(金) 21:11:39 ]
文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。
アンケートを使ってどんな(容姿・性格)の人が好感をもたれるのかをやりたなぁと考えています。

259 名前:132人目の素数さん [2008/01/11(金) 21:11:59 ]
Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX−μはN(0、1二乗)に従う。
N(0、1二乗)についてP(1.5<=σ分のX−μ)=0.07、
P(0.5<=σ分のX−μ)=0.31である。
あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、
μ+1.5σ<=Xの生徒は5段階評価の5、
μ+0.5σ<=X<=μ+1.5σの生徒は4、
μ−0.5σ<=X<=μ+0.5σの生徒は3をつけるとする。
この時5をもらうのは全体の()%、
4をもらうのは全体の()%、
3をもらうのは全体の()%である。

分かりにくくてすみません。とりあえず5をもらうのが7%というのまでわかりました。どなたかお願いします。



260 名前:132人目の素数さん mailto:sage [2008/01/11(金) 22:04:40 ]
5が7%だとわかったのに何で4と3がわからないんだ?
5で計算したのと同じようにやればいいだろ。

261 名前:132人目の素数さん [2008/01/11(金) 22:44:57 ]
4が24%で3が38%ですかね?
間違ってたらご指摘ください…。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<90KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef