統計学なんでもスレッド7

[表示 : 全て最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 11/25 00:14 / Filesize : 90 KB / Number-of Response : 277
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド7

1 名前：１３２人目の素数さん [2007/10/24(水) 08:52:19 ]: 理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。

前スレ：
統計学なんでもスレッド6
science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
science.2ch.net/test/read.cgi/math/1012782106/
関連スレ：
統計学なんて数学じゃないだろ
science6.2ch.net/test/read.cgi/math/1173876727/
＝　統計解析フリーソフト　Ｒ　【第２章】　＝
science6.2ch.net/test/read.cgi/math/1152449095/
=統計解析= SASプログラミング
science6.2ch.net/test/read.cgi/math/1184762259/
175 名前：１３２人目の素数さん [2008/01/01(火) 22:52:51 ]: >>173
候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176 名前：ふ [2008/01/01(火) 23:09:35 ]: 〉173
学部はどこなの？
数学はどのていどわかるの？
いままで読んだ統計学の本は？
統計学を学ぶ目的は？

いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 23:31:40 ]: 173です　説明不足だったことを反省しています
>>176
経済学部なので数学は半端に知っているという程度です（問題演習はそこそこできるが、証明はできません）
統計の本は読んだことがありません
授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています
最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました

>>175
上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした

>>174
統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 23:35:47 ]: 173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。

専門分野　教育学
数学理解　高校のころ２Bやって以来数年間触ってないので、ところどころ忘れている(３Cは未履修)。
既読書籍　「社会の見方、測り方―計量社会学への招待」
　　　　　　　「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹
　　　　　　　あとは、講義等で講師が自前で作成した教材等。
学ぶ目的　数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。

お手数しますが、何かお勧め頂けると有難いです。
宜しくお願いします。
179 名前：１３２人目の素数さん [2008/01/01(火) 23:49:10 ]: >>177
統計学を勉強する目的は何ですか？
研究、資格試験などありますが。
180 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 00:34:18 ]: 私は最近統計の勉強を始めた者です。
テキストは東大出版会の統計学入門を使ってます。
この本に書いてることで疑問があるのですが、
『母平均を推定する問題では、母分散が既知なら正規分布、
母分散が未知ならt分布を使う。
母分散を推定する問題ではカイ二乗分布を使う。』
という理解でよいでしょうか？
この理解ではダメな問題があったので、理解が正しいか教えてください。
181 名前：ふ [2008/01/02(水) 01:23:11 ]: 〉177
困りましたね。
本来、統計学は独学の困難な学問ですからね。
文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。
面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。
だれか先生につかないと。
182 名前：１３２人目の素数さん [2008/01/02(水) 01:43:14 ]: >>180
正規分布ならＯＫ．
推定の一般論について読めばそれの理解がよくないことがわかる。
183 名前：１３２人目の素数さん [2008/01/02(水) 02:58:44 ]: >>177
東大の統計学入門は、初心者向けの商品カタログみたいな感じだから
独学には向かないと思うよ。そのレベルなら
　蓑谷千凰彦「統計学入門」東京図書
がいいかも。もっと数学的でも良ければ、
　竹村彰通「現代数理統計学」創文社
とか。
184 名前：１３２人目の素数さん [2008/01/02(水) 06:43:36 ]: 統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185 名前：１３２人目の素数さん [2008/01/02(水) 07:56:36 ]: >>177

統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。
統計は確率論の１つの応用分野である。で、確率論をやるのなら線型代数、微積分
及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。１)線型代数：岩波基礎
数学講座の線型空間、２)微積分：岩波基礎数学講座の解析入門１～４、３)集合と
位相：岩波の現代数学概説１、２。その中でとりわけ重要なのは微積分、集合と位相
である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、
「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概
説２」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。
これとほぼ並行して、次のことをやる。

１：線型代数の穴埋め。
これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「２次形式」で十分。
２：少々の抽象代数。現代数学概説１の群、環、体あたりを読んでみよう。
３：複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき
或いは必要になったときに読んでいけばよい。
４：関数解析。お勧めは「岩波基礎数学講座の関数解析」。
５：Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門５」。
６：微分方程式。お勧めは岩波講座の現代数学への入門の
「力学と微分方程式」、「熱・波動と微分方程式」　　　　あたり。
７：岩波講座応用数学。色々読んでみるとよい。役に立つ筈。

ついでに言えば、腕力も鍛えておいた方がよい。
186 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 12:17:30 ]: >>182 教えてもらってありがとうございます。

とりあえず今の理解でおおまかには大丈夫なら、
まず先に全体を終わらせるよう先に進めます。
187 名前：１３２人目の素数さん [2008/01/02(水) 13:29:57 ]: >>186
大丈夫なのは正規分布の母平均の推定の場合に限ります。

東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。
漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの
統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 14:10:47 ]: 東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。
噛めば分かるのだが、すっと理解できるようには書いてない。
内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189 名前：１３２人目の素数さん [2008/01/02(水) 14:50:15 ]: 系列範疇法について質問があります。
各カテゴリーの相対頻度と等しい面積を持つように
正規分布を分割したいのですが、
具体的にどうすればどうすればよいのでしょうか。
190 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 19:32:13 ]: >>180って他のスレで酷い質問しててﾜﾛﾀんだがw
191 名前：１３２人目の素数さん [2008/01/03(木) 03:15:42 ]: 移動平均の最適パラメータってどうやって求めるんですか？
192 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 06:24:38 ]: 変数XがA-B群間のt検定では有意差が出ないのに
判別分析（ステップワイズ法）ではA-B群の判別に寄与する変数として投入される

ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ，なんだかしっくりこない
193 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 18:32:56 ]: コーシー分布の平均値って事実上ゼロでしょ？
194 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 21:37:43 ]: >>193
「事実上」ってなんだ
195 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 21:50:06 ]: >>192
散布図を描くとするでしょ
右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。
横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。
こういうのでどうでしょうか
196 名前：１３２人目の素数さん [2008/01/03(木) 22:52:06 ]: >>193
左右対称な分布なら　平均 = 中央値　と定義すればそう。
197 名前：１３２人目の素数さん [2008/01/03(木) 23:01:51 ]: >>193
平均と中央値をごちゃごちゃにしてはだめです。
平均と中央値は中心という概念では同じですが、定義は全く違います。
198 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 13:15:44 ]: コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない？
199 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 14:47:30 ]: >>195
あー，なるほど，そう言われるとよく分かる．
200 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 17:16:13 ]: >>198
コーシー分布にしたがってランダムに数を生成させる方法を述べよ
仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201 名前：１３２人目の素数さん [2008/01/04(金) 18:42:25 ]: >>198　>>200
コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。

あと位置と尺度を一般化したコーシー分布、例えば
ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%82%B7%E3%83%BC%E5%88%86%E5%B8%83
の母数は、「母平均」や「母標準偏差」ではない。
母平均も母分散も存在しないからね。

また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。
というか、そもそも推定している対象が存在しない。
コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。

つまり、裾長分布の兆候を持つデータの位置母数推定で、
標本平均を使うのは危険。経験的には、外れ値を除外したり、
両端を一定率で除外した調整平均が使われている。
一方、正規分布など特定の分布では少し効率が悪いが、
「標本中央値なら常に安全」という教訓になるのがコーシー。
202 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 18:49:11 ]: コーシー分布にしたがってランダムに数を生成させる方法はある。
まず、（-∞, +∞）の一様分布の確率変数p(x)を用意する（ただし、厳密な意味ではこれが一番難しい）。
あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、
q(y)=Σp(φ(y))・dφ(y)/dy
で定義されるq(y)で数を生成すればＯＫ。ただし、x=φ(y)は二価関数なので、単調増加の領域と
単調減少の領域に分けてΣを計算すれば良い。
203 名前：１３２人目の素数さん [2008/01/04(金) 18:55:38 ]: >>202
それ合ってんの？
204 名前：202 mailto:sage [2008/01/04(金) 18:57:21 ]: >>203
知らんｗ
205 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 19:00:33 ]: (-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか？
206 名前：１３２人目の素数さん [2008/01/04(金) 19:00:37 ]: >>204
何だ知ったかか
207 名前：１３２人目の素数さん [2008/01/04(金) 19:07:15 ]: 何で無駄に(-∞, +∞)で考えてんだよ
もっと効率よくしろ
208 名前：202 mailto:sage [2008/01/04(金) 19:09:23 ]: >>206
小針の確率・統計入門のP49§3確率変数の変換に書いてある
209 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 19:12:22 ]: 標準正規の比や一様分布のtanで生成するだけだろ
210 名前：201 mailto:sage [2008/01/04(金) 19:20:40 ]: 訂正
×arctan 変換で作れるよ。
○ tan 変換で作れるよ。

ｽﾏｿ。逆が２回出てくる関係なので、書く時に確かめずに勘違いした；
211 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 20:33:57 ]: 理論的に生成可能かどうかは問題ではない
問題は生成した数からどうやって>>198の言う平均を計算するかだ
そもそもこの計算自体が既に不可能だろうという話
212 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 20:48:33 ]: 実測値の算術平均なら何の問題もなく計算できます
213 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 21:27:51 ]: >>212
>>198の検証をたのむ
214 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 23:59:26 ]: だーかーらー
コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。
どれだけ大標本でもだ。つまり平均取っても無意味。

>>198は「標本平均は必ず確率収束する」と思ってる厨房ｗ
215 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 07:16:26 ]: 「事実上の平均」に面白い定義を与えられるかどうかだな。

乱数を[-d,d]にtruncateした上で平均を取って極限をとり、
最後にd→∞にしてみるとか？
216 名前：１３２人目の素数さん [2008/01/05(土) 10:53:42 ]: クイズ問題のサイトを作ろうと思っているのですが、
１万のクイズを、複数の人に自由に解かせるとして、
(クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、
一度、解くのをやめ、後でまた解いても良い。)
どのような公式で、ランキングをつけたら良いのでしょうか。
例えば、単純確率だと１０問中５問正解した人と、
１００問中５０問正解した人は、同じランクになりますが、
果たして、これは、同じランクで良いのでしょうか。
そうすると、１問中１問正解した人は、いつも１位となってしまいます。
何か、良い公式がないでしょうか。

よろしくお願いします。
217 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 13:20:23 ]: 単純に
正解数－不正解数
じゃダメ？
218 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 15:16:41 ]: >>216
検定の考え方を使えば多少は重み付けも出来るが
明確に順序をつけるのは無理だろう

ゲームとして割りきるなら
　正答率*正答率*回答数
くらいで良いんじゃないかと思う。
理論的根拠は無い。
219 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 18:26:36 ]: >>216
乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の
事象を n 回独立に繰り返した時の二項分布になるとする。
この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。
仮に１問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。

正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、
マハラノビス距離空間上のランキングが得られる。

ｐの推定値は、参加者全員の正解数合計 / 解いた問題数合計
が良いけど、それだと毎回ランキングが変化する。
問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。
220 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 20:20:15 ]: >>215
コーシーの主値
221 名前：219 [2008/01/06(日) 18:34:11 ]: >>216
数値例が無かったので補足。

選択式の回答方式だと思うので、すべて「４択」だとしよう。
そうすると、「でたらめに答えて」当たる確率は　p=1/4。
この時 μ = n/4、σ = (√n√3 )/ 4。
z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。

n　　　　　　x　　　　　　　z　　　　　 D（偏差値）
1　　　　　　1　　　　　 1.22　　　　　62　 …　１問中１問
10　　　　　 5　　　　　 0.65　　　　　56　 …　１0問中 5問
100　　　　 50　　　　　2.04　　　　　70　 …　１00問中 50問
1000　　　 500　　　　 6.45　　　　　115　…　１000問中 500問

・正規分布近似を使っていることになるので、精度条件として
　だいたい np≧5 （p≦1/2）または n(1-p)≧5 （p>1/2）が必要。
　よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。
・偏差値 D が使用する有効精度内で同じ場合には、問題数 n
　の大きい方を上位とする。

※１次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。
222 名前：１３２人目の素数さん [2008/01/06(日) 19:18:40 ]: くだらん。
正解数－不正解数の方がよっぽど役にたつ。
223 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 19:47:21 ]: >>222
Ａは、１００問全問正解（正解率１００％）で１００　－　０　＝　１００。
Bは、２００問中１５１問正解（正解率７５．５％）で１５１　－　４９　＝　１０２。
B　＞　A　でいいのか？
224 名前：１３２人目の素数さん [2008/01/06(日) 19:53:31 ]: いい。
１００問正解の時点で、Ａは残りの４９問を正解する確証がどこにもないから、
ランキングとしては151問正解のＢよりも低くランキングされるのが妥当。
225 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 19:54:36 ]: 上位一割くらいしか表示しないなら>>218がシンプルでいい
>>219みたいになると仮定の妥当性とかいろいろ面倒だからな
226 名前：１３２人目の素数さん [2008/01/06(日) 19:55:45 ]: ただし、問題文ごとに独立性がないのなら話は別。
過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら
単純な正答率によるランキングが妥当。
227 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:05:22 ]: 224=226です。
228 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:07:18 ]: 俺が野球チームの監督なら、２００打席１５１安打のバッターと、
１００打席全安打のバッターなら後者を使うけどな
229 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:14:35 ]: 何が正しい計量と判断できるかは、問題文（群）の構成に強く依存する。
問題文の独立性が保障される様な理想的な構成なら、正解数－不正解数が正しい計量となる。
が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。
230 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:27:48 ]: >>226, >>229 が言ってるのは、「独立性」ではなく「異質性」だな。
つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。
量子力学の問題の次は文学の問題とか、、、
しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ
231 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:31:06 ]: クイズという問題をどうとらえるかだが、
あらかじめ確定した操作をランダムな順序で対象に実行して
その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。
と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。
232 名前：１３２人目の素数さん [2008/01/06(日) 20:33:04 ]: こういう話題が出てきてwktkしてきた
>>180-215のような低レベルな話より断然興味深い
233 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:54:08 ]: 出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。
ネイマン・ピアソンの考え方に従うか
ベイズの考え方に従うか
両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって
どういう統計量で判断するかが決まる。
234 名前：219=221 mailto:sage [2008/01/07(月) 00:52:43 ]: >>225
「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの
回答方式なら、>>218 でも良いよ。なぜなら

　z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p))

において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、

　y = x/√n - np

で回答者同士を比較しているのと同じ。この値は p → 0 の時

　y → x/√n = (√n) (x/n) = (√回答数)・正答率

なので、自乗すれば >>218 の指標になる。

※知能や知識は、完全不確実状態（混沌）からどれだけ確実状態（秩序）
に近づいたかで計るのが、情報量的な考え方。
ただし、誤知能や誤知識という方向への脳内秩序もアリなので、
「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。
235 名前：234 mailto:sage [2008/01/07(月) 00:59:44 ]: ×　y = x/√n - np
○　y = x/√n - (√n)p
236 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 18:36:12 ]: >>234
それが>>225でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。
そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、
結局のところ意味があるのはpに依存しない部分だけというわけだ。

お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ
237 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 21:24:23 ]: すみません、お教えください。4群の共分散分析をやっていて、
回帰直線の傾きが有意に違う、という結果を得ています。
で、１つのグループAを除いて3群で検定すると傾きに有意差は見られません。
グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、
ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか？
238 名前：234 [2008/01/07(月) 21:36:34 ]: >>236
まあまあ抑えてｗ、たかがクイズのランキングの話。
で、（初等教科書的な）二項分布モデルが気に入らないようだけど、
こう考えればどうかな？

クイズの回答はすべて選択式で、選択肢の数は常にM個とする。
また出題時に、選択肢の順序は乱数でかき混ぜる。

別室に居る見えない回答者にクイズを出題して、その答えのみから
回答者がサイコロのような乱数器（完全無知脳）を使っているか、自分自身
（幾分の知能を保有）でマジに答えているかを判定する。
もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、
記述言語は HTML+Javascript で十分だろう。OSは何でも良いｗ

この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。
したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、
>>219, >>234-235 の尺度を使うことなる。

つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。
不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。
239 名前：238=234 mailto:sage [2008/01/07(月) 21:47:00 ]: × 使うことなる。 ○ 使うことになる。
240 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 22:11:03 ]: >>237
ボンフェローニでAと他の群がすべて棄却され、
他の群同士は棄却されないならそれでいいんじゃない？
（ボンフェローニだと補正がきつすぎてAと他の群で
棄却されないものが出てくるのなら問題だが。）
241 名前：237 mailto:sage [2008/01/07(月) 23:39:27 ]: >>240
ありがとうございます。方法としては間違ってないと知り、安心しました。
仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、
ttp://www.human.tsukuba.ac.jp/~percept/index.php?ANOVA%B7%AF%2F%C2%BF%BD%C5%C8%E6%B3%D3%A4%CE%CA%FD%CB%A1
を見つけました。群馬大の青木先生の掲示板では、シダックの方法？というのが出ていたのですが、
解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。
もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。
１－（１－α）^（１／ｋ）がシダックの不等式なんでしょうか？
242 名前：１３２人目の素数さん [2008/01/08(火) 01:41:49 ]: 連続型確率関数Xの確率密度関数が
f(x)=1 (0≦x≦1)
の場合で
X=e^-Y/2
とするときのYの確率密度関数の求め方ってどうすればいいですか？
243 名前：１３２人目の素数さん [2008/01/08(火) 01:45:01 ]: 変数変換の公式を調べてそれを使うだけだろ
別に何も変わったところがない
244 名前：１３２人目の素数さん [2008/01/08(火) 01:49:00 ]: >>242まで辿り着いてここでつまってしまったんです
245 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 01:50:00 ]: >>243で書いてある通り、調べればすぐわかることだから自分で解決してみな
246 名前：242 [2008/01/08(火) 02:06:12 ]: 何か勘違いしてたみたいで簡単にできました
お騒がせしてすいませんでした
247 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 02:06:18 ]: また試験のシーズンか、、、
248 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 02:17:51 ]: 試験に囚われてはならない。
自分のペースで学習することが大切だ。

試験で良い点を取ったからと言って
本当の実力が付いているとは限らない。
249 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 23:35:10 ]: >>241
シダックは使える条件があるからいいのかな？
大体4群だとボンフェローニで0.0125で
シダックで0.012741だからあまり大差ないね。
そのページのHolmの方法なんかいいんじゃない？
Shafferの方法は表がいるしね。
250 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 23:45:15 ]: 　　　　2007年11月のウェブサイト利用統計
--------------------------------------------------
　　　　　　　　順位　　延べ利用時間　利用者数
　　　　　　　　　　　　　(万時間)　　　(万人)
--------------------------------------------------
某Yahoo! 　　　1位→1位　 12549
某楽天市場　　3位→2位　　2164
某ミクシィ　　2位→3位　　1669
某YouTube　　　4位→4位　　1495　　　　　　動画投稿
某ニコニコ動画　?→5位　　1249　　　 386　動画投稿
某FC2　　　　　9位→6位　　 960　　　　　　ブログ制作支援
某Google 　　　7位→7位　　 794　　＞2000
2ちゃんねる　　5位→8位　　 751　　　　　　掲示板
某goo　　　　　8位→9位　　645　　　1800
某msn　　　　　6位→10位　　628
---------------------------------------------------
251 名前：237, 241 mailto:sage [2008/01/09(水) 18:38:41 ]: >>249
レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、
という状態だったので、それを参考にすすめる事にしました。
ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。
その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、
という事でしょうか？
（後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです）
252 名前：１３２人目の素数さん mailto:sage [2008/01/09(水) 22:49:14 ]: >>251
シダックの不等式は書かれてないが、それに基づく有意水準の調整は
>>241で合ってるよ。>>249もそれで計算しただけだしね。
ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を
使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど
確信はないなあ。
>>249で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで
進めないと効果はないかもね。
253 名前：１３２人目の素数さん mailto:sage [2008/01/10(木) 00:24:36 ]: 鼻の炎症はビエン、では耳の炎症は？
254 名前：１３２人目の素数さん mailto:sage [2008/01/10(木) 01:10:26 ]: 　━━━━━┓　　　　　　　　　　　　　　　　　　　　　　　　　＿＿＿＿
　　　　　　┃　　　　　　　　　　　　　　　　　　　　　　　　／　　　　　　＼
　　　　　　 ┃┏┳┛┃┃┃　　　　　　　,,..--――--／　　　　　　　　　＼
　━━━━━┛　 ┃　　 ┏┛　　　　　　　|　　ヾ==＿_＿ヽ　　　　　　　　　＼
　　 ┏┻━　　　　　　　　　　　　　　　　　　ヾ　　　　:::::::::::::====＼　　　　　　　 |
　　 ┃┣┓┣┓　　　━━┓╋　　 ┣　　　｀ー--／　　　　　　ミ(⌒)　　　　 /
　┏┛　　╋　　━┓ 　 ┏┛┃━┏╋　　　＿　　ヽ, )　　　　　　ﾐﾉ ~ﾚ-r -‐､/
　　　　 ━┻━　　┛ 　 ┗━　 ━┗┛　　/　　ヽ. <_　　　　　　　ノ__　 i　i　i〉〉
　　　　　━　　　　　　　　　　　　　　　　　／ヽ　　　}<´　　　　　　/ ヽ､　/_/_/ﾚ′
┏━━╋　　　　　　　　　　　　　,.-､／　　,.>-‐'" { ＿.......:::::::: ヽ､⊿)ﾄ´ ´　ヽ:;ヽ:;:-:;:-､.
┃　━ ┃　　　　┃┃　　　　　 ,,..‐'ヾ_j　 ,..<　　　　　`ー､::::::::　　/;:￣:;i　　　　ヽ､;:_;:;:;:;:;;:
┃┏┓╋　　 ┃　　　　　　,.-'"､ヽ､ |::::/ /　　　　　　/;:;:ヽ　　ノ;:;:;:;:;:;:i　　　　　　＼ヽ
┛┗┛┗┃┃┃　　　　　 i.／ヽヽ |ﾉ　　!´　　　　　 /;:;:;:;:;|　（;;／j;:;:;:;:;ヽ_　　　ﾉ　　|
　┛┗━┛ 　 ┗━┛　　（__／ヽjノ　／　　　　　　/;:;:;:;:;:;|､　　（;:;ﾉ;:;:;:;:;:;:/＼　　　　|
　 ┳━┳　　　　　　　　　／ヽ　　　／　┏━━┓ |;:;:;:;:;;/　ヽー'/;:;ﾉ;:;:;:;:/　 |＼　　 |
┏╋━╋┓　　 ┏┛　　　　|　　　|　　　　　 ┃ ）;:）;/　　　　　||（;:;:;:;/|　　ヽ､＼　|
┗╋━╋┛　 ┏┛　　 ╋ 　┃ ┃　┃ 　　　 ┃ ;:;::;:ヽ　　　　　|:　ヽ;:;:ヾ　　　ヽ__ﾉ
　 ┻━┻┃┃┗┓　　┃ 　　 ┃　┃ 　 ┏━┛
　┛┗━┛ 　　 ┗┓　┏╋ 　 ┗　　　 ┃
　　　　　　　　　　 ┗┛　　　　　　　┏┓
　　　　　　　　　　　　　　　　　　　　　　　　┗┛
255 名前：251 mailto:sage [2008/01/10(木) 01:31:44 ]: >>252
>共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない
なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。
256 名前：32と35 [2008/01/10(木) 02:04:32 ]: コックス比例ハザードモデルについてお教えください。

予後推定因子を解析する際の事ですが
単変量解析をする際に、交互作用のある因子は除こうと思うのですが
SPSS でその因子の抽出の仕方を教えてください。

イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む
必要があると思います。

もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか？
257 名前：１３２人目の素数さん [2008/01/11(金) 19:59:43 ]: 「絶対計算」という本を図書館で借りて読んだ。

要点は、絶対計算したほうが良い、という感じで
なかなかいい本だった。
258 名前：統計 [2008/01/11(金) 21:11:39 ]: 文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。
アンケートを使ってどんな（容姿・性格）の人が好感をもたれるのかをやりたなぁと考えています。
259 名前：１３２人目の素数さん [2008/01/11(金) 21:11:59 ]: Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX－μはN(0、1二乗)に従う。
N(0、1二乗)についてP(1.5<=σ分のX－μ)＝0.07、
P(0.5<=σ分のX－μ)＝0.31である。
あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、
μ＋1.5σ<=Xの生徒は5段階評価の5、
μ＋0.5σ<=X<=μ＋1.5σの生徒は4、
μ－0.5σ<=X<=μ＋0.5σの生徒は3をつけるとする。
この時5をもらうのは全体の()％、
4をもらうのは全体の()％、
3をもらうのは全体の()％である。

分かりにくくてすみません。とりあえず5をもらうのが7％というのまでわかりました。どなたかお願いします。
260 名前：１３２人目の素数さん mailto:sage [2008/01/11(金) 22:04:40 ]: 5が7%だとわかったのに何で4と3がわからないんだ？
5で計算したのと同じようにやればいいだろ。
261 名前：１３２人目の素数さん [2008/01/11(金) 22:44:57 ]: 4が24％で3が38％ですかね？
間違ってたらご指摘ください…。
262 名前：１３２人目の素数さん mailto:sage [2008/01/12(土) 13:14:22 ]: すいません、無相関の検定って何でしょうか？
初心者丸出しの質問ですみません。
263 名前：１３２人目の素数さん mailto:sage [2008/01/12(土) 14:21:27 ]: >>257
山形浩生が訳してるやつ？
結構おもろいよね
264 名前：１３２人目の素数さん [2008/01/12(土) 15:20:48 ]: >>262
単回帰の傾きゼロ検定
265 名前：１３２人目の素数さん [2008/01/12(土) 15:22:57 ]: >>258

統計数理研究所のHPで教員の業績を調べると、適当なテーマが見つかるよ。
副所長が『女子学生の飲み物調査』で論文を書いているとか。
266 名前：１３２人目の素数さん [2008/01/12(土) 21:26:58 ]: すいません、質問させてください。

繰り返しのない二元配置（または乱塊方、反復測定一元配置分散分析）
で分析できるデータを、多重比較したいのです。

そもそもそういうやり方がないので、ボンフェローニの補正を行いたいのですが、
この場合、対応のあるｔ検定を繰り返して有意水準を補正すればよいのですか。
それとも、対応のないｔ検定を繰り返せばよいのでしょうか。

ご意見くださいますでしょうか。
267 名前：１３２人目の素数さん [2008/01/15(火) 21:21:41 ]: >>262
普通に相関係数の検定でいいのでは。
268 名前：１３２人目の素数さん [2008/01/15(火) 21:29:11 ]: 変数変換について質問します。
0近傍で変化がなく、X軸のマイナス側はマイナスの値、X軸のﾌﾟﾗｽ側はﾌﾟﾗｽの値の方に増加する（TANを平たくしたような関数）
ような変数変換がしたいのですが、
ロジスティック関数を90度回転したような変換を扱うにはどうしたらよいでしょうか？
269 名前：１３２人目の素数さん mailto:sage [2008/01/15(火) 23:12:43 ]: tanを平たくした関数やロジスティック関数を90度回転させた関数で変換すればよい
270 名前：１３２人目の素数さん [2008/01/17(木) 08:18:16 ]: 目的はある値を予測することです。
外れ値の多いﾃﾞｰﾀの場合、回帰分析は回帰直線が外れ値に影響されます。
外れ値の多いﾃﾞｰﾀの場合、回帰分析は不適でしょうか？
1.不適なら分析手法は何を使うべきでしょうか？
2.また回帰分析で可能な場合外れ値分析や除去して回帰分析した予測をすると
予測の時に目的変数が未知の外れ値がきたときに予測精度が悪くなります。
どのように対処したらよいでしょうか？
271 名前：１３２人目の素数さん mailto:sage [2008/01/17(木) 20:44:18 ]: >>270
>外れ値の多いﾃﾞｰﾀの場合、回帰分析は不適でしょうか？
外れ値の多いﾃﾞｰﾀというのは、通常の１次線形回帰分析での寄与率が
何%程度なのかな？80%未満なら、その回帰式を予測式に使うのは避ける
べきではないかな。
>1.不適なら分析手法は何を使うべきでしょうか？
偏回帰線図を見て、非線形傾向なら高次回帰分析にかけてみるとよいのでは。
応答曲面法をメニューに有する数万円のソフトもあるからね。
272 名前：１３２人目の素数さん mailto:sage [2008/01/17(木) 23:09:06 ]: 2は考え違い。
外れ値に対する予測精度を高めるということは
誤差に追従させるというのと同じ。
273 名前：１３２人目の素数さん mailto:sage [2008/01/18(金) 00:02:15 ]: >>270
ロバスト回帰を使えば？
274 名前：１３２人目の素数さん [2008/01/18(金) 13:20:34 ]: >>271
40項目あり、単回帰での寄与率は大きい方から45、30、20、18、、10、9、～です。
偏回帰線図とは散布図のことでしょうか？調べてもわかりませんでした。
275 名前：１３２人目の素数さん mailto:sage [2008/01/18(金) 19:04:42 ]: >>274
>40項目あり、単回帰での寄与率は・・・
40項目とは収集データの組み数のことでしょうが、重回帰でなく単回帰というと
説明変数が１種類だけなのですか？
>偏回帰線図とは・・・
ThinkSTAT等の重回帰分析ソフトで偏回帰プロットと呼ばれている散布図の
ことです。Excelの回帰分析だと観測値グラフが似ています。
276 名前：１３２人目の素数さん [2008/01/18(金) 22:44:10 ]: ttp://www.vipper.net/vip437256.zip.html
誰かこの回答の仕方があっているか教えてくれませんか？
教科書とか持ってないんで調べようがないので。。。

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef