統計学なんでもスレッ ..
154:132人目の素数さん
07/12/28 01:01:26
すみません重回帰分析を行っているのですが
定数項を含む場合と含まない場合で相当結果が違ってきます。
特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。
また、説明変数のt値なども両者で相当な違いが見られます。
定数項を含む場合の寄与率の導出等については文献があるのですが
定数項を含まない場合についてがどうしてもよくわかりません。
なぜこのような事になるのか・・・
また、どちらの結果を使うのがよいのか・・・(定数項を分析の際入れるか)
どなたかご教授頂けないでしょうか?
155:132人目の素数さん
07/12/28 01:10:34
>>154
目的因子と説明因子の関係が原点を通るか通らないかで判断する。
156:132人目の素数さん
07/12/28 03:03:19
>>138
graduate の入門レベルの本だと、統計学やる人向けはこんな感じ。
測度論:Billingsley, "Probability and Measure"
推定:Lehmann and Casella, "Theory of Point Estimation"
検定:Lehmann and Romano, "Testing Statistical Hypotheses"
Lehmannの2冊は古いし測度論的な記述が完全に一般化されてない箇所も
あるけど、総合的にはこれを超える本はないような気がする。
Bayesとかは詳しく知らん。
回帰分析や分散分析は、なかなかいい本がない。
(昔に書かれた数学的に細かい本ならあるが。)
確率論に関しては、
Durrett "Probability: Theory and Example"
Kai Lai Chung "A Course in Probability Theory"
Kallenberg "Foundations of Modern Probability"
あたりか?
Durrettは簡潔な教科書スタイルの本だがギャップも多く難しい
という評判、Kai Lai Chungは評判はいいがやや記法が古い。
Kallenbergは辞書のような本。
補足、追加、反対意見などある人ヨロ。
157:132人目の素数さん
07/12/28 11:06:27
>>155
ありがとうございます
つまり仮定しているモデル式に定数項が含まれないなら
定数項を含まないモデルで解析という事でしょうか?
158:132人目の素数さん
07/12/28 13:19:11
>>157
まぁそういうこと。
xが0の時yは0なら定数項はなし(原点を通るから比例関係)
159:132人目の素数さん
07/12/28 18:53:06
勝手にモデルを決めたら、結果を認めて貰えない。
一般に線形回帰モデルは定数項付きなので、
何かの理由で定数項無しの特殊なモデルを使いたい場合は、
まず定数項が統計的に有意じゃないことを示す必要がある。
160:132人目の素数さん
07/12/29 07:36:36
どうか、お願いします。
バリマックス回転したいんですが、エクセルしかなく、
さっきR言語をインストールしたんですがさっぱりわかりません。
R言語のサイトで
URLリンク(aoki2.si.gunma-u.ac.jp)
が紹介されていて、この関数を入れるとバリマックス回転ができるそうなんですが
ここの関数を使おうとしてもなぜか正常に表示されず、使用することができません。
どうか、何か、妙案を出していただけませんか?
お願いします。
161:132人目の素数さん
07/12/29 12:38:08
>>160
Rのスレで質問したほうがすぐに答えてくれると思う
162:160
07/12/30 09:04:36
了解です。
163:132人目の素数さん
07/12/30 21:27:39
信頼区間の信頼率と被覆確率について教えてください。
信頼率というのは、
例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは
「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか?
また、被覆確率というのは、
ある文献では信頼率と同じことと説明されていて、
他所では「作られた信頼区間の中に母数の推定量が入る確率」である、
と説明されていました。
これはどちらが正しいのでしょうか?
164:132人目の素数さん
07/12/30 23:22:22
「信頼率」は「信頼係数」のことかな?
だと本来は同じ。
しかし二項分布とかポアソン分布などの離散型確率変数の場合、
正確な信頼区間は作れない。
よって名目上の信頼係数と実際の被覆確率とが違うのは普通。
165:132人目の素数さん
07/12/31 00:37:27
正規分布の問題で
高1男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。
このとき、無作為に男と女を1人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。
(実際の問題には平均、分散の具体的数字が入ってます)
というのがあって、解き方がわからないんですけど
どなたかアドバイスお願いします。
166:132人目の素数さん
07/12/31 00:52:21
ヒント:差 Y-X の分布
167:132人目の素数さん
07/12/31 01:14:52
>>166
アドバイスありがとうございます。
Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。
行き詰まったのでまた明日考えることにします。
168:132人目の素数さん
07/12/31 10:30:51
>>165
Xとなる確率はわかる。
YがX以上となる確率もわかる。
最後にXで積分すると全体の確率がでる。
169:132人目の素数さん
07/12/31 19:36:35
>>168
で、正規分布の密度関数の二重積分まで行って、
お手上げになる。
それが解けるようなヤシは、そもそも質問しないから。
170:132人目の素数さん
07/12/31 19:43:09
>>167
Ganbarin sai yoh !
171:132人目の素数さん
07/12/31 20:13:07
べき分布について詳しく書いてあるようなページはないですかね?
もしくは本でも良いんですが
172:132人目の素数さん
08/01/01 16:38:29
>>169
> で、正規分布の密度関数の二重積分まで行って、
> お手上げになる。
つまり、その二重積分のやり方を教えればいいということか。
173:132人目の素数さん
08/01/01 18:24:41
統計学を独学するのにいいテキストを探しています
候補としては東大出版の基礎統計学I 統計学入門か
統計学のための数学入門30講を考えているのですが
評判というか使い勝手はどうなのか教えていただけないでしょうか?
上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです
よろしくお願いします
174:132人目の素数さん
08/01/01 18:49:02
後者は統計を学ぶためのあくまで「数学」の本だよ
数学がわかるなら必要なし
175:132人目の素数さん
08/01/01 22:52:51
>>173
候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176:ふ
08/01/01 23:09:35
〉173
学部はどこなの?
数学はどのていどわかるの?
いままで読んだ統計学の本は?
統計学を学ぶ目的は?
いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177:132人目の素数さん
08/01/01 23:31:40
173です 説明不足だったことを反省しています
>>176
経済学部なので数学は半端に知っているという程度です(問題演習はそこそこできるが、証明はできません)
統計の本は読んだことがありません
授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています
最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました
>>175
上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした
>>174
統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178:132人目の素数さん
08/01/01 23:35:47
173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。
専門分野 教育学
数学理解 高校のころ2Bやって以来数年間触ってないので、ところどころ忘れている(3Cは未履修)。
既読書籍 「社会の見方、測り方―計量社会学への招待」
「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹
あとは、講義等で講師が自前で作成した教材等。
学ぶ目的 数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。
お手数しますが、何かお勧め頂けると有難いです。
宜しくお願いします。
179:132人目の素数さん
08/01/01 23:49:10
>>177
統計学を勉強する目的は何ですか?
研究、資格試験などありますが。
180:132人目の素数さん
08/01/02 00:34:18
私は最近統計の勉強を始めた者です。
テキストは東大出版会の統計学入門を使ってます。
この本に書いてることで疑問があるのですが、
『母平均を推定する問題では、母分散が既知なら正規分布、
母分散が未知ならt分布を使う。
母分散を推定する問題ではカイ二乗分布を使う。』
という理解でよいでしょうか?
この理解ではダメな問題があったので、理解が正しいか教えてください。
181:ふ
08/01/02 01:23:11
〉177
困りましたね。
本来、統計学は独学の困難な学問ですからね。
文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。
面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。
だれか先生につかないと。
182:132人目の素数さん
08/01/02 01:43:14
>>180
正規分布ならOK.
推定の一般論について読めばそれの理解がよくないことがわかる。
183:132人目の素数さん
08/01/02 02:58:44
>>177
東大の統計学入門は、初心者向けの商品カタログみたいな感じだから
独学には向かないと思うよ。そのレベルなら
蓑谷 千凰彦「統計学入門」東京図書
がいいかも。もっと数学的でも良ければ、
竹村 彰通「現代数理統計学」創文社
とか。
184:132人目の素数さん
08/01/02 06:43:36
統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185:132人目の素数さん
08/01/02 07:56:36
>>177
統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。
統計は確率論の1つの応用分野である。で、確率論をやるのなら線型代数、微積分
及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。1)線型代数:岩波基礎
数学講座の線型空間、2)微積分:岩波基礎数学講座の解析入門1〜4、3)集合と
位相:岩波の現代数学概説1、2。その中でとりわけ重要なのは微積分、集合と位相
である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、
「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概
説2」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。
これとほぼ並行して、次のことをやる。
1:線型代数の穴埋め。
これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「2次形式」で十分。
2:少々の抽象代数。現代数学概説1の群、環、体あたりを読んでみよう。
3:複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき
或いは必要になったときに読んでいけばよい。
4:関数解析。お勧めは「岩波基礎数学講座の関数解析」。
5:Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門5」。
6:微分方程式。お勧めは岩波講座の現代数学への入門の
「力学と微分方程式」、「熱・波動と微分方程式」 あたり。
7:岩波講座応用数学。色々読んでみるとよい。役に立つ筈。
ついでに言えば、腕力も鍛えておいた方がよい。
186:132人目の素数さん
08/01/02 12:17:30
>>182 教えてもらってありがとうございます。
とりあえず今の理解でおおまかには大丈夫なら、
まず先に全体を終わらせるよう先に進めます。
187:132人目の素数さん
08/01/02 13:29:57
>>186
大丈夫なのは正規分布の母平均の推定の場合に限ります。
東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。
漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの
統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188:132人目の素数さん
08/01/02 14:10:47
東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。
噛めば分かるのだが、すっと理解できるようには書いてない。
内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189:132人目の素数さん
08/01/02 14:50:15
系列範疇法について質問があります。
各カテゴリーの相対頻度と等しい面積を持つように
正規分布を分割したいのですが、
具体的にどうすればどうすればよいのでしょうか。
190:132人目の素数さん
08/01/02 19:32:13
>>180って他のスレで酷い質問しててワロタんだがw
191:132人目の素数さん
08/01/03 03:15:42
移動平均の最適パラメータってどうやって求めるんですか?
192:132人目の素数さん
08/01/03 06:24:38
変数XがA-B群間のt検定では有意差が出ないのに
判別分析(ステップワイズ法)ではA-B群の判別に寄与する変数として投入される
ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ,なんだかしっくりこない
193:132人目の素数さん
08/01/03 18:32:56
コーシー分布の平均値って事実上ゼロでしょ?
194:132人目の素数さん
08/01/03 21:37:43
>>193
「事実上」ってなんだ
195:132人目の素数さん
08/01/03 21:50:06
>>192
散布図を描くとするでしょ
右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。
横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。
こういうのでどうでしょうか
196:132人目の素数さん
08/01/03 22:52:06
>>193
左右対称な分布なら 平均 = 中央値 と定義すればそう。
197:132人目の素数さん
08/01/03 23:01:51
>>193
平均と中央値をごちゃごちゃにしてはだめです。
平均と中央値は中心という概念では同じですが、定義は全く違います。
198:132人目の素数さん
08/01/04 13:15:44
コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない?
199:132人目の素数さん
08/01/04 14:47:30
>>195
あー,なるほど,そう言われるとよく分かる.
200:132人目の素数さん
08/01/04 17:16:13
>>198
コーシー分布にしたがってランダムに数を生成させる方法を述べよ
仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201:132人目の素数さん
08/01/04 18:42:25
>>198 >>200
コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。
あと位置と尺度を一般化したコーシー分布、例えば
Wikipedia項目リンク
の母数は、「母平均」や「母標準偏差」ではない。
母平均も母分散も存在しないからね。
また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。
というか、そもそも推定している対象が存在しない。
コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。
つまり、裾長分布の兆候を持つデータの位置母数推定で、
標本平均を使うのは危険。経験的には、外れ値を除外したり、
両端を一定率で除外した調整平均が使われている。
一方、正規分布など特定の分布では少し効率が悪いが、
「標本中央値なら常に安全」という教訓になるのがコーシー。
202:132人目の素数さん
08/01/04 18:49:11
コーシー分布にしたがってランダムに数を生成させる方法はある。
まず、(-∞, +∞)の一様分布の確率変数p(x)を用意する(ただし、厳密な意味ではこれが一番難しい)。
あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、
q(y)=Σp(φ(y))・dφ(y)/dy
で定義されるq(y)で数を生成すればOK。ただし、x=φ(y)は二価関数なので、単調増加の領域と
単調減少の領域に分けてΣを計算すれば良い。
203:132人目の素数さん
08/01/04 18:55:38
>>202
それ合ってんの?
204:202
08/01/04 18:57:21
>>203
知らんw
205:132人目の素数さん
08/01/04 19:00:33
(-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか?
206:132人目の素数さん
08/01/04 19:00:37
>>204
何だ知ったかか
207:132人目の素数さん
08/01/04 19:07:15
何で無駄に(-∞, +∞)で考えてんだよ
もっと効率よくしろ
208:202
08/01/04 19:09:23
>>206
小針の確率・統計入門のP49§3確率変数の変換に書いてある
209:132人目の素数さん
08/01/04 19:12:22
標準正規の比や一様分布のtanで生成するだけだろ
210:201
08/01/04 19:20:40
訂正
×arctan 変換で作れるよ。
○ tan 変換で作れるよ。
スマソ。逆が2回出てくる関係なので、書く時に確かめずに勘違いした;
211:132人目の素数さん
08/01/04 20:33:57
理論的に生成可能かどうかは問題ではない
問題は生成した数からどうやって>>198の言う平均を計算するかだ
そもそもこの計算自体が既に不可能だろうという話
212:132人目の素数さん
08/01/04 20:48:33
実測値の算術平均なら何の問題もなく計算できます
213:132人目の素数さん
08/01/04 21:27:51
>>212
>>198の検証をたのむ
214:132人目の素数さん
08/01/04 23:59:26
だーかーらー
コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。
どれだけ大標本でもだ。つまり平均取っても無意味。
>>198は「標本平均は必ず確率収束する」と思ってる厨房w
215:132人目の素数さん
08/01/05 07:16:26
「事実上の平均」に面白い定義を与えられるかどうかだな。
乱数を[-d,d]にtruncateした上で平均を取って極限をとり、
最後にd→∞にしてみるとか?
216:132人目の素数さん
08/01/05 10:53:42
クイズ問題のサイトを作ろうと思っているのですが、
1万のクイズを、複数の人に自由に解かせるとして、
(クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、
一度、解くのをやめ、後でまた解いても良い。)
どのような公式で、ランキングをつけたら良いのでしょうか。
例えば、単純確率だと10問中5問正解した人と、
100問中50問正解した人は、同じランクになりますが、
果たして、これは、同じランクで良いのでしょうか。
そうすると、1問中1問正解した人は、いつも1位となってしまいます。
何か、良い公式がないでしょうか。
よろしくお願いします。
217:132人目の素数さん
08/01/05 13:20:23
単純に
正解数−不正解数
じゃダメ?
218:132人目の素数さん
08/01/05 15:16:41
>>216
検定の考え方を使えば多少は重み付けも出来るが
明確に順序をつけるのは無理だろう
ゲームとして割りきるなら
正答率*正答率*回答数
くらいで良いんじゃないかと思う。
理論的根拠は無い。
219:132人目の素数さん
08/01/05 18:26:36
>>216
乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の
事象を n 回独立に繰り返した時の二項分布になるとする。
この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。
仮に1問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。
正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、
マハラノビス距離空間上のランキングが得られる。
p の推定値は、参加者全員の 正解数合計 / 解いた問題数合計
が良いけど、それだと毎回ランキングが変化する。
問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。
220:132人目の素数さん
08/01/05 20:20:15
>>215
コーシーの主値
221:219
08/01/06 18:34:11
>>216
数値例が無かったので補足。
選択式の回答方式だと思うので、すべて「4択」だとしよう。
そうすると、「でたらめに答えて」当たる確率は p=1/4。
この時 μ = n/4、σ = (√n√3 )/ 4。
z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。
n x z D(偏差値)
1 1 1.22 62 … 1問中 1問
10 5 0.65 56 … 10問中 5問
100 50 2.04 70 … 100問中 50問
1000 500 6.45 115 … 1000問中 500問
・正規分布近似を使っていることになるので、精度条件として
だいたい np≧5 (p≦1/2) または n(1-p)≧5 (p>1/2) が必要。
よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。
・偏差値 D が使用する有効精度内で同じ場合には、問題数 n
の大きい方を上位とする。
※1次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。
222:132人目の素数さん
08/01/06 19:18:40
くだらん。
正解数−不正解数の方がよっぽど役にたつ。
223:132人目の素数さん
08/01/06 19:47:21
>>222
Aは、100問全問正解(正解率100%)で 100 − 0 = 100。
Bは、200問中151問正解(正解率75.5%)で 151 − 49 = 102。
B > A でいいのか?
224:132人目の素数さん
08/01/06 19:53:31
いい。
100問正解の時点で、Aは残りの49問を正解する確証がどこにもないから、
ランキングとしては151問正解のBよりも低くランキングされるのが妥当。
225:132人目の素数さん
08/01/06 19:54:36
上位一割くらいしか表示しないなら>>218がシンプルでいい
>>219みたいになると仮定の妥当性とかいろいろ面倒だからな
226:132人目の素数さん
08/01/06 19:55:45
ただし、問題文ごとに独立性がないのなら話は別。
過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら
単純な正答率によるランキングが妥当。
227:132人目の素数さん
08/01/06 20:05:22
224=226です。
228:132人目の素数さん
08/01/06 20:07:18
俺が野球チームの監督なら、200打席151安打のバッターと、
100打席全安打のバッターなら後者を使うけどな
229:132人目の素数さん
08/01/06 20:14:35
何が正しい計量と判断できるかは、問題文(群)の構成に強く依存する。
問題文の独立性が保障される様な理想的な構成なら、正解数−不正解数が正しい計量となる。
が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。
230:132人目の素数さん
08/01/06 20:27:48
>>226, >>229 が言ってるのは、「独立性」ではなく「異質性」だな。
つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。
量子力学の問題の次は文学の問題とか、、、
しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ
231:132人目の素数さん
08/01/06 20:31:06
クイズという問題をどうとらえるかだが、
あらかじめ確定した操作をランダムな順序で対象に実行して
その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。
と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。
232:132人目の素数さん
08/01/06 20:33:04
こういう話題が出てきてwktkしてきた
>>180-215のような低レベルな話より断然興味深い
233:132人目の素数さん
08/01/06 20:54:08
出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。
ネイマン・ピアソンの考え方に従うか
ベイズの考え方に従うか
両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって
どういう統計量で判断するかが決まる。
234:219=221
08/01/07 00:52:43
>>225
「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの
回答方式なら、>>218 でも良いよ。なぜなら
z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p))
において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、
y = x/√n - np
で回答者同士を比較しているのと同じ。この値は p → 0 の時
y → x/√n = (√n) (x/n) = (√回答数)・正答率
なので、自乗すれば >>218 の指標になる。
※知能や知識は、完全不確実状態(混沌)からどれだけ確実状態(秩序)
に近づいたかで計るのが、情報量的な考え方。
ただし、誤知能や誤知識という方向への脳内秩序もアリなので、
「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。
235:234
08/01/07 00:59:44
× y = x/√n - np
○ y = x/√n - (√n)p
236:132人目の素数さん
08/01/07 18:36:12
>>234
それが>>225でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。
そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、
結局のところ意味があるのはpに依存しない部分だけというわけだ。
お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ
237:132人目の素数さん
08/01/07 21:24:23
すみません、お教えください。4群の共分散分析をやっていて、
回帰直線の傾きが有意に違う、という結果を得ています。
で、1つのグループAを除いて3群で検定すると傾きに有意差は見られません。
グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、
ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか?
238:234
08/01/07 21:36:34
>>236
まあまあ抑えてw、たかがクイズのランキングの話。
で、(初等教科書的な)二項分布モデルが気に入らないようだけど、
こう考えればどうかな?
クイズの回答はすべて選択式で、選択肢の数は常にM個とする。
また出題時に、選択肢の順序は乱数でかき混ぜる。
別室に居る見えない回答者にクイズを出題して、その答えのみから
回答者がサイコロのような乱数器(完全無知脳)を使っているか、自分自身
(幾分の知能を保有)でマジに答えているかを判定する。
もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、
記述言語は HTML+Javascript で十分だろう。OSは何でも良いw
この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。
したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、
>>219, >>234-235 の尺度を使うことなる。
つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。
不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。
239:238=234
08/01/07 21:47:00
× 使うことなる。 ○ 使うことになる。
240:132人目の素数さん
08/01/07 22:11:03
>>237
ボンフェローニでAと他の群がすべて棄却され、
他の群同士は棄却されないならそれでいいんじゃない?
(ボンフェローニだと補正がきつすぎてAと他の群で
棄却されないものが出てくるのなら問題だが。)
241:237
08/01/07 23:39:27
>>240
ありがとうございます。方法としては間違ってないと知り、安心しました。
仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、
URLリンク(www.human.tsukuba.ac.jp)
を見つけました。群馬大の青木先生の掲示板では、シダックの方法?というのが出ていたのですが、
解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。
もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。
1−(1−α)^(1/k)がシダックの不等式なんでしょうか?
242:132人目の素数さん
08/01/08 01:41:49
連続型確率関数Xの確率密度関数が
f(x)=1 (0≦x≦1)
の場合で
X=e^-Y/2
とするときのYの確率密度関数の求め方ってどうすればいいですか?
243:132人目の素数さん
08/01/08 01:45:01
変数変換の公式を調べてそれを使うだけだろ
別に何も変わったところがない
244:132人目の素数さん
08/01/08 01:49:00
>>242まで辿り着いてここでつまってしまったんです
245:132人目の素数さん
08/01/08 01:50:00
>>243で書いてある通り、調べればすぐわかることだから自分で解決してみな
246:242
08/01/08 02:06:12
何か勘違いしてたみたいで簡単にできました
お騒がせしてすいませんでした
247:132人目の素数さん
08/01/08 02:06:18
また試験のシーズンか、、、
248:132人目の素数さん
08/01/08 02:17:51
試験に囚われてはならない。
自分のペースで学習することが大切だ。
試験で良い点を取ったからと言って
本当の実力が付いているとは限らない。
249:132人目の素数さん
08/01/08 23:35:10
>>241
シダックは使える条件があるからいいのかな?
大体4群だとボンフェローニで0.0125で
シダックで0.012741だからあまり大差ないね。
そのページのHolmの方法なんかいいんじゃない?
Shafferの方法は表がいるしね。
250:132人目の素数さん
08/01/08 23:45:15
2007年11月のウェブサイト利用統計
--------------------------------------------------
順位 延べ利用時間 利用者数
(万時間) (万人)
--------------------------------------------------
某Yahoo! 1位→1位 12549
某楽天市場 3位→2位 2164
某ミクシィ 2位→3位 1669
某YouTube 4位→4位 1495 動画投稿
某ニコニコ動画 ?→5位 1249 386 動画投稿
某FC2 9位→6位 960 ブログ制作支援
某Google 7位→7位 794 >2000
2ちゃんねる 5位→8位 751 掲示板
某goo 8位→9位 645 1800
某msn 6位→10位 628
---------------------------------------------------
251:237, 241
08/01/09 18:38:41
>>249
レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、
という状態だったので、それを参考にすすめる事にしました。
ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。
その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、
という事でしょうか?
(後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです)
252:132人目の素数さん
08/01/09 22:49:14
>>251
シダックの不等式は書かれてないが、それに基づく有意水準の調整は
>>241で合ってるよ。>>249もそれで計算しただけだしね。
ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を
使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど
確信はないなあ。
>>249で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで
進めないと効果はないかもね。
253:132人目の素数さん
08/01/10 00:24:36
鼻の炎症はビエン、では耳の炎症は?
254:132人目の素数さん
08/01/10 01:10:26
━━━┓ ____
┃ / \
┃┏┳┛┃┃┃ ,,..--―--/ \
━━━┛ ┃ ┏┛ | ヾ==___ ヽ \
┏┻━ ヾ :::::::::::::====\ |
┃┣┓┣┓ ━┓╋ ┣ `ー--/ ミ(⌒) /
┏┛ ╋ ━┓ ┏┛┃━┏╋ _ ヽ, ) ミノ ~レ-r -‐、/
━┻━ ┛ ┗━ ━┗┛ / ヽ. <_ ノ__ i i i〉 〉
━ /ヽ }<´ / ヽ、 /_/_/レ′
┏━╋ ,.-、/ ,.>-‐'" { _.......:::::::: ヽ、)ト´ ´ ヽ:;ヽ:;:-:;:-、.
┃ ━ ┃ ┃┃ ,,..‐'ヾ_j ,..< `ー、:::::::: /;: ̄:;i ヽ、;:_;:;:;:;:;;:
┃┏┓╋ ┃ ,.-'"、 ヽ、 |::::/ / /;:;:ヽ ノ;:;:;:;:;:;:i \ ヽ
┛┗┛┗┃┃┃ i./ヽ ヽ |ノ !´ /;:;:;:;:;| (;;/j;:;:;:;:;ヽ_ ノ |
┛┗━┛ ┗━┛ (__/ヽjノ / /;:;:;:;:;:;|、 (;:;ノ;:;:;:;:;:;:/\ |
┳━┳ /ヽ / ┏━┓ |;:;:;:;:;;/ ヽー'/;:;ノ;:;:;:;:/ |\ |
┏╋━╋┓ ┏┛ | | ┃ );:);/ ||(;:;:;:;/| ヽ、\ |
┗╋━╋┛ ┏┛ ╋ ┃ ┃ ┃ ┃ ;:;::;:ヽ |: ヽ;:;:ヾ ヽ__ノ
┻━┻┃┃┗┓ ┃ ┃ ┃ ┏━┛
┛┗━┛ ┗┓ ┏╋ ┗ ┃
┗┛ ┏┓
┗┛
255:251
08/01/10 01:31:44
>>252
>共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない
なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。
256:32と35
08/01/10 02:04:32
コックス比例ハザードモデルについてお教えください。
予後推定因子を解析する際の事ですが
単変量解析をする際に、交互作用のある因子は除こうと思うのですが
SPSS でその因子の抽出の仕方を教えてください。
イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む
必要があると思います。
もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか?
257:132人目の素数さん
08/01/11 19:59:43
「絶対計算」という本を図書館で借りて読んだ。
要点は、絶対計算したほうが良い、という感じで
なかなかいい本だった。
258:統計
08/01/11 21:11:39
文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。
アンケートを使ってどんな(容姿・性格)の人が好感をもたれるのかをやりたなぁと考えています。
259:132人目の素数さん
08/01/11 21:11:59
Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX−μはN(0、1二乗)に従う。
N(0、1二乗)についてP(1.5<=σ分のX−μ)=0.07、
P(0.5<=σ分のX−μ)=0.31である。
あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、
μ+1.5σ<=Xの生徒は5段階評価の5、
μ+0.5σ<=X<=μ+1.5σの生徒は4、
μ−0.5σ<=X<=μ+0.5σの生徒は3をつけるとする。
この時5をもらうのは全体の()%、
4をもらうのは全体の()%、
3をもらうのは全体の()%である。
分かりにくくてすみません。とりあえず5をもらうのが7%というのまでわかりました。どなたかお願いします。
260:132人目の素数さん
08/01/11 22:04:40
5が7%だとわかったのに何で4と3がわからないんだ?
5で計算したのと同じようにやればいいだろ。
261:132人目の素数さん
08/01/11 22:44:57
4が24%で3が38%ですかね?
間違ってたらご指摘ください…。
262:132人目の素数さん
08/01/12 13:14:22
すいません、無相関の検定って何でしょうか?
初心者丸出しの質問ですみません。
263:132人目の素数さん
08/01/12 14:21:27
>>257
山形浩生が訳してるやつ?
結構おもろいよね
264:132人目の素数さん
08/01/12 15:20:48
>>262
単回帰の傾きゼロ検定
265:132人目の素数さん
08/01/12 15:22:57
>>258
統計数理研究所のHPで教員の業績を調べると、適当なテーマが見つかるよ。
副所長が『女子学生の飲み物調査』で論文を書いているとか。
266:132人目の素数さん
08/01/12 21:26:58
すいません、質問させてください。
繰り返しのない二元配置(または乱塊方、反復測定一元配置分散分析)
で分析できるデータを、多重比較したいのです。
そもそもそういうやり方がないので、ボンフェローニの補正を行いたいのですが、
この場合、対応のあるt検定を繰り返して有意水準を補正すればよいのですか。
それとも、対応のないt検定を繰り返せばよいのでしょうか。
ご意見くださいますでしょうか。
267:132人目の素数さん
08/01/15 21:21:41
>>262
普通に相関係数の検定でいいのでは。
268:132人目の素数さん
08/01/15 21:29:11
変数変換について質問します。
0近傍で変化がなく、X軸のマイナス側はマイナスの値、X軸のプラス側はプラスの値の方に増加する(TANを平たくしたような関数)
ような変数変換がしたいのですが、
ロジスティック関数を90度回転したような変換を扱うにはどうしたらよいでしょうか?
269:132人目の素数さん
08/01/15 23:12:43
tanを平たくした関数やロジスティック関数を90度回転させた関数で変換すればよい
270:132人目の素数さん
08/01/17 08:18:16
目的はある値を予測することです。
外れ値の多いデータの場合、回帰分析は回帰直線が外れ値に影響されます。
外れ値の多いデータの場合、回帰分析は不適でしょうか?
1.不適なら分析手法は何を使うべきでしょうか?
2.また回帰分析で可能な場合外れ値分析や除去して回帰分析した予測をすると
予測の時に目的変数が未知の外れ値がきたときに予測精度が悪くなります。
どのように対処したらよいでしょうか?
271:132人目の素数さん
08/01/17 20:44:18
>>270
>外れ値の多いデータの場合、回帰分析は不適でしょうか?
外れ値の多いデータというのは、通常の1次線形回帰分析での寄与率が
何%程度なのかな?80%未満なら、その回帰式を予測式に使うのは避ける
べきではないかな。
>1.不適なら分析手法は何を使うべきでしょうか?
偏回帰線図を見て、非線形傾向なら高次回帰分析にかけてみるとよいのでは。
応答曲面法をメニューに有する数万円のソフトもあるからね。
272:132人目の素数さん
08/01/17 23:09:06
2は考え違い。
外れ値に対する予測精度を高めるということは
誤差に追従させるというのと同じ。
273:132人目の素数さん
08/01/18 00:02:15
>>270
ロバスト回帰を使えば?
274:132人目の素数さん
08/01/18 13:20:34
>>271
40項目あり、単回帰での寄与率は大きい方から45、30、20、18、、10、9、〜です。
偏回帰線図とは散布図のことでしょうか?調べてもわかりませんでした。
275:132人目の素数さん
08/01/18 19:04:42
>>274
>40項目あり、単回帰での寄与率は・・・
40項目とは収集データの組み数のことでしょうが、重回帰でなく単回帰というと
説明変数が1種類だけなのですか?
>偏回帰線図とは・・・
ThinkSTAT等の重回帰分析ソフトで偏回帰プロットと呼ばれている散布図の
ことです。Excelの回帰分析だと観測値グラフが似ています。
276:132人目の素数さん
08/01/18 22:44:10
URLリンク(www.vipper.net)
誰かこの回答の仕方があっているか教えてくれませんか?
教科書とか持ってないんで調べようがないので。。。
最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4830日前に更新/90 KB
担当:undef