1 名前:132人目の素数さん [2007/10/24(水) 08:52:19 ] 理論的な話題から実務上の疑問点まで。 学校の宿題は自分で考えましょう。 前スレ: 統計学なんでもスレッド6 science6.2ch.net/test/read.cgi/math/1169836298/ 統計学なんでもスレッド5 science5.2ch.net/test/read.cgi/math/1145362721/ 統計学なんでもスレッド4 science4.2ch.net/test/read.cgi/math/1123896809/ 統計学なんでもスレッド3 science3.2ch.net/test/read.cgi/math/1097491056/ 統計学なんでもスレッド2 science3.2ch.net/test/read.cgi/math/1068288283/ 統計学なんでもスレッド science.2ch.net/test/read.cgi/math/1012782106/ 関連スレ: 統計学なんて数学じゃないだろ science6.2ch.net/test/read.cgi/math/1173876727/ = 統計解析フリーソフト R 【第2章】 = science6.2ch.net/test/read.cgi/math/1152449095/ =統計解析= SASプログラミング science6.2ch.net/test/read.cgi/math/1184762259/
2 名前:にょにょ ◆yxpks8XH5Y mailto:sage [2007/10/24(水) 11:52:44 ] 今だ!2ゲットォオ  ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´ ∧∧ ) (´⌒(´ ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡  ̄ ̄ (´⌒(´⌒;; ズザーーーーーッ
3 名前:132人目の素数さん [2007/10/26(金) 16:29:07 ] 統計学って、どんなもん? 過去スレは見れないし、他のスレは無いし。 アンケートとか世論調査とか信頼できるの??
4 名前:132人目の素数さん [2007/11/03(土) 21:41:30 ] >>1 他板版関連スレ ◆統計学について語るスレ science6.2ch.net/test/read.cgi/sim/1012828891/ 心理統計スレッド3 academy6.2ch.net/test/read.cgi/psycho/1160242677/ 統計ソフト統合スレッド−SPSS・SAS以外 academy6.2ch.net/test/read.cgi/psycho/1012801769/ 統計解析ソフト ebi.2ch.net/rikei/kako/980/980470707.html
5 名前:132人目の素数さん [2007/11/05(月) 22:59:13 ] つり針が10本ついている仕掛け(さびき)で魚をつりました。 使ったさびきは3種類(赤、白、黒) それぞれで釣った回数は、赤10回、白3回、黒5回 釣れた魚は 赤が(5、3、4、8、1、0、2、1、5、7匹 白が(3、2、6)匹 黒が(7、5、4、7、8)匹 赤・白・黒の「さびき」で魚の釣れる割合に有意差があるかを知りたい。 【手順】期待値を求める。期待値と実測値の差を二乗して期待値で割ったものの総和を求める=これがカイ二乗検定 ということらしいのですが、そもそも期待値の出し方がわかりません。 どなたかアドバイス頂けないでしょうか?
6 名前:132人目の素数さん mailto:sage [2007/11/06(火) 00:12:06 ] >>5 まず帰無仮説をたてろ。 帰無仮説が支持される場合は、どのサビキに何匹の 魚が釣れると予想されるか考えろ。
7 名前:5 mailto:sage [2007/11/06(火) 07:26:10 ] >>6 様 帰無仮説というと、この場合「さびき」の種類で魚の釣れる割合に「差がない」ということですよね。 赤・白・黒のどれでも同じ割合でつれるはず と。 そうすると期待値は、10本針で10回、3回、5回で述べ180針つかい、つれた数が総計78匹 釣れる割合は43.3% この割合に比べて、赤・白・黒がどうかとみていくのでしょうか? やはり期待値というのがまだ理解できておりません・・・
8 名前:132人目の素数さん mailto:sage [2007/11/06(火) 08:53:10 ] >>7 %ではなくて、各サビキ1回で釣れる魚の数を考えて みると良い。 帰無仮説が採択される時に予測される魚の数が期待値。 各サビキで1回に釣れる魚の数(算術平均) ------------------------- 赤 白 黒 ------------------------- 実測値 3.60 3.66 6.20 期待値 ? ? ? -------------------------
9 名前:5 mailto:sage [2007/11/06(火) 09:16:53 ] 赤・白・黒で差がないとすると 延べ18回つって78匹=1回で4.33匹つれるはず。 しかしこれでは、全部同じになってしまいます。 う〜ん・・すいません。どうも平均と期待値がごっちゃになってますね。
10 名前:132人目の素数さん [2007/11/06(火) 12:50:32 ] >>9 カイ自乗適合度検定だったら、こんな風に考える。 腹を空かせて食いつき、"必ず"針に掛かってしまう78匹の魚が居る。 いま海の中には、餌の付いた赤・白・黒、色とりどりの針が 10:3:5の比で存在する。 1匹目:さあ、どの色に掛かろうかな? 2匹目:さあ、どの色に掛かろうかな? ・・・ 78匹目:さあ、どの色に掛かろうかな? 帰無仮説の下で考えた、赤・白・黒の針に各々掛かるであろう魚の数が、期待度数。 観測度数は>>5 から計算してちょ。
11 名前:5 mailto:sage [2007/11/06(火) 15:07:43 ] >>10 様 赤にかかるのは、18分の10の確率、すなわち78匹いれば43匹が赤にかかるはず。 同様に白なら13匹、黒なら22匹かかるはず。 これが期待値でしょうか? 期待度数、観測度数と期待値、観測値というのはまた別物なのでしょうか? 理解ができなくて申し訳ないです。
12 名前:132人目の素数さん [2007/11/06(火) 15:42:00 ] やっとスレが伸びてると思ったら釣りか。
13 名前:5 mailto:sage [2007/11/06(火) 23:01:59 ] 釣りではないのですが、>>11 の最後から2行目は反射的にかいてしまったので忘れてください。 例)サイコロを振ったときにでる目の期待値というのなら、 1x(1/6)+2x(1/6)・・・6x(1/6)=3.5というのは理解できるのですが この場合、延べ180針を使い、赤に100針中36尾、白に30針中11尾、黒に50針中31尾、合計78針で(102針はつれなかった)釣れた。 もし赤白黒で差がないのであれば、赤なら全体180針の内100針を占めており、その割合はすなわち釣れた78尾中の割合になるはず 釣れる期待値:赤(100/180)*78=43、白(30/180)*78、黒(50/180)*78 釣れない期待値も同様に求めて、(期待値-実測値)^2/期待値の総和=カイ二乗値(9.828・・・) こういう考えでしょうか? どこが間違っているのか、なんかすっきりしません。 アドバイスお願いいたします。
14 名前:10 [2007/11/08(木) 02:53:12 ] >>13 なら分割表かな? 赤 白 黒 計 釣れた 36 11 31 78 釣れない 64 19 19 102 計 100 30 50 180 結果(釣れた、釣れない)が、サビキの色(赤、白、黒)と独立かどうかを検定。 上の数値が観測度数。期待度数の計算は教科書とか見てね。 てかホントの話だよね?練習問題とかでなく、、、
15 名前:132人目の素数さん [2007/11/08(木) 05:29:28 ] AR()とかARIMA()とかを勉強しているのですが、いまいち分かりにくいです。 SPSSではなく、Rをつかって勉強しているのですが、 「SPSSによる線型混合モデルとその手順 石村 貞夫¥ 3,360」 って分かりやすいですか? どなたかよろしくお願いします。
16 名前:132人目の素数さん [2007/11/09(金) 19:13:22 ] robust statisticsについて 最良の本は? 英語でもよし ちゃんとわかりやすいのね 専門家じゃないので
17 名前:16 mailto:sage [2007/11/09(金) 20:42:27 ] てかrobust statistics って新しい分野なのかな?
18 名前:132人目の素数さん mailto:sage [2007/11/10(土) 13:32:36 ] >>16 一つの分野になってたとは知らなかった。 Wiki に参考文献含めて解説でてるけど、それじゃダメ? en.wikipedia.org/wiki/Robust_statistics
19 名前:16 [2007/11/10(土) 22:35:05 ] 俺は本読むの遅いんで なるべく良書を最初から読みたい 洋書の良書って よくわからんのだよね しかもマイナーそうだし だれか情報を
20 名前:132人目の素数さん [2007/11/10(土) 22:35:50 ] フエラーを詠めばいい
21 名前:16 [2007/11/10(土) 22:46:55 ] >>18 Good books on robust statistics include those by Huber (1981), Hampel et al (1986) and Rousseeuw and Leroy (1987). A modern treatment is given by Maronna et al (2006). Huber's book is quite theoretical, whereas the book by Rousseew and Leroy is very practical (although the sections discussing software are rather out of date, the bulk of the book is still very relevant). Hampel et al (1987) and Maronna et al (2006) fall somewhere in the middle ground. All four of these are recommended reading, though Maronna et al is the most up to date. practicalってやつがいいかな??? あんま理論的(ルべーグとか)なのはよくわからんしな
22 名前:132人目の素数さん mailto:sage [2007/11/15(木) 09:06:41 ] 尤度比って何ですか?
23 名前:132人目の素数さん [2007/11/15(木) 09:07:11 ] あげ
24 名前:132人目の素数さん mailto:sage [2007/11/15(木) 13:57:30 ] >>22 二つの仮説H_1, H_2 があって、 その密度関数をf_1, f_2 とするとき、 f_1(x)/f_2(x) のこと。 観測値xに対してこの値が大きければ H_1 の方が正しいモデルである可能性が高い。
25 名前:132人目の素数さん [2007/11/15(木) 19:35:55 ] 簡易な本に掲載されているやり方ではなく統計のプロがやる手順を知りたいのです。 目的は『予測すること』。目的変数は1個、説明変数は複数個です。 自分で調べてわかっている範囲を手順を記載します。間違っている、もしくは足りない箇所があれば教えてください。 【関係確認→変数変換】まず目的変数と説明変数の散布図を確認し、関係を把握する。 線形ならOK、非線形(単調増加)なら変数変換する、非線形(二次式以上)なら? つぎに、分布の正規性をヒストグラムで確認し、違うならBox-Cox変換する。 これでデータ準備完了? 【手法の選択】 @もし変数変換しても改善しないならノンパラメトリック分析を選択する。 A変数変換で改善したならパラメトリック分析を実施。この場合(線形?)重回帰分析?を選択。 (OLS回帰とGLS回帰の選択方法がどんなときにどちらを選択するか教えてください) 次に多重共線性を調べ変数除去する。(逐次法、増減法) 準備が整ったので解析を実施。 不備な点をご指摘お願いします。
26 名前:132人目の素数さん [2007/11/15(木) 19:39:04 ] 実装関連の信頼性解析について調べ始めているところです。 早速ですが,メディアンランク法の F(t)=(Σri-0.3)/(n+0.4) の0.3,0.4とは何でしょうか。
27 名前:132人目の素数さん mailto:sage [2007/11/16(金) 16:46:45 ] そもそも回帰分析の一般的方法が 1レスで収まるくらいなら苦労しないよ。 まあ、何点かコメント。 散布図を確認するのはいい心掛けだけど、そこでは、 まず異常値があるかどうかをチェックすべきだろうな。 あった場合にその扱いをどうするかは場合による。 それから、サンプルは本当に独立性を満たしているか? 満たしていなければ、いろんな方法でモデルを工夫 しなければいけない。 回帰分析では最終的な誤差の分布が問題なのであって、 元の変数の分布はモデルの正当性とは関係がない。 なので、最初に変数変換をすればOKというわけではなく 実際に回帰してみて、モデルの診断を行うという試行錯誤を せざるをえない。 その他、いろいろな問題が生じうるが、 当然ながら全部は書ききれない。
28 名前:132人目の素数さん mailto:sage [2007/11/17(土) 06:42:41 ] >>25 >不備な点・・・ 回帰分析の回帰診断ステップが、ごっそり脱落していますが。残差の分布や 寄与率の大小を点検するステップが。 >自分で調べてわかっている範囲を手順を・・・ 学校では講義がなく、何かの事情で独学を始めたということですか? 統計分野の知識素養があれば独学も楽しからずやでしょうが、大変ですね。
29 名前:25 [2007/11/17(土) 09:43:12 ] >>27 >それから、サンプルは本当に独立性を満たしているか? これは項目間の独立性(多重共線性問題)のことでしょうか? >>28 >学校では講義がなく、何かの事情で独学を始めたということですか? 実務で使う必要性がでてきたのです。もともと数学や統計の勉強は好きなので楽しんでやってますよ。 「回帰診断」で検索かけたらいろいろな情報がでてきましたのでまた調べてみます。 私にとっては回答頂いた文章の中で知らない単語がでてくるだけで、調べるヒントになるのです。 ありがとうございます。
30 名前:27 mailto:sage [2007/11/17(土) 13:07:59 ] いやいや、例えばある病気について100の症例を調べるにしても、 もし同じ人が2回その病気にかかって2回カウントされていたら、 その2つの症例は独立とはいえないでしょ。そういう時は、パラメータ の信頼区間が独立なサンプルの場合に比べて大きくなったりする。 別の例をあげると、時系列や空間データの場合には隣り合うサンプルが 相関していることが多い。 蛇足だけど、統計って教科書読んでるだけだとなかなか感覚が 掴めない。適当なデータを放り込んで分析してみるといろいろ 分かってくるよ。
31 名前:132人目の素数さん mailto:sage [2007/11/17(土) 17:48:54 ] >>30 >空間データの場合には隣り合うサンプルが > 相関していることが多い。 今分析対称のデータはこれに当てはまります。 1つの板の中に場所を表す番地1〜40があり、その各番地の複数データがサンプルです。 これの対策は何かあるのでしょうか?
32 名前:132人目の素数さん [2007/11/18(日) 16:52:14 ] マクネマーとカイの二乗検定ってエクセルでできるんですか?
33 名前:132人目の素数さん [2007/11/18(日) 16:53:45 ] 四択の選択肢の質問で 個人属性ごとに有意差つける 場合どのような検定を行えばいいのですか?
34 名前:132人目の素数さん [2007/11/19(月) 00:14:58 ] age
35 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:15:09 ] >>32 カイ二乗検定は、chitest()で出来る。 McNemar検定そのものは、エクセルにはないが、 chidistを使えば統計量は簡単な関数で書けるし、 p値は、chiinvを使えば出せる。 まずはエクセルのヘルプを見るべし。
36 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:40:19 ] >>33 4つの選択肢が順位尺度か否かによる。 順位尺度でないなら、単なるchi square test(サンプル数が 少なければFisher's exact test)でOK。この場合、選択肢 と個人属性が独立であるかだけを検定することになる。 順位尺度なら、通常はどの個人属性がより大きい値をとって いるかに興味があるはず。この場合は、属性をペアにして、 値の大小を比べるテストをした方が良い。例えば、A,B,C の3つの属性があるなら、AとB、AとC、BとCを各々比べる。 私が知っているのは Wilcoxon ranksum testにおいて同順位のサンプルによる影響を 補正したWilcoxon exact test。他にも方法があるかも知れない。 もしこれが難しすぎるなら、4つの選択肢を適当なところで 区切って二値の変数にしてしまえば、通常のカイ二乗検定で 大小を検定できる。
37 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:48:01 ] >>31 同じ地点の複数サンプルだけを補正したいなら、 repeated measure ANOVA (mixed effect modelの一種) を使えば、同一地点からのサンプルの相関を補正できる。 地理的な位置から来る相関を考慮するモデルは、 spatial statistics (空間統計学)と呼ばれる分野の人が やってるらしいが、私は詳しくは知らない。
38 名前:132人目の素数さん [2007/11/19(月) 18:21:26 ] 同一の母集団から、4つの方法でサンプルを採取した場合に方法ごとに取れるサンプルに有意な差があるかを検定する場合、何検定を使えばよいのでしょうか? 【具体例】 大小様々な水風船が無限に入ってるプールで針を大・中・小・極小と4種類つかって風船を釣ってみた。 このとき釣れる水風船の大きさや数と針の間に関係があるかどうか。そして針ごとに有意な差があるかどうかを検定したい。 関係の有無はカイ二乗検定でいいかなとおもうのですが、針ごとに有意な差があるかどうかは何をつかうべきでしょうか?
39 名前:132人目の素数さん [2007/11/19(月) 21:11:28 ] >>30 >適当なデータを放り込んで分析してみると・・・ 重回帰分析演習上達に適当なデータを開示しているWebページを、何例か 紹介願えませんか。
40 名前:132人目の素数さん [2007/11/20(火) 08:34:38 ] >>39 とりあえず有名どころ。 kdd.ics.uci.edu/
41 名前:132人目の素数さん [2007/11/20(火) 16:28:03 ] どなたか教えてください。 お願いしします。 母集団分布における確率空間についての質問です。 身長の統計調査を例にとる. 国民全体( N 人) をU とおき, その上の確率Q を Q[u] =1/N , u ∈ U とする. ここで確率空間(U,Q) が得られたので, Y (u) = u 個人の身長, u ∈ U として(U,Q) 上の確率変数を定義する. このY (u) の分布が母集団分布である. つぎに, U からu1, u2, ・ ・ ・ , un のn 人を無作為に選び, 標本調査を行う. その標本を w ≡ (u1, u2, ・ ・ ・ , un) として, 次のように新しい確率空間(Ω,F,P) を与える: Ω ≡ {w = (u1, ・ ・ ・ , un) : u1 ∈ U, ・ ・ ・ , un ∈ U} P[w] =(1/N)^n 最後の(1/N)がn乗になる理由が分かりません。 どなたか詳しく、分かり易く教えていただけないでしょうか。 お願いします。
42 名前:132人目の素数さん [2007/11/20(火) 16:31:45 ] >>38 カイ二乗検定をした後で有意差を検定するってことは、 ペア毎に差を比べるってことかな? その場合、風船の大きさが針ごとに正規分布してるかどうかが問題になるね。 サンプルがかなり大きければあまり気にしなくても良いけど。 正規分布を仮定するなら2標本のt検定だし、 そうでないなら変数変換をしてt検定するか、 変数変換せずにWilcoxon ranksum test をやる。 全ての変数をまとめて検定するっていうのなら、 正規分布ならANOVA、一般の場合はKruskal-Wallis testとかかな。 その場合、全体的に差が有意かどうかしか分からない。
43 名前:132人目の素数さん [2007/11/20(火) 16:36:05 ] >>41 問題文には書いてないけど「重複を許して」「順番も区別して」 n人を選ぶって意味だからでしょ。
44 名前:38 mailto:sage [2007/11/20(火) 17:04:32 ] >>42 氏どうも つれた風船の大きさと針の関係をU検定する場合 2つのグループ間での検定となりますよね? 大と中、大と小、大と極小、中と小、中と極小、小と極小(この6個の組み合わせ) これについてそれぞれU検定をかけて、例えば大>中、中>小、大>小(それぞれp<0.05)となったとしてこの場合、大>中>小(p<0.05)という判断でいいのでしょうか?
45 名前:41 [2007/11/20(火) 18:43:41 ] >>43 回答ありがとうございます。 何故、重複を許しても大丈夫なのでしょうか? 母集団の重複を許すと、この場合、国民ですので、同じ人を選ぶことになってしまいます。 そこがわからなくて(^^;
46 名前:132人目の素数さん [2007/11/21(水) 00:41:26 ] 1「そう思う」2「どちらかと言えばそう思う」3「わからない」 4「どちらかといえばそう思わない」5「そう思わない」 という選択肢で質問した場合、 「わからない」を除外したもので、1と2で「そう思うと回答したもの」 と4と5で「そう思わないと回答したもの」と考えてカイの二乗検定を 行ってもいいのでしょうか?
47 名前:132人目の素数さん [2007/11/21(水) 03:03:46 ] 標準正規確率変数XについてP(|X|=∞)は、ほとんど確実に0ですよね?
48 名前:132人目の素数さん [2007/11/21(水) 04:09:50 ] >>45 私も同じ人を選ぶのはおかしいと思うが、 そういう設定なのだから仕方ない。 もしかしたら、母集団に対して標本が極端に少なく、 重複する可能性が極めて低いので気にしていないのかも。 >>46 問題ない。 >>47 正規分布のsupportは(-∞,∞)だから、P(|X|=∞)=0だろ。
49 名前:132人目の素数さん [2007/11/21(水) 04:16:12 ] >>44 大>中>小が全て有意だと言うのは分かるけど、 まとめてp<0.05って書くのはちょっと気になるなあ。 全ての不等号は水準5%で有意、とかきちんと書いた方がいいんじゃ。 ちなみに>>42 も含めこのスレ>>30 以降の回答が今のところ全部自分。。
50 名前:132人目の素数さん [2007/11/21(水) 09:38:03 ] >>48 ありがとうございます! (P(|X|=∞)を質問した人間です。) いやいや、正規分布を誤解してましたm(__)m
51 名前:132人目の素数さん [2007/11/21(水) 15:11:01 ] つか、そもそも任意の実数 a について、P(X=a) = 0 だろ。 あと ∞ という数は無いから、lim[a→∞] P(|X|=a) = 0 な。
52 名前:132人目の素数さん [2007/11/21(水) 15:12:05 ] >>>46 >問題ない。 まとめるならなぜわけて回答させたんだよ??ってつっこみうるのは問題
53 名前:132人目の素数さん [2007/11/21(水) 20:03:18 ] >>51 そもそも、大数の強法則を考えれば、即座でしたね…。 チェビシェフの不等式→ボレル・カンテリの補題という王道パターンからでも示せる事に気が付きましたm(__)m(間違っていなければ。) てことは、期待値が有限の確率変数は確率1で有限値しか取らないってことになりますか?
54 名前:132人目の素数さん [2007/11/21(水) 21:50:46 ] >>52 解析する段階でメンドクサクなったからです。 本など見るとまとめた方がやりやすいと書いてありましたし。
55 名前:132人目の素数さん mailto:sage [2007/11/22(木) 01:32:16 ] >>51 は、何か根本的な勘違いをしている気がする。 測度論的な統計学を勉強する前にもうちょっと 基本的な数学のトレーニングをした方がいいんじゃない? >期待値が有限の確率変数は確率1で >有限値しか取らないってことになりますか? これは正しい。
56 名前:132人目の素数さん mailto:sage [2007/11/22(木) 01:37:03 ] >>52 きちんと考えればmultiple testingの問題なんだろうけど、 厳密な立証を求められる医薬系以外でそこまで問題にされることは 少ないのでは。 事後的なサーベイ程度なら、むしろ、区分をしすぎることによる カイ二乗検定の近似誤差の方が問題だろ。 そんな場合には、Fisher's exact test を使う。
57 名前:132人目の素数さん [2007/11/22(木) 09:48:41 ] >>55 >>53 です。どうもありがとうございますm(__)m 私は理系の人間では無いのですが、知っていなければ恥ずかしいような内容なだけに、疑問が解消されて良かったです。勘違いをして二年ほど過ごしていたようです…。
58 名前:132人目の素数さん [2007/11/22(木) 12:17:59 ] これアンカーミス?↓ 55 :132人目の素数さん:2007/11/22(木) 01:32:16 >>51 は、何か根本的な勘違いをしている気がする。 56>むしろ、区分をしすぎることによるカイ二乗検定の近似誤差の方が問題だろ。 だから何で区分して質問しておいて後でまとめちゃうんだよ、って
59 名前:132人目の素数さん [2007/11/22(木) 13:04:29 ] >>58 54でも答えてますけど、統計の本には2×5では大変なので まとめて「そう思う」「分らない」「そう思わない」と 2×3にした方がいいと書いてあったのですが・・・。
60 名前:132人目の素数さん [2007/11/22(木) 13:11:23 ] >>58 目的は有意差をみることだからまとめることには別に問題はない。 ただまとめ方自体が恣意的だと、正しい検定にならない。
61 名前:132人目の素数さん [2007/11/22(木) 15:10:30 ] いろいろ分類していった結果 25人と5人とか30人と10人とかになってしまいました(一応有意差あり) こんな小さなサンプルで有意差出しても大丈夫なんでしょうか?
62 名前:132人目の素数さん [2007/11/22(木) 17:06:35 ] >59 書名は? >60 まとめることの是非ではなく、1〜5で答えさせたことの是非
63 名前:132人目の素数さん [2007/11/22(木) 17:11:37 ] sociology.jugem.jp/?eid=182 www.okayama-u.ac.jp/user/hasep/articles/1994/9407Hasegawa/9407Hasegawa.html 2.2.8.数量データを無理やりカテゴリー分けする 独立変数や従属変数が連続変量であるにもかかわらず,それらを“上,中,下”群のように分けて分析することをいう. たとえば,調査の段階で具体的な年齢を質問しているにもかかわらず,分析の段階では“30歳以上”群と“30歳未満”群 に分けて各群の得点の差を検定したり頻度のχ2検定をしたうえで,“○○については年齢による差が認められた”というよ うに結論を下している発表を聞いたことがある.これとは別に,大学生に不安検査を行ない,不安得点に応じて“高不安群” ,“中不安群”,“低不安群”に分けて分析をしている発表を聞いたことがある.これらの例は少なくとも3つの問題点を含 んでいる.1つは2.2.7にも述べたように,事後的に作為的なカテゴリー分けが行なわれる可能性があること,第2に,連続 変量がもつ種々の貴重な情報をわざわざ捨てていることである.
64 名前:132人目の素数さん [2007/11/22(木) 18:26:06 ] >>62 >60 学部生の論文なので勘弁して下さい。
65 名前:132人目の素数さん [2007/11/22(木) 20:13:01 ] pが0.06とか0.05・・・ になる時って有意差はないが 大きな差があったとか言ってもいいのですか?
66 名前:132人目の素数さん [2007/11/23(金) 15:10:29 ] age
67 名前:132人目の素数さん mailto:sage [2007/11/23(金) 16:18:35 ] >>63 まあ、統計っていうのは正しい手法が自明なものではないので、 具体的なモデルを提示しない批判はあまり意味がない。 二つの順序変量の場合は、上の方で述べたように Wilcoxon exact testあたりを使うのが 情報のロスは少ないかも知れないとは思う。 ちなみにリンクの一つ目の書は「順序変量を誤って連続変量と みなした人」を想定して批判をするという意味のないことを やっていると思う。書評を読んだだけなので断定的なことは 言えないが。
68 名前:132人目の素数さん [2007/11/25(日) 17:43:10 ] 仮説検定をやっているんですけど、t値とp値が有意水準を片方だけ満たして 片方だけみたさないことってありますか?初心者ですいません
69 名前:132人目の素数さん mailto:sage [2007/11/26(月) 05:23:15 ] >>68 ないです。そもそもt値からp値を計算しているので。
70 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:25:50 ] Rで学ぶデータマイニングII ttp://www.amazon.co.jp/dp/4861671981/ を買おうかどうしようか迷ってるんだけど、 使った人はいるだろうか。 卒論の時系列解析の参考にしようかなと思ってる。 SとRは1年間大学で学んだし、web の R-tips はよく見るから 上記のIは買ってない。
71 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:41:53 ] Rスレで聞いた方がいいんじゃない?
72 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:49:22 ] うん…。書き込んで数学板検索してるうちにそう思った…。 マルチになるけど、Rスレにも書き込もうと思う。 もちろん、このスレも1週間はROMるから、 返事もらえてたらすごく嬉しい。ありがとう >>71
73 名前:132人目の素数さん mailto:sage [2007/11/28(水) 16:09:52 ] test ttp://www.uploda.net/cgi/uploader2/index.php?file_id=0000045121.jpg
74 名前:132人目の素数さん [2007/11/29(木) 08:44:08 ] つり橋効果の実験で、つり橋を渡っている時にたのめば65%、 渡ってからすこし後だと37%の男性が〜というデータがありますが、 その内訳が23人中7人で37%、20人中13人で65%となっており、 サンプル数が少なすぎる気もするのですが統計学的にはどうなのでしょうか。
75 名前:132人目の素数さん [2007/11/29(木) 09:14:56 ] 何を頼むの?
76 名前:132人目の素数さん [2007/11/29(木) 09:16:15 ] >>70 あの本に入ってるコードでGARCHはできるけど、使いたいモデルによるかも? 何がしたい??
77 名前:132人目の素数さん [2007/11/29(木) 09:34:18 ] >>75 連絡先をおしえてくれとかそんなことです。
78 名前:132人目の素数さん [2007/11/29(木) 10:45:08 ] !がよくわかんね
79 名前:132人目の素数さん [2007/11/29(木) 11:39:25 ] >>77 携帯で頼む訳ね 展望台からとか
80 名前:132人目の素数さん [2007/11/29(木) 12:10:17 ] wikipにリンクあった www.fpce.uc.pt/nucleos/niips/novoplano/ps1/documentos/dutton&aron1974.pdf
81 名前:132人目の素数さん mailto:sage [2007/11/29(木) 17:34:00 ] >>74 Fisher's exact test で、 p-value を計算してみたら、、、 おっと学校の宿題には答えない約束だったw
82 名前:132人目の素数さん [2007/12/02(日) 00:12:08 ] C言語かC++で仮説検定とか推定の計算をしたいのですが、 標準ライブラリにはχ2乗分布の累積密度関数などが入っていません。 統計処理用ライブラリやソースを公開しているサイトや書籍はありませんか?
83 名前:132人目の素数さん [2007/12/02(日) 15:17:29 ] 相関係数を計算する上での前提条件に正規性は必要ですか? また他の前提条件はあればご教授をお願いします。
84 名前:132人目の素数さん [2007/12/02(日) 17:15:40 ] >>82 www.alglib.net/specialfunctions/distributions/chisquare.php 本は Numerical Recipes in C(++) とか。 >>83 相関係数の定義に必要なのは分散・共分散だけ。
85 名前:132人目の素数さん mailto:sage [2007/12/03(月) 03:05:00 ] >>84 ありがとうございます。 前提条件はなしですか。 以下自分なりに調べてみたところ、注意すべき点としては、 直線性、外れ値を調べたほうがよいとありました。 直線性、外れ値を調べる方法で数値で判定する方法 (プログラムして自動で判定したい)があれば教えていただけないでしょうか?
86 名前:132人目の素数さん mailto:sage [2007/12/04(火) 02:29:09 ] >>84 ありがとうございます。 amazonで注文してみます。
87 名前:132人目の素数さん [2007/12/04(火) 23:43:51 ] 比率(変化率)の統計を求めるのは、統計学的に 許されるのでしょうか? つまり、 値A1,A2・・・An 値B1,B2・・・Bn があった時、Ai,Bi間の変化率[%] Ci = 100*(Bi-Ai)/Ai が A,Bと同じくn個あったとき、このCの標準偏差や分散を求める ということです。
88 名前:132人目の素数さん mailto:sage [2007/12/05(水) 00:17:08 ] >>87 よく使うよ。 株式や企業の収益率の変化とかが代表例かな。
89 名前:132人目の素数さん mailto:sage [2007/12/05(水) 20:39:33 ] >>88 さんきゅう
90 名前:132人目の素数さん mailto:sage [2007/12/05(水) 21:16:08 ] >>88 企業価値相関、算出しとる?
91 名前:132人目の素数さん mailto:sage [2007/12/05(水) 23:08:01 ] >>90 ごめん。やったことない。
92 名前:132人目の素数さん [2007/12/06(木) 18:17:12 ] 統計を勉強し始めたばかりなのですが、よく出てくる「ordination」という単語の日本語訳がよくわかりません。 いろいろ調べて意味はなんとなくわかってきたのですが、日本語にする時にどうすればいいのか分かりません。 初歩的な質問で申し訳ありませんが、どなたか教えていただけないでしょうか?
93 名前:132人目の素数さん [2007/12/06(木) 19:59:29 ] 多変量解析
94 名前:132人目の素数さん [2007/12/06(木) 21:34:09 ] >>92 ordinalを行うという名詞だな。順序づけ。 でも一般には単にオーディネーション。
95 名前:132人目の素数さん [2007/12/07(金) 11:37:03 ] >>92 .93 ありがとうございます! 辞書で調べてもキリストとか出てきてさっぱりだったんですが、もとは「ordinal」だったんですね! 例えば 「ordination diagram」 順序付けした図 「ordination axis」 順序付けした軸 「canonical ordination」 標準的な順序付け ってなるんでしょうか?
96 名前:132人目の素数さん [2007/12/07(金) 13:31:01 ] 携帯電話に関するのアンケートに協力してください。 2,3分で終わりますんで、、、 www.efeel.to/survey/cellularxphone/ 卒論で多変量解析をするため 回答数が必要なのでよろしくお願いします。
97 名前:132人目の素敵さん [2007/12/10(月) 23:29:02 ] 信頼係数と信頼区間の幅の関係ってどう説明したらいいんですかね? あと交互作用効果ってどんな効果ですか?
98 名前:132人目の素数さん [2007/12/11(火) 00:32:31 ] 正方形の同じ一点にaとbがあります。ここを始点とし、コインが表ならa裏ならb を隣の点に右回りで動かします。 この場合、n回目に二つとも同じ点にある確率を求めよ。
99 名前:132人目の素数さん [2007/12/11(火) 06:06:28 ] 統計学を勉強し始めなのですが、検定(?)という習ってない分野に入り、 「感染者230人のうち110人はその伝染病で2年後には死んでしまう。 2年後に死んでいる可能性は半々である(α=0、5)という仮説を検定しなさい。」 という問題でさっそくつまづいてます。どう解き始めるのですか? 簡単過ぎだと思われるのかわからないんですが、決して釣りではないです。 どなたか教えてください。お願いします。
100 名前:132人目の素数さん [2007/12/11(火) 13:49:51 ] >>99 「2年後に死んでいる可能性は半々である」という帰無仮説の下で 230人のうち何人死ぬかどうかの分布を求める(例えば、最も可能性 が高いのは115人)。サンプルサイズが割りと大きいから正規分布で 近似すると良い。そして、死者が110人以下になる確率がどのくらい あるのかを計算し、それが一定基準以下だったら帰無仮説を棄却 すればよい。
101 名前:132人目の素数さん [2007/12/11(火) 21:30:28 ] ビジネス統計学という授業の問題です…教えてください… 1.以下の9個の2変数データ(x,y)を用いて問に答えよ。 (−4,16)(−3,9)(−2,4)(−1,1)(0,0)(1,1)(2,4)(3,9)(4,16) (1)xとyそれぞれの平均値と分散を求めよ。 (2)散布図を描け。 (3)これらのデータを用いて相関係数を計算したところ、その値は0であった。この相関係 数と(2)で描いた散布図を参考にxとyの関係について分かることを述べよ。 2.平均20、分散9の正規分布における以下の範囲には全体の何%が含まれるか。 (1)20〜23 (2)22.4〜24.8 (3)17〜21.2
102 名前:132人目の素数さん [2007/12/11(火) 21:31:53 ] 竹中平蔵【びんぼうゆすりみたいな状態】になる インタビューで竹中の担当の読売新聞記者が全裸で穴にバイブを入れたまま殺された?自殺した?ことなど を、全部竹中にぶつけると【びんぼうゆすりみたいな状態】になった。 9.15 リチャード・コシミズ東京講演会 全編 (3時間24分) 【びんぼうゆすりみたいな状態】になった話は16分から www.asyura2.com/ もと総理が過去に3人を殺した話もでてくる
103 名前:132人目の素数さん mailto:sage [2007/12/11(火) 21:34:37 ] >>101 自分で解いてから質問しろかす
104 名前:132人目の素数さん [2007/12/11(火) 22:17:56 ] 100さんわかりやすい説明ありがとうございます。
105 名前:132人目の素数さん [2007/12/12(水) 10:51:43 ] いや、100は片側検定だが・・・
106 名前:132人目の素数さん [2007/12/12(水) 13:03:20 ] >>105 そうだけど、この場合に限ればどっちみち対称だから閾値だけの問題。
107 名前:132人目の素数さん [2007/12/12(水) 17:16:11 ] そこまでわかるなら99を書くはずがない
108 名前:132人目の素数さん [2007/12/12(水) 20:27:37 ] 数学系の学生で、今外れ値について勉強しています。外れ値を見つける方法として、グラブスの方法、トンプソンの方法、増山の方法をよく見つけたのですが他によく使われている方法はありますか? あと、トンプソン、増山の方法の中身(その式でなぜ外れ値が検証できるか)を説明しているサイトや文献あれば教えてもらえますか?よろしくお願いします。
109 名前:132人目の素数さん [2007/12/13(木) 05:17:36 ] >>98 斬か式で解く問題だね。大学入試に出る。東大京大が好きそうな問題だな。 n回目に同じになるためにはn-1回目は隣合っている&遅れてる方が動く必要がある。 n回目に同じ位置にいる確率をA(n)、一つはなれている確率B(n)、二つはなれている確率C(n)とすると、 A(n)=0×A(n-1)+(1/2)^2×B(n-1)+0×C(n-1) B(n)=1/2×A(n-1)+0×B(n-1)+1/2×C(n-1) C(n)=0×A(n-1)+1/2×B(n-1)+0×C(n-1) この3式からA(n)についての斬か式を作る。 A(n)=(1/2)^3×A(n-2)+(1/2)^3×C(n-2) まずこれを解く、 A(n)=1/8×A(n-2)+1/8×C(n-2) 比例定数1/8の斬か式より A(n)=〜………@ 同様にC(n)についても解く。 C(n)=〜………@ @AよりA(n)=〜
110 名前:132人目の素数さん mailto:sage [2007/12/13(木) 05:19:53 ] >>101 あまりに基礎すぎる。 自分でやったほうがいい。
111 名前:132人目の素数さん mailto:sage [2007/12/13(木) 07:57:25 ] >>101 は単発質問スレ立てし その直後に、ここに書き込みとな(マルチ) 誰か教えてください… science6.2ch.net/test/read.cgi/math/1197375253/ もう数学板に来なくていい ってか氏ね
112 名前:132人目の素数さん [2007/12/14(金) 00:05:58 ] 時系列解析のゼミに入ってるんですが、もしかしてこの分野ってマイナー気味ですか?
113 名前:132人目の素数さん mailto:sage [2007/12/14(金) 01:29:38 ] >>109 ありがとうございました
114 名前:132人目の素数さん mailto:sage [2007/12/14(金) 01:59:49 ] 俺だったら2項分布を mod 4 で集計しようとするけどね
115 名前:132人目の素数さん [2007/12/14(金) 18:24:54 ] 合ってますでしょうか。 ↓ ある模擬試験に 5000 人が受験したところ, その成績は,平均値 65 点,標準偏差 10 点の正規分布に従った。 (1) ある生徒が,75 点以上 85 点以下である確率を求めよ。 (2) この試験において,上位 5 %に入るためには,何点以上あればよいか。 (3) この試験において,順位が 100 番以内に入るためには,何点以上あればよいか。 問題文はつまりN(65,10^2)であり、 標準正規分布をz、この問題の正規分布をuと置く。 (1) P(75<_x<_85) zに変換して P(1<=z<_2) =P(0<=z<=2)-P(0<=z<=1) 正規分布表より =0.477-0.341=0.136 答え 13.6%
116 名前:115 [2007/12/14(金) 18:25:29 ] (2) P(z<=u)=0.05となるuを探せばよいので、 P(0<=z<=u)=0.5-0.05=0.45 正規分布表からu=1.64 uからzへの変換式から (x-65)/10=1.64 これを解いて 72.9点 答え 72.9点以上あればよい (3) 100/5000=0.02 P(z<=u)=0.02 となるuを探す。 P(0<=z<=u)=0.5-0.02=0.48 分布表より0.48は2.05。これを変換式に代入し、 (x-65)/10=2.05 x=85.5 答え 85.5点以上あればよい
117 名前:132人目の素数さん [2007/12/14(金) 19:09:55 ] 片側しか見ていないから×
118 名前:132人目の素数さん mailto:sage [2007/12/14(金) 22:07:24 ] あるデータを収集し、その分析をしなくてはいけません。 SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。 ランダムにN=40のサンプルを2群に分けました。 属性が等質であることは確認しました。 介入群と対照群の2群に対して、 介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。 介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。 教えてちゃんですみません。 よろしくおねがいします。
119 名前:132人目の素数さん mailto:sage [2007/12/15(土) 02:22:52 ] >>117 意味分からん。>>115-116 であってると思うけど。
120 名前:132人目の素数さん mailto:sage [2007/12/15(土) 02:31:27 ] >>118 各時点で比較したいだけなら、単なる二標本の検定でしょ? 普通にWilcoxon exact rank sum テストとかをやればよいのでは。 やり方がよく分かんなかったら 無理矢理順序尺度を二値の変数にして、 カイ二乗検定とかでも大丈夫かも。
121 名前:118 mailto:sage [2007/12/15(土) 12:53:38 ] >>120 ありがとうございます。 私の書き方が不足していたのですが、 最終的に「介入することで○○分後の尺度に変化が見られる」という結果を導き出したいと思っています。 となると、 1.2群それぞれの時間経過に伴う尺度の変化についてRepeated Measures ANOVAをして 2.それで前後の値が変化したといえるのかどうかについて検討し 2.さらにその各時点ごとにWilcoxon exact rank sum testをしてそれが2群で違うといえるのかを見る ・・・・・・ということでよろしいのでしょうか? 本当に本当に初歩的な質問でごめんなさい。 決して釣りではありませんので、よろしくお願いいたします。
122 名前:132人目の素数さん mailto:sage [2007/12/15(土) 15:56:29 ] >>121 うーん、きれいな定式化は難しそうな問題だなあ。 分析方法は結構主観によるところが大きいと思う。 自分だったら、ひとまず全部の情報を一つのモデルに盛り込むのは 難しいと考えて二時点間だけの比較をする。 (例:直前と直後、直前と5分後、直前と10分後...と試して、 最終的に、どの時点間で差が有意になるのか見ればよい。) でもって、順序尺度の2時点間の差を連続な変量とみなせるのか 単なる順序尺度の差とみて「改善、不変、悪化」くらいに分ける べきなのかを考えて、適切なモデルを選択する。 あとは、単なる2標本の検定。 頑張ればもうちょっと凝ったモデルも可能なのかも知れないけど。
123 名前:132人目の素数さん mailto:sage [2007/12/16(日) 07:51:09 ] 国友 ゲンダイ統計学 日経文庫 が書店においてない。 大学の図書館にも置いてないのにはびっくりした。
124 名前:118 mailto:sage [2007/12/16(日) 13:22:38 ] >>122 レスが送れてすみませんでした。 なるほど、そうですよね。 とても貴重なアドバイスをありがとうございます。 頑張ってみます。すごく感謝しています。
125 名前:132人目の素数さん [2007/12/19(水) 19:31:18 ] サンプルが1つずつしかない表(4行×2列、1行目、1列目はラベル)のサンプル間の有意差の求め方ってありますか? ソフトはエクセル統計を使ってます
126 名前:132人目の素数さん mailto:sage [2007/12/19(水) 19:44:25 ] A大学は卒業生の就職率について、文科系、理科系ともにB大学よりも高いと宣伝している。 このことはA大学全体でB大学よりも就職率が高いことを意味するか。 問題文からして、意味しなさそうなのですが理由がわかりません。ヒントでいいので教えて 頂きたいです。お願いします。
127 名前:132人目の素数さん mailto:sage [2007/12/20(木) 00:58:44 ] 文系、理系各々の就職率から、大学全体(文+理)の就職率を求める式を導く。
128 名前:132人目の素数さん [2007/12/20(木) 01:05:35 ] A 文系 1/1 =100% 理系 29/99 =28% B 文系 9000/9900<100% 理系 20/100 =20% 全体では A 30% B 90.2% 反例
129 名前:132人目の素数さん mailto:sage [2007/12/20(木) 02:21:44 ] >>125 データは、3行一列ってこと? 単に、「3つのグループの発生割合が同一」という帰無仮説を 検定したいだけなら、カイ二乗検定をすればよいのでは。 例えば、(15,10,5) がデータなら、(10,10,10)を期待値として カイ二乗統計量を計算。
130 名前:132人目の素数さん mailto:sage [2007/12/20(木) 08:15:32 ] >>127 ,128 ありがとうございます。 Bは就職率の高いほうに人数が偏っているってことですね。
131 名前:132人目の素数さん [2007/12/20(木) 09:51:14 ] >>130 反例は一例だから、一応、一般化して解いた方がよい。 たぶん違う大学同士の異なる学科の人数の関係が問題になってくると。
132 名前:132人目の素数さん [2007/12/20(木) 11:15:05 ] >>129 ありがとうございます。 データは3行1列です カイ二乗検定は正規分布していなくても使えるんですか?
133 名前:132人目の素数さん mailto:sage [2007/12/20(木) 13:30:19 ] >>132 「正規分布してる」って何のこと言ってるんだよ。 主語くらいちゃんと書いてくれ。 >>125 の「サンプルが1つずつしかない表」 というのも意味が良く分からないし。
134 名前:132人目の素数さん [2007/12/20(木) 14:46:40 ] CANOCOでCCAをしたいんですが、日本語で説明しているいいサイトないですかね?
135 名前:132人目の素数さん mailto:sage [2007/12/22(土) 00:05:27 ] 対応のない2元配置の分散分析を行おうと思っていたデータを 各群それぞれ Shapiro-Wilk 検定にかけてみたら全てアウトでした. それでノンパラメトリックな方法でやろうと思うのですが, この場合どんな方法が適当でしょうか?
136 名前:132人目の素数さん mailto:sage [2007/12/22(土) 00:51:46 ] >>135 Friedman検定でないの?
137 名前:132人目の素数さん [2007/12/23(日) 15:21:23 ] 正規確率プロット図をEXCELで描きたいのです。 基準化したデータをx軸まではわかります。 y軸に順位に応じた期待する値を入れるとあるのですが、『順位』という言葉に引っ掛かっています。 どのように図を描けばよいのでしょうか?
138 名前:132人目の素数さん mailto:sage [2007/12/23(日) 19:52:09 ] 現時点で世界的標準と呼べる確率・統計の本ってどれ?
139 名前:132人目の素数さん mailto:sage [2007/12/23(日) 20:17:26 ] fumio hayashi Econometrics
140 名前:132人目の素数さん [2007/12/24(月) 04:12:54 ] 計量経済信者うぜぇ
141 名前:132人目の素数さん [2007/12/24(月) 04:21:02 ] 日本人の書いた世界的な本なら、Ikeda・Watanabeか?
142 名前:132人目の素数さん [2007/12/24(月) 05:44:56 ] 重回帰分析を実施する前に、 ◆正規性検定(歪度、尖度)で調べる→不可なら変数変換 ◆直線性(散布図)→不可なら変数変換 と上記2つを満たすために変数変換する手順、方法をご教授お願いします。
143 名前:132人目の素数さん [2007/12/25(火) 07:40:12 ] >>142 実際のところどうなんだろ? まず重回帰分析をやって決定係数をだした後に、マルチコ、外れ値、正規性や直線性を決定係数で判断しながら変数変換するのかな。 家にあった5冊の書籍を確認したが手順がわからないね。
144 名前:132人目の素数さん [2007/12/25(火) 16:10:05 ] 統計ソフトの英文マニュアルを読んでいます。 CON-file の「CON」は何の略字でしょうか?
145 名前:132人目の素数さん [2007/12/25(火) 22:10:24 ] キツネ
146 名前:132人目の素数さん mailto:sage [2007/12/26(水) 02:17:00 ] 池田渡辺ってだれよ?
147 名前:132人目の素数さん mailto:sage [2007/12/26(水) 02:45:54 ] スタンダードは ホーエルでは?
148 名前:132人目の素数さん mailto:sage [2007/12/26(水) 02:46:29 ] Fumio Hayashiこそ世界の林です 豊田先生の著書なんかもいいかもしれんね。
149 名前:132人目の素数さん [2007/12/26(水) 04:07:57 ] だから、林は計量経済学であって、確率・統計じゃないだろ。 計量経済学って結局確率・統計の深い所まで書いてないだろ? 渡辺信三を知らないのか?
150 名前:132人目の素数さん [2007/12/27(木) 07:31:25 ] 重回帰分析の手順って確立されていないということですか?
151 名前:132人目の素数さん [2007/12/27(木) 16:52:25 ] 今数理統計学を大学で履修してるんですけど、 全く理解しないで暗記だけでテスト受けてる感じです。。。 知識詰め込むだけの数学はつまらなくてしょうがないです。 皆さんはどうやって数理統計を勉強してますか? なにかおすすめの参考書などありますか? 大体有名な分布やそれらの積率母関数の求め方はちゃんと頭に入ってるんで、 これを生かしたいんです。
152 名前:132人目の素数さん [2007/12/27(木) 17:43:36 ] ★★小泉純一郎と安倍晋三は朝鮮人★★ コピペして各板に貼り付けよう 知人にも話そう 小泉純一郎 ・戦前大臣を務めた祖父小泉又次郎は純粋な日本人とされる。だが、純一郎の帰化朝鮮人である父が鮫島姓を買い取り 又次郎の娘をたぶらかして婿として小泉家に入る そこで小泉家は帰化朝鮮人である純一郎の父に乗っ取られた 参照ja.wikipedia.org/wiki/%E5%B0 上下くっけて %8F%E6%B3%89%E7%B4%94%E4%B9%9F ・父親の純也は、鹿児島東加世田の朝鮮部落の出身者といわれる 日大卒業名簿には、純也の日本名はなく、 見知らぬ朝鮮名が書かれているという 純也は朝鮮人の帰国事業、地上の楽園計画の初代会長であった ・結婚後、子供をもうけ即離婚した宮本佳代子は在日企業エスエス製薬創業者の孫 ・小泉の元秘書官の名前は飯島勲←注目 帰化朝鮮人 ・派閥のドン森喜朗も生粋の朝鮮人 ←森も帰化人がよく使う通名 ・小泉は、横須賀のヤクザ、稲川会と関係が深い 安倍晋三 ・岸家 毛利元就が陶晴賢と厳島沖で戦い大勝を収めた際、寝返って毛利方についた船の 調達人が「ガン」と称する帰化人であったという 毛利はその功績によって「ガン」を 田布施周辺の代官に召したてた このガンを岸家の先祖とする説がある ・祖父岸信介が文鮮明と共に 反共団体 国際勝共連合(統一教会)を設立 ・官房長官時代統一教会「合同結婚式」に祝電を送り、話題に ・安倍のスポンサーは、下関の朝鮮人パチンコ業者である ・グリコ森永事件時、明らかになった帰化朝鮮人企業森永のご令嬢と結婚 ・そのわが国のファーストレディーは電通(会長成田豊、半島生まれの帰化人)勤務という分かりやすい 経歴の持ち主の朝鮮の血筋 ・韓国、中国の留学生に日本の企業に入ってもらうために住居費分、学費免除分、生活費など月計20万〜30万円相当の支給 日本人のワーキングプア層を全く省みない また帰化系在日系朝鮮人が日本の企業で技術を盗み、半島の現代などの企業に 伝授していることが深刻な問題になっている
153 名前:132人目の素数さん [2007/12/27(木) 18:06:11 ] >>151 統計数理はあとで役立つ。 基礎トレだから手抜きせずマジにもならずやっとくのが吉。
154 名前:132人目の素数さん [2007/12/28(金) 01:01:26 ] すみません重回帰分析を行っているのですが 定数項を含む場合と含まない場合で相当結果が違ってきます。 特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。 また、説明変数のt値なども両者で相当な違いが見られます。 定数項を含む場合の寄与率の導出等については文献があるのですが 定数項を含まない場合についてがどうしてもよくわかりません。 なぜこのような事になるのか・・・ また、どちらの結果を使うのがよいのか・・・(定数項を分析の際入れるか) どなたかご教授頂けないでしょうか?
155 名前:132人目の素数さん mailto:sage [2007/12/28(金) 01:10:34 ] >>154 目的因子と説明因子の関係が原点を通るか通らないかで判断する。
156 名前:132人目の素数さん [2007/12/28(金) 03:03:19 ] >>138 graduate の入門レベルの本だと、統計学やる人向けはこんな感じ。 測度論:Billingsley, "Probability and Measure" 推定:Lehmann and Casella, "Theory of Point Estimation" 検定:Lehmann and Romano, "Testing Statistical Hypotheses" Lehmannの2冊は古いし測度論的な記述が完全に一般化されてない箇所も あるけど、総合的にはこれを超える本はないような気がする。 Bayesとかは詳しく知らん。 回帰分析や分散分析は、なかなかいい本がない。 (昔に書かれた数学的に細かい本ならあるが。) 確率論に関しては、 Durrett "Probability: Theory and Example" Kai Lai Chung "A Course in Probability Theory" Kallenberg "Foundations of Modern Probability" あたりか? Durrettは簡潔な教科書スタイルの本だがギャップも多く難しい という評判、Kai Lai Chungは評判はいいがやや記法が古い。 Kallenbergは辞書のような本。 補足、追加、反対意見などある人ヨロ。
157 名前:132人目の素数さん [2007/12/28(金) 11:06:27 ] >>155 ありがとうございます つまり仮定しているモデル式に定数項が含まれないなら 定数項を含まないモデルで解析という事でしょうか?
158 名前:132人目の素数さん mailto:sage [2007/12/28(金) 13:19:11 ] >>157 まぁそういうこと。 xが0の時yは0なら定数項はなし(原点を通るから比例関係)
159 名前:132人目の素数さん mailto:sage [2007/12/28(金) 18:53:06 ] 勝手にモデルを決めたら、結果を認めて貰えない。 一般に線形回帰モデルは定数項付きなので、 何かの理由で定数項無しの特殊なモデルを使いたい場合は、 まず定数項が統計的に有意じゃないことを示す必要がある。
160 名前:132人目の素数さん [2007/12/29(土) 07:36:36 ] どうか、お願いします。 バリマックス回転したいんですが、エクセルしかなく、 さっきR言語をインストールしたんですがさっぱりわかりません。 R言語のサイトで ttp://aoki2.si.gunma-u.ac.jp/R/src/all.R が紹介されていて、この関数を入れるとバリマックス回転ができるそうなんですが ここの関数を使おうとしてもなぜか正常に表示されず、使用することができません。 どうか、何か、妙案を出していただけませんか? お願いします。
161 名前:132人目の素数さん mailto:sage [2007/12/29(土) 12:38:08 ] >>160 Rのスレで質問したほうがすぐに答えてくれると思う
162 名前:160 mailto:sage [2007/12/30(日) 09:04:36 ] 了解です。
163 名前:132人目の素数さん mailto:sage [2007/12/30(日) 21:27:39 ] 信頼区間の信頼率と被覆確率について教えてください。 信頼率というのは、 例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは 「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか? また、被覆確率というのは、 ある文献では信頼率と同じことと説明されていて、 他所では「作られた信頼区間の中に母数の推定量が入る確率」である、 と説明されていました。 これはどちらが正しいのでしょうか?
164 名前:132人目の素数さん mailto:sage [2007/12/30(日) 23:22:22 ] 「信頼率」は「信頼係数」のことかな? だと本来は同じ。 しかし二項分布とかポアソン分布などの離散型確率変数の場合、 正確な信頼区間は作れない。 よって名目上の信頼係数と実際の被覆確率とが違うのは普通。
165 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:37:27 ] 正規分布の問題で 高1男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。 このとき、無作為に男と女を1人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。 (実際の問題には平均、分散の具体的数字が入ってます) というのがあって、解き方がわからないんですけど どなたかアドバイスお願いします。
166 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:52:21 ] ヒント:差 Y-X の分布
167 名前:132人目の素数さん mailto:sage [2007/12/31(月) 01:14:52 ] >>166 アドバイスありがとうございます。 Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。 行き詰まったのでまた明日考えることにします。
168 名前:132人目の素数さん mailto:sage [2007/12/31(月) 10:30:51 ] >>165 Xとなる確率はわかる。 YがX以上となる確率もわかる。 最後にXで積分すると全体の確率がでる。
169 名前:132人目の素数さん [2007/12/31(月) 19:36:35 ] >>168 で、正規分布の密度関数の二重積分まで行って、 お手上げになる。 それが解けるようなヤシは、そもそも質問しないから。
170 名前:132人目の素数さん mailto:? [2007/12/31(月) 19:43:09 ] >>167 Ganbarin sai yoh !
171 名前:132人目の素数さん mailto:sage [2007/12/31(月) 20:13:07 ] べき分布について詳しく書いてあるようなページはないですかね? もしくは本でも良いんですが
172 名前:132人目の素数さん mailto:sage [2008/01/01(火) 16:38:29 ] >>169 > で、正規分布の密度関数の二重積分まで行って、 > お手上げになる。 つまり、その二重積分のやり方を教えればいいということか。
173 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:24:41 ] 統計学を独学するのにいいテキストを探しています 候補としては東大出版の基礎統計学I 統計学入門か 統計学のための数学入門30講を考えているのですが 評判というか使い勝手はどうなのか教えていただけないでしょうか? 上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです よろしくお願いします
174 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:49:02 ] 後者は統計を学ぶためのあくまで「数学」の本だよ 数学がわかるなら必要なし
175 名前:132人目の素数さん [2008/01/01(火) 22:52:51 ] >>173 候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176 名前:ふ [2008/01/01(火) 23:09:35 ] 〉173 学部はどこなの? 数学はどのていどわかるの? いままで読んだ統計学の本は? 統計学を学ぶ目的は? いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:31:40 ] 173です 説明不足だったことを反省しています >>176 経済学部なので数学は半端に知っているという程度です(問題演習はそこそこできるが、証明はできません) 統計の本は読んだことがありません 授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています 最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました >>175 上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした >>174 統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:35:47 ] 173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。 専門分野 教育学 数学理解 高校のころ2Bやって以来数年間触ってないので、ところどころ忘れている(3Cは未履修)。 既読書籍 「社会の見方、測り方―計量社会学への招待」 「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹 あとは、講義等で講師が自前で作成した教材等。 学ぶ目的 数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。 お手数しますが、何かお勧め頂けると有難いです。 宜しくお願いします。
179 名前:132人目の素数さん [2008/01/01(火) 23:49:10 ] >>177 統計学を勉強する目的は何ですか? 研究、資格試験などありますが。
180 名前:132人目の素数さん mailto:sage [2008/01/02(水) 00:34:18 ] 私は最近統計の勉強を始めた者です。 テキストは東大出版会の統計学入門を使ってます。 この本に書いてることで疑問があるのですが、 『母平均を推定する問題では、母分散が既知なら正規分布、 母分散が未知ならt分布を使う。 母分散を推定する問題ではカイ二乗分布を使う。』 という理解でよいでしょうか? この理解ではダメな問題があったので、理解が正しいか教えてください。
181 名前:ふ [2008/01/02(水) 01:23:11 ] 〉177 困りましたね。 本来、統計学は独学の困難な学問ですからね。 文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。 面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。 だれか先生につかないと。
182 名前:132人目の素数さん [2008/01/02(水) 01:43:14 ] >>180 正規分布ならOK. 推定の一般論について読めばそれの理解がよくないことがわかる。
183 名前:132人目の素数さん [2008/01/02(水) 02:58:44 ] >>177 東大の統計学入門は、初心者向けの商品カタログみたいな感じだから 独学には向かないと思うよ。そのレベルなら 蓑谷 千凰彦「統計学入門」東京図書 がいいかも。もっと数学的でも良ければ、 竹村 彰通「現代数理統計学」創文社 とか。
184 名前:132人目の素数さん [2008/01/02(水) 06:43:36 ] 統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185 名前:132人目の素数さん [2008/01/02(水) 07:56:36 ] >>177 統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。 統計は確率論の1つの応用分野である。で、確率論をやるのなら線型代数、微積分 及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。1)線型代数:岩波基礎 数学講座の線型空間、2)微積分:岩波基礎数学講座の解析入門1〜4、3)集合と 位相:岩波の現代数学概説1、2。その中でとりわけ重要なのは微積分、集合と位相 である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、 「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概 説2」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。 これとほぼ並行して、次のことをやる。 1:線型代数の穴埋め。 これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「2次形式」で十分。 2:少々の抽象代数。現代数学概説1の群、環、体あたりを読んでみよう。 3:複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき 或いは必要になったときに読んでいけばよい。 4:関数解析。お勧めは「岩波基礎数学講座の関数解析」。 5:Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門5」。 6:微分方程式。お勧めは岩波講座の現代数学への入門の 「力学と微分方程式」、「熱・波動と微分方程式」 あたり。 7:岩波講座応用数学。色々読んでみるとよい。役に立つ筈。 ついでに言えば、腕力も鍛えておいた方がよい。
186 名前:132人目の素数さん mailto:sage [2008/01/02(水) 12:17:30 ] >>182 教えてもらってありがとうございます。 とりあえず今の理解でおおまかには大丈夫なら、 まず先に全体を終わらせるよう先に進めます。
187 名前:132人目の素数さん [2008/01/02(水) 13:29:57 ] >>186 大丈夫なのは正規分布の母平均の推定の場合に限ります。 東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。 漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの 統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188 名前:132人目の素数さん mailto:sage [2008/01/02(水) 14:10:47 ] 東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。 噛めば分かるのだが、すっと理解できるようには書いてない。 内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189 名前:132人目の素数さん [2008/01/02(水) 14:50:15 ] 系列範疇法について質問があります。 各カテゴリーの相対頻度と等しい面積を持つように 正規分布を分割したいのですが、 具体的にどうすればどうすればよいのでしょうか。
190 名前:132人目の素数さん mailto:sage [2008/01/02(水) 19:32:13 ] >>180 って他のスレで酷い質問しててワロタんだがw
191 名前:132人目の素数さん [2008/01/03(木) 03:15:42 ] 移動平均の最適パラメータってどうやって求めるんですか?
192 名前:132人目の素数さん mailto:sage [2008/01/03(木) 06:24:38 ] 変数XがA-B群間のt検定では有意差が出ないのに 判別分析(ステップワイズ法)ではA-B群の判別に寄与する変数として投入される ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ,なんだかしっくりこない
193 名前:132人目の素数さん mailto:sage [2008/01/03(木) 18:32:56 ] コーシー分布の平均値って事実上ゼロでしょ?
194 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:37:43 ] >>193 「事実上」ってなんだ
195 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:50:06 ] >>192 散布図を描くとするでしょ 右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。 横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。 こういうのでどうでしょうか
196 名前:132人目の素数さん [2008/01/03(木) 22:52:06 ] >>193 左右対称な分布なら 平均 = 中央値 と定義すればそう。
197 名前:132人目の素数さん [2008/01/03(木) 23:01:51 ] >>193 平均と中央値をごちゃごちゃにしてはだめです。 平均と中央値は中心という概念では同じですが、定義は全く違います。
198 名前:132人目の素数さん mailto:sage [2008/01/04(金) 13:15:44 ] コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない?
199 名前:132人目の素数さん mailto:sage [2008/01/04(金) 14:47:30 ] >>195 あー,なるほど,そう言われるとよく分かる.
200 名前:132人目の素数さん mailto:sage [2008/01/04(金) 17:16:13 ] >>198 コーシー分布にしたがってランダムに数を生成させる方法を述べよ 仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201 名前:132人目の素数さん [2008/01/04(金) 18:42:25 ] >>198 >>200 コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。 あと位置と尺度を一般化したコーシー分布、例えば ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%82%B7%E3%83%BC%E5%88%86%E5%B8%83 の母数は、「母平均」や「母標準偏差」ではない。 母平均も母分散も存在しないからね。 また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。 というか、そもそも推定している対象が存在しない。 コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。 つまり、裾長分布の兆候を持つデータの位置母数推定で、 標本平均を使うのは危険。経験的には、外れ値を除外したり、 両端を一定率で除外した調整平均が使われている。 一方、正規分布など特定の分布では少し効率が悪いが、 「標本中央値なら常に安全」という教訓になるのがコーシー。
202 名前:132人目の素数さん mailto:sage [2008/01/04(金) 18:49:11 ] コーシー分布にしたがってランダムに数を生成させる方法はある。 まず、(-∞, +∞)の一様分布の確率変数p(x)を用意する(ただし、厳密な意味ではこれが一番難しい)。 あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、 q(y)=Σp(φ(y))・dφ(y)/dy で定義されるq(y)で数を生成すればOK。ただし、x=φ(y)は二価関数なので、単調増加の領域と 単調減少の領域に分けてΣを計算すれば良い。
203 名前:132人目の素数さん [2008/01/04(金) 18:55:38 ] >>202 それ合ってんの?
204 名前:202 mailto:sage [2008/01/04(金) 18:57:21 ] >>203 知らんw
205 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:00:33 ] (-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか?
206 名前:132人目の素数さん [2008/01/04(金) 19:00:37 ] >>204 何だ知ったかか
207 名前:132人目の素数さん [2008/01/04(金) 19:07:15 ] 何で無駄に(-∞, +∞)で考えてんだよ もっと効率よくしろ
208 名前:202 mailto:sage [2008/01/04(金) 19:09:23 ] >>206 小針の確率・統計入門のP49§3確率変数の変換に書いてある
209 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:12:22 ] 標準正規の比や一様分布のtanで生成するだけだろ
210 名前:201 mailto:sage [2008/01/04(金) 19:20:40 ] 訂正 ×arctan 変換で作れるよ。 ○ tan 変換で作れるよ。 スマソ。逆が2回出てくる関係なので、書く時に確かめずに勘違いした;
211 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:33:57 ] 理論的に生成可能かどうかは問題ではない 問題は生成した数からどうやって>>198 の言う平均を計算するかだ そもそもこの計算自体が既に不可能だろうという話
212 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:48:33 ] 実測値の算術平均なら何の問題もなく計算できます
213 名前:132人目の素数さん mailto:sage [2008/01/04(金) 21:27:51 ] >>212 >>198 の検証をたのむ
214 名前:132人目の素数さん mailto:sage [2008/01/04(金) 23:59:26 ] だーかーらー コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。 どれだけ大標本でもだ。つまり平均取っても無意味。 >>198 は「標本平均は必ず確率収束する」と思ってる厨房w
215 名前:132人目の素数さん mailto:sage [2008/01/05(土) 07:16:26 ] 「事実上の平均」に面白い定義を与えられるかどうかだな。 乱数を[-d,d]にtruncateした上で平均を取って極限をとり、 最後にd→∞にしてみるとか?
216 名前:132人目の素数さん [2008/01/05(土) 10:53:42 ] クイズ問題のサイトを作ろうと思っているのですが、 1万のクイズを、複数の人に自由に解かせるとして、 (クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、 一度、解くのをやめ、後でまた解いても良い。) どのような公式で、ランキングをつけたら良いのでしょうか。 例えば、単純確率だと10問中5問正解した人と、 100問中50問正解した人は、同じランクになりますが、 果たして、これは、同じランクで良いのでしょうか。 そうすると、1問中1問正解した人は、いつも1位となってしまいます。 何か、良い公式がないでしょうか。 よろしくお願いします。
217 名前:132人目の素数さん mailto:sage [2008/01/05(土) 13:20:23 ] 単純に 正解数−不正解数 じゃダメ?
218 名前:132人目の素数さん mailto:sage [2008/01/05(土) 15:16:41 ] >>216 検定の考え方を使えば多少は重み付けも出来るが 明確に順序をつけるのは無理だろう ゲームとして割りきるなら 正答率*正答率*回答数 くらいで良いんじゃないかと思う。 理論的根拠は無い。
219 名前:132人目の素数さん mailto:sage [2008/01/05(土) 18:26:36 ] >>216 乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の 事象を n 回独立に繰り返した時の二項分布になるとする。 この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。 仮に1問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。 正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、 マハラノビス距離空間上のランキングが得られる。 p の推定値は、参加者全員の 正解数合計 / 解いた問題数合計 が良いけど、それだと毎回ランキングが変化する。 問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。
220 名前:132人目の素数さん mailto:sage [2008/01/05(土) 20:20:15 ] >>215 コーシーの主値
221 名前:219 [2008/01/06(日) 18:34:11 ] >>216 数値例が無かったので補足。 選択式の回答方式だと思うので、すべて「4択」だとしよう。 そうすると、「でたらめに答えて」当たる確率は p=1/4。 この時 μ = n/4、σ = (√n√3 )/ 4。 z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。 n x z D(偏差値) 1 1 1.22 62 … 1問中 1問 10 5 0.65 56 … 10問中 5問 100 50 2.04 70 … 100問中 50問 1000 500 6.45 115 … 1000問中 500問 ・正規分布近似を使っていることになるので、精度条件として だいたい np≧5 (p≦1/2) または n(1-p)≧5 (p>1/2) が必要。 よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。 ・偏差値 D が使用する有効精度内で同じ場合には、問題数 n の大きい方を上位とする。 ※1次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。
222 名前:132人目の素数さん [2008/01/06(日) 19:18:40 ] くだらん。 正解数−不正解数の方がよっぽど役にたつ。
223 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:47:21 ] >>222 Aは、100問全問正解(正解率100%)で 100 − 0 = 100。 Bは、200問中151問正解(正解率75.5%)で 151 − 49 = 102。 B > A でいいのか?
224 名前:132人目の素数さん [2008/01/06(日) 19:53:31 ] いい。 100問正解の時点で、Aは残りの49問を正解する確証がどこにもないから、 ランキングとしては151問正解のBよりも低くランキングされるのが妥当。
225 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:54:36 ] 上位一割くらいしか表示しないなら>>218 がシンプルでいい >>219 みたいになると仮定の妥当性とかいろいろ面倒だからな
226 名前:132人目の素数さん [2008/01/06(日) 19:55:45 ] ただし、問題文ごとに独立性がないのなら話は別。 過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら 単純な正答率によるランキングが妥当。
227 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:05:22 ] 224=226です。
228 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:07:18 ] 俺が野球チームの監督なら、200打席151安打のバッターと、 100打席全安打のバッターなら後者を使うけどな
229 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:14:35 ] 何が正しい計量と判断できるかは、問題文(群)の構成に強く依存する。 問題文の独立性が保障される様な理想的な構成なら、正解数−不正解数が正しい計量となる。 が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。
230 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:27:48 ] >>226 , >>229 が言ってるのは、「独立性」ではなく「異質性」だな。 つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。 量子力学の問題の次は文学の問題とか、、、 しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ
231 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:31:06 ] クイズという問題をどうとらえるかだが、 あらかじめ確定した操作をランダムな順序で対象に実行して その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。 と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。
232 名前:132人目の素数さん [2008/01/06(日) 20:33:04 ] こういう話題が出てきてwktkしてきた >>180-215 のような低レベルな話より断然興味深い
233 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:54:08 ] 出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。 ネイマン・ピアソンの考え方に従うか ベイズの考え方に従うか 両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって どういう統計量で判断するかが決まる。
234 名前:219=221 mailto:sage [2008/01/07(月) 00:52:43 ] >>225 「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの 回答方式なら、>>218 でも良いよ。なぜなら z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p)) において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、 y = x/√n - np で回答者同士を比較しているのと同じ。この値は p → 0 の時 y → x/√n = (√n) (x/n) = (√回答数)・正答率 なので、自乗すれば >>218 の指標になる。 ※知能や知識は、完全不確実状態(混沌)からどれだけ確実状態(秩序) に近づいたかで計るのが、情報量的な考え方。 ただし、誤知能や誤知識という方向への脳内秩序もアリなので、 「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。
235 名前:234 mailto:sage [2008/01/07(月) 00:59:44 ] × y = x/√n - np ○ y = x/√n - (√n)p
236 名前:132人目の素数さん mailto:sage [2008/01/07(月) 18:36:12 ] >>234 それが>>225 でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。 そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、 結局のところ意味があるのはpに依存しない部分だけというわけだ。 お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ
237 名前:132人目の素数さん mailto:sage [2008/01/07(月) 21:24:23 ] すみません、お教えください。4群の共分散分析をやっていて、 回帰直線の傾きが有意に違う、という結果を得ています。 で、1つのグループAを除いて3群で検定すると傾きに有意差は見られません。 グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、 ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか?
238 名前:234 [2008/01/07(月) 21:36:34 ] >>236 まあまあ抑えてw、たかがクイズのランキングの話。 で、(初等教科書的な)二項分布モデルが気に入らないようだけど、 こう考えればどうかな? クイズの回答はすべて選択式で、選択肢の数は常にM個とする。 また出題時に、選択肢の順序は乱数でかき混ぜる。 別室に居る見えない回答者にクイズを出題して、その答えのみから 回答者がサイコロのような乱数器(完全無知脳)を使っているか、自分自身 (幾分の知能を保有)でマジに答えているかを判定する。 もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、 記述言語は HTML+Javascript で十分だろう。OSは何でも良いw この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。 したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、 >>219 , >>234-235 の尺度を使うことなる。 つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。 不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。
239 名前:238=234 mailto:sage [2008/01/07(月) 21:47:00 ] × 使うことなる。 ○ 使うことになる。
240 名前:132人目の素数さん mailto:sage [2008/01/07(月) 22:11:03 ] >>237 ボンフェローニでAと他の群がすべて棄却され、 他の群同士は棄却されないならそれでいいんじゃない? (ボンフェローニだと補正がきつすぎてAと他の群で 棄却されないものが出てくるのなら問題だが。)
241 名前:237 mailto:sage [2008/01/07(月) 23:39:27 ] >>240 ありがとうございます。方法としては間違ってないと知り、安心しました。 仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、 ttp://www.human.tsukuba.ac.jp/~percept/index.php?ANOVA%B7%AF%2F%C2%BF%BD%C5%C8%E6%B3%D3%A4%CE%CA%FD%CB%A1 を見つけました。群馬大の青木先生の掲示板では、シダックの方法?というのが出ていたのですが、 解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。 もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。 1−(1−α)^(1/k)がシダックの不等式なんでしょうか?
242 名前:132人目の素数さん [2008/01/08(火) 01:41:49 ] 連続型確率関数Xの確率密度関数が f(x)=1 (0≦x≦1) の場合で X=e^-Y/2 とするときのYの確率密度関数の求め方ってどうすればいいですか?
243 名前:132人目の素数さん [2008/01/08(火) 01:45:01 ] 変数変換の公式を調べてそれを使うだけだろ 別に何も変わったところがない
244 名前:132人目の素数さん [2008/01/08(火) 01:49:00 ] >>242 まで辿り着いてここでつまってしまったんです
245 名前:132人目の素数さん mailto:sage [2008/01/08(火) 01:50:00 ] >>243 で書いてある通り、調べればすぐわかることだから自分で解決してみな
246 名前:242 [2008/01/08(火) 02:06:12 ] 何か勘違いしてたみたいで簡単にできました お騒がせしてすいませんでした
247 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:06:18 ] また試験のシーズンか、、、
248 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:17:51 ] 試験に囚われてはならない。 自分のペースで学習することが大切だ。 試験で良い点を取ったからと言って 本当の実力が付いているとは限らない。
249 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:35:10 ] >>241 シダックは使える条件があるからいいのかな? 大体4群だとボンフェローニで0.0125で シダックで0.012741だからあまり大差ないね。 そのページのHolmの方法なんかいいんじゃない? Shafferの方法は表がいるしね。
250 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:45:15 ] 2007年11月のウェブサイト利用統計 -------------------------------------------------- 順位 延べ利用時間 利用者数 (万時間) (万人) -------------------------------------------------- 某Yahoo! 1位→1位 12549 某楽天市場 3位→2位 2164 某ミクシィ 2位→3位 1669 某YouTube 4位→4位 1495 動画投稿 某ニコニコ動画 ?→5位 1249 386 動画投稿 某FC2 9位→6位 960 ブログ制作支援 某Google 7位→7位 794 >2000 2ちゃんねる 5位→8位 751 掲示板 某goo 8位→9位 645 1800 某msn 6位→10位 628 ---------------------------------------------------
251 名前:237, 241 mailto:sage [2008/01/09(水) 18:38:41 ] >>249 レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、 という状態だったので、それを参考にすすめる事にしました。 ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。 その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、 という事でしょうか? (後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです)
252 名前:132人目の素数さん mailto:sage [2008/01/09(水) 22:49:14 ] >>251 シダックの不等式は書かれてないが、それに基づく有意水準の調整は >>241 で合ってるよ。>>249 もそれで計算しただけだしね。 ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を 使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど 確信はないなあ。 >>249 で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで 進めないと効果はないかもね。
253 名前:132人目の素数さん mailto:sage [2008/01/10(木) 00:24:36 ] 鼻の炎症はビエン、では耳の炎症は?
254 名前:132人目の素数さん mailto:sage [2008/01/10(木) 01:10:26 ] ━━━━━┓ ____ ┃ / \ ┃┏┳┛┃┃┃ ,,..--――--/ \ ━━━━━┛ ┃ ┏┛ | ヾ==___ ヽ \ ┏┻━ ヾ :::::::::::::====\ | ┃┣┓┣┓ ━━┓╋ ┣ `ー--/ ミ(⌒) / ┏┛ ╋ ━┓ ┏┛┃━┏╋ _ ヽ, ) ミノ ~レ-r -‐、/ ━┻━ ┛ ┗━ ━┗┛ / ヽ. <_ ノ__ i i i〉 〉 ━ /ヽ }<´ / ヽ、 /_/_/レ′ ┏━━╋ ,.-、/ ,.>-‐'" { _.......:::::::: ヽ、)ト´ ´ ヽ:;ヽ:;:-:;:-、. ┃ ━ ┃ ┃┃ ,,..‐'ヾ_j ,..< `ー、:::::::: /;: ̄:;i ヽ、;:_;:;:;:;:;;: ┃┏┓╋ ┃ ,.-'"、 ヽ、 |::::/ / /;:;:ヽ ノ;:;:;:;:;:;:i \ ヽ ┛┗┛┗┃┃┃ i./ヽ ヽ |ノ !´ /;:;:;:;:;| (;;/j;:;:;:;:;ヽ_ ノ | ┛┗━┛ ┗━┛ (__/ヽjノ / /;:;:;:;:;:;|、 (;:;ノ;:;:;:;:;:;:/\ | ┳━┳ /ヽ / ┏━━┓ |;:;:;:;:;;/ ヽー'/;:;ノ;:;:;:;:/ |\ | ┏╋━╋┓ ┏┛ | | ┃ );:);/ ||(;:;:;:;/| ヽ、\ | ┗╋━╋┛ ┏┛ ╋ ┃ ┃ ┃ ┃ ;:;::;:ヽ |: ヽ;:;:ヾ ヽ__ノ ┻━┻┃┃┗┓ ┃ ┃ ┃ ┏━┛ ┛┗━┛ ┗┓ ┏╋ ┗ ┃ ┗┛ ┏┓ ┗┛
255 名前:251 mailto:sage [2008/01/10(木) 01:31:44 ] >>252 >共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。
256 名前:32と35 [2008/01/10(木) 02:04:32 ] コックス比例ハザードモデルについてお教えください。 予後推定因子を解析する際の事ですが 単変量解析をする際に、交互作用のある因子は除こうと思うのですが SPSS でその因子の抽出の仕方を教えてください。 イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む 必要があると思います。 もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか?
257 名前:132人目の素数さん [2008/01/11(金) 19:59:43 ] 「絶対計算」という本を図書館で借りて読んだ。 要点は、絶対計算したほうが良い、という感じで なかなかいい本だった。
258 名前:統計 [2008/01/11(金) 21:11:39 ] 文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。 アンケートを使ってどんな(容姿・性格)の人が好感をもたれるのかをやりたなぁと考えています。
259 名前:132人目の素数さん [2008/01/11(金) 21:11:59 ] Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX−μはN(0、1二乗)に従う。 N(0、1二乗)についてP(1.5<=σ分のX−μ)=0.07、 P(0.5<=σ分のX−μ)=0.31である。 あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、 μ+1.5σ<=Xの生徒は5段階評価の5、 μ+0.5σ<=X<=μ+1.5σの生徒は4、 μ−0.5σ<=X<=μ+0.5σの生徒は3をつけるとする。 この時5をもらうのは全体の()%、 4をもらうのは全体の()%、 3をもらうのは全体の()%である。 分かりにくくてすみません。とりあえず5をもらうのが7%というのまでわかりました。どなたかお願いします。
260 名前:132人目の素数さん mailto:sage [2008/01/11(金) 22:04:40 ] 5が7%だとわかったのに何で4と3がわからないんだ? 5で計算したのと同じようにやればいいだろ。
261 名前:132人目の素数さん [2008/01/11(金) 22:44:57 ] 4が24%で3が38%ですかね? 間違ってたらご指摘ください…。
262 名前:132人目の素数さん mailto:sage [2008/01/12(土) 13:14:22 ] すいません、無相関の検定って何でしょうか? 初心者丸出しの質問ですみません。
263 名前:132人目の素数さん mailto:sage [2008/01/12(土) 14:21:27 ] >>257 山形浩生が訳してるやつ? 結構おもろいよね
264 名前:132人目の素数さん [2008/01/12(土) 15:20:48 ] >>262 単回帰の傾きゼロ検定
265 名前:132人目の素数さん [2008/01/12(土) 15:22:57 ] >>258 統計数理研究所のHPで教員の業績を調べると、適当なテーマが見つかるよ。 副所長が『女子学生の飲み物調査』で論文を書いているとか。
266 名前:132人目の素数さん [2008/01/12(土) 21:26:58 ] すいません、質問させてください。 繰り返しのない二元配置(または乱塊方、反復測定一元配置分散分析) で分析できるデータを、多重比較したいのです。 そもそもそういうやり方がないので、ボンフェローニの補正を行いたいのですが、 この場合、対応のあるt検定を繰り返して有意水準を補正すればよいのですか。 それとも、対応のないt検定を繰り返せばよいのでしょうか。 ご意見くださいますでしょうか。
267 名前:132人目の素数さん [2008/01/15(火) 21:21:41 ] >>262 普通に相関係数の検定でいいのでは。
268 名前:132人目の素数さん [2008/01/15(火) 21:29:11 ] 変数変換について質問します。 0近傍で変化がなく、X軸のマイナス側はマイナスの値、X軸のプラス側はプラスの値の方に増加する(TANを平たくしたような関数) ような変数変換がしたいのですが、 ロジスティック関数を90度回転したような変換を扱うにはどうしたらよいでしょうか?
269 名前:132人目の素数さん mailto:sage [2008/01/15(火) 23:12:43 ] tanを平たくした関数やロジスティック関数を90度回転させた関数で変換すればよい
270 名前:132人目の素数さん [2008/01/17(木) 08:18:16 ] 目的はある値を予測することです。 外れ値の多いデータの場合、回帰分析は回帰直線が外れ値に影響されます。 外れ値の多いデータの場合、回帰分析は不適でしょうか? 1.不適なら分析手法は何を使うべきでしょうか? 2.また回帰分析で可能な場合外れ値分析や除去して回帰分析した予測をすると 予測の時に目的変数が未知の外れ値がきたときに予測精度が悪くなります。 どのように対処したらよいでしょうか?
271 名前:132人目の素数さん mailto:sage [2008/01/17(木) 20:44:18 ] >>270 >外れ値の多いデータの場合、回帰分析は不適でしょうか? 外れ値の多いデータというのは、通常の1次線形回帰分析での寄与率が 何%程度なのかな?80%未満なら、その回帰式を予測式に使うのは避ける べきではないかな。 >1.不適なら分析手法は何を使うべきでしょうか? 偏回帰線図を見て、非線形傾向なら高次回帰分析にかけてみるとよいのでは。 応答曲面法をメニューに有する数万円のソフトもあるからね。
272 名前:132人目の素数さん mailto:sage [2008/01/17(木) 23:09:06 ] 2は考え違い。 外れ値に対する予測精度を高めるということは 誤差に追従させるというのと同じ。
273 名前:132人目の素数さん mailto:sage [2008/01/18(金) 00:02:15 ] >>270 ロバスト回帰を使えば?
274 名前:132人目の素数さん [2008/01/18(金) 13:20:34 ] >>271 40項目あり、単回帰での寄与率は大きい方から45、30、20、18、、10、9、〜です。 偏回帰線図とは散布図のことでしょうか?調べてもわかりませんでした。
275 名前:132人目の素数さん mailto:sage [2008/01/18(金) 19:04:42 ] >>274 >40項目あり、単回帰での寄与率は・・・ 40項目とは収集データの組み数のことでしょうが、重回帰でなく単回帰というと 説明変数が1種類だけなのですか? >偏回帰線図とは・・・ ThinkSTAT等の重回帰分析ソフトで偏回帰プロットと呼ばれている散布図の ことです。Excelの回帰分析だと観測値グラフが似ています。
276 名前:132人目の素数さん [2008/01/18(金) 22:44:10 ] ttp://www.vipper.net/vip437256.zip.html 誰かこの回答の仕方があっているか教えてくれませんか? 教科書とか持ってないんで調べようがないので。。。