1 名前:132人目の素数さん [2007/01/27(土) 03:31:38 ] 前スレ 統計学なんでもスレッド5 science5.2ch.net/test/read.cgi/math/1145362721/ 統計学なんでもスレッド4 science4.2ch.net/test/read.cgi/math/1123896809/ 統計学なんでもスレッド3 science3.2ch.net/test/read.cgi/math/1097491056/ 統計学なんでもスレッド2 science3.2ch.net/test/read.cgi/math/1068288283/ 統計学なんでもスレッド science.2ch.net/test/read.cgi/math/1012782106/ 関連スレ = 統計解析フリーソフト R = science3.2ch.net/test/read.cgi/math/1062650510/
2 名前:にょにょ ◆yxpks8XH5Y mailto:sage [2007/01/27(土) 09:23:35 ] 今だ!2ゲットォォォォ!!  ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ∩ ∩ 〜| ∪ | (´´ ヘノ ノ (´⌒(´ ((つ ノ⊃≡≡≡(´⌒;;;≡≡≡  ̄ ̄ ̄(´⌒(´⌒;; ズズズズズ
3 名前: ◆TuTO3UJe2Y [2007/01/27(土) 14:15:57 ] 新スレでは答えます
4 名前:132人目の素数さん [2007/01/27(土) 16:28:28 ] くんまー拡大!
5 名前:132人目の素数さん [2007/01/27(土) 21:03:43 ] レポートで回帰分析の結果書くんだけど回帰分析にも帰無仮説ってあるの? あれば書いた方がいいですか?
6 名前: ◆TuTO3UJe2Y [2007/01/27(土) 21:53:16 ] >>5 場合による あれば勿論書いた方がいいっていうか書かなきゃダメ
7 名前:132人目の素数さん mailto:sage [2007/01/28(日) 05:47:59 ] 【統計を】理系に多い血液型は何??【取ろう】 science5.2ch.net/test/read.cgi/rikei/1094367065/ ◆統計学について語るスレ science5.2ch.net/test/read.cgi/sim/1012828891/ 【製薬企業】 ☆統計解析スレッド其の壱☆ 【CRO】 school6.2ch.net/test/read.cgi/doctor/1039331241/ = 統計解析フリーソフト R 【第2章】 = science5.2ch.net/test/read.cgi/math/1152449095/ 【●】 文部科学省 統計数理研究所 part2 science5.2ch.net/test/read.cgi/math/1054036747/ 統計ソフト統合スレッド−SPSS・SAS以外 academy5.2ch.net/test/read.cgi/psycho/1012801769/ 心理統計スレッド3 academy5.2ch.net/test/read.cgi/psycho/1160242677/ 統計学 academy5.2ch.net/test/read.cgi/sociology/982489314/
8 名前:132人目の素数さん mailto:sage [2007/01/28(日) 05:49:05 ] えらそうな住人〜経済学的統計と解析〜社会学板 academy5.2ch.net/test/read.cgi/sociology/1136371390/ なんで統計学者って経済学部出身者が多いの? academy5.2ch.net/test/read.cgi/economics/1139223663/ 統計・計量分析で一番使われてるソフトは? academy5.2ch.net/test/read.cgi/economics/1106197885/ 経済学で使う統計学スレッド academy5.2ch.net/test/read.cgi/economics/1094012265/ 統計・解析ソフトについて pc10.2ch.net/test/read.cgi/bsoft/1012298063/ Data Mining (データマイニング) part 1 science5.2ch.net/test/read.cgi/sim/1101296843/ 【金鉱脈】データマイニングのスレ【発見】 pc10.2ch.net/test/read.cgi/linux/1139645444/ ☆統計学が出来ないマーケティング学者☆ money5.2ch.net/test/read.cgi/manage/1104337367/
9 名前:132人目の素数さん [2007/01/29(月) 22:57:45 ] VARモデルについて、わかりやすく解説してある本などご存知でしたら教えていただけないですか?
10 名前:132人目の素数さん mailto:sage [2007/02/01(木) 11:17:47 ] レポートの提出期限が過ぎたからか、静かだな…
11 名前:132人目の素数さん mailto:sage [2007/02/02(金) 13:57:37 ] よく文章にでてくる ~ ind の ind ってどんな意味? Y(i) ~ ind Poisson(mu(i))みたいな
12 名前:132人目の素数さん mailto:sage [2007/02/02(金) 15:25:03 ] independently independently identically distributed も i.i.d. と略して使うよ。
13 名前:132人目の素数さん mailto:sage [2007/02/02(金) 15:56:54 ] independently了解です。助かります。 independent か induction かなーとか勝手におもってました。
14 名前:132人目の素数さん [2007/02/03(土) 02:29:42 ] 多変量T分布の分散と、 ウィシャート分布(多変量カイ2乗分布)の平均の求め方が載っている参考書か、 サイトしりませんか? 全くできません・・・
15 名前:132人目の素数さん mailto:sage [2007/02/03(土) 03:19:54 ] 統計学が科目としてある資格を教えてちょんまげ
16 名前:132人目の素数さん mailto:sage [2007/02/03(土) 10:43:57 ] アクチュアリーとか統計士とか臭気判定士とかぐらいしか思いつかん。 公認会計士など選択に入っているのはまだまだあるやろな。
17 名前:132人目の素数さん mailto:sage [2007/02/04(日) 01:11:29 ] 離散型でも連続型でも、どんな分布だろうと、 確率分布関数は存在するけど 確率密度関数はあるとは限らない これは正しいですか?
18 名前:132人目の素数さん mailto:sage [2007/02/04(日) 01:31:45 ] 正しいです。
19 名前:132人目の素数さん [2007/02/04(日) 02:20:21 ] F分布で、F(m,n,α)=1/F(n,m,α)と本には書いてあるのに、F(m,n,α)=1/F(m,n,α)として例題は解いてます どちらが正しいんですか?
20 名前:132人目の素数さん mailto:sage [2007/02/04(日) 06:25:25 ] >>19 正しいのはF(m,n,α) = 1/F(n,m,1-α) 密度関数を適当に変数変換すれば簡単に証明できるよ
21 名前:19 [2007/02/05(月) 03:16:17 ] >>20 THANX
22 名前:132人目の素数さん [2007/02/07(水) 15:28:51 ] 最小二乗法の重みづけの計算方法がどうしてもわかりません ttp://homepage3.nifty.com/m_nw/dataac3j.htm 上のサイトに詳しく説明が書かれているのですが、計算部分がどうしてもうまくいきません。 ソフトを使った結果と全く違う結果になってしまいます。 問題は単純に(x,y)のデータ群があってこれに対応するy=ax+bの係数を導きたいです。
23 名前:132人目の素数さん mailto:sage [2007/02/07(水) 21:58:27 ] 丁寧ねえ……。思うとだろうとかはずとかが目立つページですな。 > 全体を通じて乱文となってしまいましたので、不明の点、不適切な表現等 > ございましたら 掲示版又はメールにてお知らせください。 って書いてあるんだから著者に尋ねたら?
24 名前:132人目の素数さん mailto:sage [2007/02/08(木) 11:37:28 ] >>22 そのサイトの公式間違ってない? 記号の定義を俺が勘違いしたのかもしれないけど 書いてある通りに計算するとxの3次の項が出てくるんだが… 回帰式を y_{i} = ax_{i}+bとして、二乗誤差 f = \sum_{i=1}^{n} (y_{i} - ax_{i}-b)^{2} の最小化を考える これをa,bで偏微分して0とおくと df/da = \sum_{i=1}^{n} -x_{i} * 2(y_{i} - ax_{i}-b) = 0 df/db = \sum_{i=1}^{n} -2(y_{i} - ax_{i}-b) = 0 となるから、これをa,bについて解く すると a = S_{xy} / S_{x} b = \bar{y} - a\bar{x} となる。 ただし、\bar{x},\bar{y}はそれぞれx,yの平均 S_{x}はxの分散、S_{xy}はxとyの共分散である。 こんな感じか?TeX使えないと数式書くの面倒だな
25 名前:132人目の素数さん [2007/02/08(木) 18:40:49 ] はじめまして。生物板から来ました。 あっちの板でちょっとお祭りになっています。 前スレscience5.2ch.net/test/read.cgi/life/1094584332/179- 今スレscience5.2ch.net/test/read.cgi/life/1170907261/ 最近世間をにぎわした灯台工学研究科の捏造事件がありましたが、実は2ちゃんではあの事件と同じぐらいの有名な捏造疑惑が知られていました。 この捏造王子が当時いつお縄になるかとみなワクテカしてたけど、長く海外逃亡していて忘れちゃってました。 ところが最近この捏造王子がテニュアトラック教員として帰国することになり、お祭りになったという次第です。 現在、この捏造王子の過去の仕事のあやしさを住人たちが検証している最中といったところです。 そこでそのあやしいデータのひとつとして以下のページにでてくるグラフが話題になっています。 ttp://www.brain.riken.go.jp/bsi-news/bsinews20/no20/research2.html 培養した細胞に3種類のタンパク質を組み合わせを作って導入しその効果を見たというものです。 ところがこのグラフが我々ナマモノ屋から見てきれい過ぎるのです。 特に5%程度の差が矛盾なく観察されるためには膨大な観察数が必要だと考えます。 ただ生データが示されておらず、簡単な検証方法を思いつきません。 そこでこのスレの専門家の方にひとつご助力を賜りに参りました。 どうかよろしくお願い申し上げます。mOm 参考レスscience5.2ch.net/test/read.cgi/life/1170907261/50 長文陳謝 orz
26 名前:132人目の素数さん [2007/02/08(木) 21:00:08 ] この↑問題、なにとぞ統計スレの先生方のお力をお貸しくださいOrz このままでは日本は捏造大国になってしまいます。
27 名前:132人目の素数さん [2007/02/08(木) 22:44:25 ] ローリング相関ってなんですか?
28 名前:132人目の素数さん [2007/02/08(木) 23:06:07 ] データの捏造方法 1 べつのサンプルのデータにするかえる 2 自分で数字をいじる 3 統計資料から拝借してラベルを付け替える
29 名前:132人目の素数さん [2007/02/08(木) 23:23:29 ] >>28 すいませんがよくわからないのでもう少し具体的に説明していただけませんか?
30 名前:132人目の素数さん [2007/02/08(木) 23:27:42 ] >>29 いや>>28 さんは質問してるんじゃない? 捏造王子は間違いなく2をやってます。 何とか検証する方法は無いでしょうか?
31 名前:132人目の素数さん [2007/02/08(木) 23:45:19 ] 出現する数字の分布が正規分布でない
32 名前:132人目の素数さん [2007/02/08(木) 23:52:12 ] データの中に自分のサインを残している
33 名前:132人目の素数さん mailto:sage [2007/02/09(金) 00:00:47 ] >>25 データ数が分からないことには何とでも言えそう。 回帰分析でそれぞれの効果を推定するときれいに出るが、 それを仮に真値としたとき偶然このデータが得られる確率は データ数に依存します。最も無理のない結果のための データ数は各群350ぐらいと出ました。 (そのときの確率は0.11ぐらい。当てはまり過ぎと言われない確率0.05を 超えるのは大体データ数150以上が必要です。) 細胞のデータと言うことですからこのぐらいの数は取っているのでは?
34 名前:132人目の素数さん [2007/02/09(金) 00:20:21 ] >>33 ありがとうございます。 データ数を何に相当すると考えるかで少し違いますが、通常は培養皿ごとに計数して、 複数の培養皿からの数値で平均を取って検定します。 つまりデータ数は培養皿数に相当すると考えられます。 そして150も350もほぼ不可能な培養皿の数(通常は多くて10)です!!
35 名前:132人目の素数さん mailto:sage [2007/02/09(金) 00:51:57 ] 統計量Sn、Tnは漸近的に同値であり、また、Snは分布関数Fに分布収束するとする。 このときTnもFに分布収束する。 という命題を証明したいのですが、糸口がつかめません。 どなたかヒントだけでもいいので教えていただけませんでしょうか?
36 名前:132人目の素数さん [2007/02/09(金) 00:53:44 ] >>28 ,>>31-33 皆様さきほどは急いでいて御礼が不充分で申し訳ありませんでした。本当に感謝しております。m0m 現在、頂いた回答を向こうのスレに貼って、向こうで実験系に詳しい人たちとの議論待ちです。 その結果また何か分からないことや私の事実誤認があったらお手数をおかけして恐縮ですが 再度ご相談に参ります。よろしくお願いいたします。
37 名前:132人目の素数さん mailto:sage [2007/02/09(金) 01:17:27 ] >>34 また見に来るだろうから書いておくが、そんなに少ないならこんな感じ。 各群10個:p=0.00005530468 各群20個:p=0.0004044062 各群30個:p=0.001247549 各群40個:p=0.002702961 各群50個:p=0.004825427 もちろん推定された効果通りにきれいな真値であるわけではない可能性も あるので上記のp値の計算は額面通りには受け取れません。 ただし、交互作用まで分散分析をかけると各効果はp=0.05ぐらいで 効いているのに対して交互作用はどれもp=0.2ぐらいできれいに 効いていないと出るので線形性は抜群なのですけどね。
38 名前:132人目の素数さん mailto:sage [2007/02/09(金) 01:21:58 ] >>37 自己レス。 培養皿の効果が0, 1ならその通りなのだが、 それをある程度の細かさで分類しているならデータ数は培養皿数とは 言えないだろう。皿が10個としてその程度が1/15区切りでつけられるのなら ぎりぎりOKとなるかな。
39 名前:132人目の素数さん mailto:sage [2007/02/09(金) 05:44:51 ] >>35 xをTnの連続点とすし、εを任意の整数とする。 Pr{Tn<=x}=Pr{Tn<=x, |Sn-Tn|<ε}+Pr{Tn<=x, |Sn-Tn|>=ε}
40 名前:35 mailto:sage [2007/02/09(金) 08:37:20 ] >>39 ありがとうございます。 それを参考にして考えてみます。
41 名前:132人目の素数さん mailto:sage [2007/02/09(金) 21:15:02 ] >>33 ,37 自己レス。 計算を間違ってた。_| ̄|○ n=350のときのp値は0.385だった。0.5までいくにはn=400ぐらい必要。 0.05を超えるのはn=150過ぎだが、小さいときの表は次のように修正。 各群10個:p=0.000002530724 各群20個:p=0.00003769463 各群30個:p=0.0001776871 各群40個:p=0.000523022 各群50個:p=0.001189512 結局一つの皿でどのぐらいの精度の結果を得ているか次第です。 10個だとやはり5%刻みぐらいのデータが得られていないと だめでしょう。
42 名前:132人目の素数さん mailto:sage [2007/02/09(金) 21:36:35 ] SPSSやJMPを使った集統計が三度の飯の次くらいに好きなんだが、 こんなオイラを雇ってくれる奇特な研究室はないかな。
43 名前:132人目の素数さん [2007/02/09(金) 22:03:29 ] >>42 おしい!三度のメシより、だったら家で雇ったのに。 あとRな。
44 名前:132人目の素数さん mailto:sage [2007/02/10(土) 22:31:00 ] 集統計屋さん、うちの研究室にはいるよ@年収600マン・ポスドク・野心なしの主婦。 さくさくやってくれるんで、ボス以下全員すごく助かってる。 売り込んでみたら?
45 名前:132人目の素数さん [2007/02/10(土) 23:22:31 ] >>41 統計スレの神 本当にありがとうございます。みな深く感謝しています。 ちょっと若干1名場外乱闘で粘着があり、とばっちりで不快な思いをさ せたかも知れず申し訳ありません。 向こうはダミーで、こちらに書き込みさせてください。 ご指摘の件はもういちど良く考えて見ます。捏造王子たちが適当に 直線を引いた可能性が高くなってきたと思っています。 もひとつ質問なのですが、捏造王子たちはこのグラフの隣り合う区画 同士の平均値の差が統計的に有為である、としているようです。これ はt検定ですが、この隣り合う二群間での平均値の差の検定に必要な サンプル数を彼らは満たせているでしょうか? 誤解があったら申し訳ありません。 よろしくお願いします。
46 名前:132人目の素数さん mailto:sage [2007/02/10(土) 23:23:55 ] 葛西そこそこでヴィドはヴィドったwww
47 名前:46 mailto:sage [2007/02/10(土) 23:24:42 ] すいません、誤爆しました
48 名前:132人目の素数さん mailto:sage [2007/02/11(日) 00:34:07 ] >>45 せっかく作ったのでこちらに載せときます。 乱数で見るデータの例です。 1500個を150個ずつ群にまとめた場合 0.427 0.387 0.367 0.433 0.420 0.380 0.380 0.393 0.360 0.313 300個を30個ずつ群にまとめた場合 0.633 0.500 0.333 0.367 0.567 0.467 0.467 0.300 0.333 0.367 もしデータが入手できて各群300個ぐらいしかないのに挙動が1500個のときと 同じ程度なら(そうでないと棄却はできないはず) 二項分布の方に疑いが行きます。
49 名前:132人目の素数さん [2007/02/11(日) 05:46:32 ] 国立医学部一年の般教で統計やってます 圧倒的に意味が不明 母比率とか意味不明 なんで偏差平方和をnで割ったら分散じゃないの?
50 名前:132人目の素数さん mailto:sage 今は医学部に入る奴でもこんなアホなのか…… [2007/02/11(日) 11:00:42 ] それじゃ一昔前の高卒にも劣るよ
51 名前:132人目の素数さん [2007/02/11(日) 12:52:52 ] >>50 だって授業なんて聞いてないし笑 説明ヨロ☆
52 名前:132人目の素数さん [2007/02/11(日) 13:35:14 ] >>51 聞いてなくても本読めばわかるだろ笑
53 名前:132人目の素数さん [2007/02/11(日) 14:02:02 ] >>52 大学の過去問しかない…笑
54 名前:132人目の素数さん mailto:sage [2007/02/11(日) 14:24:29 ] >>49 授業で使ってる教科書に書いてあるんじゃね? 宿題の答え聞かれてる気がするからあまり詳しく答えたくないけど… nでなくn-1で割るのは推定値の不偏性(推定値の平均が真の値になるという性質)を満たすため 偏差平方和の平均値出してみな
55 名前:132人目の素数さん [2007/02/11(日) 14:39:25 ] phi.ypu.jp/oldlec/social_stat_p05.html
56 名前:132人目の素数さん [2007/02/11(日) 15:12:14 ] >>54 ありがとう! 教科書はないんだ。 授業中にもらうしょぼいプリントだけ。当然どっかいった笑 宿題じゃなくて後期試験の科目なんだよね 友達からプリント借りて調べてみよう。 統計を勉強する上でコツみたいなの教えてください笑
57 名前:132人目の素数さん mailto:sage [2007/02/11(日) 20:19:44 ] 平均と期待値の違いってなんですか?
58 名前:132人目の素数さん mailto:sage [2007/02/11(日) 23:03:43 ] 完備十分統計量は最小十分統計量であるということを証明したいんですが、なかなか証明ができません。 証明の道筋をどなたか教えてください。
59 名前:質問です。 [2007/02/15(木) 19:57:02 ] >控除率の実際 >以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、 >ミスのない完全なプレーを行うことを前提とする。 >スロットマシン 3%〜15% >様々。ここでは一般的と思われる値を挙げた。 (ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87 )より転載。 ということは、スロットマシンの腕がどんなに良い人でも、控除率を3%〜15%より下げるのは無理だということですか? また、ヘタクソな人がやれば、控除率は3%〜15%よりかなり上がるということでしょうか? あと基本的な質問ですが、控除率が2%のギャンブルというのは、簡単に言えば 100円を元手に無限回挑戦し続けると、元手が98円に減るということですか?
60 名前:132人目の素数さん mailto:sage [2007/02/16(金) 00:30:33 ] >>59 控除率が正のものを無限回やったら破産しますがな。w
61 名前:132人目の素数さん mailto:sage [2007/02/16(金) 00:34:01 ] 人が無限回できることって無限小の距離を移動することとかですか
62 名前:質問です。 mailto:sage [2007/02/16(金) 20:45:00 ] >>60 どうも根本的なところを勘違いしていたようですね。 ではこういうことでしょうか? 控除率が2%のギャンブルを一回やると、当然、元手が増える人も減る人もいるが、 参加した全員の平均をとってみると、元手の98%に減ったという結果になるということですか? また、控除率が2%のギャンブルというのは、参加した全員の掛けた金の合計の2%が確実に親のポッポに入るということでいいの でしょうか? また変な勘違いをしていたら教えてください。
63 名前:132人目の素数さん mailto:sage [2007/02/16(金) 21:18:32 ] >>62 手数料という表現からすると概ねそれでよいのでしょう。 ただし、なんらかの必要経費が生じるものだとそれがそのまま利益という 訳ではないのでしょうが。
64 名前:132人目の素数さん [2007/02/16(金) 21:31:29 ] 文鳥が好きで煙草を吸わない30代独身男性は、 日本国内に何人くらいいると考えられますか?
65 名前:質問です。 [2007/02/18(日) 11:55:27 ] >>63 レスありがとうございます。 だいたい分かりかけてきました。最後の質問にしたいと思いますが、 >控除率の実際 >以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、 >ミスのない完全なプレーを行うことを前提とする。 >スロットマシン 3%〜15% >様々。ここでは一般的と思われる値を挙げた。 (ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87 )より転載。 ”プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、 ミスのない完全なプレーを行うことを前提とする。 ” と、いうことは、スロットの腕がどんなに良い人でも控除率を3%以下に下げるのは不可能であり、 素人がやると、もちろん控除率は腕の良い人より上がるということでしょうか?
66 名前:132人目の素数さん [2007/02/18(日) 21:17:26 ] >>65 まだ勘違いしてますよ。 控除率はどのプレーヤーに対しても一律で貸せられる場所代や税金のようなものです。 どんなに上手にプレーをしても、控除率は変わりません。 ただ、上手にプレーすれば、下手くそにプレーするよりも、最終的に手元に残る金額は多くなりますが。しかしこれは控除率とは何ら関係のないものです。
67 名前:132人目の素数さん mailto:sage [2007/02/20(火) 16:08:47 ] 統計学って ある確率が1%以下であるなら、それは絶対におかしいと決めるような学問なの?
68 名前:132人目の素数さん [2007/02/20(火) 16:54:05 ] ベータ分布のパーセント点を求める近似式をcで作らなきゃいかんのだが どうやるんだ?
69 名前:132人目の素数さん mailto:sage [2007/02/20(火) 21:01:57 ] >>68
数値計算のアルゴリズム本(e.g. 奥村さんのアルゴリズム事典
oku.edu.mie-u.ac.jp/~okumura/algo/ )を探すか、
フリーの有り物(e.g. dcdflib.c)を使う。
70 名前:132人目の素数さん mailto:sage [2007/02/20(火) 22:24:04 ] 分らない問題スレで核心にせまるレスが付かなかったため、 統計スレの皆様、お力添えくださいm(_ _)m ■問題 A君とB君は互いに相手よりもテニスが強いと言い張ります。 そこで、10試合をして勝敗によりどちらのほうが強いか決めようということになりました。 統計学的に有意に強いと認められるには、どちらかが何勝すれば良いでしょうか。 ただし、引き分けは無いものとする。 ■自分で考えた答え(合っていますか?) A君とB君の勝敗の組み合わせ数は2^10=1024通り 10試合のうちA君が8勝する組み合わせ数は10!/(8!2!)=45通り 10試合のうちA君が9勝する組み合わせ数は10!/(9!1!)=10通り 10試合のうちA君が10勝する組み合わせ数は10!/(10!0!)=1通り 従ってA君とB君が互角と仮定すると A君が8勝以上する確率は(45+10+1)/1024≒0.055 A君が9勝以上する確率は(10+1)/1024≒0.011 統計学的に有意に強いと認められるには、互角となりうる危険率を5%以下にする必要があるから 9勝以上しないといけない。 この解答は合っていますか?
71 名前:132人目の素数さん [2007/02/20(火) 22:36:56 ] >>69 ありがとう。やっぱり不完全ベータ関数を計算してニュートンで求めるしかないのかな?
72 名前:132人目の素数さん mailto:sage [2007/02/20(火) 23:08:18 ] >>71 Handbook of Mathematical functions には近似式載ってる。 けど、精度書いてない。 dcdflib.c の cdfbet() は、逆分布関数も計算できる。
73 名前:132人目の素数さん [2007/02/20(火) 23:38:15 ] 統計超・超初心者のとっちょです。 ある生産工程の不良率(良品率)を調査するために製品を10個抜き取り、寸法を 測定しました。結果は以下の通りです(単位:mm)。 2,2,2,2,2,3,3,3,4,5 平均:2.8 標準偏差:1.0 製品規格は下限規格のみで1mm以上です。上限規格はありません。 分布の形状は右側(値の大きい)に裾野の広い分布であり、工程の設備能力からも 合点のいくところで、偏ったサンプリングをしているとは考えにくいです。 こんな分布をしている場合の工程不良率を算出しようとした場合、どのように算出 したら良いのでしょうか?当HPのポアソン分布等を拝見したのですが、初心者の私 には、ポアソン分布を使って良いものか否か分からない状況です。 こんな私にご教授頂ければ幸いです。よろしくお願いします。
74 名前:132人目の素数さん [2007/02/20(火) 23:50:26 ] >>72 サンクス。これはつかえそう!
75 名前:132人目の素数さん [2007/02/22(木) 20:59:46 ] >>73 ポアソン分布はサッカーの得点みたく離散型データの場合。 その場合は、測定精度が粗くて値の種類が少ないから、 データの相対度数分布をそのまま確率分布(の推定値)として使うのが吉。 つまり理論分布なんぞイラネ。
76 名前:132人目の素数さん mailto:sage [2007/02/22(木) 21:38:27 ] いきなりすいません。必死で探してるんですが正確度の計算方法が わかりません。 今まで人の目で数えていたものを機械で数えようとしています。 人の目で数えたものと機械で数えた数字の正確さを表す数値として 正確度というのがあるのことまではこぎつけたのですが、その計算式が わかりません。 どなたか教えていただけませんか?
77 名前:132人目の素数さん [2007/02/23(金) 05:01:21 ] すいません。統計学初学者です。 正規分布の加法性でわからないことがございます。 1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2) 2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2) 正規分布を足しても引いても、 平均はそれぞれ、足されるあるいは引かれますが、 なぜ、分散だけはどちらも足されるのでしょうか? 分散は引くことは出来ないものなのでしょうか? よろしくお願いいたします。
78 名前:132人目の素数さん mailto:sage [2007/02/23(金) 11:42:23 ] >>76 統計学全体で通じる「正確度」なんてありません。応用している各分野で 系統誤差を使いやすいように数値化しています。例えば、測定値の平均を から実際の値を引いたものなどを使います。 関係している工学の人に「正確度」「精密度」についてきいてください。
79 名前:132人目の素数さん mailto:sage [2007/02/23(金) 11:59:52 ] >>77 式のイメージではなく、分散とはどういう数かをまず考えてみてください。 2つの正規分布は無相関なので、定義にしたがって分散を計算すると和に なります。 2つの確率変数の間に相関があれば、分散は和にはなりません。例えば、 極端な場合で u2 = - u1 という関係があるとすると、分散は 0 になっ てしまいます。この場合でも、分散を引いている訳ではありません。 教科書で「共分散」というのを調べてみてください。
80 名前:77 [2007/02/24(土) 05:20:39 ] >>79 ありがとうございました。 共分散勉強します。
81 名前:132人目の素数さん mailto:sage [2007/02/27(火) 18:54:14 ] 院に行って統計勉強する場合どこがおすすめ?学部は早慶です。
82 名前:132人目の素数さん mailto:sage [2007/02/28(水) 18:15:46 ] >>81 やりたい専門決めている? それに合った教員が居るところにすれば… 無ければ、そのまま上に行った方がいいかもね。
83 名前:132人目の素数さん [2007/03/04(日) 19:27:17 ] お前ら、Zipの法則について語れ
84 名前:132人目の素数さん mailto:sage [2007/03/04(日) 20:00:47 ] zipか、なつかしいなあ。100MBでも文書ファイルだけなら充分大容量だったのだが。 Zipf? それは語れない。
85 名前:83 [2007/03/05(月) 13:39:43 ] >>84 細かいこと気にする奴だなwまぁ、いいさ。 で、俺は勉強中なんだけど、世界の人口や日本の人口で試してみた (計算はExcelね)。 興味深い結果が得られているけど、面倒くさいので報告しない。 まずは計算して見れ〜
86 名前:132人目の素数さん [2007/03/05(月) 16:07:27 ] >>85 あれは経験則ではないの? ビジネス書なんかによくある80-20の法則なんかと同類の話ではないの?
87 名前:83 [2007/03/05(月) 17:04:06 ] >>86 よくわからん。俺は単にExcelで計算して遊んでいるだけ(笑
88 名前:よろしく。 [2007/03/06(火) 04:34:29 ] ベイズの定理の重要性について、 できましたら、短文にてご説明願えたらと思います。
89 名前:132人目の素数さん mailto:sage [2007/03/06(火) 09:56:24 ] ,,,--─===─ヽ/へ /iiiiiiiiiiiiii彡≡≡≡|≡ヾ ヽ iiiiiiiiiiiiiiiiiii彡≡≡≡≡|≡ミミヾ丶 iiiiiiiiiiiiiiiiiiii/ ̄ ̄ ̄ ̄ ̄ ̄\ミiiiiiヽ iiiiiiiiiiiiiiiiii/ \iiiiiiiゞ iiiiiiiiiiii/ \iiヽ iiiiiiiiiiiiiii《 ━━━'/ ヽ━━━ ヽミヽ ...iiiiiiiiii彡/ __,.:: :: __ ヽiiiii| ..iiiiiiiiiiiii》| ::: |iiiii| iiiiiiiiiiiiiiii|, |iii| ..iiiiiiiiiiiiiiiiii, ( ● ● ) .|iiii| iiiiiiiiiiiiiiiiiiiiiii 》━━━━《 |iiiii| Bayesなんて、プッ iiiiiiiiiiiiiii《《《ヽ 》 / ̄ ̄\ 《 |iiiiiiii| iiiiiiiii《《《《《《《《 《《 \ ̄ ̄/ 》》 |iiiiiiiiiii| iiiiiiiiiiii《《《《《《《《《《《 》》  ̄ ̄ 《《 》》》》》iiiii| iiiiiiiiii《《《《《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》iii| iiiiiiiiiiiiiii巛巛巛巛巛巛巛巛巛》》》》》》》》》》》》》》IIII iiiiiiiiiiiiiiiiiiiiii巛巛巛巛巛巛巛巛》》》》》》》》》》》》iiiiiii
90 名前:132人目の素数さん mailto:sage [2007/03/06(火) 14:57:51 ] >>86 ランダムネットワークを仮定すると、ネットワーク上の簡単な値が Zipf分布に従うことが理論的に証明されている。 ただ、とてもランダムネットワークとは思えないようなものや、 複雑な値についてもZipfの法則が成立するのは興味深いところ。 くりこみみたいな手法でなんか議論できないかなあとは思ってる。
91 名前:132人目の素数さん [2007/03/06(火) 16:25:48 ] cross-validation法は、残差を用いた推定より、 どういった点で優れているのでしょうか?
92 名前:132人目の素数さん [2007/03/07(水) 15:10:54 ] お願いします! 1、800人の学生のうち、622人がカメラ付き携帯電話を所持していました。 この結果から実際に全学生中75%以上の学生がカメラ付き携帯を所持しているという仮説を 有意水準0.05で検定せよ。 2、次の値は、48年と88年における小1身長のデータから計算されたものである。等分散が仮定できるものとして、 2群の母平均に差があるかいなかを有意水準0.05で検定せよ。 48年→ データ数30、標本平均108、標本分散15 88年→ データ数30、標本平均117、標本分散21 計算途中の結果付きで回答してもらえると嬉しいです。
93 名前:132人目の素数さん mailto:sage [2007/03/07(水) 15:16:29 ] >>92 はマルチ だいたい数字が違うだけの同じ練習問題が普通に載ってると思うが。
94 名前:132人目の素数さん mailto:sage [2007/03/07(水) 15:21:20 ] 今時分にレポート提出の大学もあるんだね。
95 名前:132人目の素数さん mailto:sage [2007/03/08(木) 15:55:17 ] 今日成績を受け取りに言ったのですが、 卒業するのに単位がどうしてもあと1教科分2単位必要なのです。 3月中にレポートでもなんでもします。 単位を取得させてもらえないでしょうか。 ご検討のほど、どうかよろしくおねがいします。
96 名前:132人目の素数さん mailto:sage [2007/03/08(木) 16:36:09 ] 最近では、レポートの主要部分をネットからのコピペした場合、 不正行為とみなすところが増えている。不正行為の場合、その 期の全単位消失といった処分が多いはず。 だから、ここに答えを書くと卒業がより遠くなって、かわいそ うなので、みんな書いちゃだめだよ。 ということで、教科書をよく読んで、自力でがんばってね。
97 名前:132人目の素数さん : mailto:sage [2007/03/08(木) 17:50:20 ] 基本的な質問かと思いますが、本などに解説がないのでお聞きしたいです。 尺度水準の説明で、名義尺度は名前や職業など任意に割り振られたデータで 和を計算したり平均を出しても意味がないとの説明が多いのですが、 例えば携帯のアンケート調査で、機種を選ぶ際に重視した機能をひとつお選びください で、1.ディスプレイの大きさ 2.カメラの画素数 3.文字変換機能 4.セキュリティ機能 5.その他 があり、その結果、1が40%、2が25%、3が20%、4が10%、その他が5% という結果となった場合、選択肢は名義尺度なので、解釈時に ユーザが機種選びに重視した項目の順位は1位ディスプレイ、2位カメラの画素数といった 表現やディスプレイの大きさは文字変換機能の2倍重視されている、といった 表現が間違いということになるのでしょうか? どなたかご教授ください
98 名前:132人目の素数さん mailto:sage [2007/03/08(木) 18:49:31 ] >>97 平均を求めるとはその例だと 1*0.4+2*0.25+3*0.2+4*0.1+5*0.05=2.15 と計算し、カメラの画素数と文字機能変換の 間辺りを重視していますというようなとんちんかんなことを することです。 単なる順位付けや比較は名義尺度で行っても全然 問題ありません。
99 名前:132人目の素数さん [2007/03/08(木) 22:10:43 ] 経済分析のための統計的方法 岩田 暁一 と 確率・統計入門 小針 あき宏 ってどっちがいいですか?
100 名前:132人目の素数さん mailto:sage [2007/03/08(木) 22:33:35 ] >>99 まず、目的を書いてくれ。教科書としてのタイプがちがうから、 答えようがない。
101 名前:132人目の素数さん [2007/03/08(木) 23:01:18 ] 経済学部です。それを考えると最初のがいいんですけど、 ファイナンスやりたくて数学の勉強もしてるから、下のほうがいいのかぁと
102 名前:132人目の素数さん mailto:sage [2007/03/09(金) 10:02:39 ] 両方やるってどうだろう。とりあえず最初に少しぐらい
分からなくてもいいやって方針で小針ワールドを味合って
から、岩田でゴチゴチと。
103 名前:132人目の素数さん : mailto:sage [2007/03/09(金) 17:21:51 ] >>98 ご回答ありがとうございます。 胸のつかえが取れました。
104 名前:132人目の素数さん mailto:sage [2007/03/11(日) 21:48:04 ] 369
105 名前:132人目の素数さん mailto:sage [2007/03/12(月) 19:08:45 ] 変数xおよびyが それぞれ平均値30および20、 標準偏差が10および6、をもつ確率変数である場合、 x=x+2y の標準偏差を求めよ。ただし、xとyの相関係数は0とする。 ってあるんだが、どう解いていけばいいかわからねぇ・・・ 解く方向性だけ教えてくれ。
106 名前:132人目の素数さん mailto:sage [2007/03/13(火) 02:51:57 ] x,yの相関係数は0ってことはx,yは独立ってこと。 だから、確率変数の和の分散を求めるにはそれぞれの分散を足せば出る。 それぞれの分散は平均値と標準偏差から出る(2yの方は係数が絡むことをお忘れなく)。 x+2yの分散が得られたらあとはそれを元に求める標準偏差を計算すればよい。
107 名前:132人目の素数さん mailto:sage [2007/03/13(火) 09:58:33 ] >>106 相関係数0だからって独立とは限らんのだが…。 計算上は独立であることは使わないので同じになるけど。
108 名前:132人目の素数さん mailto:sage [2007/03/14(水) 02:00:44 ] >x=x+2y の標準偏差を求めよ。 両辺から x を引き 0 = 2y 両辺を 2 で割ると y = 0 故に、確率変数 y が 0 の時の標準偏差を求めれば良い。 y の値としてゼロのみを考える条件付き分布問題だから、、、 Ans, 標準偏差ゼロ
109 名前:105 mailto:sage [2007/03/14(水) 13:15:43 ] そう解くだったんだ。教科書見てもわからなかったから悶えてたw Thanks!
110 名前:132人目の素数さん mailto:sage [2007/03/14(水) 19:49:31 ] マジで信じたんかよ。w
111 名前:132人目の素数さん [2007/03/19(月) 22:13:22 ] 誤差と残差の違いって何ですか?
112 名前:132人目の素数さん mailto:sage [2007/03/20(火) 12:59:29 ] 残差(residual)は、測定値と推定値の差で、説明できない残り。 誤差(error)は、真の値と推定値や測定値の差が本来なのだけど、 真の値なんか分からないから統計使うので、 (とりあえず値)±(統計誤差)の範囲に真の値が入る確率が95%に なるように計算した「統計誤差」か、「とりあえずの値の標準 偏差」かどちらかを言うことが多い。
113 名前:132人目の素数さん [2007/03/24(土) 08:02:50 ] 別スレ science6.2ch.net/test/read.cgi/math/1170218754/ で、 統計学=Kolmogorovの確率論+Fisherの最尤法 と言い切っているんですが、これって普通ですか? そうでないなら、別の言い方ってありますか?
114 名前:KingOfUniverse ◇667la1PjK2 ◆OYFsVKEYdw [2007/03/24(土) 08:08:45 ] ないね。
115 名前:132人目の素数さん mailto:sage [2007/03/24(土) 09:39:17 ] >>113 そんな単純でないのは確かだな。多変量解析は別と言っている時点で 今の統計学の半分は捨ててるし。 また、少なくとも「Neyman, Pearsonの基準」がないと検定ができない。
116 名前:132人目の素数さん [2007/03/24(土) 09:56:13 ] >>113 無理は承知で一言で答えよ。 と言うことならば、「なるほど」と思う。 対案を言えと言われれば困るので。
117 名前:132人目の素数さん [2007/03/24(土) 14:20:39 ] >>115 すまんが、良く分からん。もう少しkwsk。
118 名前:132人目の素数さん mailto:sage [2007/03/24(土) 17:22:09 ] >>117 Wikipediaの「ネイマン・ピアソンの補題」を見よ。
119 名前:132人目の素数さん mailto:sage [2007/03/25(日) 05:19:14 ] >>115 「Neyman, Pearsonの基準」がないと検定ができない? 最尤比検定 >>113 オレなら 統計学=Fisherの最尤法 + 回帰分析 これなら ニュートン力学=慣性系 + 「f=ma」 +作用反作用 と比較できる。 統計学に「Kolmogorovの確率論」 を加えるのは、 ニュートン力学に「微分方程式論」を加えるのと同じで、不要。
120 名前:132人目の素数さん [2007/03/25(日) 11:03:12 ] >>115 Neyman-Pearson は単なる補題だしこれを統計学の前提条件のように 扱うのはおかしいのでは?Uniformly Most Powerful test(一様最強力 検定)を最良のテストとみなしていること自体は、前提条件と言えない こともない。もっとも、Decision theoryの一般的な枠組みを統計学の 基礎と考えた方がすっきりするように思う。 Kolmogorovは、統計学の数学的基礎として必要だろう。少なくとも 収束概念を数学的に扱うためには必要。Fisherの最尤法は、確かに 統計学の非常に多くの場所で使われているのは事実だが、あくまで それは統計学の一部分であって、最尤法なしに統計学が全く成り立 たないわけではないのではない。
121 名前:132人目の素数さん [2007/03/25(日) 11:05:14 ] >>14 了解です。
122 名前:132人目の素数さん mailto:sage [2007/03/25(日) 12:54:52 ] >>113 〜>>120 今のところ>>119 に賛成するが、すこし勉強してから、その理由を言いたい。 「統計学の公理的アプローチ」 というような内容の本があれば、どなたか教えてくれませんか? (物理のたいていの本は「法則」が最初に宣言されていて、公理的である) もしそのような統計の本がないなら、その理由を考えたい。 >>113 の問題提起は面白い。
123 名前:132人目の素数さん [2007/03/25(日) 13:03:48 ] いまのところ>>119 に賛成だが、もうすこししっかり考えたい。 どなたか 「統計学の公理的アプローチ」 というような内容の本を知っているなら、教えてくれませんか? (物理の本はたいていは「法則」が最初に宣言されていて、公理的といえる) もしそのような統計の本がないなら、その理由を考えたい。 >>113 の問題提起は面白いと思う。
124 名前:132人目の素数さん mailto:sage [2007/03/25(日) 13:05:50 ] 122=123 誤操作で、すみません。
125 名前:120 [2007/03/25(日) 13:34:13 ] 誤>>全く成り立たないわけではないのではない。 正>>全く成り立たないわけではない。 すまそ。
126 名前:132人目の素数さん [2007/03/25(日) 15:28:36 ] >>119 最尤比検定 → 尤度比検定 スマソ
127 名前:132人目の素数さん mailto:sage [2007/03/25(日) 23:00:45 ] 初学者なんですが 回帰分析、分散分析、多変量解析について 理解しやすい本て何かありますか?
128 名前:132人目の素数さん mailto:sage [2007/03/25(日) 23:58:14 ] この話題でこんなに盛り上がるとはな。 「Neyman, Pearsonの基準」をあげたのは検定の基礎だからで、 元の>>113 の考えが純粋数学のように公理として必要なものを あげる立場と考えたから。 統計学は記述統計と推測統計に分かれ、推測統計が推定と検定で 成り立っていることに異論はないだろう。その中で記述統計は データの整理であり、公理といったものとなじまない。 そうすると推定の基礎が最尤法で、検定の基礎がネイマン・ピアソンと するとなんとなくよさそうに思った。(尤度比検定でも実際棄却域をどう取るかは それと無縁ではいられない。>>120 の言うように広く言えばDecision theoryを 取り入れるべきということだ。) >>119 のような考えは公理としてではなく統計学の中心的な方法は何? というコンセプトであろう。公理よりこの方がすっきりするように感じるのは 統計学がやはり応用数学だからなんだろうか。
129 名前:132人目の素数さん [2007/03/26(月) 04:49:12 ] Decision theoryでは一般的すぎると思うが。 もうすこし具体的に、「Decision theory の中の○○」と言わなければ(ry
130 名前:132人目の素数さん [2007/03/26(月) 11:02:20 ] 同意 「Decision theoryの一般的な枠組み」=「統計学の一般的な枠組み」 じゃあ意味ないからね。 また、違うとしても Decision theory= ○○ + △△ と答えないと、言葉のすり替えになってしうのでは?
131 名前:132人目の素数さん [2007/03/26(月) 11:11:29 ] ○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○ このレスをみたあなたは・・・3日から7日に ラッキーなことが起きるでしょう。片思いの人と両思いになったり 成績や順位が上ったりetc...でもこのレスをコピペして別々のスレに 5個貼り付けてください。貼り付けなかったら今あなたが1番起きてほしくないことが起きてしまうでしょう。 コピペするかしないかはあなた次第... ○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○
132 名前:132人目の素数さん [2007/03/26(月) 15:45:06 ] >>129 , >>130 確かにそうだな。それでは、 統計学=Kolmogorovの確率論+リスクの最小化原理 では、どうだろう。 仮説検定に関しては、Neyman-Pearson Lemma がUMP test がリスク最小化の十分条件であることから必然的に導けるし、 推定に関しては、不偏性、有効性に関しては直接的に定式化できる。 漸近的性質に関しても、リスクのsequenceを考えることでほぼ解決できるように思う。 (自分は、漸近正規性とかに関してそういう枠組みで考えたことはないけど。。。) 最尤法に関しても、推定値の近傍があるリスクを最小化する統計量として 位置づけられるのでは? 思いつきで書いてるので、どこまで正しいか分からん。
133 名前:132人目の素数さん mailto:sage [2007/03/27(火) 01:04:00 ] >>132 すごいな。推定も検定も一緒に処理しようというわけか。 それだと多変量解析も範疇に入れられそうだ。 数学的にリスク最小化原理の一般化ができれば 統計学も公理系の上に乗っていると主張できるかな?
134 名前:132人目の素数さん [2007/03/27(火) 06:01:20 ] >>132 はノーベル賞だね。
135 名前:132人目の素数さん [2007/03/27(火) 06:30:17 ] >>132 すげぇ〜。 Fisherの再来だぁ〜。
136 名前:132人目の素数さん [2007/03/27(火) 08:31:20 ] 統計学のパラダイムシフト
137 名前:132人目の素数さん [2007/03/27(火) 18:45:36 ] >>132 統計学最大の問題(統計学の公理化)が2ちゃんねるで解かれるとは・・・
138 名前:132人目の素数さん mailto:sage [2007/03/28(水) 03:24:33 ] >>132 リスク関数の決め方に恣意性が・・・
139 名前:132 [2007/03/28(水) 15:48:49 ] >>138 残るね。 ただ私が思ったのは、もうちょっとDecision Theoryの立場から 様々な統計学の手法をまとめれば、数学的にすっきりするし、 各手法の位置づけや関係が整理できるんじゃないかということ。
140 名前:132人目の素数さん mailto:sage [2007/03/28(水) 22:49:03 ] >>139 同意 そんな本があったら買うね。 言いだしっぺの君が書いてよ。
141 名前:132人目の素数さん [2007/03/29(木) 07:53:41 ] >>140 書けねーよ
142 名前:132人目の素数さん [2007/03/29(木) 08:39:02 ] . ,イ/〃 ヾ= 、 _,,r-‐''"´ ^ `N /l/ `ヽ 彡 法学部 N! l `、 ,, -‐- ,,-彡 l ヽ 医学部 l` ´ ``‐ 、 彡´ | ,,w,,wヽヽ ,, | 薬学部 `ヽ _彡 政経部 | //レ/ハl/ハ\ヾー _,, ,,r,,/lヾ | } ハl/ ,/ハlヾヾ,l、 /三f、,,_ _,ヾニ_ ____彡ノノノノノ_ヾヾ | ,l、 、 l___ /レ /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽ 哲学 \_ l`=l fモチ)_{´ヽl!l :l l ll !l `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ / \ ヾ}弋_シl弋 ヽl ヽ- ヽl lゝ__,ノ | ゞ___ノl/l / l `~゙´ lァノ (● ) \ ヾl `' `''´lヽ ── /l\l l、, l_ノ 〈 _ l!ノ_人__) | }\  ̄ ̄ ,ィl \  ̄ / l l ___ / ── 丿 ⌒´ ,/ ,/\ \__// \ \___/ ,,-''\|\ _ /|\ - / |、 / ,|、 -‐' \_,,-‐'\ `ヽ、 ,,r' /| \ / .| \__/ ,,rヽ‐-‐ '' / l`ヽ ,,-‐'' \ /\/\ / \. \____/ /\ ,,-‐'' /\ ,/ l ヽ -‐''´ \/ }゙ _,,,‐''\ \ / /l\‐'' / `ヽ、_ l
143 名前:132 [2007/03/29(木) 14:23:29 ] 書けないですね。 とりあえず、過去にそんなこと試みた人はいないのかな? ちょっと、まわりに聞いてみよう。。。
144 名前:132人目の素数さん [2007/03/29(木) 14:58:29 ] . ,イ/〃 ヾ= 、 _,,r-‐''"´ ^ `N /l/ `ヽ 彡 法学部 N! l `、 ,, -‐- ,,-彡 l ヽ 医学部 l` ´ ``‐ 、 彡´ | ,,w,,wヽヽ ,, | 薬学部 `ヽ _彡 政経部 | //レ/ハl/ハ\ヾー _,, ,,r,,/lヾ | } ハl/ ,/ハlヾヾ,l、 /三f、,,_ _,ヾニ_ ____彡ノノノノノ_ヾヾ | ,l、 、 l___ /レ /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽほっ統計学\_ l`=l fモチ)_{´ヽl!l :l l ll !l `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ / \ ヾ}弋_シl弋 ヽl ヽ- ヽl lゝ__,ノ | ゞ___ノl/l / l `~゙´ lァノ (● ) \ ヾl `' `''´lヽ ── /l\l l、, l_ノ 〈 _ l!ノ_人__) | }\  ̄ ̄ ,ィl \  ̄ / l l ___ / ── 丿 ⌒´ ,/ ,/\ \__// \ \___/ ,,-''\|\ _ /|\ - / |、 / ,|、 -‐' \_,,-‐'\ `ヽ、 ,,r' /| \ / .| \__/ ,,rヽ‐-‐ '' / l`ヽ ,,-‐'' \ /\/\ / \. \____/ /\ ,,-‐'' /\ ,/ l ヽ -‐''´ \/ }゙ _,,,‐''\ \ / /l\‐'' / `ヽ、_ l
145 名前:132人目の素数さん [2007/03/30(金) 08:12:50 ] >>143 「統計学の公理的構成」が統計学最大の問題であることを、 非専門家たちに知らしめただけでも君の功績は学位論文以上だよ。 この辺りを読んで、君を乗り越える若い才能が出てくることを期待しよう。
146 名前:132人目の素数さん [2007/03/30(金) 19:50:26 ] t検定でふたつの集合の平均値が同じかどうか調べる時、 同じだという帰無仮説を危険率5%で棄却されなかった事をもって 「同じだ」と言っていいんでしょうか?なんかやり方が逆のような気が
147 名前:132人目の素数さん mailto:sage [2007/03/30(金) 22:05:34 ] >>146 同等性検定でぐぐれ
148 名前:132人目の素数さん [2007/03/31(土) 05:32:17 ] >>146 帰無仮説が棄却されないとほんとは何も言えないんだけど、 しばしばそのように解釈されてしまう。
149 名前:KingOfUniverse ◆667la1PjK2 [2007/03/31(土) 09:56:31 ] 対立仮説が棄却されるかどうか。
150 名前:132人目の素数さん [2007/03/31(土) 14:14:36 ] 一般には対立仮説は棄却されうるが、>>146 のケースでは無理。
151 名前:132人目の素数さん [2007/03/31(土) 22:49:41 ] >>112 >誤差(error)は・・「とりあえずの値の標準偏差」かどちらかを言う・・・ 「とりあえずの値の標準偏差」って、標準誤差のことですか?
152 名前:132人目の素数さん [2007/04/01(日) 02:44:49 ] >>148 Neyman-Pearson Lemma の方の検定なら、パラメータに関する「仮説」と「対立仮説」しかないので 「採択」と「棄却」が明確に成立する。 Neyman-Pearson検定論やWaldのDecision Theory は、「帰無仮説」という考え方を捨てて初めて成立する。 この立場での検定なら >>149 が正しい。 帰無仮説を重視するのは Fisher流の有意性検定で、逆にこちらは明確な対立仮説を設定しない。 パラメータだけでなく、検定時の確率モデル全体が「帰無仮説」に含まれているためだ。 例えば、散開星団が「星団」であることを統計的に検証するために、「天空上に星が一様に分布する」 という帰無仮説を立てる。そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」 であり、このような広いモデル選択は、Neyman-Pearson検定論では記述できない。 いまの統計学のテキストは、この辺の区別が無く、グッチャグチャに書かれているのがほとんど。
153 名前:152 [2007/04/01(日) 03:07:40 ] >そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」 このところは「偶然ではない何か」に訂正しといてちょ
154 名前:132人目の素数さん [2007/04/01(日) 06:29:28 ] >>152 いや、全ての検定は、対象となる確率変数がとりうる確率測度の族Pを 帰無仮説P_0と対立仮説P_1に分割した上で定義されるべきだろ。 その際、Pが(有限次元)パラメータで記述されるかどうかは関係がない。 確かに、対立仮説が明示されていない検定もあるが、 それは理論的基礎が不完全なだけでは。
155 名前:146 mailto:sage [2007/04/01(日) 10:04:20 ] よく分からないけど分かりました!ありがとうございます(><)
156 名前:132人目の素数さん [2007/04/02(月) 02:54:02 ] 刑事裁判は被告が有罪か無罪かを決めるだけだぞ。 >>154 によると、被告が無罪になった時には、同時に真犯人がわかっていてそれが 有罪に決まらないような裁判は、理論的基礎が不完全らしいなw
157 名前:132人目の素数さん [2007/04/02(月) 07:09:21 ] >>156 >被告が無罪になった時には、同時に真犯人がわかっていてそれが >有罪に決まらないような裁判は、理論的基礎が不完全らしいなw 1. 被告人が無罪になのにそれより怪しい人は見つかっていない、 っていう状況は論理的に完全だと思う? 2. 「真犯人がわかって」いる必要はないだろ。被告人より怪しい 人が存在する必要はあるだろうけど、特定される必要はない。 っていうか、仮説検定をちゃんと理解してないだろ?
158 名前:132人目の素数さん [2007/04/06(金) 10:48:07 ] Kernel SEM ってどんなモデル? ぐぐったけどそれらしきモノがでてこない。 フツーのSEMとどこが違うんでしょか?
159 名前:132人目の素数さん [2007/04/06(金) 23:22:01 ] Gini係数の目安、つまり 〜0.1 平準化が仕組まれる人為的な背景がある 0.1〜0.2 相当平等だが向上への努力を阻害する懸念がある 0.2〜0.3 社会で一般にある通常の配分型 0.3〜0.4 少し格差があるが、競争の中での向上には好ましい面もある 0.4〜0.5 格差がきつい 0.5〜 特段の事情がない限り是正を要する と区分されていますが、これと似た区分を書いてある英文の論文知りませんか? 卒論で必要なもので。 お願いします。
160 名前:132人目の素数さん [2007/04/06(金) 23:43:53 ] ググれ
161 名前:132人目の素数さん mailto:sage [2007/04/07(土) 09:22:01 ] >>159 こんなのを見つけた。 www1.doshisha.ac.jp/~sshinoha/report/2006_china/NigeriaPaperLatest.pdf 英語ではあるが。
162 名前:132人目の素数さん [2007/04/07(土) 13:56:54 ] >>161 本人だったりして。
163 名前:132人目の素数さん [2007/04/07(土) 16:29:29 ] 161さんありがとうございます。 欧米のジャーナルにはありませんか?ぐぐってもなかなかでてきません。
164 名前:132人目の素数さん [2007/04/07(土) 16:39:36 ] > 欧米のジャーナルにはありませんか? それは曹達
165 名前:132人目の素数さん [2007/04/07(土) 21:33:41 ] >>159 今時そんな能天気で紋切り型の区分を使ったら笑われるぞ。 まず↓Wikipediaを読め。 en.wikipedia.org/wiki/Gini_coefficient 次に世界銀行の↓でどんな問題が専門的に扱われてるか調べてみれ。 www.worldbank.org/research/inequality/index.htm
166 名前:132人目の素数さん [2007/04/07(土) 22:42:55 ] 魔方陣 www.u-kan.jp/
167 名前:132人目の素数さん [2007/04/08(日) 15:00:41 ] 大学の統計の授業でRとJMPとSNなんとかを使う授業があるんですがどれを取れば広く対応できますか?
168 名前:132人目の素数さん [2007/04/08(日) 18:33:39 ] SNなんとかだな。 というのは嘘。なんとかではわからない。 あなたの専攻なんかにもよると思う。 統計の先生ではなく、その専門の先生に相談する方が早いだろうね。 それはともかく、そんなに色々あるのか。うらやましい。
169 名前:132人目の素数さん [2007/04/08(日) 20:27:35 ] >>168 ありがとう 最初の授業は取るて決めてなくても見てまわれるらしいから話聞いてきます ちなみに専門はまだ決まってないです
170 名前:132人目の素数さん mailto:sage [2007/04/08(日) 23:00:49 ] >>167 まずSNなんとかは勘違いじゃないのかな? 大学でやりそうなのはSPSSとかだと思うけど。 もしそうではないマイナーなソフトだとしたら余り意味がないかもな。 広く対応の意味が分からないな。大学においてというなら >>168 の言うように専門の先生に寄るだろう。 社会に出てからというのならSNなんとかがSPSSなら 一番使う可能性が高いだろう。最近はJMPも広がってるけどね。 広くが自由にという意味ならRはフリーソフトであり、 自宅のPCでも使えるので便利。ただし、コマンド入力による 操作が面倒なら困るかも。
171 名前:132人目の素数さん [2007/04/11(水) 02:38:19 ] STATA9がいいよ
172 名前:132人目の素数さん [2007/04/11(水) 20:13:15 ] >>170 勘違いでした 調べてみたらSAS でした JMPとRで迷ってましたがJMPのほうが講義がわかりやすいらしいのでそれにしようかと思っています
173 名前:132人目の素数さん mailto:sage [2007/04/12(木) 01:00:05 ] >>172 ほうほう一番高価なSASまで準備しているとはすごいところだな。 SASは製薬会社御用達なのでそれに興味があるなら必須だけど そうでないならJMPは無難なところ。
174 名前:132人目の素数さん mailto:sage [2007/04/12(木) 12:53:36 ] >>173 履修担当に話を伺った所おおまかにわけるとRとSASは主に生物系等の講義取っている学生向けのようでした 文理混合大なのでわかりにくいorz
175 名前:132人目の素数さん mailto:sage [2007/04/12(木) 20:23:23 ] でも、JMPって独特だからなあ。 将来、「広く対応」できるかなあ。 最初からJMPなら慣れるもんかなあ。
176 名前:132人目の素数さん mailto:sage [2007/04/12(木) 21:30:02 ] すみません。SPSSによる多重比較について質問させてください。 2×3表でχ2乗検定し、有意となりました。 さて、その次に、どの群間に差があるのかを検定したいのですが、 SPSSで検定できるのでしょうか? 数値データなら、多重比較を使うと良いのでしょうが、 カテゴリカルデータ、しかも、順序ではないデータの場合、 どうすればよいのでしょうか? 数値データ同様、分散分析→その後の検定でtukey、dunnett、あたりを 選択してよいのでしょうか? ノンパラいろいろSPSS本を調べたのですが、載っていませんでした。 ご存知の方がおられましたら、なにとぞご教示のほどお願いいたします。
177 名前:132人目の素数さん mailto:sage [2007/04/12(木) 22:43:46 ] >>165 希に見る、親切かつ適切な書き込みだなー。
178 名前:132人目の素数さん mailto:sage [2007/04/13(金) 00:24:29 ] >>176 その分散分析は二元配置に対するものですから分割表には使えません。 (データの形が同じなために形式的には使えますが、誤用です。) そもそも分割表に対する多重比較は書籍ではないでしょう。 ぐぐって探してみた?
179 名前:132人目の素数さん [2007/04/14(土) 23:57:24 ] 生物系の学生ですが、マルコフ連鎖モンテカルロシミュレーションについて初学者が学習しやすい参考書やWeb上の資料はないでしょうか?
180 名前:132人目の素数さん mailto:sage [2007/04/15(日) 00:15:20 ] >>179 ここなんかはすでに見たわけ? www.e.u-tokyo.ac.jp/~omori/MCMC/index.htm
181 名前:132人目の素数さん [2007/04/15(日) 10:04:57 ] >>180 素晴らしいサイトを紹介していただきありがとうございます。 もう一つ質問させて下さい。マルコフ連鎖モンテカルロシミュレーションとは、どのような場合に使う手法なのでしょうか?
182 名前:132人目の素数さん [2007/04/15(日) 13:50:42 ] >>181 激しくたくさんのパラメータを同時推定したいけど、 joint distribution が分かってないときとか。
183 名前:132人目の素数さん [2007/04/16(月) 18:54:49 ] >>182 素人解釈で、間違っていたら申し訳ありません。 仮にjoint distributionが分かれば(仮定できれば)、分散分析のようなモデル (一般化線形混合モデル?)でパラメータが推定できますよね? マルコフ連鎖モンテカルロシュミレーションでは、例えば個体の生存率 など、多数の要因が複雑に関わっている現象(そのためにjoint distributionが仮定できない)について、それぞれの要因の効果(パラメータ) を推測できるという理解でよいのでしょうか?
184 名前:132人目の素数さん [2007/04/17(火) 05:05:56 ] >>183 大体そんな感じ。 あと、joint distribution が分かってても、 複雑すぎて計算が困難な場合にも使われる希ガス。
185 名前:132人目の素数さん [2007/04/17(火) 23:34:49 ] フリクションモデルの概要と推計方法をよかったら教えていただけないでしょうか?
186 名前:132人目の素数さん mailto:sage [2007/04/20(金) 01:22:36 ] どうしても分からないので質問させてください。 重回帰分析を行うのにExcelでLINEST関数というのがあります。 これの機能に切片を0にして偏回帰係数を求めるという機能がついていますがこれがどのような計算をしているか分かりません。 例えば z=a+bx+cy (a切片,b,c:偏回帰係数) という式の切片aを0にしたい場合z,x,yが全て0のサンプルを沢山加えて偏回帰係数求めると b,cは確かにExcelが求めた切片0の偏回帰係数に一致します。 しかしながら、 Excelで切片を0にしないときのF検定でF分布の自由度をn-2としたとき Excelで切片を0にしたときのF分布の自由度がn-1になっている所を見ると 0をサンプルにたくさん用いずに偏回帰係数を算出していると思われるのですが これは一体どのようにして切片0の偏回帰係数を計算しているのでしょうか?
187 名前:132人目の素数さん [2007/04/20(金) 12:17:09 ] 回帰の計算は単に、 z=a+bx+cy の代わりに、z=bx+cy が使われいるだけです。 先見的に、定数項=0が分かっている場合に使うモデルです。 またF値は、 z=a の残差をRSS0 z=bx+cy の残差をRRS1 としたとき、 F = ((RSS0-RSS1)/2) / (RSS1/(n-2)) 注) 2 は変数の数(x,yの2個) として計算されているようですが、 そもそも、z=bx+cy は残差の平均がゼロになりませんし、 モデル;z=bx+cyはz=aを含んだモデルではないので、 このF値はF分布に従わず何の意味もないと思います。
188 名前:132人目の素数さん [2007/04/21(土) 15:06:39 ] M$のソフトだからな。 ようやくExcelの分散が負にならなくなったのも、2年前くらいだっけ。 ましてや回帰なんつー高度な計算を期待しても、まず永久にムリ。
189 名前:132人目の素数さん [2007/04/21(土) 15:15:22 ] 沖縄県の方へ(命に関わる注意事項です) 沖縄県での選挙ですが、どうか民主党だけは避けてください。県民の生命に関わる可能性があります。 民主党の最大の公約は一国二制度(※)ですが、一度「一国二制度 沖縄 三千万」等で検索をお願いします。 この際、民主党のHPで調べても良いです。以下の注釈↓と矛盾することは書いてないはずですから… ※一国二制度 簡単に言えば沖縄を中国と日本の共有物にし、そこに3000万人の中国人を入植させます。 (つまり沖縄人口の 96% を中国人にして、実質、沖縄を中国人の居住地とします。) さらに「自主」の名の下、沖縄で有事が起きても自衛隊は干渉できません。 3000万人の中国人が、少数派となった130万人の日本人に何をしても、です。 そして反日教育を受けた中国人の反日感情の強さは、ほとんどの日本人の理解を超えるものです。 今回の選挙で民主党が勝った場合、「自主」「発展」を連呼しつつ段階的に進めていくことになります。 自主と言っても、自主を認めるのが「住人の96%が中国人となった」後だということに気をつけてください。 発展と言っても、新沖縄の少数派となった「少数民族日本人」の発展ではないことに気をつけてください。
190 名前:なんき [2007/04/21(土) 22:39:31 ] 仕事で金融工学をやってます。GAUSSという統計ソフトのことを どなたかご存知でしたら教えてもらえますか。株価をジャンプ過程で 表したモデルのパラメータの時系列推定をこれでやっているようなのですが、 もともと専攻は制御工学系で統計ソフトとか苦手なもので、 お力をお借りしたい次第です。よろしくお願いします。
191 名前:132人目の素数さん [2007/04/21(土) 23:57:13 ] Gauss っていわゆる行列言語です。 見た目はプログラミング言語に似ていますが、 たくさんの統計関数が組み込まれている統計ソフトです。 行列計算は比較的高速ですが、繰り返し文などは 遅いです。 確か、個人でも購入できますが、値段は高いです。 似た言語:Matlab, R, S-plus, Ox
192 名前:なんき [2007/04/22(日) 00:12:06 ] >>191 レスありがとうございます。GAUSS、さっきぐぐったら10万円もするらしく、 使いこなせるのならば会社に買ってもらおうと思うんですが、日本語マニュアル ないらしく、かなり不安です。他のソフトとの比較感とか、業界での普及状況とか お教えいただけるとうれしいです。
193 名前:132人目の素数さん [2007/04/22(日) 10:25:44 ] 普及度合いからすると、Matlab や S-plus, R の方が上ですね。 「株価のジャンプ過程のパラメーター推定」というやつのコードが Gauss のパッケージに入っているとか、誰かがコードを公開している ということなのかと思いました。 そうではなくて、一般的に統計ソフトを導入したいということであれば、 無料であるRから始めてみるのがお勧めですが。
194 名前:132人目の素数さん [2007/04/22(日) 10:28:27 ] 別のところで聞いたけどレス付かないのでお願いします 非線形の最小二乗法について詳しく書いてある本紹介してください。 修正Marquardt法とか、アルゴリズム関係も含めて、お願いします。
195 名前:132人目の素数さん [2007/04/22(日) 17:52:32 ] 半端な専門書よりも↓が詳しい dl.cybernet.co.jp/matlab/support/manual/r14/toolbox/optim/tutorial.shtml わからないところがあれば基礎ができてないので、非線形最適化の入門書嫁
196 名前:195 mailto:sage [2007/04/22(日) 17:57:28 ] リンク間違えた dl.cybernet.co.jp/matlab/support/manual/r14/toolbox/optim/tutoriab.shtml
197 名前:132人目の素数さん [2007/04/22(日) 18:51:05 ] 収束がわかんなくなっちゃいました。。誰か教えてください。 収束は、無限の世界における数の安定的な性質と理解してよいですか?
198 名前:132人目の素数さん [2007/04/22(日) 21:47:46 ] 心理測定データに基づく尺度の構成について、サーストンの比較判断の法則を中心に、説明せよ。
199 名前:132人目の素数さん [2007/04/22(日) 22:35:05 ] >>197 スレ違い >>198 板違い
200 名前:132人目の素数さん [2007/04/23(月) 01:01:55 ] >>197 統計学にはいろんな収束があるから、もうちょっと詳しく書かないと。
201 名前:132人目の素数さん mailto:sage [2007/04/23(月) 01:53:36 ] >>198 尺度の構成は統計分析に大きな影響を与えるので気になるところ。 探してみると www.oak.dti.ne.jp/~xkana/psycho/stat/stat_02/index.html といった説明が見つかった。一つ勉強になったな。
202 名前:132人目の素数さん [2007/04/23(月) 02:46:23 ] 人間の知覚感度を5段階評価しただけだろ。楽な分野だな。
203 名前:132人目の素数さん [2007/04/23(月) 23:59:59 ] >>195 レスサンクス 非線形最適化の入門書とやらを紹介してくださらんか・・・
204 名前:132人目の素数さん mailto:sage [2007/04/24(火) 12:58:29 ] 質問させてください. あるデータ(間隔尺度が3つ)について繰り返しのある二元配置の 分散分析をやろうとしているのですが,これを共分散構造分析でも やることは可能でしょうか? また可能であれば注意点とかありますか? よろしくお願いします.
205 名前:132人目の素数さん mailto:sage [2007/04/24(火) 23:07:10 ] >>204 共分散構造分析は統計的方法を広く含んでいてその中には回帰分析もありますから 回帰分析の一種である分散分析はもちろん範疇に含まれます。 ところでデータは間隔尺度が3つとありますが、それをx,y,zとするとx,yで二元表を作り zを分析するといった感じですか?x,yが元々ごく少数の値しかとらないというならともかく そうでないなら無理矢理度数分布にせずそのまま解析した方がいいように思います。
206 名前:204 mailto:sage [2007/04/25(水) 01:14:01 ] >>205 そのとおりです. x,yがそれぞれ5水準でzを分析するんですが, 5水準だと多すぎるでしょうか? 共分散構造分析の練習にでもと思ったのですが...
207 名前:132人目の素数さん mailto:sage [2007/04/25(水) 01:24:34 ] >>206 5水準なら細かさの点ではいいですが、分散分析だとせっかくの間隔尺度が消えてしまいます。 (順序尺度の間違いではないですよね?) また、共分散構造分析にかける場合、そのx,yをそのまま変数として間隔尺度を生かした 解析をするなら分散分析とは対応しません。分散分析ではそれぞれの変数を名義尺度 として扱いますから。(回帰分析の一種といったのはあくまでもダミー変数を使うと した場合。)
208 名前:204 mailto:sage [2007/04/25(水) 01:48:02 ] >>207 厳密には x,y は順序尺度です. ただし質問紙調査で5段階評価を聞いているものなので, まあ間隔尺度として扱ってもいいんじゃないかなと思ってます. z はちゃんとした間隔尺度です. それで x,y の幅がそれぞれ -2 から 2 の5段階だとして, x,y がどちらも小さいほど z(0 から 100)はちいさくて, x,y がどちらも大きいと z は大きくなる,というような ストーリーにしたいのですが.
209 名前:132人目の素数さん mailto:sage [2007/04/25(水) 10:08:47 ] >>208 順序尺度を量的に扱うのは文系ではよく見られます。 因子分析にかけているのも見たこともあります。 共分散構造分析をかける人もいるでしょう。 間隔尺度とみなしても妥当かどうかは判断が分かれるところですが、 数量化法などの利用を勧めても統計に詳しい人が回りにいなくて使えないようです。 今回の目的から考えると共分散構造分析という大層なものでなくても 普通に線形回帰で様子を見ればいいのではないでしょうか。 量的に扱う問題点は結局それを報告する相手が納得するかどうかです。
210 名前:132人目の素数さん [2007/05/01(火) 15:46:10 ] R以外にもフリーの統計ソフトあるってうわさを聞いたんですけど知ってる人いませんか? 計量経済学の手法がたくさん実装されてるらしいんですが。
211 名前:132人目の素数さん [2007/05/01(火) 21:35:58 ] フリーの統計ソフトなんて、MS-DOSの時代から星の数ほどありますがな。 (大型機上のFORTRANなんかは知らないけど。)
212 名前:132人目の素数さん [2007/05/01(火) 22:55:27 ] 2つの変量の関係を、散布図にしてみると、2次式もしくは、区間を区切った (例えば、0<x<150°)三角関数に近いと思うのだが、最適な式を得る分析方法 は、ありますか? 直線だったら、最小自乗法で、回帰直線を得るようなものの、2次式版です。
213 名前:132人目の素数さん mailto:sage [2007/05/01(火) 23:48:01 ] >>212 y = a0 + a1*x + a2*x^2 を当てはめるということ? それも線形重回帰分析ですがな。 (x^2を新たな変数として準備しておくだけ。)
214 名前:132人目の素数さん mailto:sage [2007/05/02(水) 12:58:49 ] >>212 最小二乗法自体は直線回帰以外にも使える。 f(x;a,b,c) = a + b x + c x^2 として、これを点列 (x[k], y[k]) に 当てはめたときの二乗誤差 E = Σ(y[k] - f(x[k];a,b,c) )^2 を パラメタ a, b, c で最小化、つまり偏微分して 0 と置いて解く。
215 名前:132人目の素数さん [2007/05/04(金) 23:41:09 ] クロスバリデーションについて、詳しく解説している書籍やサイト等(日本語・英語は問いませんが、なるべくなら日本語で)を誰か紹介してくれませんか?
216 名前:132人目の素数さん mailto:sage [2007/05/06(日) 23:28:05 ] >>215 とりあえず、ぐぐれ。 そうすれば自分がいかに漠然とした質問をしているかが分かるだろう。
217 名前:132人目の素数さん [2007/05/08(火) 08:09:35 ] 最近、イデア論と統計学が同じであることに気付いた。 この事実は新発見なのか?またはよく言われていることなのか? 教えてください。
218 名前:132人目の素数さん mailto:sage [2007/05/09(水) 05:15:15 ] イデア論と統計学の類似性については昔から言われていることです。 たとえば、 sociology.jugem.jp/?eid=167 ただ、ここまでで、これ以上の発展はないと思います。 貴方の発見がこれ以上なら非常に面白いので教えてください。
219 名前:132人目の素数さん mailto:sage [2007/05/10(木) 17:54:20 ] 数学@2ch掲示板用 掲示板での数学記号の書き方例と一般的な記号の使用例 members.at.infoseek.co.jp/mathmathmath/
220 名前:132人目の素数さん [2007/05/15(火) 10:23:02 ] 質問です。 平均の長さがa1,a2,a3,a4,a5 の5つの部品を継ぎ合わせて 組み付ける工程がある。この工程の仕上がり寸法の規格は, 2.020±0.030mmである。各部品寸法の精度(標準偏差)は 同程度で製作できる。仕上がり寸法が正規分布するものとして, 規格を満足しないものが0.3%程度あってもよいとするならば, 各部品精度をどの程度にすればよいか検討しなさい。 という問題です。統計を始めたばかりで全然分からないのですが、 完成品が正規分布N(2.020,x^2)に従うとして、±0.030mmを超えるもの が0.003程度となるxを調べたところおよそx=8になりました。 この考え方があっているのかもわからない初心者です。 (これだと平均の長さとか、5つに分かれていることなどがまったく 無意味になっているのでおそらく違うのでしょう・・・) ご教授お願いします。
221 名前:132人目の素数さん mailto:sage [2007/05/15(火) 14:19:59 ] おしえてください。 これから統計など学ばなければならなくなってしまい、 猿でもわかるような、だれでもわかるような、絵が沢山かいてあって わかりやすい、統計学の本さがしています。 みなさん教えてください。 主観、客観は問いません みなさんに教えて貰った本を買いに行こうと思います。 宜しくお願いします。 ※ ここのスレは 英語が沢山でてきていて、ともてレベルが高いので 超初心者のスレとかあるんですかね?
222 名前:132人目の素数さん mailto:sage [2007/05/15(火) 15:11:34 ] 絵が描いてある=わかりやすいってのはよくある誤解の一つだな。 絵やグラフにかいたほうが分かりやすいという物事はあるが、そういうのがあればあるほど分かりやすいってものでもない
223 名前:132人目の素数さん mailto:sage [2007/05/16(水) 00:14:59 ] >>221 >猿でもわかるような(中略)絵が沢山かいてあって(中略)統計学の本 マンガでわかる統計学 www.amazon.co.jp/dp/4274065707 条件に当てはまり評判が良い本ならこれですね。 この本だけで済むはずないとは思いますが最初の一歩にどうぞ。
224 名前:132人目の素数さん [2007/05/22(火) 02:35:12 ] このスレか質問スレのどちらに書いたらよいか迷いましたが、 統計に関することなのでこちらに書きます。 標準正規分布の尖度がなぜ3になるのか分かりません。 そもそも標準化した3次、4次のモーメントがなぜ歪度、尖度を表すのか という点も完全には理解できていません。 ウィキ等で調べたのですが、いまいちよく分かりませんでした。 厳密には難しい概念なのでしょうか。
225 名前:132人目の素数さん mailto:sage [2007/05/22(火) 13:29:02 ] >>223 dクス。いきなり買ってしまった。 1 点 マンガでわかる統計学 販売: Amazon.co.jp 1 点 マンガでわかる統計学 因子分析編 販売: Amazon.co.jp 1 点 マンガでわかる統計学 回帰分析編 販売: Amazon.co.jp 全部買ってしまった。 で、読んでみると、とても分かり易かった。 なんか、『萌え単』みたいだね。 マンガでわかる統計学の最後は『陰からマモル』みたいだったしwwww 初心者には向いている本ですね。
226 名前:132人目の素数さん [2007/05/22(火) 16:48:37 ] ここでよいか分りませんが、質問させてもらいます。 ある二次元分布の線形性(直線性)を示す、最適なパラメーターはないでしょうか?
227 名前:132人目の素数さん mailto:sage [2007/05/23(水) 13:55:03 ] すいません。助けをお借りしたくて書き込みします。 統計学の「と」の字も分からない私が、大学で統計学の課題を出されてしまいました。 自力でやろうとはしたのですが、やはりわかりません。よければ教えて下さい。 標本A 標本B 16 8 9 2 12 10 12 1 10 4 6 5 という二つの標本のグループがあり、問題は 1)標本A,Bの母平均に差があるかどうかを有意水準5%で検定しなさい。 2) 1)の検定の自由度はいくらか? です。どうかよろしくお願いします。
228 名前:132人目の素数さん mailto:age [2007/05/23(水) 15:54:21 ] age
229 名前:132人目の素数さん mailto:sage [2007/05/23(水) 20:50:26 ] >>227 ワロタ
230 名前:132人目の素数さん [2007/05/23(水) 22:35:48 ] 本を読め本をw
231 名前:132人目の素数さん mailto:sage [2007/05/23(水) 22:42:07 ] 統計学の講義をとってる人が何で統計学の「と」の字くらいわからないのよ。 使ってる教科書の題名と目次を挙げてみなよ。誰かが答えてくれるかもよ。
232 名前:132人目の素数さん mailto:sage [2007/05/24(木) 08:36:07 ] 文系の人間で、いきなり統計学やると難しいな。
233 名前:132人目の素数さん mailto:sage [2007/05/24(木) 08:47:06 ] Σがわからんとか、内積がわからんとかなら救いようがあるが、 √がわからんとか、二乗の和がわからんとか、どないせえっちゅうねん、と思うことがある。
234 名前:132人目の素数さん mailto:sage [2007/05/24(木) 10:39:11 ] データ数がわからないときの平均ってどうやって出すんですか? 誰か教えてください。 お願いします。
235 名前:234 mailto:sage [2007/05/24(木) 10:40:25 ] ヒストグラム、相対頻度はわかっています。
236 名前:234 [2007/05/24(木) 11:12:27 ] 貯蓄残高について 貯蓄残高 相対頻度 200万未満 9.99 400 12.85 600 13.54 800 10.54 1000 9.97 1200 7.63 1400 6.18 1600 4.6 1800 4.31 2000 3.02 2200 2.21 2400 1.89 2400以上 13.26 模範解答には「便宜上200万未満は、100万以上200万未満。 2400万以上は未満として扱うと書いてある2400万以上5000万未満」 と書いてあります。 問題は貯蓄残高の対数をとったものでヒストグラムを書き、平均を求めよ といった感じです。
237 名前:132人目の素数さん mailto:sage [2007/05/24(木) 11:14:17 ] >>234 意味不明
238 名前:234 [2007/05/24(木) 11:17:25 ] >>237 236の問題でも意味不明ですか?
239 名前:132人目の素数さん [2007/05/24(木) 16:15:44 ] 誰か教えてください。 問い 「所得分布や資産分布が対数正規分布に従うとする根拠を以下の2つの 命題をヒントとして述べよ。」 ヒント1:ランダムな要因をいろいろ足したものは、中心極限定理より正規分布に従う。 ヒント2:変数の積の対数を取ると、個別の変数の対数の和となる。
240 名前:132人目の素数さん [2007/05/24(木) 19:56:28 ] >>238 ランダムサンプリングしれべよかね?
241 名前:132人目の素数さん [2007/05/25(金) 00:38:38 ] >>239 別に根拠とかないと思うんだよね。 出題者に、お前何が言いたいんだよ、と小一時間問い詰めたい。 まあ、「ヒント1」のステートメントの馬鹿さ加減からして、 賢ぶってる経済系の教官かなw
242 名前:132人目の素数さん [2007/05/25(金) 12:01:26 ] ja.wikipedia.org/wiki/%E6%9C%89%E6%84%8F
243 名前:132人目の素数さん [2007/05/25(金) 13:27:34 ] >>242 ひどいね 誰かかきなおせ 同種の検定を繰り返して全体での有意性の有無を判断する場合(多重比較)には、1回の検定に対する有意水準をαとすれば全K回の検定で第1種の過誤の可能性がKαとなる。 具体的にはα=0.05、K=20とするとKα=1となってしまい、これでは検定の意味がない(必ず有意の結論が出る)。そこで簡単な方法として、1回の検定における有意水準をαで なくα/Kとする方法も採られる(ボンフェローニ補正)。
244 名前:math太郎 mailto:aaa@bbb.ccc [2007/05/25(金) 13:45:51 ] >236 統計学というより、簡単な算数の問題ですね。 対数取ったあとの平均値は1191万円。 対数とらないときには、1229万円。 平均所得高いねー・・・。 おれも平均ぐらい所得欲しいぞ。。。 多分、高校生ですよね???
245 名前:132人目の素数さん mailto:sage [2007/05/25(金) 16:27:18 ] >>244 所得じゃなくて、貯蓄だからこんなもんじゃない?
246 名前:math太郎 mailto:aaa@bbb.ccc [2007/05/26(土) 01:56:24 ] >245 ううう、貯蓄ですね・・・ 2400万以上が13.26%というのは、 所得にしては高すぎると思いました・・・。
247 名前:132人目の素数さん [2007/05/26(土) 05:25:47 ] 検定の範囲での中間試験あるんだが、練習問題出してくれ
248 名前:132人目の素数さん [2007/05/26(土) 16:10:44 ] >>243 書き直しておいてあげたよ。これでOK?
249 名前:132人目の素数さん [2007/05/26(土) 19:53:29 ] >>248 GJ。重箱隅だけど、 「k回の試行の従属性に依存する」 ↓ 「k回の試行の独立性に依存する」 統計的(または確率的)独立性の場合、否定形は「独立ではない(not independent)」。 「従属(dependent)」という表現は使わないよ(理解可能ではあるが)。
250 名前:132人目の素数さん [2007/05/26(土) 23:53:41 ] >>249 dependentは、普通に使うと思うけど。。。 でも、日本語で書くときは独立性とした方が自然かな。 実は、書くときにもそう思ったので、直しておくか。
251 名前:132人目の素数さん [2007/05/27(日) 18:41:57 ] Googleヒット件数 「独立 independence(t)」 名 Results 1 - 10 of about 238,000 for "statistical independence". 形 Results 1 - 10 of about 728,000 for "statistically independent". 否 Results 1 - 10 of about 42,700 for "not statistically independent". 「従属 dependence(t)」 名 Results 1 - 10 of about 94,800 for "statistical dependence". 形 Results 1 - 10 of about 44,500 for "statistically dependent". 否 Results 1 - 10 of about 399 for "not statistically dependent". よって、 名詞形 Pr{ "独立性" } > Pr{ "従属性" } 否定形1 Pr{ "非独立" } ≒ Pr{ "従属" } 否定形2 Pr{ "独立" } >>> Pr{ "非従属" }
252 名前:132人目の素数さん [2007/05/27(日) 20:19:27 ] 標準偏差の答えが0ってありえますか?
253 名前:132人目の素数さん mailto:sage [2007/05/27(日) 20:33:38 ] データ: 1, 1, 1, 1 の平均は 1、標準偏差はゼロ。
254 名前:132人目の素数さん [2007/05/28(月) 11:22:04 ] すみません、1/5の確率の物を100回試行したら成功数が 10以下になるみたいな確率をエクセルの関数で求めるには なんの関数を使えばいいかわかる方居ますか? ヒントだけでも教えて頂けるとありがたいです。
255 名前:132人目の素数さん mailto:sage [2007/05/28(月) 12:24:21 ] ヒント:それは統計と関係ない
256 名前:132人目の素数さん mailto:sage [2007/05/28(月) 13:20:42 ] 的確な指摘
257 名前:132人目の素数さん [2007/05/28(月) 14:01:42 ] >>251 ご苦労。independence が dependence よりも多いのは、 independenceを前提としているモデルが多いからでは、 という気がする。 "Suppose X1, X2 be statistically independent random variables" みたいな。
258 名前:132人目の素数さん [2007/05/28(月) 14:03:17 ] >>254-255 いや、正規分布で近似をするなら統計と関係あるし。 100くらいの標本数なら、正確な確率を求めるのは難しくない かも知れないけど。
259 名前:132人目の素数さん mailto:sage [2007/05/28(月) 14:11:16 ] >>254 に対する回答は =NORMDIST(10,100*0.2,SQRT(100*0.2*0.8),1) でいいのかな?
260 名前:132人目の素数さん mailto:sage [2007/05/28(月) 17:35:55 ] 計算が難しくもないのになぜへんな近似するアルか…
261 名前:132人目の素数さん mailto:sage [2007/05/29(火) 08:01:00 ] 数値は例ってことじゃ
262 名前:132人目の素数さん [2007/05/29(火) 19:21:37 ] シンプソンのパラドックスのプロジェクトするんですけど何書けばわかんない・・・ やった事は、SPの説明、何が原因で起きるか、野球選手の打率の例、テストの男女比較の例、んで結論として、どうすれば 集めたデータをこのパラドックスなしで解析できるか・・ って位なんだけど、なんか付け足せることありますかね?
263 名前:132人目の素数さん mailto:sage [2007/05/29(火) 20:49:58 ] 適切な層別化が必要という教訓を得れば十分だとおもう
264 名前:132人目の素数さん [2007/05/30(水) 00:54:13 ] ja.wikipedia.org/wiki/%E5%8C%85%E9%99%A4%E5%8E%9F%E7%90%86 ここにある、包除原理を確率において用いた恒等式の証明がわかりません。 よければ指南してもらえないでしょうか?? お願いします
265 名前:132人目の素数さん mailto:sage [2007/05/31(木) 08:04:25 ] 大学院入試で統計学の基礎が範囲なんですが、おそらく基礎の基礎だと思うんですが、 分散や尺度や相関関係などに関しての参考書とかないでしょうか?
266 名前:132人目の素数さん mailto:sage [2007/06/01(金) 08:44:47 ] >>265 数IIICの大学入試の問題集にもその程度は出てますよ。
267 名前:132人目の素数さん mailto:sage [2007/06/01(金) 22:46:48 ] >>266 出てたあなぁ・・・理系なのにわからない・・・
268 名前:132人目の素数さん [2007/06/04(月) 14:42:25 ] >>264 これは、帰納法で証明すると簡単だよ。 等式の右辺の最後は正確には±ではなく(-1)^(n+1)なので このwikiの説明わかりにくいよね。
269 名前:132人目の素数さん [2007/06/06(水) 10:37:11 ] 統計用語がわからなくて・・・質問です。 どなたか、おしえてください。 ある一定量のリンゴをサンプリングしてその全部を一人が味見してA:おいしい、B:普通、C:まずい と評価します。 このときにA、B、Cの割合が必ずある値になるように評価するという約束をします。 A:B:C=1:2:1とか、です。 この割合のことを統計用語ではなんというのでしょう? また、こういう割合を設定する約束のことをなんと表現するのでしょうか?
270 名前:132人目の素数さん [2007/06/06(水) 22:18:18 ] エクセル使う問題は大体こなせたのですが課題でひとつわからないのが残ってしまいました。 3つの事象XYZに関する独立性をXYZ上で定められた確率測度Qを利用して Q(X∩Y∩Z)=Q(X)Q(Y)Q(Z)が成り立つと定義する。 事象のペアXY,YZ、ZXが独立であっても3つの事象の独立がいえるか? 反例があればかきなさい。 という問題なのですが反例はあるんでしょうか? なかなかできず困ってます。
271 名前:math太郎 mailto:aaa@bbb.ccc [2007/06/06(水) 23:58:40 ] >269 正しいのかどうかわからんけど、 「評価割合の設定」とか聞いたことがありますよ。
272 名前:132人目の素数さん mailto:sage [2007/06/07(木) 02:10:00 ] 反例: Ω={w1,w2,w3,w4} P(w1)=P(w2)=P(w3)=P(w4)=1/4 X={w1, w2} Y={w1, w3} Z={w2, w3} っつーか、宿題は自分でやりましょう。
273 名前:132人目の素数さん mailto:sage [2007/06/07(木) 12:47:16 ] >>270 包除原理とド・モルガン
274 名前:132人目の素数さん [2007/06/08(金) 08:03:25 ] 共分散を求める際の平均は、加重平均でもよいですか?
275 名前:132人目の素数さん mailto:sage [2007/06/08(金) 22:14:43 ] 院試に統計・確率が必要なんですが、何か良い参考書ありませんかね? 詳細に書くなら、入門的であって、なおかつ詳しいところまで書いてある本です。
276 名前:132人目の素数さん mailto:sage [2007/06/08(金) 22:46:26 ] >>275 おまえには無理 あきらめろ
277 名前:132人目の素数さん mailto:sage [2007/06/12(火) 10:29:44 ] Academic版 Intercooled Stata 9から10へのアップグレードのお知らせが来た。 $413か、ちょっと悩むな。
278 名前:132人目の素数さん [2007/06/12(火) 13:57:31 ] すんません S:N比 = 100:1のガウシアンノイズって、 誤差は分散いくつのガウス分布に従うんでしょうか。。?
279 名前:初心者 [2007/06/15(金) 07:19:19 ] 初心者の質問ですが、お願いします。 ある測定値の、方法1と、方法2での結果の違いについて、 対応のないt検定をしようと思っているのですが、測定結果に "10未満"というのがあり、その扱いに困っています。 例えば、方法1の結果は(14,17,10未満,16,10未満)、方法2の 結果は(16,20,19,16,19)といった感じです。 こういった場合はどうすれば良いのでしょう? そもそも検定の選択が違い、t検定できないのでしょうか? 教えていただければ幸いです。
280 名前:132人目の素数さん mailto:sage [2007/06/15(金) 16:46:45 ] >>279 俺なら、conservativeに Wilcoxon テストを使うけどな。 そもそも 正規性を仮定しているt検定を 小標本のそういうデータに適用すること自体に無理がある。
281 名前:初心者 [2007/06/15(金) 17:53:33 ] >>132人目の素数さん ありがとうございます。 Wilcoxonを調べてみます。
282 名前:132人目の素数さん [2007/06/15(金) 17:58:14 ] 統計学がんばりましょう。
283 名前:132人目の素数さん mailto:sage [2007/06/18(月) 12:30:56 ] じゃんけんで8連勝する確立教えてちょ・v・あいこなしで
284 名前:132人目の素数さん mailto:sage [2007/06/18(月) 16:40:06 ] 1/256かな。
285 名前:132人目の素数さん [2007/06/18(月) 22:30:25 ] どなたか教えてください、ちょっと困ってます。医学論文を読んでいたら、 ”A indicated some level of significance if the 95% bracket was used.” という文章がありました。”95% bracket”は95%信頼区間のことでしょうか? どなたか回答をお願いします。
286 名前:132人目の素数さん [2007/06/18(月) 22:36:37 ] じゃんけんは、グー、チョキ、パー各々の出現確率が 1/3 じゃないぞ。 人によって必ず癖があるから、まず勝敗が五分五分にならない。 おまけに人間は、学習能力によって過去の結果を参考にしながら 次の戦略を立てるから、互いに独立な試行でもない。 よって、1/256 = (1/2)^8 は誤り。 答えは、データを取って研究してみないことにはわからん。
287 名前:132人目の素数さん mailto:sage [2007/06/18(月) 22:54:50 ] >>285 その文の中にある統計用語は、「有意水準(level of significance)」だけ。 「95%四角括弧」が何を意味してるのかは、その論文見てみないとわからんちょ。
288 名前:132人目の素数さん [2007/06/19(火) 04:23:29 ] はじめまして。 統計の初歩の初歩の部分の質問なんですが… 度数分布表の階級をわけるときは、未満にするのが基本なんですか…? わからないのは、懸垂の回数の問題なんですが、 階級 1回以上3回未満 3回以上5回未満 5回以上7回未満 または、 1回以上3回以下 4回以上6回以下 7回以上9回以下 どちらの分け方が正しいのですか? 先生曰く、気温問題は小数があるので未満で区切り 試験結果問題は以下で区切るといいました。 なんで違いが出るのかわかりません。 よろしくお願いします。
289 名前:132人目の素数さん mailto:sage [2007/06/19(火) 11:20:17 ] >>285 その通りでしょう。ここでの"bracket"は、括弧という意味では使われていないと思う。 limitを持った領域、まさに区間に相当する意味で使っているのでは。英英辞典引いてみてね。
290 名前:132人目の素数さん [2007/06/19(火) 11:51:34 ] >>288 細かいこと気にするな、どっちでも同じだ。 ただ「1回以上4回未満」は、結局のところ、{1,2,3} のいずれかだから、 各値になる確率が同様なら、平均は2になる。 そういう意味で、「1回以上3回以下」としておいた方が 1と3を足して2で割ると平均が分かって便利なんだよエッヘン、 と先生は言いたかったのかもしれん。
291 名前:132人目の素数さん [2007/06/20(水) 19:14:06 ] >>289 医学論文で 95%信頼区間 を短く言いたければ「95% CI」 が普通。 文学的な表現を使ったりするのは、一般向けニュース記事だな。 論文ならレフリーに怒られる。
292 名前:↑ mailto:sage [2007/06/20(水) 19:54:44 ] 馬鹿
293 名前:132人目の素数さん mailto:sage [2007/06/20(水) 22:49:40 ] >>291 医学論文じゃなくてもそれが普通だっての。そんなこと言ったって、目の前にある論文には役に立たん。 理解することの方が重要。 ・・・と>>292 の言いたいことを解説してみた。
294 名前:132人目の素数さん [2007/06/21(木) 00:02:08 ] 授業で疑問点が出たのでお願いします! xi〜N(μ、σ^2)の時 E(Σ(xi−x bar)^2)=(n−1)σ^2となることを示してください。
295 名前:132人目の素数さん mailto:sage [2007/06/21(木) 00:05:22 ] N(μ、σ)のEから計算できない?疑問点じゃなくて宿題じゃねーか。
296 名前:132人目の素数さん [2007/06/21(木) 00:11:04 ] そこがわからないので教えていただきたいのです。 自分、まだ統計学をかじり始めたばかりなので(>_<)
297 名前:132人目の素数さん mailto:sage [2007/06/21(木) 00:15:23 ] >293 確率論も学ばず統計学とな
298 名前:293 mailto:sage [2007/06/21(木) 05:37:18 ] え、俺?
299 名前:132人目の素数さん [2007/06/21(木) 05:39:02 ] >>289 所得階級の場合は bracket をそんな意味に使うけどね。他には見たことない。 95 percent bracket とかでググってみそ。 >>292-293 基地外?
300 名前:132人目の素数さん mailto:sage [2007/06/21(木) 05:49:58 ] A category of people or things that are similar or fall between specified limits : those in a high income bracket. (Oxford) 非専門的ではあっても、日本人が「括弧」から受ける印象ほど変な表現ではない。 試しに、"percent bracket" でもググって見たら。 念のためだけど、そう言う表現を使うことの是非は論じてないからね。
301 名前:132人目の素数さん [2007/06/21(木) 11:48:39 ] _____ /::::::::::::::::::::::::::\〜プーン /:::::::::::::::::::::::::::::::::::::::\〜プーン |:::::::::::::;;;;;;|_|_|_|_|〜プーン |;;;;;;;;;;ノ∪ \,) ,,/ ヽ〜 |::( 6∪ ー─◎─◎ )〜 |ノ (∵∴ ( o o)∴)〜 | ∪< ∵∵ 3 ∵> ムッキー! \ >>299 ⌒ ノ_____ \_____/ | | ̄ ̄\ \ 基地外? ___/ \ | | | ̄ ̄| |:::::::/ \___ | \| | |__| |:::::::| \____|つ⊂|__|__/ / |:::::/ | ̄ ̄ ̄ ̄| 〔 ̄ ̄〕 カタカタカタカタ
302 名前:132人目の素数さん [2007/06/21(木) 13:19:07 ] >>301 自画像かよw まあ英語圏の医療統計の専門家に ”A indicated some level of significance if the 95% bracket was used.” つー断片的な表現だけ見せて、「この "bracket" は信頼区間の意味か?」と聞けば、 全員が「それだけでは意味不明」と答えるよ。 肝心の情報を持ってる質問者の >>285 は、それ以上説明せんし、議論するだけ無駄だな。 まあ一応、推理だけしておくと、、、 1. その論文には図があって、図の中に |-----| (またはその縦型)のような図形が描かれてる。 2. で、その図形が、例えば、観測値の(95%)中央範囲を表す、とか、どっかに定義されてる。 3. 後の文章で、それを「the 95% bracket (95% H型図形)」と表現。
303 名前:132人目の素数さん [2007/06/24(日) 22:56:55 ] ある眼圧下降薬を10人に点眼して、1日後、2日後・・・14日後 と毎日朝9時に眼圧を測定しました。 2日後以降、眼圧が下がらなくなりましたって時は 反復測定のANOVAしてposthocすればいいのでしょうか? 教えてくださいまし。
304 名前:132人目の素数さん [2007/06/25(月) 22:47:35 ] すいません4つほど質問があります 1.標本数Nの標本から得られた平均値の標本分布の標準偏差をなんと呼ぶんでしょうか? 2.1つ1つの標本の分布と、標本抽出分布(標本平均の分布)との違いを教えてほしいです。 3.標本誤差と母集団標準偏差と標本数の関係 4.母集団から標本抽出を行う場合、標本数Nが大きくなると、標本誤差はどうなるか? すいません。馬鹿な私に教えてくださいまし
305 名前:132人目の素数さん [2007/06/27(水) 13:32:21 ] >>304 宿題は自分でやりましょう。 統計の問題というより、本を読んで定義と概念を理解すれば 答えられる問題ばかりですよね。
306 名前:132人目の素数さん [2007/06/27(水) 13:45:51 ] >>303 とりあえず2日後から14日後のデータだけを 線形トレンド(と定数項)に回帰して、 線形トレンドの係数が有意かどうか見てみたら?
307 名前:132人目の素数さん [2007/06/27(水) 18:05:11 ] 303です。 早速やってみます。ありがとうございます。
308 名前:132人目の素数さん mailto:sage [2007/06/27(水) 20:37:19 ] 今データ学習アルゴリズムって本を読んでて、カルバック擬距離が正であることの証明を読んでたんですが、 どうやらこの証明が間違ってるようです。 そこで自力で証明しようとしたんですが、なかなかうまくいきません。 どなたか証明の糸口を教えていただけないでしょうか?
309 名前:132人目の素数さん [2007/06/27(水) 23:19:24 ] 確率分布の問題で質問です。 Excelで解答を出したいのですが、正規分布と対数正規分布の関係が理解できません。 どなたかアドバイスをお願いします。 【問題】 ある地域の大雨時の排水量は平均4500[m^3/日]、標準偏差1500[m^3/日] の対数正規分布であると推定された。この地域に最大排水量は5500[m^3/日] の排水設備を設けたとき、以下の諸量はいくらになるか。 (1)この地域の洪水確率。 (2)この地域の排水量が2000[m^3/日]と5000[m^3/日]の間になる確率。 (3)この地域の90%確率排水量はいくらか。(累積確率90%に対応する変数の値、 10%の確率で年間降雨量はこの値以上になる) よろしくお願いします。
310 名前:132人目の素数さん [2007/06/28(木) 11:49:46 ] >>309 対数正規分布というのは、対数を取ると正規分布になる分布。 つまりXが正規分布に従うとき、exp(X)が対数分布に従う。 Xの平均、分散が分かってれば、exp(X)の平均・分散も分かる。 っていうか、そんなの教科書に公式載ってるでしょ?
311 名前:132人目の素数さん mailto:sage [2007/06/28(木) 13:50:36 ] 多変量解析についてご助言お願いします。 変動に周期性のある、ある変数を、他の変数を用いて、 時間的に関係式として記述したいのですが、 関係式に使う変数の絞り方等、この分野に殆ど無知であるために、 googleで調べてみても要領がよくつかめないのです。 この場合用いるべき手法や、おすすめの本、概 要の載っているHPなどありましたら、どうか教えていただけませんでしょうか。
312 名前:132人目の素数さん mailto:sage [2007/06/28(木) 17:03:10 ] >>311 やりたいことと合ってるか分からないけど、典型的には「ダミー変数」がキーワードじゃない? 12ヶ月なら11個の変数をぶち込んでregressすればいいんじゃないか。
313 名前:309 mailto:sage [2007/06/28(木) 17:27:47 ] >>310 丁寧な返答ありがとうございます。 つまり、対数正規分布を平均、分散を元に正規分布へ変換し、正規分布の確率密度関数を出しxについて積分すれば確率が求められるということでしょうか? 教科書を持っていないのでネットで検索してみました。
314 名前:132人目の素数さん mailto:sage [2007/06/29(金) 07:33:23 ] >>311 株価とか経済指標など予測が極めて困難な解析とかが目的なの?
315 名前:311 mailto:sage [2007/06/29(金) 10:35:14 ] >>312 >>314 迅速な返答ありがとうございます。 どうも言葉足らずだったようで、解りにくい事を言って申し訳ありません 私がやろうとしているのは、>>314 さんの仰るとおり予測が困難な解析で 一つの変数をコントロールしている要因がそもそも不明な状態です。 なので、1.リストアップしたうちからなるべく少ないパラメーターで、2.かつ正確に、 3.できれば時間経過的に周期を解析する。というのが至上目的です。 何分初めての経験で、2・3についてはそこまで期待していませんので、 こういう方法が良いんじゃないのか、程度のアドバイスを頂けたらと思っております。
316 名前:132人目の素数さん mailto:sage [2007/06/29(金) 12:50:42 ] 1,2の両立を考えるのは「モデル選択」という問題。 普通は「AIC」とか「Cp統計量」とかいう値を基準にして 最適なパラメーターセットを探すらしいよ。
317 名前:132人目の素数さん mailto:sage [2007/06/29(金) 16:43:20 ] 1に関しては近似によるあてはめが一番簡単。しかし当てはめ方は言わば任意だから 2がどうしても厳しい。 鍵となるのは摂動やランダムウォークやカオスかな。 ただしカオスに周期性を求めることは出来ない。 1の選択はとても難しい。モデルを作り上げるとすると条件をクリアした媒介変数を 採用するのだろうが、その条件は当然演算者や具現する人の恣意性の介入が予想される。 バタフライ効果と言う言葉があるけど影響が微小であると判断し切り捨ててしまった パラメータによって演算に多大な影響を及ぼす場合もあるのでパラメータごとに性質 を分析し採用の判断基準とすることが望ましいと思われます。
318 名前:132人目の素数さん [2007/06/30(土) 04:00:28 ] >>315 単なるモデル選択の問題なら、 >>316 が言うようにAICやC_pなどを使うのが良い。 Rなどのパッケージソフトで簡単にできる。 予測したい変数に先見的な季節性(例えば変数が電力使用量で、毎夏 に値が大きくなるなど)がある場合は、季節調整のためのダミー変数 を入れる方法もあるし、時系列モデルをつかって予め季節要因を取り 除くという便宜的な方法もある(例えばX-12 ARIMA など)。
319 名前:132人目の素数さん [2007/06/30(土) 04:02:42 ] >>313 その通りです。余計なお世話かも知れませが、 >>310 からそこまで理解できるのであれば、 あなたが直面している困難は 多分教科書(or公式集)を持っていないことだけです。
320 名前:132人目の素数さん mailto:sage [2007/06/30(土) 05:08:13 ] >>315 www.ne.jp/asahi/music/marinkyo/komputilo/statistiko.html.ja.sjis
321 名前:309 mailto:sage [2007/06/30(土) 09:13:43 ] >>319 ということは、 (1)の答えは=1-NORMDIST(ln(5500),ln(4500),ln(1500),1)に100かけたので。 (2)は=NORMDIST(ln(5000),ln(4500),ln(1500),1)-NORMDIST(ln(2000),ln(4500),ln(1500),1)に100かけたので。 (3)は=NORMINV(0.9,ln(4500),ln(1500))*100であっていますでしょうか?
322 名前:311 mailto:sage [2007/06/30(土) 11:19:11 ] 沢山のアドバイスありがとうございました。 取りあえずRの使い方と>>320 さんの本でゆるゆる勉強していきたいと思います。
323 名前:132人目の素数さん [2007/06/30(土) 14:48:19 ] >>309 青木先生んとこと2ちゃんねるでマルチポストとは度胸あるな。 最悪だ。
324 名前:132人目の素数さん [2007/06/30(土) 23:30:38 ] 母分散に関する区間推定を自分でデータを探してしなさい というレポートが出てるのですが、何かいいデータはないですか?
325 名前:132人目の素数さん mailto:sage [2007/07/01(日) 02:38:56 ] litchfield-wilcoxon法 とはどのようなものなのでしょうか? これを用いてレポートを書かなければならないので、 どなたか手順などをご教授いただけないでしょうか?
326 名前:132人目の素数さん [2007/07/01(日) 05:32:18 ] >>324 MLB選手の打率
327 名前:132人目の素数さん [2007/07/01(日) 05:34:33 ] >>325 wwww ttp://okwave.jp/qa2244107.html
328 名前:132人目の素数さん [2007/07/01(日) 15:07:55 ] 標準偏差について教えてください。 母集団の標準偏差を求める式においては、 (各標本と平均との差)の2乗を(標本の個数)で割った値の平方根を 求めますが、 標本の標準偏差を求める式において、は (各標本と平均との差)の2乗を(標本の個数-1)で割った値の平方根を 求めます。 この際、標本の標準偏差では何故標本の個数から1引くのでしょうか? よくわからないんで、気になって仕方ありません。
329 名前:132人目の素数さん [2007/07/01(日) 15:43:49 ] >>328 その標本の分で(自由度−1)。こう考えとけ。
330 名前:132人目の素数さん mailto:sage [2007/07/01(日) 15:55:44 ] >>328 ちゃんと教科書買った方がいい…
331 名前:132人目の素数さん [2007/07/01(日) 16:45:12 ] 最近統計の勉強が必要になって、ハンバーガー統計学 というサイトを見つけたので、そこで勉強していたのですが、 kogolab.jp/elearn/hamburger/chap2/sec3.html ここでは、区間推定をするために母集団を正規分布と仮定していますが、 正規分布の保証がない場合はどうすればいいのでしょうか? また、 不偏分散=((データ−平均値)の二乗)の総和÷(個数-1) と不偏分散を求めていますが、(個数-1)というのは何か根拠のある 値なのですか? よろしくお願いします。
332 名前:132人目の素数さん [2007/07/01(日) 17:05:48 ] >>331 正規分布じゃなくても確率モデルがあればそれに応じて計算すればよい。 何もなければ求められない。 >>328 >>331 標本分散=(n-1)/n 母分散 ttp://www.kisc.meiji.ac.jp/~iwabuchi/suuchi/fuhenbunsan.html
333 名前:331 [2007/07/01(日) 18:11:43 ] ありがとうございます。 正規分布でない場合はやはりほかの事をしなければいけないんですね。 ありがとうございます。 n-1にもちゃんと根拠があったんですね。 ただ、(xの平均値-u)の二乗の期待値が(σの二乗)/nになる というところが肝心だと思うのですが・・・。
334 名前:132人目の素数さん [2007/07/01(日) 19:23:05 ] 期待値よりも、tとかχ自乗とかFとかの検定用の分布を使う時に 自由度の重要さを理解させるのが目的。 標準偏差推定値は不偏にならんし。 只の推定だけだったら、観測値の個数で割っとくのが、一番矛盾が少ない。
335 名前:132人目の素数さん mailto:sage [2007/07/02(月) 01:52:40 ] >>334 矛盾が少ない、という言い方は抵抗があるなぁ。 確かにnで割る方が最尤推定値ではあるが、最尤推定値が「矛盾が少ない」というのは違うと思うな。
336 名前:132人目の素数さん [2007/07/02(月) 11:57:44 ] すみませんが、統計学用語の日本語訳を教えてください。 英語の教科書で”Crest=|max-min|/(2*RMS)"とあります。 最大-最小の差を実効値の2倍(つまりpk-pkの平均振幅)で割っているので、 変動の激しさを表すことはわかるのですが、"Crest"の日本語に対応する 用語がわかりません。このCrestというのは日本語ではなんと言う言葉に なるのでしょうか。 なにとぞよろしこ。
337 名前:132人目の素数さん [2007/07/03(火) 12:21:04 ] 教科書に載ってた問題なのですが、教科書の答えとあいません。 私の解答のどこがいけないかよろしければ教えてください。 問、知能指数IQは正規分布N(100,15^2)に従う。IQが150以上の人は全体の何%? あるIQの値bは一次変換Z=(b-100)/15 より正規分布N(0,1)に従う。 IQの値150は一次変換より(150-100)/15=10/3=3.333・・・ 求める割合をaとすると P(150≦X)=P(3,333・・・≦Z)=a P(Z<3.333・・・)=1-a P(0<X<3.333・・・)=0.5-a 正規分布表より P(0<X<3.333・・・)=0.4996 よってa=0.0004 答え0.04% 教科書の答え 0.12%
338 名前:132人目の素数さん mailto:sage [2007/07/03(火) 12:43:04 ] 訂正 P(0<X<3.333・・・)=0.5-a 正規分布表より P(0<X<3.333・・・)=0.4996 のXはZ
339 名前:132人目の素数さん [2007/07/03(火) 12:43:10 ] 問、が本当にそれであっているのであれば 君の回答が正で、教科書の答えが誤だね。
340 名前:132人目の素数さん mailto:sage [2007/07/03(火) 13:00:28 ] >>339 そうですか・・・ 返答ありがとうございました
341 名前:336 [2007/07/05(木) 11:08:55 ] 事故解決です。波高率って言うんですね。
342 名前:132人目の素数さん [2007/07/06(金) 18:32:55 ] お願いします。 X1=1 X2=9 X3=8 X4=7 X5=1 X6=1 X7=1 X8=3 は時系列のデータとする。n=2 n=3とした移動平均値を求めて図示し、どちらが滑らかか図より判断せよ(n=2の場合は中心化せよ) という問題がわかりません。どなたか解説していただけないでしょうか?自分なりに教科書に目を通してやってみたのですが全くわかりません。宜しくお願いします。
343 名前:132人目の素数さん mailto:sage [2007/07/07(土) 06:09:50 ] >>342 移動平均の式とグラフ付き例題1つさえあれば、小学校3年生でもできる問題。 それを誰かに教わらないとできないようなら、小学校1年生からやり直すしかない。。
344 名前:132人目の素数さん [2007/07/07(土) 18:56:47 ] >>327 鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱 鬱鬱鬱 鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱 鬱鬱鬱 鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱 鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱 鬱鬱鬱鬱鬱 鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱 鬱鬱鬱 鬱鬱鬱鬱鬱 鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱 鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱 鬱鬱 鬱鬱鬱 鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱 鬱鬱 鬱鬱鬱鬱 鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
345 名前:132人目の素数さん mailto:sage [2007/07/07(土) 23:09:59 ] 母集団の分布は、平均μ(未知)、分散σ^2(既知)の正規分布に従っている。 _ クラメール・ラオの不等式を用いて、標本平均Xがμの最良推定量であることを示しなさい。 という問題なのですが示せません・・・ 計算してみたら _ {nI(X;μ,σ^2)}^-1 = 2πσ^4 / n という値になり、V(X)=σ^2 / n と結果が違えてしまいます。 助けてください。
346 名前:345 mailto:sage [2007/07/08(日) 00:10:19 ] 解決しました。すいません。 計算途中のlogの位置が間違えていたようです。
347 名前:132人目の素数さん mailto:age [2007/07/08(日) 07:29:57 ] >>345 ttp://image.blog.livedoor.jp/oooooop/imgs/f/c/fcb45f06.jpg
348 名前:132人目の素数さん [2007/07/08(日) 07:31:44 ] ttp://blog73.fc2.com/g/gamansite/file/photo2.jpg
349 名前:132人目の素数さん [2007/07/08(日) 07:32:37 ] 6.dtiblog.com/e/eroero5757/file/32814-7212436-0-23869080-pc.jpg
350 名前:132人目の素数さん [2007/07/08(日) 07:34:26 ] ttp://12.dtiblog.com/f/fetimani/file/file_20060724T145615187.jpg
351 名前:132人目の素数さん [2007/07/08(日) 07:39:23 ] ttp://blog17.fc2.com/o/oppaideai/file/8999.jpg
352 名前:132人目の素数さん [2007/07/10(火) 02:10:38 ] 基本的なことかもしれませんが…お願いします>< @仮説検定を用いることによって、どのようなことを明らかにすることができるのか。 具体例をあげて説明しなさい。 A集団Aと集団Bがあり、それぞれ平均値・分散・標準偏差がわかっている。 これら3つの情報を用いて、2つの集団の特徴をどのように比較できるか。 具体例を挙げて説明しなさい。
353 名前:132人目の素数さん mailto:sage [2007/07/10(火) 03:05:26 ] 何で性懲りもなく基本的な宿題を丸ごとここで聞く訳? 過去ログ見ても、殆ど回答が貰えないのは分かるでしょ。 勉強しろ。クラスメートと話せ。何を勉強していいかすら分からなければ、まずそれを先生に聞け。
354 名前:132人目の素数さん [2007/07/10(火) 17:06:56 ] 統計学初心者です。以下の問題の意味がわかりません。どうぞご教授ください 偶数目が出る確率が1/9、奇数目が出る確率が2/9といういびつなさいころを五回投げる。4以上の数がnかい出る確率をpとする。そのとき4以上が出る回数の期待値、分散、標準偏差を求めよ 以上のような基本的な問題なのですが、偶数目が出る確率が1/9、奇数目が出る確率が2/9の時点で確率としておかしいのではないか思います。もし解ける方がいらっしゃいましたら教えてくださいお願いします
355 名前:132人目の素数さん mailto:sage [2007/07/10(火) 17:26:47 ] 3て書いたつもりがへたくそで9に見えてる
356 名前:132人目の素数さん mailto:sage [2007/07/10(火) 17:28:43 ] 1,3,5がでる確率がそれぞれ1/9 2,4,6がでる確率がそれぞれ2/9 全部あわせて1となる。
357 名前:132人目の素数さん [2007/07/10(火) 19:07:48 ] すごく簡単な問題かもしませんがだれか教えください。。。 問題 正規分布N(10、8)に従う確率変数Xに対して、標準偏差分布表を用いて次の問いに答えよ 1.Xが12以上の確率を求めよ 2.Xが6以下の確率を求めよ 3.Xが6以上12以下である確率を求めよ よろしくお願いします
358 名前:132人目の素数さん mailto:sage [2007/07/10(火) 19:32:24 ] 幾何分布は Pr[ X=n+k | X≧k ] = Pr[ X=n ] となることを示せ という問題なんですが、Pr[ X=n+k | X≧k ]の意味がわかりません どうやって求めたらいいんでしょうか Pr[ X=n+k | X≧k ] = Pr[ X=n+k , X≧k ] / Pr[ X≧k ] かと思ったんですが、今度は Pr[ X=n+k , X≧k ] を どうやって求めたらいいのかわからなくなりました
359 名前:132人目の素数さん mailto:sage [2007/07/10(火) 20:36:12 ] >>358 Pr[ X=n+k , X≧k ] = Pr[ X=n+k & X≧k] あとは考えてみれ
360 名前:358 [2007/07/10(火) 22:56:49 ] >>359 Pr[ X=n+k , X≧k ] = 納x=k,∞] ( p^(n+x) )(1-p) と計算すればいいのでしょうか しかしそうすると、右辺は p^(n+k) となってしまい 題意を満たさないと思うのですが どう計算すればいいのでしょうか
361 名前:132人目の素数さん mailto:sage [2007/07/11(水) 00:39:36 ] 1/Pr[ X≧k ]
362 名前:358 mailto:sage [2007/07/11(水) 01:05:43 ] Pr[ X=n+k | X≧k ] = Pr[ X=n+k , X≧k ] / Pr[ X≧k ] = Σ[x=k,∞] ( p^(n+x) )(1-p) / Σ[x=k,∞] ( p^(x) )(1-p) = p^(n+k) / p^k = p^n となって Pr[ X=n ] = (p^n)(1-p) と一致しないんですが、何がいけないんでしょうか
363 名前:132人目の素数さん mailto:sage [2007/07/11(水) 01:43:00 ] >>362 Σ[x=k,∞] ( p^(n+x) )(1-p)=Pr[X≧n+k] になっちゃうなぁ。 たとえば、「x=2 かつ x≧1」は、「x=2」と同値だ。 「X=n+k かつ X≧k」は「X≧n+k」と同値ではないだろう?
364 名前:132人目の素数さん mailto:sage [2007/07/11(水) 17:24:10 ] 統計学においての四捨五入のルールについての質問です。 問いD 処理温度が250℃の時、プラスチック強度を40得るためには圧力をどう設定しなければなりません か? 答え: ?式:Yhat=−0.727+0.192X1-1.136X2のX1に250、Yに40を代入する。 40=-0.727+0.192×250-1.136X2 X2=6.402287 つまり、プラスチック強度を40得るためには圧力を6.402287気圧以上に設定しなければならない。 という所まで計算したんですが、?式というのは問4までに回帰分析でもとめたもので、各項目は既に小数点第四位で四捨五入しているんです。 その場合、今回の圧力は小数点何位で四捨五入すべきでしょうか。 悩みどころなのは、どれだけ必要か、を聞いているのだから四で切っちゃまずい気もするし ここだけ繰り上げにするのもどうかと思う 質問の仕方が稚拙ですみません。よろしくお願いします
365 名前:132人目の素数さん [2007/07/12(木) 03:03:54 ] くだらない質問ですいません。 絵の下手なぼくはノートに正規分布の曲線(ベルカーブ)をフリーハンドで書くのが苦痛でしかたありません。 簡単に描けるテンプレート定規みたいなのをご存じないでしょうか? ついでに、シグマとかパイとかのギリシャ文字もぼくが書くと下手な絵のようになってしまいます。 これもちょうど良いテンプレート定規が無いでしょうか? よろしくお願いします。
366 名前:365 [2007/07/12(木) 03:08:26 ] もうひとつついでに質問させてください。 ガウスの正規分布やピアソンのカイ二乗分布、スチューデントのt分布などがどのように発見されたのか、 数学的にもそれなりに詳しく分かりやすく具体的に書かれた書籍って無いでしょうか?
367 名前:132人目の素数さん [2007/07/12(木) 03:11:30 ] 【参院選】民主党から、在日コリアンの期待背負った金氏(民団幹部)が立候補…在日参政権訴え news22.2ch.net/test/read.cgi/newsplus/1184165873/l50
368 名前:132人目の素数さん [2007/07/12(木) 21:43:22 ] 最近大学で研究室に入ったのですが、統計的にデータをまとめる際に分からないことがあったのでお尋ねします。 有意に差があるかの検定法は分かるのですが、同じものであることを統計的に出す方法はあるのでしょうか? 統計の本は買ったのですが、数学が苦手で、基本的な所から進めません。
369 名前:132人目の素数さん mailto:sage [2007/07/13(金) 00:10:06 ] どれを勉強すれば良いのか分からないので質問お願いします 例えばイチローが9月に30本ヒット打ったとして その時にある日3本以上ヒット打つ確率は?って問題だと 何を勉強すれば良いのでしょうか??
370 名前:132人目の素数さん mailto:sage [2007/07/13(金) 05:33:40 ] >>369 まず、 「順列・組み合わせ」 から勉強しよう。
371 名前:132人目の素数さん mailto:sage [2007/07/13(金) 08:50:40 ] >>370 どうも。これって高校のときの確率の話しですか? マジすか・・・ 単純な順列なら出来るんすけど(5人の並べ方) ちょっとだけ応用も同じで(女子3人と男子5人で女子3人が常に隣り合う場合) けど、それ以上は分からない・・・何かお勧めのHPないですか?? あと、もう一つ質問なんですが、平均50kg標準偏差10kgでその荷物が70kg以上である確率とかです・・・
372 名前:132人目の素数さん mailto:sage [2007/07/13(金) 09:27:42 ] >>371 順列組み合わせなら、高校範囲くらいでじゅうぶんだろ。 ただしそのイチローの場合もうちょっと条件が必要になる。 9月中に何試合あるのか。 一試合で何打席あるのかなんてのも 考えなくちゃならない。 実際は試合毎に打席数はちがうんだろうが、平均何打席ってのでも いいのかもしれない。 > あと、もう一つ質問なんですが (ry 標準正規分布表(両側確率) の 2.00のとこを見れ。 なぜ2.00のとこかというと、 70kgってのは 平均50kgから標準偏差10kgの2.00倍離れているからだ。 さてじつはそこに書いてある数値は70kg以上だけではなくて30kg以下の場合も含んである。 (30kg以下も同じく平均から20kgはなれてるだろ?) なもんでその半分が、70kg以上である確率。
373 名前:132人目の素数さん mailto:sage [2007/07/13(金) 12:08:27 ] >>372 いろいろ調べてるんですが、みつからないっす・・・ 問題は適当に作ったんで、9月30試合、1試合30打席も可ということで 単純に(全部の組み合わせ-1日だけ2本の組み合わせ)/全部の組み合わせ 30!-29!/30!だと間違っていますか? 後半はOKです なんか計算式で、Z=(70-50)/10=2.00 正規分布で見てってあったんですが、この場合も半分にするんすかね?
374 名前:132人目の素数さん mailto:sage [2007/07/13(金) 13:25:56 ] 横槍だけど、どえらい勘違いをしてない? 組み合わせというのは、ある日の、例えば5打席中、どれか3打席でヒットを打つということでしょう? 一打席でヒットを打つ確率は、単に打率の問題で、それは月間全打席(例えば5打席20試合=100打席)中、30打席。 この打率に基づいて、一日に3本ヒットを打つ組み合わせを考えるんだと思うけど。
375 名前:132人目の素数さん mailto:sage [2007/07/14(土) 21:29:47 ] 一次変換する」という言葉が出てきたんですがどういうことをすることを いうんでしょうか?UBまでしか勉強してないんで分からないのですがおしえてください.
376 名前:132人目の素数さん mailto:sage [2007/07/15(日) 02:24:50 ] u=Av (Aは行列、u, vは座標上の点あるいはベクトル)で表される、平面から平面への変換。 二次元ならx'=ax+by, y'=cx+dyと書ける。 これでは分からないだろうから、一次変換、(線形)写像、一対一、等のキーワードでググリれ。 ちなみに、統計分野なら標準化は一次変換にあたるよね。
377 名前:132人目の素数さん [2007/07/15(日) 18:57:06 ] あるテストを受けた生徒500人の得点の平均は45点、標準偏差は13点であった。 得点が19点より上で71点より下の生徒は、500人のうち少なくとも何人いると見積もれるか。 この問題がどうしても分からないです・・・ ヒントでもあればぜひヨロシクお願いします。 自分的にはチェビシェフの不等式を利用しようと考えたのですが。
378 名前:132人目の素数さん mailto:sage [2007/07/15(日) 19:00:18 ] >>377 標準正規分布表を見てってのじゃあかんの?
379 名前:132人目の素数さん [2007/07/15(日) 19:44:53 ] >>378 分布表ついてないです・・・
380 名前:132人目の素数さん [2007/07/15(日) 20:18:05 ] ±2σで0.954499736
381 名前:132人目の素数さん mailto:sage [2007/07/15(日) 21:33:03 ] >>377 もっと勘を働かせないとw なぜ19点と71点なのか?それは・・・ 45-2*13=19 45+2*13=71 だから>>380 が使える。 まあ、日本の中学・高校数学らしい問題だね。
382 名前:132人目の素数さん [2007/07/15(日) 21:45:55 ] すみません。質問です。 t検定の対応のある検定と、対応のない検定とでは検定結果が どう違ってくるんでしょうか? あと、第一種と第二種の過誤の両方の確率を下げるためにはどうすればよいの でしょうか? すみません。お願いします。
383 名前:132人目の素数さん mailto:sage [2007/07/15(日) 21:53:28 ] 後は自分でやり給へ。
384 名前:132人目の素数さん mailto:sage [2007/07/16(月) 01:44:13 ] >>381 分布表無しで>>380 の値をどうやって手に入れるのですか?
385 名前:132人目の素数さん mailto:sage [2007/07/16(月) 02:17:04 ] もしかして2σであることは理解してたのか? まあ正確には分布表が必要けど、統計を学ぶ人には95%というのは殆ど常識じゃない?
386 名前:384 mailto:sage [2007/07/16(月) 04:48:47 ] >>385 あ、失礼。 自分は377じゃないです。 2σだというのは気が付いてはいましたし2σだと約95%だとは知ってはいましたが >>379 に 分布表はないとあるので なにかそれが約95%であるとわかるうまい方法があるのかと思って 便乗質問しました。
387 名前:132人目の素数さん [2007/07/16(月) 04:58:24 ] >>386 おまえ分かってないだろほんとは
388 名前:132人目の素数さん mailto:sage [2007/07/16(月) 04:59:41 ] >>387 ええ、もちろんわかってないから聞いたんですが。
389 名前:132人目の素数さん mailto:sage [2007/07/16(月) 05:03:46 ] 平均から2σ以内に95%が入るのは 呪文のように憶えています。 どういう理屈で2σ以内が95%なのかはわかってないという意味です。
390 名前:132人目の素数さん mailto:sage [2007/07/16(月) 10:22:52 ] 理屈も何も、あの範囲で積分したらそうなるべ
391 名前:132人目の素数さん [2007/07/16(月) 13:11:41 ] 横からあれだけど、>>377 はの答えは475人でおk?
392 名前:132人目の素数さん [2007/07/16(月) 13:17:12 ] 数学技能検定ってのがあるそうですが、統計学だけに的を絞ったものって無いでしょうか? 職場で統計だけ使うものですから・・・
393 名前:132人目の素数さん [2007/07/16(月) 13:43:18 ] テストの点って上下限があるからβ分布じゃねえの
394 名前:132人目の素数さん [2007/07/16(月) 15:17:41 ] >>393 じゃねえ
395 名前:132人目の素数さん mailto:sage [2007/07/16(月) 17:07:18 ] いやはやなんともお恥ずかしい発言を・・・・ >>393
396 名前:132人目の素数さん [2007/07/16(月) 19:09:50 ] すみません。わたくし学部1年生なのですが、統計で行き詰ってしまいました。 どなたか教えてください。 均一分布・ランダム分布・集中分布それぞれの分散と平均の大小。 そしてポアソン分布、二項分布は上の3つのどれに当てはまるか。 この2つを教えてくださいお願いします
397 名前:132人目の素数さん mailto:sage [2007/07/17(火) 15:24:12 ] >ランダム分布 そんな分布、ないと思うけど。。。
398 名前:132人目の素数さん [2007/07/17(火) 15:38:50 ] すみません382のものなんですが・・・・ 第一種と第二種の過誤の両方の確率を下げるためにはどうすればよいの か解く手ほどきをお願いします。 すごく困っています。しらべてもよくわからないのでどなたか よろしくお願いします
399 名前:132人目の素数さん mailto:sage [2007/07/18(水) 01:38:34 ] >>398 両方を同時に下げる事は出来ないぞ
400 名前:132人目の素数さん mailto:sage [2007/07/18(水) 02:06:58 ] 両方を同時に下げることはできなくても、最適解は求まるがな。 自分でがんばれ。
401 名前:398 [2007/07/18(水) 02:42:51 ] >>400 自分でがんばれって、しらべてわからなかったからこの場を借りて質問させてもらっているんですよ。 そこらへん分かってます?なんでもスレに質問してあんたの様なレスを貰うのは非常に心外ですね。 大体、あんたもよく分かってないから答えられないんじゃないのぉ?
402 名前:132人目の素数さん mailto:sage [2007/07/18(水) 04:50:11 ] うわ、逆切れきた。皆さん御愁傷様です。 >>401 「なんでも」って書いてあるけど、このスレでは、 教科書読めば数値を求めるのは容易い場合や、 簡単に割り切れる答えはないけど、基本概念を元に何らかの答えを導くことが出来る場合、 紋切り型に答えを教えるまでもない(あるいはそうすべきでない)という了解があると思う。(過去のレスを読め) そういう場合、何処までは理解しているという努力の痕跡や、 もっと具体的に何が分かっていないかを書かないと、相応の答えは貰えないでしょう。 実社会でもそうだと思うから、こんなのでキレてたらあんた生きて行けないよ。 ゼロからやるにはクラスメートとやんなさい。
403 名前:132人目の素数さん mailto:sage [2007/07/18(水) 06:43:54 ] 電子・電気板にあったリンク M女史の遺したもの members.at.infoseek.co.jp/ms_mzn/
404 名前:132人目の素数さん mailto:sage [2007/07/18(水) 07:09:16 ] うは。その移植したかったVBアプリはこんな程度のものですね。 redroses.hp.infoseek.co.jp/game.htm これがヤバい・・・ redroses.hp.infoseek.co.jp/diary.htm
405 名前:398 [2007/07/18(水) 07:38:45 ] >>402 偉そうに何言ってるのこの人?こういうケチで心の狭い男の人って絶対彼女出来なさそ。最悪〜!
406 名前:132人目の素数さん mailto:sage [2007/07/18(水) 07:46:11 ] 朝から宿題の回答具合をチェックかな。もうあきらめろ。
407 名前:132人目の素数さん mailto:sage [2007/07/18(水) 07:54:48 ] >>404 抱腹絶倒 redroses.hp.infoseek.co.jp/Mystery.htm
408 名前:398 [2007/07/18(水) 08:07:28 ] >>406 こっちは朝じゃありませんよーだwww
409 名前:132人目の素数さん [2007/07/18(水) 08:12:25 ] キチガイだな。放置スルー推奨w
410 名前:132人目の素数さん mailto:sage [2007/07/18(水) 08:15:31 ] >>408 俺の所も朝じゃないんだけど・・・ >>409 耐性なくってすまん。これで最後にする。
411 名前:398 [2007/07/18(水) 08:17:36 ] >>410 あなたがどこに居ようが関係なんですけども。 なに朝から宿題の回答具合チェックって?馬鹿じゃないのオジサン。
412 名前:132人目の素数さん mailto:sage [2007/07/18(水) 08:23:42 ] >あなたがどこに居ようが関係なんですけども。 >>408
413 名前:132人目の素数さん [2007/07/18(水) 08:34:52 ] >>412 分かってないよね〜。>>408 では私の居場所の事、>>410 はオジサンの居場所。 ちゃんと読んでよ〜
414 名前:132人目の素数さん [2007/07/18(水) 11:23:53 ] すれ違いうざ過ぎ いい加減に消えろ粘着w
415 名前:132人目の素数さん [2007/07/18(水) 11:41:29 ] 【私の居場所】と【オジサンの居場所】が出会う確率は?
416 名前:132人目の素数さん mailto:sage [2007/07/18(水) 11:46:20 ] 知るかボケ >>415
417 名前:132人目の素数さん [2007/07/18(水) 11:53:08 ] 【私の居場所】、【オジサンの居場所】、【ボケの居場所】 この3点を結んで出来る三角形の面積の最大値・最小値を求めよ。
418 名前:132人目の素数さん mailto:sage [2007/07/18(水) 11:59:33 ] 案外小さかったりw
419 名前:132人目の素数さん mailto:sage [2007/07/18(水) 12:02:36 ] 三角形の三点が既知なら面積は求まるから、最小値も最大値もナンセンス。
420 名前:132人目の素数さん [2007/07/18(水) 12:11:10 ] そのとおり!
421 名前:132人目の素数さん [2007/07/18(水) 12:33:59 ] >399、400 やっぱり下げることは不可能ですよね?? なんか、Dプライム?だかっていう計算を行えば良いって聴いたんですけど・・・ どうなんでしょうか?? しつこくてすいません。
422 名前:132人目の素数さん mailto:sage [2007/07/18(水) 12:43:38 ] >>421 お前、実はバイオ系のバカだろw
423 名前:132人目の素数さん mailto:sage [2007/07/18(水) 12:52:48 ] sageて
424 名前:132人目の素数さん mailto:sage [2007/07/18(水) 12:53:09 ] >>421 >>399、400 >やっぱり下げることは不可能ですよね?? >なんか、Dプライム?だかっていう計算を行えば良いって聴いたんですけど・・・ 「聴いて」どうするw ゆとりは師ねw
425 名前:132人目の素数さん [2007/07/18(水) 13:01:30 ] つまらない話で盛り上がってる所すみません。質問があります。 以下の様な実験を行いました: ・心理言語関係の実験で、ある2つの条件下での正答率に違いがあるかを検討 ・被験者内要因計画を使用し、それぞれの条件 -統制群(ctrl)と実験群(exp)- は20課題ずつ ・実験には50人が参加 回帰分析を [reg <- lm(exp〜ctrl)]の様に行ったのですが、平均への回帰問題がある事に気付きました。 ここで被験者個人の正答率をジャックナイフ又はブートストラップで修正し、平均への回帰分を取り除く事は 可能でしょうか?また可能の場合、過大修正してしまう事も考えられますでしょうか? 意見・アドバイス等ありましたらお願いします
426 名前:132人目の素数さん mailto:sage [2007/07/18(水) 13:12:18 ] >つまらない話で盛り上がってる所すみません さりげなくw >>421 Dプライムとかういのは知らないけど、両方下げるのは無理でしょう。いろんな本やウェブサイトにも書いてある。 多分いぢわる問題だな。 標本数を増やせばいいと俺は思ったが。まあ「聴いた」人にもう一回聴いてみれ。
427 名前:132人目の素数さん mailto:sage [2007/07/18(水) 13:32:19 ] Dぷらいむって d' のことじゃん。Signal detection を習ってるのね。分かってんのかな?分かってねーんだろーな。
428 名前:132人目の素数さん [2007/07/18(水) 13:53:16 ] またまた、つまらない話で恐縮です。 偉い先生は、これを無視してください。 手頃な先生、よろしければお答えください。 街中で1人の女性に「あなたより美人を紹介してください」と言い、 次々と女性を辿っていけば、その国一番の美女にたどり着くというTV企画があります。 しかし、この番組を何度見ても、どんどん不細工な女性になっていくのです。 なぜでしょうか? 因みに、この企画には統計学の先生も協力されています。
429 名前:132人目の素数さん [2007/07/18(水) 13:56:46 ] ・美の基準の問題(問われた女性と視聴者一般間の相違) ・問われた女性が真実を言う確率の問題 ・等々
430 名前:132人目の素数さん [2007/07/18(水) 15:17:45 ] ありがとうございました。 女性に対して「あなたより美人を紹介してください」というのが問題なのですね。 私は、第三者に「この人より美人を・・・」と尋ねればいいのでは?と思うのですが・・・
431 名前:132人目の素数さん [2007/07/18(水) 19:05:01 ] ベイジアンのみなさんこんにちわ。 僕にフィッシャーとの違いをおしえてください。
432 名前:132人目の素数さん mailto:sage [2007/07/18(水) 19:32:28 ] 分かる方ご教示ください。 @確率変数XとYは独立で、E(X)=3 E(Y)=2V (X)=4V (Y)=5 Z=2X-4Yとするとき、E(Z)、V(Z)を求めよ。 解答を見ながら進めていたのですが、V(Z)がよくわかりません。。 V(Z)=V(2X-4Y)=V(2X)+V(4Y)=2の自乗V(X)+4の自乗V(Y) =4x4+16x5=16+80=96 となっていたのですが、途中から+に戻るのと 自乗になる所が理解できません^^; こうゆう公式なのでしょうか? A棒の長さはX〜N(25、36)にしたがっているという(単位cm)。 (1)P(X≦17.8) (17.8-25)/6=−7.2/6 =-1.2 この式の分母の6は、どのようにして求めたらいいのでしょうか?
433 名前:ベイジアン [2007/07/18(水) 19:47:26 ] フィッシャー?それ誰? いいかい君たち、わかってないみたいだから言うけどね、統計学はベイズの定理から始まったんだ。 前時代的な確率論に汚染された者たちに媚びる必要など無い。 さあ、ベルヌーイ分布と共に僕らの輝かしい事後確率を導こうじゃないか!
434 名前:ポイズン mailto:sage [2007/07/18(水) 19:59:26 ] >>432 こりゃまた、大変な質問だな。 @ V(aX+bY)(X, Yは独立とは限らない)の「公式」すら知らないのは何故? → まともな教科書があれば分かる。 次に、簡単に「公式」で片付ける根性がいかん。手を動かせば、その裏が簡単に理解できる。 分散の定義 V(X) = E {(X - μ)^2} を展開したり、Yも追加してやれば、@に関する二つの質問は自明だろう。 答えを写してるだけで、何にも根本的な勉強になってないじゃん!Aも同様。 教えてちゃんが現れる頻度は、ポワソン分布に一致するか、識者の見解を求む。
435 名前:132人目の素数さん mailto:sage [2007/07/18(水) 20:36:16 ] >>377 「何人いると見積もれるか」だから、多分今まで答えているみなさんが言うとおり 正規分布近似で答える問題なんだと思うけど、正規分布表がついていなければ、 「条件を満たす、19点より上で71点より下の生徒数の最小値」として376人と いう答えを出すことはできるよ。 チェビシェフを使うという発想は悪くない。けど、そのまま使うよりは、チェビシェフを導くときの 考え方を使う、という方が分かりやすいかな。 |点数-45|≧26を満たす人数がk人いるとすると、 分散 = (1/500)Σ[i=1 to 500](x_i-45)^2 ≧(1/500)*k*(26)^2 = (k/125)*(13^2) なので、kの満たす条件は...という感じで解いていけばいい。
436 名前:132人目の素数さん [2007/07/19(木) 11:20:06 ] >>425 なかなか面白い考えと言うか問題だな。ジャックナイフにしろブートストラップにしろ理論的には可能だが、一筋縄では行かなさそうか。
437 名前:132人目の素数さん [2007/07/20(金) 03:00:28 ] すいません。皆さんにとっては凄い初歩的な問題なのかもしれませんが、わからなくて困っています。 誰か教えていただけませんか? (1)次の資料は、任意に抽出した勤労者100人の習慣労働時間数を小さい順から並べたものである(単位は 時間)。100個のデータの総和は 3398 であり、各データの2乗和は 121792 である。設問に答えなさい。 10 10 15 16 18 20 22 23 23 23 23 24 25 25 26 26 27 27 27 28 28 28 28 28 28 28 29 29 30 30 30 31 31 31 32 32 32 32 33 33 33 33 33 34 34 34 35 35 35 36 36 36 36 36 36 37 37 37 37 37 38 38 38 38 39 39 39 39 39 39 39 40 40 40 40 40 40 40 40 40 41 41 41 41 41 41 42 42 42 42 43 43 44 44 45 45 45 45 45 52 設問 3.中央値、最頻値、平均値などからみて、習慣労働時間の分布に関して分かる特徴を述べなさい。 抽出した100人の週給のデータ(単位は,万円)からは平均は 10.29、標準偏差は 3.26 が得られた。また、 週間労働時間と週給の共分散の値は、22.47 であった。 7.労働時間についての労働者間の格差と、週給についての労働者間の格差を比較しなさい。 8.週間労働時間と週給との間に何らかの関係がありますか、それとも無関係ですか。もし、関係がある としたら、どのような、またどの程度の関係がありますか。 一人の勤労者の週間労働時間(X)から週給(Y)を予測するため、Y=α+βX で示す関係式を想定する。 9.関係式 Y=α+βX を計測する方法を説明しなさい。 10.上に与えられたデータから、関係式 Y=α+βX を計測しなさい。 ある一人の勤労者を、at random に取り上げ、その勤労者の週給を予測してみたい。 11.大勢の勤労者の中から一人を抽出したとき、その勤労者の週給はどれほどと予測しますか。理由を つけて答えなさい。 12.抽出した一人の勤労者の週間労働時間が42時間であると分かったとき、その勤労者の週給はどれほ どと予測しますか。理由をつけて答えなさい。
438 名前:132人目の素数さん mailto:sage [2007/07/20(金) 06:07:02 ] 10人の学生から3人を選ぶ際に、完全にランダムに選ぶにはどのようにすれば良いでしょうか? サイコロを使う?replaceは許さない?
439 名前:132人目の素数さん mailto:sage [2007/07/20(金) 06:07:50 ] ついでに、これがランダムであるという検定法はあるでしょうか?
440 名前:132人目の素数さん mailto:sage [2007/07/20(金) 13:49:41 ] >>438 >10人の学生から3人を選ぶ際に、完全にランダムに選ぶにはどのようにすれば良いでしょうか? >サイコロを使う?replaceは許さない? Rなら sample(c(0,1,2,3,4,5,6,7,8,9), 3, replace=F) だけど、サイコロでといわれれば、どうやればいいかな・・・
441 名前:132人目の素数さん mailto:sage [2007/07/20(金) 18:16:56 ] 20面サイコロ振ってみれば?0−9×2のやつ。 重複サンプリングは同じ目が出たら振りなおし、でよいでしょう。
442 名前:132人目の素数さん [2007/07/20(金) 21:38:13 ] 質問お願いします。 【問】ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして次の問に答えよ。 3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確率を求めよ。
443 名前:132人目の素数さん [2007/07/20(金) 22:09:45 ] >>442 100±10であることより0.125となる
444 名前:132人目の素数さん [2007/07/20(金) 22:47:09 ] >>443 すいません。解答のプロセスもう少し詳しくお願いします。
445 名前:132人目の素数さん [2007/07/21(土) 04:19:07 ] >>442 正規分布も標準偏差も関係ない。 ある学生のIQが100以上である確率が1/2で それを3乗するだけじゃん。
446 名前:132人目の素数さん mailto:sage [2007/07/21(土) 04:48:18 ] >>445 正規分布であることは関係があるのでは? 標準偏差は関係ないが。
447 名前:132人目の素数さん [2007/07/21(土) 05:59:16 ] >>446 正規分布だから>>445 の言ってる様に(1/2)^3になるんだろ
448 名前:132人目の素数さん mailto:sage [2007/07/21(土) 06:47:39 ] 関係ないのは標準偏差10ということだね。
449 名前:132人目の素数さん [2007/07/21(土) 06:54:11 ] ある大学の学生がもし4人しかおらずにN(100,10^2)であるとすると 確率ゼロ
450 名前:132人目の素数さん [2007/07/21(土) 07:09:20 ] >>449 学生4人では大学は成立しないのよ! ばかばかばか!
451 名前:132人目の素数さん mailto:sage [2007/07/21(土) 08:51:09 ] 私立マンツーマン大学
452 名前:132人目の素数さん [2007/07/21(土) 18:37:04 ] ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして 次の問いに答えよ。 答えは四捨五入して小数点以下2桁まで求める。 @IQが90以下の確立を求めよ。 A上位1%以内に入るために最低必要なIQはいくらか。 B3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確立を求めよ。 C25人の学生をランダムに選んだとき、この25人の平均IQが104を超える確立を求めよ。 どなたかご教授お願いします。
453 名前:132人目の素数さん [2007/07/21(土) 18:49:22 ] 今さらなんだけど累計差の出し方がわかりません… 公式を教えてくださる方いますか?
454 名前:132人目の素数さん [2007/07/21(土) 19:33:43 ] 相関係数の公式がよくわからないんですが・・・;;; Σ(xi-X)(yi-Y) / √(Σ(xi-X)^2 ・ Σ(yi-Y)^2) この公式だと一度2乗したものを√で戻しますよね? それだと(xi-X)(yi-Y) /(xi-X)(yi-Y) になって絶対1になっちゃいませんか・・・? 数学本気で苦手なので・・・誰か教えてください;;;
455 名前:132人目の素数さん mailto:sage [2007/07/21(土) 19:35:07 ] 見覚えのある問題がw
456 名前:132人目の素数さん mailto:sage [2007/07/21(土) 20:04:28 ] >>454 Σは飾りか!w root(1^2+2^2) = 1+2か考えてみたら?
457 名前:132人目の素数さん [2007/07/21(土) 20:07:25 ] >>456 ぬぬぬ・・・? Σをどうすればいいんですか・・・?;;;;
458 名前:454 [2007/07/21(土) 20:25:12 ] sX sYのほかにsXYも求めておかないといけないってことなのかな・・・?
459 名前:132人目の素数さん mailto:sage [2007/07/21(土) 20:38:37 ] >>457 本当に飾りだったんだな…。足し算だよ。 x_1=1, x_2=2としたとき、 Σx_i^2 = 1^2+2^2 ということだ。
460 名前:132人目の素数さん [2007/07/21(土) 20:55:36 ] >>459 ふむふむ・・・。 一個一個を2乗して、足していくいくってことですよね・・・? そこまではわかったんですが、式に√ついてますよね? √ついてると結局Σ(xi-X)(yi-Y)と同じことになりませんか・・・?
461 名前:132人目の素数さん mailto:sage [2007/07/21(土) 21:33:43 ] >>460 √Σxi = √(x1+x2+...) Σ√xi = √x1 +√x2+... Σxi Σyi = (x1+x2+..)(y1+y2+...) Σxi yi = x1y1 +x2y2 +x3y3 +...
462 名前:132人目の素数さん [2007/07/21(土) 22:34:32 ] >>461 なるほど・・・・。 そういうことだったんですか・・・。俺バカだな・・・orz
463 名前:132人目の素数さん mailto:sage [2007/07/21(土) 23:41:08 ] >>452 > > >ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして >次の問いに答えよ。 >答えは四捨五入して小数点以下2桁まで求める。 >@IQが90以下の確立を求めよ。 0.158655 >A上位1%以内に入るために最低必要なIQはいくらか。 125 >B3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確立を求めよ。 0.125 >C25人の学生をランダムに選んだとき、この25人の平均IQが104を超える確立を求めよ。 ? >どなたかご教授お願いします。 リアル春厨の回答でした
464 名前:春厨 mailto:sage [2007/07/21(土) 23:42:09 ] ×確立 ○確率 でしょ?
465 名前:132人目の素数さん [2007/07/21(土) 23:56:48 ] 俺いつも悩むんだけど、正規分布で平均とかって分布のどちら側に属するんだろ? 平均0の場合 <0に50%、0≦に50%入ってるの?
466 名前:132人目の素数さん [2007/07/22(日) 00:09:04 ] 正規分布とは左右大将で1ミリずれてもいけない
467 名前:132人目の素数さん [2007/07/22(日) 00:14:26 ] 平均は両方に属するの? すると分布は99%しかカバーしないの? それとも右左両方用に実は平均が二つ並んでいるの? イメージがつかめない・・・
468 名前:132人目の素数さん mailto:sage [2007/07/22(日) 00:19:31 ] >>465 どちらにも属さないんじゃないの。
469 名前:132人目の素数さん [2007/07/22(日) 00:19:52 ] そもそも正規分布って連続分布だよね。 IQって離散値じゃなかったっけ?
470 名前:132人目の素数さん [2007/07/22(日) 00:21:34 ] >>468 >>>465 >どちらにも属さないんじゃないの。 > えっ!じゃあ積分の時にどっちにも含めないの? それで正規分布は事象の100%をカバーするの? きゃーーー頭が湯気吹いた・・・
471 名前:132人目の素数さん [2007/07/22(日) 00:28:45 ] >>470 分布関数勉強しとけよ
472 名前:132人目の素数さん mailto:sage [2007/07/22(日) 00:42:48 ] ある本にも書いてあるけど、 確率密度関数が連続型の場合、特定のxが起きる確率はゼロ。 まあ、微分積分を踏まえれば常識になるのでは。面積ゼロだからね。
473 名前:473 mailto:sage [2007/07/22(日) 01:01:43 ] 4=7-3
474 名前:454 [2007/07/22(日) 01:29:47 ] なんどもすみません・・・。 共分散sxyを求める公式は sxy= 1/nΣxi・yi - xの平均値・yの平均値 ですよね? これをつかって相関係数rを求めるための公式の r= sxy/sx・sy に当てはめてやってるんですが、 自分のやってる問題の解答と自分の答えが微妙に違います(r=-0.814になるところがr=0.815になったりと・・・) 問題も載せたほうがいいんでしょうか?かれこれ4時間くらい同じ問題に詰まってますorz
475 名前:132人目の素数さん mailto:sage [2007/07/22(日) 01:46:23 ] sxy= 1/nΣ(xi - xの平均値)・(yi - yの平均値)
476 名前:132人目の素数さん mailto:sage [2007/07/22(日) 01:46:40 ] 載せなきゃわかるわけないしお前の解答も載せなきゃ どこで間違えているのか分かるわけが無い。
477 名前:132人目の素数さん mailto:sage [2007/07/22(日) 02:39:27 ] スタージェスの公式って、どうゆう考え方で導かれたんですか。 なぜこの式で、最適な階級の幅が求まることになるのでしょうか。
478 名前:132人目の素数さん mailto:sage [2007/07/22(日) 02:52:34 ] 経験則と聞いたが。
479 名前:132人目の素数さん [2007/07/22(日) 20:25:32 ] 基本的なことですみませんが教えてください。 コインを5枚トスして、表が出る枚数をXとする。 次の確立はいくらか[X=3] これを二項分布にあてはめると 5!/3!(5!-3!) ×0.5の三乗×(-0.5)の(5-3)乗 になりこれを計算すると0.3125になると思うんですが、 回答によると0.03215になっています。(勿論途中式はありません) どうしても回答の数字にはならないのでどなたか教えていただけないでしょうか? 二項分布を使うところから間違っているのでしょうか?
480 名前:132人目の素数さん [2007/07/22(日) 20:38:06 ] >>479 どちらでもなく0.03125
481 名前:132人目の素数さん mailto:sage [2007/07/22(日) 20:38:09 ] 5!/3!(5-3)!
482 名前:132人目の素数さん [2007/07/22(日) 20:50:01 ] 479です 早速のレスありがとうございます 5!/3!(5-3)! ×0.5の三乗×(-0.5)の(5-3)乗 を解くと =120/6×2 ×0.125×0.25 =120/12 ×0.03125 =0.3125 ではないでしょうか?
483 名前:132人目の素数さん mailto:sage [2007/07/22(日) 22:20:45 ] コインを5枚投げて、表が3枚出る確率が3% なんというイカサマ\(^O^)/
484 名前:132人目の素数さん [2007/07/23(月) 00:13:31 ] 年 消費支出Y 可処分所得X 1993 346.521 393.224 1994 356.914 396.406 マクロ消費関数が Yhat=0.938462107+0.894589743X の時 1994年の限界消費性向は、 0.894589743*396.406+0.938462107=355.5592038 0.894589743*393.224+0.938462107=352.7126192 で 355.5592038-352.7126192=2.846584562 ↑がΔC で 356.914-346.521=10.393 ↑がΔYだとすると、 2.846584562/10.393=0.273894406 で正しいのでしょうか?
485 名前:132人目の素数さん mailto:sage [2007/07/23(月) 16:32:52 ] >>473 お前は何を言っているんだ?
486 名前:132人目の素数さん [2007/07/23(月) 17:12:30 ] 質問させてください。 偏差値は例えばどんな事に活用できますか?学力偏差値以外で教えて下さい。
487 名前:132人目の素数さん mailto:sage [2007/07/23(月) 18:00:21 ] >>486 実際に使われている例としては、 子供の発育異常(低身長など)の判断基準になっている。 具体的に「偏差値(平均が50、±標準偏差が±10)」の数字が 使われている訳ではないが、実質的に偏差値30以下または70以上を 「異常」と定義して治療の対象としている。
488 名前:132人目の素数さん [2007/07/23(月) 18:18:08 ] >>487 ありがとうございます。レポート課題で偏差値を統計学的に調べなきゃならなくてorz 検索しても学力偏差値ばっかでして。 何か企業がマーケティング等で使われたりしないんですかね?
489 名前:132人目の素数さん mailto:sage [2007/07/23(月) 18:36:10 ] 偏差値(平均50、標準偏差±10)なんてめんどうなものを使うのは 小数点のついた数字が理解できないアホを相手にするときだけで、 マーケティングに使おうと思ったら生の分布をグラフに出すよ。
490 名前:132人目の素数さん [2007/07/23(月) 19:23:52 ] >>489 そうですか。偏差値ってあんまり実用性ないみたいですね。学力偏差値くらいしかちゃんと使ってるの知らないし。とりあえず調べてレポート終わらせました
491 名前:132人目の素数さん [2007/07/24(火) 07:37:55 ] X、Yを確率変数とし、λ=1/2 の指数分布に従う。XとYは独立であるとする。 このときX+Yの分布はどうなるか。 という事なのですが、指数分布はガンマ分布の特別な場合なので X〜Ga(1,2) Y〜Ga(1,2) で ガンマ分布の再生性より X+Y〜Ga(2,2) となると思ったのですが、これは正しいのでしょうか ノートには 2*(X+Y)〜Ga(2,1) というような事が書いてあるのですが、ガンマ分布の再生性を考えると 前者でいいような気がするのですが ご教授お願いします
492 名前:491 mailto:sage [2007/07/24(火) 07:42:05 ] >ノートには 2*(X+Y)〜Ga(2,1) λ*(X+Y)〜Ga(2,1) の間違いです
493 名前:132人目の素数さん mailto:sage [2007/07/24(火) 11:19:36 ] >>490 「偏差値」という数字自体を使ってるのは学校塾以外で見た事ないな。 大抵は平均値グラフの上下に±標準偏差、±標準偏差×2、…のグラフを書く。 この手のグラフはどの分野でも見かける。 それを見る人が、その意味をどれほど理解しているかは知らないが:-)
494 名前:132人目の素数さん [2007/07/24(火) 17:55:13 ] どなたか教えてください。 散布度についてその種類や特徴などを述べなさい という課題が出たのですが、 さまざまなサイトを回ってきたのですが、 その内容に触れられているものが見つからなくて。 すみませんが誰か教えてください。 お願いいたします。
495 名前:132人目の素数さん [2007/07/24(火) 18:05:28 ] >>494 ttp://www.oak.dti.ne.jp/~xkana/psycho/stat/stat_19/index.html
496 名前:132人目の素数さん [2007/07/24(火) 18:09:40 ] >>495 お忙しいところすみません。 助かりました。本当にありがとうございます。
497 名前:132人目の素数さん mailto:sage [2007/07/24(火) 18:26:33 ] >>452 のCってどうなるんでしょうか。
498 名前:132人目の素数さん mailto:sage [2007/07/24(火) 20:32:02 ] >>497 25人の平均値も正規分布に従う。
499 名前:132人目の素数さん mailto:sage [2007/07/25(水) 00:43:03 ] 適合度検定の話なんですが、 なぜ統計量v=Σ((n-f)^2/f) (観測度数n、理論度数f)は、χ2乗分布に従うんですか?
500 名前:132人目の素数さん mailto:sage [2007/07/25(水) 00:54:43 ] >>499 >適合度検定の話なんですが、 >なぜ統計量v=Σ((n-f)^2/f) >(観測度数n、理論度数f)は、χ2乗分布に従うんですか? サンプルの平均が正規分布に従うから。
501 名前:132人目の素数さん [2007/07/25(水) 01:21:22 ] 統計超初心者です。初歩的な質問で申し訳ありませんが、 どなたか教えてください。 課題の分析をstataソフトでやっておりまして、これまではいつも係数が 数字で出てきていたのですが、今数値を入力したところ 係数がところどころ-6.2e+03のような形で出てしまったのですが これはどのように解釈したらよろしいのでしょうか。 どうぞ宜しくお願いします。
502 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:26:36 ] -6.2*10^3と読む
503 名前:132人目の素数さん [2007/07/25(水) 01:30:27 ] t検定と正規分布の違いって何ですか? 教えてください
504 名前:132人目の素数さん [2007/07/25(水) 01:35:24 ] >>503 違いすぎてどう答えたらいいのかわからないです。 ○「検定」と△「分布」の違いを聞かれて、 うまく答えられる人はいないかと。
505 名前:132人目の素数さん [2007/07/25(水) 01:37:45 ] >502さん 早速のお返事助かります! -6.2×10の3乗ということなんですね。 生粋の文系なので、分からないことだらけで・・・ 本当にありがとうございました!
506 名前:132人目の素数さん [2007/07/25(水) 01:40:39 ] >>504 レスありがとうございます。 t検定と正規分布による検定の相違の間違いでした。 でも、検定と分布じゃ違いますよね・・・
507 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:40:47 ] >>503 マルチしまくり
508 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:46:53 ] >>507 マルチですみません。 分からなくて誰かの助けというか手を借りたかっただけなんです;;
509 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:54:19 ] t分布
510 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:54:40 ] 相関係数 Σ(x-e[x])*(y-e[y])/n これって、xとyのサンプル数がじゃないと、求められませんよね? たとえば国語のテストを受けた人数と数学のテストを受けた人数が異なっていた場合 それに相関係数を求めることはできないよね?
511 名前:132人目の素数さん mailto:sage [2007/07/25(水) 01:57:03 ] なんのための相関係数なんだ・・・
512 名前:132人目の素数さん mailto:sage [2007/07/25(水) 02:45:18 ] ちょっと宿題の相手をしすぎではないのか
513 名前:132人目の素数さん mailto:sage [2007/07/25(水) 03:20:00 ] 夏だからかな・・・
514 名前:132人目の素数さん mailto:sage [2007/07/25(水) 09:27:30 ] だからといって >>500 のようにうそを教えちゃいかんな。
515 名前:132人目の素数さん mailto:sage [2007/07/25(水) 09:37:35 ] >>514 えっ、うそなんですか?僕、納得しちゃいましたよ。 正規分布するサンプル集団からとられたサンプルの誤差はχ自乗分布に従うって。
516 名前:499 mailto:sage [2007/07/25(水) 10:49:44 ] >500を見て悩んでいたんですが、やっぱり解りません。 χ^2分布というのは、標本分散が従う確率分布なのではないんですか?
517 名前:132人目の素数さん mailto:sage [2007/07/25(水) 11:47:25 ] >>516 >500の話だと自由度の計算が出来なくなる。
518 名前:132人目の素数さん mailto:sage [2007/07/25(水) 11:51:25 ] >>499 ttp://www.biwako.shiga-u.ac.jp/sensei/kumazawa/tahenryou/chisq.pdf
519 名前:132人目の素数さん [2007/07/25(水) 14:43:03 ] 基本問題ですがわかりません^^;だれか解いていただければ幸いです^^ 多いので分けてカキコさせていただきます 下記の確率分布それぞれの下側5%と上側5%を求めよ (1) 平均(3)分散(2)の正規分布 (2) 自由度(13)のt分布 (3) 自由度(23)のx2乗分布 (4) 自由度(4、14)のF分布 16個の個のサンプルx1、x2、x3・・・・・、x16は、平均100、 分散9の母集団からランダムに抜き取られたものである (1) E[{x1+2x2+3x3}÷6] Var[{x1+2x2+3x3}÷6]は それぞれいくらになるか (2) E[xバー],Var[xバー]はそれぞれいくらになるか? ただしxバーは16個のサンプルの平均である。 (3)上記母集団は正規分布に従うものとする。xバーが 102以上となる確率を求めよ。
520 名前:132人目の素数さん [2007/07/25(水) 14:44:16 ] 大手ビデオ・カメラ・メーカーのO社では、ズームモーター を外注する。A社かB社のいずれかにしたい。そこで実際に 両者からサンプルとして9個ずつズームモーターを納入して もらい、決め手となるズームスピードを測定した。以下はそ の測定結果である ズームスピード(単位:秒) A社 3.4 3.1 3.5 3.2 3.3 3.2 3.3 3.4 3.3 3.2 B社 3.2 3.0 3.2 3.0 3.4 3.1 3.3 3.1 3.1 3.3 とする。以下の設問に答えよ (1) A社とB社のモーターのズーム・スピードの母平均 に差があるかどうかを有意水準5%で検定せよ。 (2) A社とB社のモーターのズーム・スピードの母平均 の差の信頼水準95%の信頼区間を求めよ。ただし、A,B 両社とも、左から9個ずつのデータのみが与えられている ものとせよ。 以上です。できるだけ今日中に答えていただけると幸いです。 長文失礼いたしました。
521 名前:132人目の素数さん [2007/07/25(水) 14:52:10 ] ここはマルチでも丸投げでも答えてもらえると聞いたもので^^; やはり期限を設けます。 今日の午後5時までに解答(提出できる形で)を書き込んでください。
522 名前:132人目の素数さん mailto:sage [2007/07/25(水) 15:01:38 ] 誰も5時までに書き込むなよ?
523 名前:132人目の素数さん mailto:sage [2007/07/25(水) 15:41:53 ] >>519 (1) 3、5 (2) 0.06、2.35 (3) 13、35 (4) 0.1 3.1 >>520 (1) t(18)=2.11, p=.049 (2) [.017, .272]
524 名前:132人目の素数さん [2007/07/25(水) 16:02:53 ] ありがとうございます^^できれば途中過程もお願いできますか?
525 名前:132人目の素数さん mailto:sage [2007/07/25(水) 16:21:17 ] 丸投げする方も、回答する方も、暇な季節なんだなー。
526 名前:132人目の素数さん mailto:sage [2007/07/25(水) 17:25:01 ] 密度関数の高さって何を意味してるのでしょうか? f(x)としたら、xに8とか9とか適当に数字を入れたら、値でますよね。あの値はどういう意味なんでしょうか?
527 名前:132人目の素数さん mailto:sage [2007/07/25(水) 17:30:42 ] 特に意味はない 積分したときに都合よく面積=確率を表せるように数値取ってるだけ
528 名前:132人目の素数さん mailto:sage [2007/07/25(水) 17:38:31 ] >>527 どうも、長年の疑問が解けました。
529 名前:132人目の素数さん mailto:sage [2007/07/25(水) 17:42:13 ] >>525 >丸投げする方も、回答する方も、暇な季節なんだなー。 と回答する事の出来ないお兄ちゃんが申してますww
530 名前:132人目の素数さん [2007/07/25(水) 17:49:10 ] 途中過程まだですか?^^;;イライラ
531 名前:132人目の素数さん mailto:sage [2007/07/25(水) 18:02:05 ] うるせえよ。そのまま単位おとして留年して人生終了しとけw
532 名前:132人目の素数さん mailto:sage [2007/07/25(水) 18:02:21 ] ↓以下、答えや途中経過を書き込まないようにしてください
533 名前:132人目の素数さん mailto:sage [2007/07/25(水) 18:23:42 ] 途中経過です >>519 (1)は暗算。 (2)〜(4) 各自由度とp=.05及びp=.95を自作プログラムに入力 >>520 (1)データを入力->Rで t.test(a, b, var.equal=T) (2)右一個のデータを各社から削除 ->t.test(a, b, var.equal=T) -> CIを見ました。
534 名前:132人目の素数さん [2007/07/25(水) 19:51:43 ] 統計学の入門のめじゃーな本は統計学入門(東大出版)ですが 多変量解析(多次元正規分布)の入門としてメジャーな本は何ですか?
535 名前:132人目の素数さん mailto:sage [2007/07/25(水) 20:12:04 ] >>534 cohen&cohen
536 名前:132人目の素数さん [2007/07/25(水) 20:45:48 ] >>503 γ⌒/^^/^- ,ゝ`/~ /~ /~ /⌒ _ 〈(_| | |~ |~ /^ ) (/~ /~ /~ /~ ~ /~ /^\ ()/)/~ /~ |~ .|~ |~ |~ /) へ^〈,|,,、,,|,,、,,,,,|~,,,,、〈~,, 〈~ /⌒|)\ |::::::: ゛ ゛ ,,,,;;::'''''ヽ |:::::::: ,,,,;;::::::::::::::: __ ヽ |::: " __ :::: <'●, | ┌―. - '"-ゞ,●> ::::::... | | | ̄.. ::::::: | ヽ.\{_ ( ○ ,:○) | . '・,.、 . \\/. ,'・, ,'・, . '・,.、、 . \_ヽ. __,-'ニニニ,',ヽ . '・バカはひっこんでろ .. ヽ. │ /,'・,.、’、′’、′′′‘‘‘、 . \ │ │’、′′,.、 . '・,.、 | ヾニ二ン"|・ '・,.、’、 | / ヽ\ / l `ー-::、_ ,,..'|ヽ. :人 `ー――''''' / ヽ _/ `ー-、 ,.-'" \ー-、 ,.-'" \: \ .,.-''" | /. \ ~>、,.-''" | ,,..-‐'''"" ヾ ,.-''"| /――――、/
537 名前:オシムジャパン [2007/07/25(水) 22:13:52 ] ある大学生のIQは平均100、標準偏差10の正規分布に従うとして次の問に答えよ。 (1)25人の学生をランダムに選んだ時、この25人の平均IQが104を超える確率を求めよ。 この問題お願いします。
538 名前:132人目の素数さん mailto:sage [2007/07/25(水) 22:17:31 ] まるち
539 名前:132人目の素数さん mailto:sage [2007/07/25(水) 22:29:48 ] >>527 少し誤解を招くかな? 数値自体に意味はないが、比較するときには相対的に意味がある。
540 名前:132人目の素数さん mailto:sage [2007/07/26(木) 00:48:07 ] コンピュータサイエンスの大学院で機械学習を道具として使ってるんですけど、 オーソドックスな統計学をガッツリ勉強したくなりました。 よい本を知ってる人が教えてください。 和書洋書は問いません。self-containedでしかもたくさん詰まってる、本格的なのがよいです。
541 名前:132人目の素数さん mailto:sage [2007/07/26(木) 05:09:30 ] >>540 「日本女性の外性器」 滋賀医科大学
542 名前:132人目の素数さん mailto:sage [2007/07/26(木) 16:18:04 ] >>541 内性器や内分泌系等も含めた包括的なものはありますか?
543 名前:132人目の素数さん mailto:sage [2007/07/26(木) 16:37:34 ] >>542 「日本女性の外性器?統計学的形態論 日本性科学体系」 取り敢えずは、これを統計学的に分析し全ての画像を脳裏に焼き付けてから、次に進みたまえ
544 名前:132人目の素数さん [2007/07/27(金) 04:55:48 ] stataを使ってデータ分析をしようとしているのですが、 どうしても分からないことがあり、書き込みさせていただきます・・・。 重回帰分析の結果、いくつかの変数の係数部分に(dropped)と出てしまう のですが、この原因は何なのでしょうか?サンプル数不足でしょうか? またサンプル数以外にも原因が考えられればぜひ教えてください。 宜しくお願いします。
545 名前:132人目の素数さん mailto:sage [2007/07/27(金) 06:18:19 ] >>544 droppedと出るのは、複数の変数が完全にcorrelatedな関係にあるためで、Stataが自動的に重複を排除しています。 例えば、p = 2q で表されるp, q が共にindependent variableになっていれば、Stataはどちらかをdropします。 OLSの原則として、independent variablesは互いに独立でないといけません。
546 名前:132人目の素数さん mailto:sage [2007/07/27(金) 06:31:05 ] >>545 を見直して自分は馬鹿かと思ったのだけど、 "independent variable"と書いたのは、X (x1,x2, ...) そのものとして読んで下さい。 これらは独立だから、まさに"independent variable"と呼ばれている訳で。
547 名前:132人目の素数さん mailto:sage [2007/07/27(金) 07:27:34 ] 多重共線性だっけか?
548 名前:132人目の素数さん [2007/07/27(金) 10:42:38 ] 逆行列が作れなくなるから数値が出ない
549 名前:132人目の素数さん mailto:sage [2007/07/27(金) 12:43:56 ] そだね。β-hatが作れないんだよね。 ちなみにStataでも行列計算が簡単に出来るから、やってみると面白いです。
550 名前:544です [2007/07/27(金) 19:48:53 ] どうもありがとうございました! ではcorrelationの高い変数を調節して再度 挑戦してみます。本当に助かりました!
551 名前:toukei [2007/07/28(土) 02:28:53 ] 統計の基本の問題がわからないのですがわかる人がいたらお願いします。 データについて平均値と分散を求めなさい。 データ・6、4、5、5、7、3、4、6 平均値= 分散= 解いてくれたらホントにありがたいです><
552 名前:132人目の素数さん mailto:sage [2007/07/28(土) 02:42:15 ] >>551 ja.wikipedia.org/wiki/%E5%B9%B3%E5%9D%87 ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3
553 名前:132人目の素数さん mailto:sage [2007/07/28(土) 02:59:12 ] 分散はともかく、平均がわからないってやばくね? 小学校レベルだぞ・・・
554 名前:toukei [2007/07/28(土) 03:23:23 ] 続きなのですが、分散わかる人お願いします><
555 名前:132人目の素数さん mailto:sage [2007/07/28(土) 03:24:59 ] >>554 ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3 の 標本分散。
556 名前:toukei [2007/07/28(土) 03:33:17 ] 551番目のやつに書いてある分散の答えの値は ずばり何になるかわかりませんか?
557 名前:132人目の素数さん mailto:sage [2007/07/28(土) 04:09:33 ] あんたヤバいって。答えだけ欲しいってのが小学生だな。
558 名前:toukei [2007/07/28(土) 04:19:01 ] オレはわかる人だけに聞いてることであってお前みたいにただ おちょっくってるやつに聞いてねえよ。 因みにここのスレ統計のことについて何でも質問してもいいみたいだから ただ利用しただけだよ。
559 名前:toukei [2007/07/28(土) 04:21:06 ] とっとと答えろよ低能ども!
560 名前:toukei [2007/07/28(土) 04:26:32 ] 559のオレと同じ名前使ってるやつ……ほんとABCDだな
561 名前:toukei [2007/07/28(土) 04:40:39 ] いいからとっとと答えろよw もちろん途中計算つきでなw 間違えても間違えんなよw
562 名前:toukei [2007/07/28(土) 04:55:25 ] 561番 なりすまし、うざっ。
563 名前:toukei [2007/07/28(土) 05:19:45 ] うぜえなあ はやく答え書き込めよ そろそろママがおきちゃうだろ!
564 名前:toukei [2007/07/28(土) 05:20:28 ] >>559 >>561 >>563 とtoukeiちゃんの気持ちを代弁してみました!
565 名前:toukei [2007/07/28(土) 05:26:09 ] 代弁? 大きなお世話だよ。
566 名前:132人目の素数さん mailto:sage [2007/07/28(土) 05:41:35 ] >>551 平均 5 分散 1.71
567 名前:132人目の素数さん mailto:sage [2007/07/28(土) 08:22:28 ] >>566 分散 1.67
568 名前:132人目の素数さん mailto:sage [2007/07/28(土) 08:23:53 ] 1.80
569 名前:132人目の素数さん [2007/07/28(土) 10:06:46 ] >>567 >>568 計算し直せ。1.71が正解
570 名前:132人目の素数さん mailto:sage [2007/07/28(土) 10:34:58 ] >>569 >>556 が空気を読まずに答え書くから、みんなカモフラージュに嘘書いてんの。それぐらい分かれ。 勉強する気のない奴の糞質問がいっぱい来たらうざいし、こたえること自体馬鹿らしいから。
571 名前:132人目の素数さん mailto:sage [2007/07/28(土) 11:00:28 ] それにしても1.71にはならんような
572 名前:132人目の素数さん mailto:sage [2007/07/28(土) 11:13:15 ] ああそうだ、1.71は電卓でやったんだろ。自由度が考慮されてて、標本分散とは違う。しかも、細かいと言うなら分散じゃなくて標準偏差だ。
573 名前:132人目の素数さん [2007/07/28(土) 11:16:20 ] >>570 腐った香具師ばっかなんだな。わざわざ嘘書くのかよwww それぐらい分かれじゃねーんだよボケが
574 名前:132人目の素数さん [2007/07/28(土) 11:18:37 ] >>572 標準偏差は1.31だよ
575 名前:132人目の素数さん mailto:sage [2007/07/28(土) 11:57:50 ] てゆうかみんな嘘書いてんだろ。
576 名前:132人目の素数さん [2007/07/28(土) 12:17:40 ] 世論調査の仕組みについて是非教えてください
577 名前:132人目の素数さん [2007/07/28(土) 12:29:23 ] >>575 計算も何もしてないで好き勝手な子と言うな
578 名前:toukei [2007/07/28(土) 13:57:12 ] やっぱり分散1.71ではなく1.31ですよね。 12/8人−1=1.71… ルートで1.309… 少数第3位を四捨五入して1.31
579 名前:132人目の素数さん [2007/07/28(土) 14:21:40 ] >12/8人−1 ゆとり乙
580 名前:132人目の素数さん [2007/07/28(土) 18:06:19 ] ある集団の上位25%の所得は一律1800万円、 下位75%の所得は一律200万円であるという。 この集団についてのジニ係数G1を求めよ。 これを教えてください。
581 名前:132人目の素数さん mailto:sage [2007/07/28(土) 18:21:31 ] ジニ係数って何かわかってるか? 横1(100%)縦1(100%)としたときの所得分率面積の二倍だぞ
582 名前:132人目の素数さん [2007/07/28(土) 18:40:58 ] 今年履修したばかりなので何も分からないんです。 具体的な解き方を教えてほしいんですけど。
583 名前:132人目の素数さん [2007/07/28(土) 18:46:36 ] ここのところのやり取りを見れば、教えてもらえるかどうかくらいわかるだろ。 自分の先生に尋ねた方が早いよ。プリンの一つも手土産にしなされ
584 名前:132人目の素数さん [2007/07/28(土) 18:50:12 ] 月曜に私権なんで聴いている暇ないんですよ。
585 名前:132人目の素数さん mailto:sage [2007/07/28(土) 19:01:00 ] >582 >具体的な求め方 581に書いてるだろ お前は三角形や台形面積の求め方もしらんのか。 もう手遅れだな。小学生レベルのこともわからんのじゃ話にならない
586 名前:132人目の素数さん mailto:sage [2007/07/28(土) 19:22:16 ] データ S=(1,4,4,7.8,9,10,11,12,20)が与えられている。範囲、第1四分位点、第3四分位点を求めよ。 範囲ってどうやって求めるんでしょうか・・。第1四分位点が(7+8)/2=7.5、第3四分位点が(10+11)/2=10.5となった んですが合ってますでしょうか?よろしくお願いします。
587 名前:132人目の素数さん [2007/07/28(土) 19:24:45 ] いや、三角形や台形の面積は分かりますが、 それがどう関係あるのでしょうか? 具体的な式などを教えて頂きたいのですが・・・
588 名前:132人目の素数さん [2007/07/28(土) 19:30:23 ] >>586 4番目のデータは7.8でオケーなの?それとも7と8か。 範囲は(最大値−最小値)、すなわち20-1=19
589 名前:132人目の素数さん [2007/07/28(土) 19:37:13 ] >>588 すいません、7と8です・・。申し訳ありません。第1四分点と第3四分位点は、上記の計算で合ってますでしょうか? 範囲ですが、ありがとうございます。理解しました。
590 名前:132人目の素数さん mailto:sage [2007/07/28(土) 19:40:09 ] >>587 ローレンツ曲線と三角形の面積を差し引いて二倍しろって言ってるだろ。 具体的な式は教えた。 それでわからないならお前はその程度の人間だから単位落として留年してろ。
591 名前:132人目の素数さん mailto:sage [2007/07/28(土) 20:14:59 ] 事前に問題の分かってる試験なのか。それだけで大ボーナスなのに・・・
592 名前:132人目の素数さん mailto:sage [2007/07/28(土) 20:19:52 ] >>584 はなんでそんなに切羽詰る状況になる前に訊きに行かなかったんだろうねw
593 名前:132人目の素数さん mailto:sage [2007/07/28(土) 20:23:26 ] 質問です。 1.さいころを1回投げたときに (1)標本空間を作成しなさい。 (2)事象の総和が64通りになる事を確認しなさい。 2.色の異なる2個のサイコロを1回投げる。事象Aを「目の和が4」、事象Bを「2個のサイコロの目が等しい」 (1)全標本空間Sを作成しなさい。 (2)Sの中で事象A、事象Bに相当する部分を指摘しなさい。 この1なんですけど、問題おかしくないですか。(1)って、標本空間は1,2,3,4,5,6ですよね?でも、(2)で64通りなんて ならなくないですか?あと、2なんですけど、この全標本空間って(1,1),(1,2)・・・・・(6,6)の36通りですよね?
594 名前:132人目の素数さん mailto:sage [2007/07/28(土) 22:36:08 ] どこをどうひねれば64て数字が出てくるか良く考えるんだ。
595 名前:132人目の素数さん mailto:sage [2007/07/28(土) 23:10:33 ] >>594 考えてみます。標本空間の部分はおkですか?
596 名前:132人目の素数さん mailto:sage [2007/07/28(土) 23:21:02 ] 明らかに変だろ。何の問題?
597 名前:132人目の素数さん mailto:sage [2007/07/28(土) 23:29:10 ] >>596 変ですよね・・・。学校でもらった問題です。 一応、64通り出してみました。コンビネーションでやると63通りで、それに空集合加えれば64通りになりました。
598 名前:sd [2007/07/28(土) 23:36:14 ] 身長170pの人の体重は、平均60.5s、標準偏差5.9sで分布している。 170pの人の体重が58s以下である確率はいくらか。 58sがカバーする範囲が58.5s未満として計算しなさい。(小数点第3位まで) どこから手をつけていいのかわかりません。 ご教授よろしくお願いいたしますm(__)m
599 名前:132人目の素数さん [2007/07/28(土) 23:45:51 ] 今所得格差についての統計分析をしているのですが、 行き詰ってしまいました。どなたかお答えいただけると助かります。 グループA(サンプル数 20000超) グループB(サンプル数 1000ほど) グループC(サンプル数 700ほど) グループD(サンプル数 500ほど) 統計モデルでは所得を被説明変数にして、 グループを説明変数にしようと思っています。 グループAは米国の白人層で、他のいくつもの資料が 示すとおり、このグループの所得が一番高くなるはずなのですが、 なぜかグループBCDといった移民グループの所得中央値の方が高く なってしまいます。 この食い違いはデータが悪いのでしょうか(ちなみにデータは統計局のものです。) もしくはサンプル数のスケールが違いすぎるからなのでしょうか。 重みづけなどをすれば解消されるのではと思い、 いろいろ教科書やネットで調べてみたのですが、 中々思うようなものにたどり着けませんでした・・・。 お分かりになる方、どうぞよろしくご教授願います!
600 名前:132人目の素数さん mailto:sage [2007/07/28(土) 23:53:53 ] すいません。どなたか>>586 の四分位点についてお願いします。
601 名前:132人目の素数さん [2007/07/29(日) 00:14:18 ] >>598 法政大学経営学部乙 月曜の試験頑張ろうな といっても俺も>>598 の問題がさっぱり計算できないんで誰か教えてくだしあ><
602 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 00:53:15 ] >>598 平均より2kg以上少ない確率だな。 標準偏差5.9kgだから、正規分布で(2/5.9)*σ以下である確率だ。 後は正規分布表か、その値が出る関数電卓かを使わないと答えられん。 統計の教科書に載ってるだろ<正規分布表
603 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 09:35:58 ] どう解けばいいのかわかりません・・。お願いします。 基準点0からc(0より大きいある定数)の間で鉛筆を転がす。止まったところまでの距離を確率変数Xとする。 ただし鉛筆は空間上の全ての点で同じ確かさで止まるとする。 (1)確率密度関数を求めよ。 (2)Xの平均(期待値)を求めよ。 (3)Xの分散を求めよ。
604 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 09:56:36 ] >603 >ただし鉛筆は空間上の全ての点で同じ確かさで止まるとする。 これが答えのすべてを握っている。 これから確率分布(もちろん [0, c] の範囲に全て収まる)のグラフを書けるか?簡単だけど、これが出来なければThe End.
605 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 10:34:36 ] いちよー分布は書けました。
606 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 10:59:25 ] >>605 それが出来れば答えは公式レベルで分かる。
607 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 11:06:24 ] >>604 同じ確かさで止まるとする・・・。ってことは、確率変数は0〜C?で、確率は1/cってことですか?
608 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 11:31:40 ] そうとも言えるが、 確率密度関数っていったら、離散型じゃなくて連続型じゃないの? だったら、1/cではないから、ここでは確率は問われてないでしょう? グラフが書ける=関数が分かる=後は計算で何でもござれ、回答終わり、となるはずだ。
609 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 11:41:16 ] >>608 ってことは、関数はX/Cになるんでしょうか。
610 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 11:51:13 ] ちがう。多分直感的には1/cでいいのだが、連続する場合は・・・ってもうヤダ。 こんなスレだった?
611 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 11:55:35 ] あ、1/cはもちろん関数でなく確率の話。最後のおせっかい。
612 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 12:47:39 ] なんでこんな簡単な問題が議論してんだよ。 (1) f(x)=1/c (0 <= x <= c), (2) c/2, (3) c^2/12 以上。はい次。
613 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 12:55:17 ] >>612 適当な答え書くなwww
614 名前:toukei [2007/07/29(日) 14:27:21 ] あるテストで行った結果その得点分布は平均45点、標準偏差10点の 正規分布となった。 〔3〕得点が62点以上の人は全体の何パーセントであるか? この答え46%ではないですか?わかる人教えてください。
615 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 17:01:03 ] 初めて書かせていただきます。 私の学校で、特異性と感受性について統計学的な見解を述べるという試験が 出されるようなのですが、私自身が、統計学を選考していないため、どのよ うに書くべきなのかわかりません。 もしわかる方が、いらっしゃれば教えていただけると幸いです。 参考になりそうなHPとか教えていただけるだけでも結構です。 よろしくお願いします。
616 名前:名無しさん@そうだ選挙に行こう mailto:sage [2007/07/29(日) 17:03:17 ] おい誰か>>615 の「異性と感度についての統計学的な見解」について答えてやれ
617 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 17:54:52 ] 自分が男性、すなわち異性が女性である場合、統計学的には首5%耳10%胸30%陰部50%その他5%の確率で性感帯がある その他にはアナルやひざの裏なども含まれるので要注意だ 自分が女性、すなわち異性が男性である場合、ちんこ120%の確率で性感帯がある 自信を持って触ってやれ
618 名前:名無しさん@そうだ選挙に行こう [2007/07/29(日) 18:02:25 ] 手元に-1と書かれているカードが1枚、0と書かれているカードが2枚、1と書かれているカードが1枚ある。この4枚 のカードを母集団として以下の問に答えなさい。 (1)カードを1枚無作為に抽出する。取り出した標本が-1である確率、0である確立、1である確率を計算せよ。 (2)この母集団から大きさ2の標本を復元抽出したときの取り出されたカードの組み合わせを(Xa,Xb)とする。とりう る組を全て書け。 (3)それぞれの組み合わせに対して、標本平均Xc=(Xa+Xb)/2を計算してXcの確率関数を書け。 (4)Xcの平均と分散および母集団の平均と分散を計算せよ。 (1)-1:1/4 0:1/2 1:1/4 (2)(Xa,Xb)=(-1,0),(-1,1),(0,-1),(0,0),(0,1),(1,0),(1,-1) (3)それぞれXc=-1/2 , 0 , -1/2 , 0 , 1/2 , 1/2 , 0 (4)平均=(-1/2+ 0+(-1/2)+0+1/2+1/2+0)/7=0 分散=1/7 母集団の平均=平均の計算方法と同じ よって0 母集団の分散=平均の分散の計算方法と同じ よって1/7 一応、自分で解いてみたんですが、これで合ってますか?お願いします。
619 名前:132人目の素数さん [2007/07/29(日) 21:30:10 ] 単純回帰分析をしなくてはならないのですが、 なにか良いネタは思い付きませんか? データを見ててもひらめきません。
620 名前:132人目の素数さん [2007/07/31(火) 19:09:37 ] 2ちゃん使用時間と月収
621 名前:132人目の素数さん [2007/07/31(火) 19:18:28 ] >>618 >大きさ2の標本を復元抽出したときの 調べようね
622 名前:132人目の素数さん [2007/08/03(金) 23:01:15 ] 等分散性ではないときは回帰分析は駄目だとよく書籍にかかれていますが、 ならどうすればいいのでしょうか? 他の解析方法、解決策等があるのでしょうか? よろしくお願いいたします。
623 名前:132人目の素数さん mailto:sage [2007/08/03(金) 23:05:30 ] どんな対象についてどんな分析をしようとしているのかわからないとなんとも
624 名前:132人目の素数さん [2007/08/03(金) 23:08:40 ] >>623 製造工程の分析です。回帰分析をしていたら、 残差とすごい相関があったため、調べていくと等分散性にいきつきました。 しかし、ならどうすればよいのかがわからず止まってしまいました。
625 名前:132人目の素数さん [2007/08/04(土) 04:51:10 ] 1対3でじゃんけんをした場合、3人のうち誰か一人でも勝てる確率は何%ですか? 引き分けた場合はその人だけ勝負がつくまで行う。 また、3人同時ではなくそれぞれ順番にじゃんけんをした場合、誰か一人でも勝てる確率は上記の場合と同じですか?
626 名前:132人目の素数さん mailto:sage [2007/08/04(土) 06:10:42 ] >>624 heteroscedasticityの話か。GLSは?
627 名前:132人目の素数さん [2007/08/04(土) 15:41:25 ] >>624 意味分からん。残差と何の相関が高かったの? データには単なる独立なサンプル?それと時系列とかの構造が入ってる?
628 名前:132人目の素数さん mailto:sage [2007/08/04(土) 17:04:44 ] >>624 残差(residual)と回帰後の y の相関でしょう。 理論では、residualは 独立かつランダムな散らばりでなければならないのに、yと相関が高かったと。 独立変数で平方根をとるなどいじってもダメかな。 俺も勉強中だが、計量経済のスレに行った方がいい気がする。しかし、この先は理論づくしかと。
629 名前:628 mailto:sage [2007/08/04(土) 17:05:15 ] アンカー間違えた、>>627 ね
630 名前:132人目の素数さん [2007/08/04(土) 17:24:27 ] >>628 「決定係数」と「非決定係数」についてお勉強しようね
631 名前:628 mailto:sage [2007/08/04(土) 17:47:00 ] >>630 見当違いも甚だしいww
632 名前:132人目の素数さん [2007/08/04(土) 17:55:20 ] ヒントもわからないほど無知な 628 哀れ
633 名前:132人目の素数さん mailto:sage [2007/08/04(土) 18:07:56 ] >>631 俺を偽装する意図は何だ??俺は626=628=629だけだ。 >>630 それってまさに俺が626と628で説明したheteroscedasticityに行き着く話なんだけど。 >>624 xの選び方も、余地があるなら考えた方がいいかも。
634 名前:132人目の素数さん mailto:sage [2007/08/04(土) 18:21:12 ] >>633 GLMでいいだろ
635 名前:132人目の素数さん mailto:sage [2007/08/04(土) 18:24:47 ] >>634 ???なんだそれ???wwwwww GMMとGLSなら知ってるけど。
636 名前:132人目の素数さん mailto:sage [2007/08/04(土) 18:25:33 ] >>634 開発の新たな推定方法GLMについて、以下続く。
637 名前:132人目の素数さん mailto:sage [2007/08/04(土) 19:31:16 ] >>636 本気でGLM推定とか言ってんの? OLS推定が主に使われるGneral Linear Modelっつーフレームワーク知らねーんだ?
638 名前:132人目の素数さん mailto:sage [2007/08/04(土) 19:52:37 ] 今度は新しい単語を開発w
639 名前:132人目の素数さん [2007/08/04(土) 20:06:46 ] まあ >>624 が言ってることを、意味が通じるように解釈すると、 『「残差の二乗」と「説明変数群」との「重相関係数 R」または「決定係数 R^2」が大きい』 でないの?検定だとブルーシュ・ペイガンとかホワイトね。 何も考えずに回帰すると、普通に起きるけど、 散布図を参考にしながら適当な非線形変換を考えてやれば良いだけ。 基本的には、数量関係の良い近似式を探す問題で、統計学はその補助的ツール。 補助的ツールが答えを見つけてくれるわけじゃない。見つけるのは自分。
640 名前:638 mailto:sage [2007/08/04(土) 20:38:48 ] >>639 意味が通じてないよw
641 名前:639 mailto:sage [2007/08/04(土) 20:53:15 ] >>640 俺は、夏厨スレになってるから、そもそもの >>624 に話を戻しただけ。 意味も知らずに GLM とか喚いてる厨とは別の厨w
642 名前:638 mailto:sage [2007/08/04(土) 21:06:09 ] >>641 >意味が通じる様に解釈すると って言ってるけど、キミの解釈ははちゃめちゃだよって言ってるんだけどwww
643 名前:639 mailto:sage [2007/08/04(土) 21:15:23 ] 夏真っ盛りのようで・・・さて秘所に行くとするか
644 名前:132人目の素数さん [2007/08/04(土) 21:29:57 ] >>643 消えろボケ
645 名前:624です。 [2007/08/05(日) 00:45:37 ] これ、残差を逆に利用できませんか? yの値が増加すれば、残差の二乗が均一ではなく、増加傾向なんです。 だから、残差の値からyを推定するという考え方は間違っているでしょうか? >>627 1.データは製造条件(○○寸法、○○電圧等)です。 2.時系列データは入っていませんが、○月○日に作った製品の製造条件という意味では入っています。 >>628 はいその通りです。 >>633 xの選び方についての工夫とは、 残差と相関ができる原因の変数を除去するということでしょうか? >>639 >散布図を参考にしながら適当な非線形変換を考えてやれば良いだけ。 なるほど、一つ一つ散布図を確認して、 残差とyが無相関になるように工夫するという意味ですね。
646 名前:624です。 [2007/08/05(日) 01:03:18 ] >>645 >これ、残差を逆に利用できませんか? >yの値が増加すれば、残差の二乗が均一ではなく、増加傾向なんです。 >だから、残差の値からyを推定するという考え方は間違っているでしょうか? その分誤差が大きいことに気づきました。無理ですね。自己解決。
647 名前:132人目の素数さん [2007/08/05(日) 02:42:29 ] >>645 1.実際値 y と、この回帰式との誤差は、標準偏差で 2cm です。 でも y の値が大きくなると誤差の絶対値も大きくなる傾向が・・・ 2.実際値 y と、この回帰式との相対誤差は、標準偏差で約 1% です。 回帰式の値が大きくなると誤差の絶対値も大きくなる傾向がありますが、 相対誤差の程度(標準偏差)はほぼ一定です。 上の2のような結果が得られる線形回帰モデルを式で表せ。
648 名前:132人目の素数さん [2007/08/05(日) 10:00:24 ] 主成分分析で質問です。 相関係数行列で固有ベクトル、固有値を求めました。 因子負荷量を 1、λの平方根と係数の積から求める 2、相関係数を直接求めていく の二通りでやったのですが、値が一致しません。 はっきり言って、説明不足で何を言ってるのかわからないとは思います。 もし、言ってる事が分かる方がいれば、何か助言を下さい。
649 名前:132人目の素数さん [2007/08/05(日) 10:51:39 ] >>648 どうして一致すると思うのか説明してみ。 ヒント 相関係数行列の固有ベクトルと固有値の関係
650 名前:624です mailto:sage [2007/08/05(日) 13:46:17 ] 製造分野のデータには、動特性 (0点比例関係、ばらつきも、値が大きくなるにつれて大きくなる) ものが大半です。 ばらつきの指標SN比=log10(m/σ)^2が使われます。 このようなデータを回帰分析で扱う場合はどのような変換をかければよいのでしょうか?
651 名前:132人目の素数さん [2007/08/05(日) 15:03:41 ] >>650 私物化する気か? しつけーんだよ。
652 名前:132人目の素数さん [2007/08/05(日) 16:10:26 ] >>649 わからないっす・・・ 出直してきます(>_<)
653 名前:132人目の素数さん mailto:sage [2007/08/05(日) 17:17:19 ] いや気長に待て。 やさしい人が答えてくれるよ。
654 名前:132人目の素数さん mailto:sage [2007/08/05(日) 19:57:17 ] 答えがわかってたら、とっくに教えてるよ。 恥ずかしながら、わからないんだよ。 許してくれ。
655 名前:132人目の素数さん [2007/08/05(日) 22:15:55 ] 教えてください。 Excelで,マン・ホイットニーのU検定や,ウィルコクソンの符号付順位和検定をする方法はあるのでしょうか? 標準では入っていないアドインを入れないと出来ないでしょうか?
656 名前:132人目の素数さん [2007/08/06(月) 00:16:56 ] どなたかSTATAに詳しい方いらっしゃいますか? CLARIFYについてお聞きしたいのですが・・・。 期待値を求める場合 ロジットモデルlogit y x1 x2...の前にestsimpと打つと書いて あるのですが、logitの頭にxi:がついている場合はこれは 外すと考えてよいのでしょうか。 宜しくご教授ください。
657 名前:132人目の素数さん mailto:sage [2007/08/06(月) 08:59:52 ] estsimpは私の使ってる Stata 9には入ってないのでわかりません。 期待値を求める?ためのコマンドではないような。ヘルプを見ましょう。 xiは、i.variableのような使い方をする時に必須なんですがね。
658 名前:132人目の素数さん [2007/08/06(月) 14:49:21 ] 年齢と理想のライフコースの関連を検討するときに用いる分析方法って 何をつかえばいいのでしょうか?
659 名前:132人目の素数さん mailto:sage [2007/08/06(月) 22:11:34 ] >>650 田口博士が考案した式だね。 統計を知った上で、統計において分布を仮定してる時点で実用的ではないと指摘したとか。 統計学の書籍も書いていたような。 製造分野では、製品一つ一つの品質保証が重要。 物理量をエネルギー(エントロピー)の次元に変換して加法性をもたせる。 しかしエントロピーは計算がややこしいため簡易式としたのがその式だよ。 等分散性(動特性)を式に盛り込みばらつき量を評価している。 統計学ではなく品質工学を勉強した方がいいかもよ。
660 名前:132人目の素数さん [2007/08/08(水) 08:23:14 ] 統計モデル構築するときに、変数を増減してモデルを決めると 思うんですが、そのときにそれぞれのモデルに含まれる 観測数が一緒になるというのは大前提なのでしょうか? 自分がやっているモデルだと、変数を増減するごとに観測数が 変わってしまうのですが、これはそれまでのデータ処理に 問題があったっていうことなんですかね・・。 超基本な質問ですみませんです。
661 名前:132人目の素数さん [2007/08/08(水) 08:37:37 ] >>660 そうじゃない。変数によって観測値が変わるのは当然だよ。
662 名前:132人目の素数さん [2007/08/08(水) 08:52:20 ] >>661さん レスありがとうございます。 言葉足らず(というかあやまり)でした。すみません。 観測数というのはそのモデルにあてはまるサンプル数(observed number と 表示されています)のことなんですが、それも変数によって変わるもの なんでしょうか?
663 名前:132人目の素数さん mailto:sage [2007/08/08(水) 09:00:59 ] >>661 観測値ではなく観測数とおっしゃっているようですが、…。 >>660 ある変数は1時間ごとに測定し、ある変数は2時間ごとに測定するとか 欠測値があるとかかな?モデル選択をしようと思っている統計ソフトが 欠測値に対応しているなら観測数が変化しようともそのまま計算してくれる と思うけど。
664 名前:132人目の素数さん [2007/08/08(水) 09:19:52 ] >>663さん ありがとうございます。 指摘いただいた点を調べたところ、 欠損値の問題のような気がしてきました。 ちなみに今使っているソフトは欠測値には対応してなさそうです。 こういうときは観測数を無視してモデル選択するしか ないんでしょうかね・・。
665 名前:132人目の素数さん [2007/08/08(水) 09:33:50 ] >>660 >>662 どんな統計モデルか少し具体的に書いてくれ
666 名前:132人目の素数さん [2007/08/08(水) 09:44:28 ] >>665さん 多項ロジスティック回帰モデルを使おうと思っています。 従属変数が収入の“レベル”(金額ではないです) を示すカテゴリーデータで、独立変数に教育、性別、 年齢などを入れたいと考えています。 ・・・こんな感じでいいんでしょうか? もし的外れだったらすみません。。。
667 名前:132人目の素数さん mailto:sage [2007/08/08(水) 09:53:17 ] 共分散 Σ(X-E[X])(Y-E[Y}) これって (ΣXY)-(ΣX)*(ΣY) と同じですか?
668 名前:132人目の素数さん [2007/08/08(水) 16:21:11 ] 共分散 ≠ Σ(X-E[X])(Y-E[Y}) ≠ (ΣXY)-(ΣX)*(ΣY)
669 名前:教えて下さい。 [2007/08/13(月) 19:07:24 ] 心理のツール(質問紙)を作成する時に、 いくつかの項目で「天井効果」が出てしまいました。 天井効果が出るような項目を、統計処理しても 正しい値が出ない?
670 名前:132人目の素数さん mailto:sage [2007/08/13(月) 19:59:38 ] なにをもって「正しい値」と言っているかしらないが 統計処理が難しくなることは確か。
671 名前:132人目の素数さん mailto:sage [2007/08/13(月) 20:42:17 ] 天井効果ということばを知ってる時点でどうすべきかも知っているはず。
672 名前:教えて下さい。 [2007/08/13(月) 21:56:09 ] 同じ質問紙を時間をおいて調査したら、 最初より、二回目の方が点数が高くなってしまって、 二回目に調査した時にはほとんどの項目で天井効果が出ているのです・・・。 これって、差を検定するのにT検定じゃ無理だよね? 相関を見る時、どの方法を使えばいいの?
673 名前:132人目の素数さん mailto:sage [2007/08/13(月) 22:04:31 ] >>672 検定する前に調査の妥当性について検討したら?
674 名前:教えて下さい。 [2007/08/13(月) 22:14:38 ] アメリカで作られたツールを日本語訳したのですが、 アメリカのデータも天井効果になっているみたい・・・。 こまったなぁ〜・・・ どうしよう。夏休み中にまとめなきゃいけないんだけど、 統計に詳しい人いないのですぅ。(涙)
675 名前:教えて下さい。 [2007/08/13(月) 22:15:23 ] ノンパラで検定するというのは有り?
676 名前:132人目の素数さん [2007/08/14(火) 05:10:05 ] >>672 2変数の相関を見たいなら、 Spearman あるいは Kendall の相関係数を使えばよいのでは。
677 名前:教えて下さい。 [2007/08/14(火) 06:46:42 ] >>676 どうもありがとうございます!
678 名前:132人目の素数さん [2007/08/14(火) 21:31:52 ] Rでガンマ分布にあてはめてGLMを行う際のリンク関数について不明な点があります。 デフォルトではinverseが当てはめられていますが,logを使ってもいいですよね。 AICや残差に違いはありません。 これは他の分布でもいえることと思うのですが,この際リンク関数を選択する場合には何を基準にしたらよいのでしょうか? よろしくお願いします
679 名前:132人目の素数さん mailto:sage [2007/08/20(月) 04:51:14 ] √(xy+yz+zx)/3 などの相加平均と相乗平均の間にある平均に名前はついているのでしょうか?
680 名前:132人目の素数さん mailto:sage [2007/08/20(月) 12:09:31 ] >>679 算術平均。 と適当なことを書いてみました。 入試問題としてこのような問題文を書いたら間違いなく叱られる。 意味不明です。
681 名前:132人目の素数さん mailto:sage [2007/08/20(月) 12:12:20 ] 算術平均(arithmetic mean)は相加平均と同じ
682 名前:132人目の素数さん mailto:sage [2007/08/20(月) 14:27:54 ] √(xy+yz+zx)/3 が間にあるとは全然思わないが、 冪乗平均(m-乗平均)や一般平均とかのことか??
683 名前:132人目の素数さん mailto:sage [2007/08/20(月) 14:31:48 ] >>679 あんまりいい記事じゃないが en.wikipedia.org/wiki/Mean でも見て来い。 ちなみに、日本語版はもっと酷いから、見ない方がいい。
684 名前:132人目の素数さん mailto:sage [2007/08/20(月) 14:58:36 ] >>683 Elementary symmetric mean ってのみたいです。 Elementary symmetric mean - en.wikipedia.org/wiki/Elementary_symmetric_mean Newton's inequalities - Wikipedia, the free encyclopedia en.wikipedia.org/wiki/Newton 's_inequalities MacLaurin's inequality - Wikipedia, the free encyclopedia en.wikipedia.org/wiki/Maclaurin%27s_inequalities
685 名前:132人目の素数さん [2007/08/21(火) 01:15:55 ] 推測統計学の特に点推定について、一般化最小二乗法など各種パラメータ推定法について説明した書籍や文献はないでしょうか? ご存じの方がいましたら教えて下さい。
686 名前:132人目の素数さん [2007/08/21(火) 18:54:21 ] 正規分布が仮定される10個程度のデータ中にひとつだけ飛びぬけた値があって、外れ値かと思ってグラブス・スミルノフ検定をやったら確かに省いてよいことになりました。 でも、ちょっと気になってこの10個のデータで1標本KS検定をやっても正規性は否定できませんでした。 外れ値を省いた9個のデータが正規性を示すことはわかるのですが、GS検定で外れ値と分かったものを含んでもなおKS検定で正規性が否定できないのはどういった理由からでしょうか?
687 名前:132人目の素数さん [2007/08/22(水) 06:05:34 ] スミルノフ・グラブスとコルモゴロフ・スミノフじゃ全然方法が異なるから、 結果が異なっても別に何もおかしくないんじゃないの? それとも何か結果が一致しなきゃいけない理由があるの? ついでにスミルノフ・グラブス検定で棄却されたら その値を除いてもいいなんていう理論はないと思うけど。
688 名前:132人目の素数さん [2007/08/22(水) 10:10:37 ] >>687 両方とも正規性を前提にしているんじゃないの?
689 名前:687 [2007/08/22(水) 12:33:20 ] >>688 そうだけど、統計量の構成の仕方が違うでしょ。 SG検定は、パラメトリックに、ある観測値が異常値かを検定してる。 一方KS検定は、経験分布関数全体をノンパラで検定してる。 私はその分野に詳しい訳ではないが、同値な検定には見えない。
690 名前:132人目の素数さん [2007/08/22(水) 12:56:33 ] >>689 なるほど。なのでKSの方がパワーレスなのか。
691 名前:132人目の素数さん mailto:sage [2007/08/22(水) 15:57:55 ] 統計関係の雑誌のランク付けというか好みの傾向とかまとめてるところないでしょうか?
692 名前:132人目の素数さん mailto:sage [2007/08/22(水) 16:07:22 ] Econ journal ranking から econometrics に関係するものを抜き出せ。傾向なんか知らん。
693 名前:132人目の素数さん mailto:sage [2007/08/22(水) 17:24:40 ] カイ二乗検定や、G検定等の検定方法について質問です。 netと買った本だけで独学を始めたばかりなのでよくわかっていません。 あまりにバカな質問なのかもしれませんがお許しください(つД`;) 1)2x2分割表であらわせなく、かつ期待値が小さい場合にはG検定を使う方が良い この理解であっているのやら間違っているのやら、、、。 2)G検定の式はG=博タ測値ln(実測値/期待値) これで正しいのでしょうか・・・?(Wikiに書いてあったものを鵜呑みです) 3)ln(実測値/期待値)とは、log(実測値/期待値)だと思うのですが 実測値が0の場合、実測値/期待値=0で、log0の計算が うまいことできないと思ってしまいます。 これはどのように解決すれば良いのでしょうか? 以上。。。無知すぎて遅々として進まないのですが、どーにかしたい あがく者からの質問でした〜。
694 名前:132人目の素数さん [2007/08/23(木) 02:52:41 ] >>691 こんなサイトもある。信頼性は知らん。 www.alba.edu.gr/survey/Ststns/
695 名前:132人目の素数さん mailto:sage [2007/08/23(木) 21:07:05 ] 相関係数について質問があります. 3変数x, y, zがあったとして xとyの相関係数,xとzの相関係数が既知のとき, yとzの相関係数というのは一意に定まるのでしょうか? よろしくお願いします
696 名前:132人目の素数さん [2007/08/23(木) 21:56:51 ] T検定のやり方を教えて下さい。 頭は良い方ではないので、わかりやすく説明していただければ嬉しいです。 よろしくお願いします。
697 名前:132人目の素数さん mailto:sage [2007/08/23(木) 21:59:56 ] >>695 定まらない。コインを3回投げるくらいで簡単に反例が作れる。
698 名前:132人目の素数さん mailto:sage [2007/08/23(木) 22:01:51 ] >>696 自分で調べようとせず、頭が良くない人に掲示板で説明するのは無理。
699 名前:132人目の素数さん [2007/08/23(木) 22:29:34 ] 698→様々なサイトを見て回った結果、理解できなかったのでここに頼ってみました。 再度、お願いします。
700 名前:132人目の素数さん mailto:sage [2007/08/23(木) 22:37:14 ] >>699 無理。あきらめろ。
701 名前:132人目の素数さん [2007/08/23(木) 22:46:15 ] 別に、あなただけに聞いているわけではないから
702 名前:132人目の素数さん mailto:sage [2007/08/23(木) 23:01:47 ] さまざまなサイトを見てわからないのに ここで聞いて分かるという発想が理解できんな
703 名前:132人目の素数さん [2007/08/23(木) 23:14:09 ] 器小せぇな ま〜期待はしていなかったがな
704 名前:132人目の素数さん mailto:sage [2007/08/23(木) 23:55:48 ] >>693 1)G検定でも必ずしも適当とは言い切れないが、まぁその理解でもいいと思う。 2)2が抜けてる 3)lim[t→+0]tlogt=0なので0で計算する。エントロピーと一緒。 log(実測値/期待値)の前に乗じてある(実測値)が重要。
705 名前:132人目の素数さん [2007/08/25(土) 15:05:21 ] >>696 まず先にt検定をどんなデータに使うか説明してみてくれよ。
706 名前:132人目の素数さん mailto:sage [2007/08/25(土) 18:35:03 ] >>703 器の問題じゃないし。ヴァカに手取り足取り教えるのは掲示板では無理。 リアルで手取り足取り教えてくれる人がいないお前は、かなり悲惨そうだな。 まずは友達作る能力を身につけることからお勧めする。 ほんとうに不愉快な人間だな。
707 名前:703 [2007/08/26(日) 04:06:21 ] >>706 お前の方がもっと不愉快な人間だぜ。分かんねの?
708 名前:132人目の素数さん mailto:sage [2007/08/26(日) 12:39:53 ] >>703 通りすがりのものだが、 教科書にいくらでも詳しい説明が載ってることを 掲示板で聞くのはどーかと思うよ。 もっと言えば、実世界で聞く場合でも、 説明を読んだ上でどの部分が分からないのかくらいは はっきりさせておくべきだろう。
709 名前:132人目の素数さん mailto:sage [2007/08/26(日) 14:14:30 ] >>708 いいじゃねーかよ。たかが掲示板。答えてくれる香具師だって出てくるさ
710 名前:132人目の素数さん mailto:sage [2007/08/26(日) 14:54:35 ] この空気で答えたら顰蹙物だけどな
711 名前:132人目の素数さん [2007/08/26(日) 16:00:53 ] >>696 >T検定のやり方を教えて下さい。 1. 仮説下で t 分布にしたがう検定統計量の値を計算する。 2. その検定統計量の自由度を計算する。 3. 【お勉強】 テキストの t 分布表で自由度に対応する行を見る。 【実際】 自由度、検定統計量の値に対応する P値 を計算する。 4. あとは普通の検定手順。 以上//
712 名前:132人目の素数さん mailto:sage [2007/08/26(日) 23:43:45 ] はき古しとまでいかないけど そんなパンツより、新品のパンツで挑んだほうがいいんですか 新品のパンツだとしてユニクロの安いパンツで構わないんですか あとちん毛ボーボーでもいいですか? 少し剃った方がいいんでしょうか 統計学の方は他の場所で統計取って自慢し合ってください
713 名前:132人目の素数さん mailto:sage [2007/08/29(水) 09:32:26 ] JRSSBのエディターに もし載せるチャンスをもちたいなら、ここ直せ でrejectされたのですが 直した内容で再投稿するべきか、 もっとランクを落とした雑誌に投稿すべきか 悩んでます ちなみにすでに任期なしの職にはついていますが 来年から雑用が大量にくると聞いています
714 名前:132人目の素数さん mailto:sage [2007/08/29(水) 10:20:33 ] わざわざ指摘されたってことはいい兆候ではないのか?
715 名前:132人目の素数さん [2007/08/29(水) 15:03:30 ] confidence band とconfidence intervalの違いって何ですか?
716 名前:132人目の素数さん mailto:sage [2007/08/30(木) 08:58:01 ] confidence interval は、true parameter (あるいはその関数) に対する信頼区間、 confidence band は、モデルで想定している誤差項を含んだ 信頼区間を指すのでは? 例えば、正規分布に従うX の平均 μ=EX を推定したいとして、 X の観測値が100個あって、平均が5, 標準偏差で3だとすると、 大雑把に言って μの95% confidence intervalは、(5-2*3/10,5+2*3/10) = (4.4, 5,6) (注:2標準偏差=95%信頼区間, 10は観測数の平方根), Xの95% confidence band は、(5-2*3, 5+2*3) = (-1, 11) になるのでは?
717 名前:713 mailto:sage [2007/08/30(木) 11:17:50 ] >>713 >>714 ありがとうございます レジェクトされた論文をランクを落とした雑誌に投稿後に レビューアにいわれた追加実験を加えたものをJRSSBに再投稿 というのはありなのでしょうか? 前回との差分が減るのでかえってレジェクトされやすくなるだけでしょうか
718 名前:132人目の素数さん mailto:sage [2007/08/30(木) 12:17:45 ] 知らんがな、自分で考えろ、って感じだけど、 何故再投稿を躊躇しているのか良く分からん。 常識的には、アドバイス貰って直して他にだけ提出・・・というのは道理が通らないと思うが。
719 名前:713 mailto:sage [2007/08/30(木) 13:58:16 ] 知人に相談したところ editorの段階でrejectされただけなので望み薄といわれました まあどんなrejectでも理由は書くよね
720 名前:132人目の素数さん [2007/09/01(土) 07:13:04 ] ロジスティック回帰についての初心者向けの本、もしくはウェブページで何かいいもの はないでしょうか?
721 名前:132人目の素数さん mailto:sage [2007/09/01(土) 08:38:06 ] >>720 ググったかい?