1 名前: ◆OHr6mNLYV6 [03/11/08 19:44] (´Д`;三;´Д`) 語って下さい.偉大な統計学を... 質問にはやさしいお兄さんが答えてくれます. 前スレ science.2ch.net/test/read.cgi/math/1012782106/ 関連スレ 【 確率論・統計学の実用の仕方 】 science.2ch.net/test/read.cgi/math/1041865872/ こんな確率もとめてみたい その1/2 science.2ch.net/test/read.cgi/math/1029400897/ ■確率制御■ science.2ch.net/test/read.cgi/math/1017042903/
284 名前:132人目の素数さん [04/01/31 00:14] ほんとに基本的なことで恐縮ですが、以下の問題について教えてください。 生物雑種第2代の分離比が、ある実験の結果42:157であった。この結果を用いて この結果がメンデルの分離の法則による分離比(1:3)を満足しているかどうか 検定せよ。 この問題に対して私はメンデルの法則に”満足している”ことを知りたいのだ から、帰無仮説は”満足していない”と考えました。 この考え方はおかしいのでしょうか?おかしいとしたら、どのように考えれば よいのかアドバイスをお願いいたします。
285 名前:132人目の素数さん mailto:sage [04/01/31 00:17] >>284 ほらよっ。 www.google.co.jp/search?q=%93K%8D%87%93x%8C%9F%92%E8%81@%83%81%83%93%83f%83%8B&ie=Shift_JIS&hl=ja&lr=
286 名前:132人目の素数さん mailto:sage [04/01/31 00:54] >>284 「満足していない」という仮説を立てるのは自由だが、その仮説からいったい どういう計算ができるのか?と自問してみたまへ。
287 名前:☆キキ+キ゚Д゚ ◆qpmo.OOqAo [04/01/31 02:00] なんと! HPで☆キキ+キ゚Д゚♪の声が聴ける! ホームに☆キキ+キ゚Д゚♪の哲学論が流れている! www.geocities.co.jp/HeartLand/8862/ ↑HPはこれね。 みんなで☆キキ+キ゚Д゚♪の声を聴こう!
288 名前:132人目の素数さん mailto:sage [04/01/31 17:42] >>281 (Xa,Xb,Xc)から、何かを線形予測したいんだろけど、自己相関行列だけからじゃわからんよ。 その問題の前後になんか条件とか説明は無いの? >>282 本当は問題にどういう推定量を使うか書いていないからわからないんだけど、一般的な解釈で解答すれば次の通り。 割合の推定量ってのはたぶん、食べている人の人数をX、全体人数をNとすればX/Nのことだろ。 んで、食べている人の割合の真の値がpなら、このXは、2項分布Bin(N,p)に従う。 この分散はNp(1-p)だから、X/Nの分散は、p(1-p)/Nになる。 今、このp(1-p)/Nの中のpは真の確率だけど、これをpの推定値600/1000で置き換えたものを、 X/Nの分散の推定値としてみることができる。 だから、0.6*(1-0.6)/1000=0.00024が多分出題者の求めている答えだと思う。
289 名前:132人目の素数さん mailto:sage [04/01/31 18:10] >>284 考え方としてはいい方向だよ。間違っているときに積極的に捨てたい仮説が帰無仮説だから。 だけど、検定の方式というのは、帰無仮説を仮定したときに、実際起こった結果が起こる確率 を計算できなければ判定ができない。 よって、>>286 氏の言うとおり、仮説が色々な値をとる様な場合は、この確率の計算ができない から、必然的に値がはっきりしてる方を帰無仮説にとることになる。 だから、「3:1である」と「3:1でない」だったら、値が1つに決まっていて確率計算が できる前者を帰無仮説にとるわけだね。
290 名前:132人目の素数さん [04/02/01 20:39] 誘導でこっちにきました。統計で質問です。 サンプル数15 Aの割合60パーセント、Bの割合80パーセント AとBに有意差があるか検定したいのですがどうすればいいですか?
291 名前:132人目の素数さん [04/02/01 21:52] 『モンティ・ホールのジレンマ』はどういうこととどういうことがジレンマになってるんですか?
292 名前:132人目の素数さん mailto:sage [04/02/02 08:06] >>290 ちょっと状況は違うけど、2群の母比率の差に関する検定を準用すればいいんではないかな。 >>291 正解っぽい解答が2つ以上存在すること(1/2と1/3)。すぐに1/3と分かる人にとってはジレンマでも なんでもないんだけどね。 複数の正しいと思われる互いに矛盾する解答が存在する場合が「ジレンマ」、論理的に解がありそう だけど解が見つからないような場合が「パラドックス」。 同じような意味で使われる場合も多いけど。
293 名前:132人目の素数さん mailto:sage [04/02/02 23:40] 二項分布のPの求め方を教えてください
294 名前:132人目の素数さん mailto:sage [04/02/03 00:16] >>293 推定値を求めたいなら、出た割合をpの推定値とするのが普通。
295 名前:助けて頂けませんか? [04/02/03 16:26] 274・279の者ではないのですが、 統計の問題なんですが解けないので、助けて頂けませんか? できれば解説等も書いてあれば幸いです。 問 不眠症のための睡眠薬Aの効果を調べるために、 20人の不眠症患者を無作為に選び、睡眠薬Aを投与した。 その結果、睡眠薬の増加は以下のようになった。 (1)睡眠時間の平均増加時間Uに対する 様々な信頼度の(両側、片側)信頼区間を作り、 睡眠薬の効果について考察しなさい。 (2)睡眠時間が平均的に1時間以上増加したら、 睡眠薬の効果があったと判断することにすると、 下の実験結果より睡眠薬の効果があったと判断してよいか、 どうかを考察しなさい。 (3)睡眠時間の増加の標準偏差値は、 標本の大きさによらず、 いつもほぼ一定の値であることは知られている。 このことを利用して、 睡眠時間の平均増加時間の両側信頼区間の区間幅を1時間未満にするには、 何人の患者に対して実験すべきか考えなさい。 _______________________________ |0.6|−0.3|2.4|1.3|−0.5|1.5|0.9|−0.6|0.9|4.3| ーーーーーーーーーーーーーーーーーーーーーーーーーーーー |2.7|−0.1|1.9|3.2| 1.6|1.3|1.8| 1.8|3.3|1.8| ーーーーーーーーーーーーーーーーーーーーーーーーーーーー 見にくいかもしれませんが、御願い致します
296 名前:132人目の素数さん mailto:sage [04/02/03 16:35] >>295 まず不思議なのは このスレに来て 何故、274・279に同じ問題の コピペがあるということが分かったのか?
297 名前:助けて頂けませんか? [04/02/03 16:52] 他の板に同じのが載っているという事でしょうか? それとも答えるに値しない程の低レベルの問題と言う事とかでしょうか? 見当違いの答えをしているのでしたら、申し訳ありません。 殆ど統計を勉強していなかった為、全くと言って良い程理解出来ないので、 解き方のヒントだけでも頂けたら有難いです。
298 名前:132人目の素数さん mailto:sage [04/02/03 17:12] >>297 で、教科書は読んだのかな? 丸投げにしか見えないのだけど。
299 名前:132人目の素数さん mailto:sage [04/02/03 17:31] >>297 あなたはこの問題をどこで手に入れ、何故この問題を解く必要があるのか? というあたりを答えてもらいましょうか。 どうみても あなたは>>279 と同じ人だと思いますが 全く同じ問題で、かつ、名前欄に妙なメッセージを入れているし
300 名前:教えてください [04/02/03 17:40] 私は上の睡眠薬のレポートができないと統計学の単位がもらえないのです。 だから誰か助けてください。 この問題は授業のレポートです。 私は貧乏なのでみんなのように教科書をかったりできないので大変困っています。
301 名前:132人目の素数さん mailto:sage [04/02/03 17:44] 図書館・・・
302 名前:132人目の素数さん mailto:sage [04/02/03 17:49] >>300 これは医学部のレポートだろ? ホントにお金無いの?(w
303 名前:教えてください [04/02/03 17:50] もしよければ誰か親切な方教えてくれないでしょうか。図書館の本はすでに借りられていました
304 名前:132人目の素数さん mailto:sage [04/02/03 18:06] 来年また頑張れば? 教科書を買う金なんて 2〜3日分、食費削るか 半日くらい肉体労働のバイトすればすぐ たまるじゃん。
305 名前:132人目の素数さん mailto:sage [04/02/03 18:09] ここまで荒し続けて来ていまさら何言ってるの?ってカンジ。
306 名前:助けて頂けませんか? [04/02/03 18:09] 295・297です 297の人は恐らく同じ学校か、 同じ教師の教わってるのではないでしょうか? 自分はテキストは持っていますが、 読んでいるうちにだんだん分からなくなってきてしまうんです・・・ 検定の考え方までなら少しは理解出来ますが、標準正規分布図を描き、 選択域・棄却域の場所等からが理解不能になってしまうんです。 以降はどの様に考えれば良いのでしょうか? 御手数でしょうか、宜しく御願い致します。
307 名前:助けて頂けませんか? [04/02/03 18:13] 間違えました!! 300の人が同じ学校か、同じ教師という事です!!
308 名前:132人目の素数さん [04/02/03 18:13] >>306 だったら、君のテキストを貸してあげれば?(w
309 名前:132人目の素数さん mailto:sage [04/02/03 18:14] >>307 簡単にいっちゃうと 自作自演で自分が何番かこんがらがって来たということかな?
310 名前:132人目の素数さん mailto:sage [04/02/03 18:16] >>295 (1) 正規分布を仮定。 データの標本平均x~、(不偏)標本分散s^2をもとめて、 (x~-t(ε/2)*s/√(n-1), x~+t(ε/2)*s/√(n-1)) ここで、t(ε)は自由度19のt分布のε点。εは、1%や5%をとる。 (2) 標本平均が1より大きいから、帰無仮説μ=1、対立仮説μ>1で検定。 有意水準εなら、x~-1>t(ε)*s/√(n-1)で、仮説が棄却される。 仮説が棄却されたら効果ありと言っていい。 (3) (1)で作った信頼区間から幅は、2*t(ε/2)*s/√(n-1)が分かる。 これが1未満になる、っていう不等式をnについて解くだけ。 これで何が何だか分からないようだったら素直に単位落としなさい。
311 名前:132人目の素数さん mailto:sage [04/02/03 18:20] >>310 間違えた。(1)のs^2はただの標本分散(20で割る)の方。
312 名前:助けて頂けませんか? [04/02/03 18:42] 295です >>310・311さん御指導有難う御座いました。 ダメもとで解いてみます。 >>皆様 既出の同じ質問をして、 自作自演に取られる様に感じさせてしまい失礼致しました。 不快な気分にさせてしまい、 大変申し訳御座いませんでした。 最後に、295・297・306・307は自分が書いたものですが、 それ以外は自分のではない事だけを記しておきます。
313 名前:132人目の素数さん mailto:sage [04/02/03 22:35] 馬鹿ばっかの学部だな。
314 名前:132人目の素数さん [04/02/04 05:31] 母分布がN(μ、2^2)であるとき、これからサイズ100の標本を抽出したところ 、標本平均 _ 100 X=1/100狽wi i=1 は8.5であった。信頼度95%で母平均μの信頼区間はいくらのか 求めよ!! 全く分かりません!!誰か解いてください!!お願いします!!
315 名前:132人目の素数さん [04/02/04 05:42] ,..-──- 、 /. : : : : : : : : : \ 冒 /.: : : : : : : : : : : : : : ヽ l l ,!::: : : :,-…-…-ミ: : : : :', ./〜ヽ{:: : : : :i '⌒' '⌒' i: : : : :} ________ |__| {:: : : : | ェェ ェェ |: : : : :} / . .||ポサ.|| { : : : :| ,.、 |:: : : :;! < うわゎぁぁぁぁぁっ /|.l ン||_.ヾ: :: :i r‐-ニ-┐| : : :ノ \ |  ̄ -!、 ゞイ! ヽ 二゙ノ イゞ‐′  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ | −! \` ー一'´丿 \ ノ ,二!\ \___/ /`丶、 /\ / \ /~ト、 / l \ / 、 `ソ! \/l::::|ハ/ l-7 _ヽ /\ ,へi ⊂ニ''ー-ゝ_`ヽ、 |_厂 _゙:、 ∧  ̄ ,ト| >‐- ̄` \. | .r'´ ヽ、 ,ヘ \_,. ' | | 丁二_ 7\、|イ _/ ̄ \ i \ ハ |::::|`''ー-、,_/ /\_ _/⌒ヽ _________________________________________________ このスレを見た人は、10年以内にかならず氏にます。 でも、逃れる方法はあります、 ※10日以内に20箇所のスレにこれをはるのです。 すみません、僕、氏にたくないんだす
316 名前:132人目の素数さん [04/02/04 13:04] どなか次の問題よろしくお願いします。 ある商店街における従来の平均駐車時間は42.5分であるという。 最近、平均駐車時間が長くなっているとして駐車場を拡張する計画が出された。 拡張にはそれなりの費用がかかる。 果たして本当に駐車時間が長くなったかを調べるため、 ランダムに36枚の入出力記録用紙を調べたところ、平均は46分であった。 今までの経験から標準偏差は7.6分であることが分かっている。 拡張計画を推進するかどうか、統計的な見地から判断しないさい。
317 名前:310 311さんへ [04/02/04 15:46] 本当にご指導ありがとうございます。 もしよければ解説付きで全回答していただけないでしょうか。
318 名前:132人目の素数さん mailto:sage [04/02/04 16:43] キタ━━━━━━(゚∀゚)━━━━━━━!!!!!
319 名前:310 311さんへ [04/02/04 16:51] おねがいします
320 名前:310 311さんへ [04/02/04 17:10] もう一度お助けください
321 名前:132人目の素数さん mailto:sage [04/02/04 17:34] >>317 >310に書かれている文章が読めないのか? >これで何が何だか分からないようだったら素直に単位落としなさい。
322 名前:310 311 321さんへ [04/02/04 17:37] 自力で解くことができました。 御指導有難う御座いました。 不快な気分にさせてしまい、 大変申し訳御座いませんでした。 最後に、317・319・320は自分のではない事だけを記しておきます。
323 名前:132人目の素数さん [04/02/04 17:43] アホばっかりだな
324 名前:132人目の素数さん [04/02/04 18:16] すいませんお願いします。 区間[-1/2,1/2]を台に持つ一様分布をXとしたときに Xj〜f(x)をすべて独立として、 その和の平均z2=(x1+x2)/2 ,z3=(x1+x2+x3)/3 のp.d.f.を求めろという問題なのですが。
325 名前:132人目の素数さん mailto:sage [04/02/04 18:24] >>324 問題がおかしいだろ。 そもそも日本語になってない。
326 名前:132人目の素数さん mailto:sage [04/02/05 06:23] >>314 分散既知の正規母集団の平均の信頼区間(x~-u(ε)σ/√n,x~+u(ε)σ/√n)に代入するだけ。 >>316 帰無仮説 μ=42.5、対立仮説 μ>42.5とおいて正規母集団の平均の分散既知の場合の片側検定。 x~>42.5+u(ε)σ/√nで仮説を棄却。 仮説が棄却されれば長くなったと言え、拡張計画を推進するべき、となる。 >>324 普通に変数変換なり、P((X+Y)/2<z)を求めて微分するなりして求めりゃいいが、かなりめんどくさい 場合分けが必要。 Z2=(X1+X2)/2は、f(z)=2(1-2|z|) (-1/2<=z<=1/2)かな。 Z3はかなりめんどくさい。がんばれ。
327 名前:132人目の素数さん [04/02/05 17:57] 数学は全くの初心者の実家が手打ちのそば屋で働く者です。 うちでは蕎麦粉8割、小麦粉1.5割、中力粉0.5割の割合で粉を混ぜます。 このできたものが完全に混ざり合っているかを証明する方法ってありますか? なんとなく毎日蕎麦を作っていて、ふと気になったもので。 統計とは関係ないのでしょうか?
328 名前:132人目の素数さん mailto:sage [04/02/05 19:00] >>327 小麦粉と中力粉がどう違うのか説明せよ。いずれにせよ 数学はこの問題には無力。熱力学のエントロピーの 概念が近いが、それでも意味のある結論は出ないだろう。 割り粉に食紅で色をつけることでもできれば、それを混ぜて実験 できるが、粉に色をつける方法を思いつかない。水かけたらアウト だしね。顕微鏡で見る手もあるが(小麦粉の粒子が大きいはず) 混ぜ方の良否はわからないだろう。 うん、あれ何度かきまぜたら混ぜ終わったといえるのか、よく わかんないんだよね。昔の本職は材料を桶にいれて木の棒で 何度も何度もかきまぜたそうだ。
329 名前:132人目の素数さん mailto:sage [04/02/05 19:06] >>324 問題の表記に変なところがあるが、問題自体は自明(というか、 よくあるやつ)なので、結果だけ出しておく。2変数の和の pdfは三角分布(3角形)になる。底辺は [-1/2, 1/2] で面積 は1だから、高さはわかるよな。3変数の和はそれを少し崩した、 放物線を3個組み合わせた形になる。だんだん正規分布の形に 近づく。計算するには、分布をフーリエ変換してn乗して、 逆フーリエ変換するのだ。
330 名前:132人目の素数さん mailto:sage [04/02/05 23:24] >>328 レスありがとうございます。 やっぱり統計学とは関係なかったんですね。 蕎麦ではないんだけど、昔聞いた話でなにかを混ぜた時に四等分して、 一つを更に四等分した物をサンプルにすると混ざり具合がわかると 聞いたことがあったんです。 こういうのは学術的になんて言うのか知りたかったというのもありまして。 小麦粉と中力粉の違いってのはウチでの単に呼び方で小麦粉=強力粉 ってことです。スマソ。 ちなみにそれらの違いは粒子の大きさだけです。
331 名前:328 mailto:sage [04/02/06 00:24] >>330 中力粉と強力粉の違いなら、そりゃ粒子の大きさじゃないぞ。 グルテン(たんぱく成分)の含有率の差だ。これ以上はスレ違い にて省略。 4等分うんぬんは、一回の攪拌操作でどれだけの混合がなされて いるかを定量化する試みだろう。木鉢に粉が 1kg 入っているとし て、一回の攪拌ではそれを 100個に分割する、言い換えれば 10gの 小部分に分割する操作と仮定する。操作を n回くりかえして、結果 が粉の粒子の体積くらいまで分割されれば完全に混合されたと いえるだろう。もし粉の 1粒を 1μgとすれば、 log(10^9)/log(10^2) = 9/2 = 4.5 で、4〜5回の攪拌でまざって しまう。けっこう早いものだね。
332 名前:132人目の素数さん [04/02/06 14:54] すみません、質問いいですか? わからない問題スレで誘導されました。 f(x)=exp[-(x-x_i)^2/2σ^2 + k*x] というガウス型の関数の規格化をしたいんですが、手ほどきお願いします。
333 名前:132人目の素数さん [04/02/06 16:07] >>332 まず、指数の部分を平方完成する。 -{(x-x_i)^2/(2σ^2)} + k*x = -(1/(2σ^2)) { (x-x_i)^2 -(2σ^2)kx} = -(1/(2σ^2)) { x^2 -2(x_i +kσ^2)x +(x_i)^2} = -(1/(2σ^2)) { (x -(x_i +kσ^2))^2 -(2x_i kσ^2 + (kσ^2)^2) } = (1/2){ 2 x_i k +(k^2)(σ^2)} -(1/(2σ^2)) (x -(x_i +kσ^2))^2 これの前半はxに関係無い項 f(x)=exp[-(x-x_i)^2/2σ^2 + k*x] = exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-(1/(2σ^2)) (x -(x_i +kσ^2))^2) y = x -(x_i +kσ^2)/((√2)σ)と置けば f(x) = exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-y^2) なので、普通のガウス積分を使って正規化できる。
334 名前:332 [04/02/06 16:14] >>333 ご丁寧な解説有難う御座います! これで確率、期待値が計算できますぅ!
335 名前:316 [04/02/06 21:37] >>326 遅くなりましたがどうもありがとうございます。 よろしければ次の問題もよろしくお願いします。 アメリカのある州の警察学校の女子生徒が、体育科目の男女合格率に 差があるとして雇用機会均等条例違反で訴えた。 女性は9人中6人が合格し、男性は37人中34人が合格した。 条例には、雇用昇進に関する各種のテストにおいて男性の合格率が 著しく高くならないように男女の合格率の許容される比を0.8と定めている。 果たしてこの科目に性差別があるといえるか。 また、合格率の許容比が1のときはどうか。
336 名前:132人目の素数さん [04/02/07 14:14] 非線形混合モデルのレベル3ランダム効果の分散を、ラプラスでの近似に成功 したヤシはいるのだろうか?
337 名前:336 [04/02/08 07:16] 反応なしか...ちょっと質問の出し方が唐突過ぎたか。 それではもうちょっと詳しく。 3レベル非線形混合モデル(Nonlinear Mixed Model)でロジットをリンク関数として 使っている。レベル1でのひとつの係数をランダム係数とし、レベル2で その係数を(固定効果+ランダム効果)とし、ランダム効果の分散を推定 する。さらにレベル2の固定効果をレベル3でまたまた(固定効果+ランダム効果) とし、ランダム効果の分散を推定する、というモデルなのですが... 一般的にはPQL (Penalized Quasi-Likelihood) で推定するのが早いけど、 バイアスが生じる。そこでラプラス方程式を応用して近似すると、 かなり推定値が良くなる。レベル2の分散の推定ではそれが応用された例が HLMというソフトだ。 で、レベル3にラプラス近似を成功した人はいるのか?というのが質問だ。 もちろん質問するくらいなのでHLMでもレべル3の分散にはまだ応用して いない。 もちろん正統な最尤法でえっちらとやれば、よい推定値が出るのだが何しろ遅い。 PQL+ラプラスで数分のものが最尤法では2、3日かかる。 何かこれに関して知っている人はいませんかぁ?
338 名前:132人目の素数さん [04/02/08 12:03] 下のような計画(例)で薬剤の有用性を判定したいのですが。 ある疾患を患っている患者を40名集め、その患者に対して薬剤Xを投与する。 投与前および投与1週間後に下記のスコア表に基づき、重篤度を判定する。 (1.微弱 2.軽度 3.中程度 4.やや重篤 5.かなり重篤) 薬剤Xの投与が疾患に対して有効であるかどうかを検定せよ。 データ例 投与前 投与1週間後 3 2 4 2 4 3 5 3 4 1 4 5 3 1 …… …… 調べたところ、対応のあるt検定(1標本t検定)のノンパラメトリックバージョンの 検定をすればいいと分かりましたが、マン・ホイットニー検定は対応の無い検定(2標本型)にしか対応していないので、 ウィルコクソンの符号付順位和検定を使うのが妥当でしょうか?
339 名前:132人目の素数さん [04/02/08 15:41] age
340 名前:132人目の素数さん mailto:sage [04/02/10 18:13] 質問よいでしょうか。 部分空間へ射影したときの平均二条誤差を最小にする主成分分析で、 サンプルになるベクトルの要素が正の値をとる場合、 最大の固有値に対応する固有ベクトルの方向(又はその逆)に、 「必ず」平均値があると思うんですが、 あってますかね?
341 名前:132人目の素数さん mailto:sage [04/02/11 02:51] >>338 妥当だと思います。 ただし、その計画では、薬剤が有効なのか、時間経過や心理的効果によるものなのかが、見分けがつきません。 大げさな例をあげると、風邪の人に薬剤を投与して1週間たてば、薬剤を投与していなくても、症状は改善する、ということです。 疾患が慢性的なものであるという知見があれば、時間経過の影響は考えなくてよいでしょう。 時間経過や心理的効果を除きたければ、 A群 薬剤 B群 プラセボ マン・ホイットニーの U 検定 勉強中の身のため、ご参考まで。
342 名前:132人目の素数さん [04/02/11 13:01] >>341 >>338 でつ。回答していただきありがとうございまつ。 慢性的な疾患(例えば、高脂血症や皮膚疾患や心疾患など)ならば この方法で問題なさそうですね。
343 名前:340 mailto:sage [04/02/12 10:58] 質問取り下げます。 何か根本的にわかっていないような気がします。
344 名前:132人目の素数さん [04/02/12 14:35] χ二乗値が570になることってありますか? 電卓で計算しなきゃいけないレポートがあって自分で計算したら 570という数字が出てきてしまいますた…
345 名前:132人目の素数さん [04/02/12 22:39] age
346 名前:132人目の素数さん mailto:sage [04/02/13 20:06] >>344 期待値A:1, 実現値A:18, 期待値B:1, 実現値B:18, 自由度2-1=1 χ^2=(18-1)^2/1+(18-1)^2/1= (17^2)*2=578
347 名前:132人目の素数さん [04/02/13 20:08] グラフを作ったとき各プロットの有意差の有無をアルファベット を用いて表せと言われたのですが良くわかりません。 a,b,c...と書いてあれば各プロットに有意差があることがわかるのですが、 ab,bcdなどと書く意味やつけ方がわかりません。 どうか御教授下さい。 検索や文献をさがしても見つかりませんでした。
348 名前:132人目の素数さん [04/02/14 00:53] 重回帰分析について質問よろしいでしょうか。 今、ある機械である製品を製造するとします。 その時の機械の条件や環境の条件を独立変数として、いくつかXを取り出します。 製造された製品の物性を目的変数Yとして、回帰式を計算するとします。 たとえば、変動する条件(独立変数)を4つ取り出したとして、回帰式で 表すと、 Y=a+b*X1+c*X2+d*X3+e*X4+ε と表せます。この時の4つの独立変数X1〜X4のうち、目的変数Yに最も 影響を及ぼしている独立変数を評価する方法はあるのでしょうか? それぞれの独立変数の単位は異なるので、回帰係数で比較する事はできない と思うのですが…、どうすればいいのでしょうか? 「Yに最も影響している条件(変数)は○○です」というような評価は可能でしょうか。 駄文申し訳ありません、、、どなたか教えてください
349 名前:132人目の素数さん [04/02/15 01:07] あげ
350 名前:132人目の素数さん mailto:sage [04/02/15 19:18] >>348 単位の影響を取り除きたければ、データを標準化(基準化)。 標準化偏回帰係数は,ある独立変数が 1 標準偏差変動したときに,標準化された従属変数が何単位変動するかを表す。 まず、影響と寄与はちがいます。。影響はA→B、寄与はA→←B。 標準化偏回帰係数によって、予測にどの程度各変数が寄与しているか?を見ることができる。 ただし、多重共線性に注意。 あと、予測(重回帰モデル)が妥当かどうか検証。 青木先生のページを参照 ttp://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/index.html
351 名前:348 [04/02/16 20:45] >350 影響を見る場合は偏回帰係数を標準化する必要はないのですか?
352 名前:350 mailto:sage [04/02/17 03:19] >351 標準化する必要があります。 細かいところを気にしなければ、標準化偏回帰係数を見ればよいです。 ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。 私がゴチャゴチャ言ってるのは、 重回帰分析は寄与がわかっても、因果(影響)はわからない!ということ。 回帰を学ぶ上で、寄与と因果は、しっかり区別しなくてはいけません。 影響を見るのは、因果的推測と言って、最新の研究。ま、基本は重回帰だけど。
353 名前:132人目の素数さん mailto:sage [04/02/17 15:31] 統計学は全くの素人なのですが、疑問に思うことがあります。 www1.odn.ne.jp/youth-study/ このサイトで、高校生の生活と意識に関する調査というものについてです。 問7「あなたのクラスには、男子生徒と女子生徒の割合はどのくらいですか?」 という設問で、日本のデータを見ると43.9%が「ほぼ全員女子」で、 女子校のようです(男子のみは11.9%)。 そのため、 問10「あなたのクラスでは、次のことについて、男子と女子はどっちが多いですか?」 という問以下詳細15問の回答のうち、女子のデータは全て「女子が多い」となるのは、 当然のような気がします。 同じように問7のデータから、男子校(74.5%)、女子校(71.4%)から サンプリングしたと思われる韓国のデータでは、問10の中の15問は 全て無回答の比率が50〜70%になっているのは、異性がいないので 比較できないと判断したためと思えます。 この調査の「概要」を読むと、 問10の<クラスの中の男子生徒と女子生徒の行動>についての項目で、 >日本の女子生徒は「先生によく反抗する人」「校則をよく守らない人」に対して、 >「女子が多い」と肯定するのが特徴である。 とされていますが、どうも釈然としません。サンプルのかたよりからすると、 統計上、間違った解釈ではないのでしょうか。
354 名前:132人目の素数さん [04/02/17 20:54] >352 なるほど。 どの説明変数が目的変数と関わりをもっているかを見るためには、 標準化偏回帰係数で比較して標準化偏回帰係数が最も大きい説明変数が 最も目的変数と関わりを持っているということですか。 あるサイトで”要因の絞り込み”という方法を見たのですが、 この方法で”目的変数と最も関わりを持っている説明変数”を 求める事はできますか?(標準化偏回帰係数ではなく、P値を見ているようですが) ちなみにここです ttp://202.245.103.49/kenshu/Sozai/Excel/statistic/analysis25.htm
355 名前:350 mailto:sage [04/02/18 06:34] >354 変数選択の話ですね。 予測するのには、できるだけ変数が少なく相関が高い方が良いモデルとなります。 そこで、各偏回帰係数が0かどうかを検定します。 P値は、ある偏回帰係数が0である確率を表しています。 各偏回帰係数のP値を計算してみて、大きいものから削っていき、 最もよいモデルのところで止めます。 要するに、0に近い偏回帰係数を削っていくだけです。 多分、同じ結果になると思います。(0に近いところは順番が少し変わるかも。 変数選択して、最良のモデルを作ってから、標準化偏回帰係数で解釈。 コレが1番良いかと。
356 名前:132人目の素数さん [04/02/18 21:38] 2336 名無しさんにズームイン! sage諏訪 New! 04/02/18 21:27 ID:BynTAKDd うわーーーーーーーー書けるっ!!!!書けますうぅぅぅぅぅぅぅ!!!!!!!! 2337 名無しさんにズームイン! New! 04/02/18 21:27 ID:n8ilzDQ6 あ 2338 1001 New! Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。 2339 1001 New! Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。 2340 名無し募集中。。。 New! 04/02/18 21:27 ID:Ha+lJUyb >>2000 おめ おまいら!大変ですよ!この現象を統計学理論で説明して下さい! W杯アジア地区第1次予選「日本×オマーン」 PART14 live8.2ch.net/test/read.cgi/liventv/1077105141/
357 名前:132人目の素数さん [04/02/19 18:55] 発生確率1/6で、試行回数10回の、標準偏差の式を教えてくだされ。
358 名前:132人目の素数さん [04/02/19 19:12] >>357 何の標準偏差が知りたいの?
359 名前:132人目の素数さん [04/02/19 19:18] >>358 当たりがでる確率が1/6のくじを、10回くじ引きした場合の、 実際に起きた場合ではなく、理論的な標準偏差値の算出方法です。 質問のしかたが、悪いかもしれませんが・・・解るでしょうか?
360 名前:132人目の素数さん [04/02/20 00:06] 統計超初心者なので簡単な質問かも知れませんが許して下さい。 実は明日レポート提出なので・・・ 薬品Aを1000人に使ったとき、100人が副作用が出ました。 薬品Bでは1500人中、1000人が副作用がでました。 こういう場合に、統計学的に有意に薬品Aの方がよい、というにはどんな検定すればいいんでしょうか。 実際の数字はもっと確率が近いんです。 統計のソフトはエクセル統計を使ってます。 よろしくお願いします。
361 名前:132人目の素数さん mailto:sage [04/02/20 00:33] よーし、統計初心者の漏れが惑わす回答をしちゃうぞ。 有意に「良い」ということは出来ないが、 母比率の差の検定とかでしょうか。 間違ってたらすまそ。一回くらい答えられる人になりたかったのよ。
362 名前:132人目の素数さん mailto:sage [04/02/20 00:49] >353 集めた日本、アメリカ、、、のサンプルからの、 集めた日本、アメリカ、、、のサンプルの解釈としては間違ってはいないが、 そのサンプルが偏っているので、 その解釈を日本全体、アメリカ全体、、、の解釈としているところに 問題があるんではないでしょうか? 先日、TVで、 「高学歴である裁判官は、同じ高学歴の被告をひいきしている。 その証拠に、死刑になった被告のうち高学歴の者は少ししかいない。 そういう統計が出てるんです。」 とか、なんとか、言っていた人がいたが、 確かに、死刑になった被告のうち高学歴の者は少ししかいないのは正しい解釈だろう。 だが、その解釈=裁判官がひいきしている、という解釈はどうか?と。 それを調べたいならば、 高学歴の死刑になった被告/高学歴の死刑を求刑された被告 低学歴の死刑になった被告/低学歴の死刑を求刑された被告 を比較するべきだろう、と。 解釈が都合のいいように飛躍してるんですよね。 こうやって、統計の評判が落ちていくんだろうな、と思う今日この頃。
363 名前:132人目の素数さん [04/02/21 00:25] 実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね?
364 名前:132人目の素数さん [04/02/21 02:46] >>360 「t検定」でぐぐれ。
365 名前:132人目の素数さん mailto:sage [04/02/21 02:51] >361 おしい。。。では、補足を。 2群の母比率の差の検定は、片側検定を定義できるので、 有意に「良い」と言えます。
366 名前:132人目の素数さん [04/02/21 11:27] 363なんですが実際はどうなのでしょう? コンサルタントが明らかに無意味な重回帰分析をしているようにしか思えないのです。
367 名前:132人目の素数さん [04/02/21 11:41] 例えば民力データの 〜18歳 人口 18〜23歳 人口 23〜28歳 人口 29〜 人口 4つの独立変数と 従属変数:売上高 を使って年齢別の要因分析をするなんてどう考えても変ですよね?
368 名前:132人目の素数さん mailto:sage [04/02/21 12:26] >>365 そ、そっか_| ̄|○ (´-`).。oO(いつかちゃんと答えられる人になれますように・・・) >>360 をt検定でやろうとするとどうなるんですかね? t検定って平均値の差を検定するものだと思いこんでました。
369 名前:132人目の素数さん mailto:sage [04/02/22 11:36] 統計学入門 基礎統計学 東京大学教養学部統計学教室 (編集) これと同程度か少しカンタンなことについて書かれた洋書があれば教えてください。 www.amazon.co.jp/exec/obidos/ASIN/4130420658/
370 名前:132人目の素数さん [04/02/22 13:32] 367ですが私の質問はDQN過ぎますか?
371 名前:132人目の素数さん mailto:sage [04/02/22 22:12] >367 363で >実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね?と言うか無意味ですよね? 相関関係があるから不可能??意味がよくわからない 相関関係がわかるだけで、要因かどうかはわからないってことでしょうか? 367で >例えば民力データの > 〜18歳 人口 >18〜23歳 人口 >23〜28歳 人口 >29〜 人口 >4つの独立変数と >従属変数:売上高 >を使って年齢別の要因分析をするなんてどう考えても変ですよね? どう考えても?実務的な意見が欲しかったのでは?理論的な意見でもいいの? どのように考えて、どこが変なのか?を示すべきかと。 質問の意図がはっきりしないことと、 実務家じゃないので、レス控えてました。
372 名前:132人目の素数さん [04/02/25 17:11] 本当にあほな質問で泣きたくなるのですが、 標本と母集団の違いってはっきり一言で言うとなんでしょうか。 サンプルが20個あっても30個あっても標本なのでしょうか。 どなたかお答えください。
373 名前:132人目の素数さん mailto:sage [04/02/25 18:48] A,B二つの工場から消費地へ製品を輸送する場合,輸送費はAから 消費地まで1トン当り6万円,Bからは1トン当り10万円かかるという。 工場の毎月の生産量はA工場は50トン,B工場は40トンである。 2工場から2工場から消費地へ合わせて65トン送りたい。輸送費を最小にするには 各工場から何トンずつ送ればよいか。 答えは分かるけど解き方がワカラン_| ̄|○ どなたか御教授願います・・・。
374 名前:132人目の素数さん mailto:sage [04/02/25 19:36] よーしまた統計初心者の漏れが答えちゃうぞー! 今度こそはちゃんと答えられるようになってやる! >>372 ある集団があったときに、サンプルとして取り出したものが「標本」で、 そのサンプルを取り出せる可能性をもつ物全てが「母集団」かしら。 一言で言うと、「母集団から取ったサンプルが標本」。 自分で読んでて何言ってるかわからんなぁ(^^; 20個30個あったとしても、それが集団の全てで無い限りは標本です。 >>373 線形計画法で解けるはずなので解いてみます。
375 名前:132人目の素数さん mailto:sage [04/02/25 19:46] >>373 あれ?線形計画法以前の問題? その条件だとA工場に最大量わりふったほうが安い? 何か別条件無いのかしら。
376 名前:132人目の素数さん mailto:sage [04/02/25 19:53] >>375 線形計画法の問題なんですけど,これ以外他の条件無いんですよ。 おっしゃる通りAに最大量割り振った方が安いと思うんですけど, 線形計画法用いての課程が分からなくて・・・。
377 名前:132人目の素数さん mailto:sage [04/02/25 19:59] やっぱ漏れが初心者過ぎて何か考え違いしてるのかなぁ・・・ こんなんじゃだめかしら? A工場から x (トン)、B工場から y (トン)送る 輸送費を k とします。すると、 x + y = 65 ・・・(1) 6x + 10y = k ・・・(2) x =< 50 , y =<40 ・・・(3) が成り立ちます。 (1)をグラフで書くと y = -x + 65 上で [25,40]から[50,15]までになります。・・・(4) ここで(2)式は y = -3/5 x + 1/10 k ・・・(5)より、 (4)と(5)が重なる範囲内で、kが最も小さい時を選べば良いのです。 従って、(50,15)の時にkが最小となり、 「輸送費はA工場から50トン、B工場から10トン送ったときに最小となる」 が導かれます。
378 名前:132人目の素数さん mailto:sage [04/02/25 20:01] >>376 あ、やっぱりこれでいいんですか。 ってことでこれを参考にして下さいヽ(´ー`)ノようやく答えられた 座標を表す括弧が[ ]と( )でありますけどまぁ気にしないで下さい。
379 名前:132人目の素数さん [04/02/25 20:07] >>377-378 解説ありがとうございました! 似たような別問題があるのでそっちをこの方法でやってみます!
380 名前:132人目の素数さん mailto:sage [04/02/25 20:15] いえいえ、またわからなかったらどうぞヽ(´ー`)ノ って>>377 、最後の最後で間違えてるな_| ̄|○ B工場から15トンね
381 名前:132人目の素数さん mailto:sage [04/02/26 05:49] >374 おしぃ。母集団と標本について補足を。 母集団から無作為に(ランダムに)抽出したものが標本です。 あと、わかりやすいように英語。 (parent) population 母集団 sample 標本 random sampling 無作為抽出
382 名前:372 [04/02/26 07:43] 374さん、381さん、丁寧な解説ありがとうございました。 と言うことは、母集団か標本かを見分けるには、数を見るのではなく 内容を見るのですね。抽出したと書いてなければ、母集団として 判断してもいいのでしょうか。車の例などは、10個であれば標本だと わかるのですが(世界には10個以上車があるから・・・ですよね?) たとえば、バスケットボールの点数などはどうなんでしょうか。 10回バスケットボールの記録を測れば、その10回は母集団に なると考えていいのですか。よろしくお願いします。
383 名前:381 mailto:sage [04/02/27 06:25] >381 すいません、間違えました。 標本=母集団から抽出したもの 標本は母集団から無作為に抽出されなければならない、でした。 >382 まず、 母集団=知識・情報を得たいと考えている対象の全体 バスケットボールの点数の知識・情報を得たい。 バスケットボールの点数の全体は、0〜∞。 母集団は、バスケットボールの点数0〜∞。 標本は、10個。 標本から母集団を推定。 有限母集団、無限母集団の話と、 母集団と標本の関係の話が絡んでます。 上は無限母集団の場合です。次に、有限母集団の方を考えてみましょう。 1シーズンのバスケットの点数の知識・情報を得たい。 1シーズンのバスケットの点数の全体は、そのまま。 母集団は1シーズンのバスケットの点数全体 標本をいくつかとる。 標本から母集団を推定。 結論、標本からじゃなくて、目的から母集団を決めましょう。 一般的なバスケットボールの点数を調べたければ、その10回は標本。 その10回のバスケットボールの点数を調べたければ、その10回は母集団。
384 名前:372 mailto:sage [04/02/27 18:02] 381さん、詳しい解説をありがとうございます。 これですっきりしました。くだらない質問にお付き合いくださって 本当にありがとうございます。ここに来てみて良かったです。