統計学なんでもスレッド2

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 02/24 22:49 / Filesize : 314 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド2

1 名前： ◆OHr6mNLYV6 [03/11/08 19:44]: (´Д｀;三;´Д｀)
語って下さい．偉大な統計学を．．．
質問にはやさしいお兄さんが答えてくれます．

前スレ
science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【　確率論・統計学の実用の仕方　】
science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたいその1/2
science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
science.2ch.net/test/read.cgi/math/1017042903/
324 名前：１３２人目の素数さん [04/02/04 18:16]: すいませんお願いします。
区間[-1/2,1/2]を台に持つ一様分布をＸとしたときに
Xj～f(x)をすべて独立として、
その和の平均z2=(x1+x2)/2 ,z3=(x1+x2+x3)/3
のp.d.f.を求めろという問題なのですが。
325 名前：１３２人目の素数さん mailto:sage [04/02/04 18:24]: >>324
問題がおかしいだろ。
そもそも日本語になってない。
326 名前：１３２人目の素数さん mailto:sage [04/02/05 06:23]: >>314
分散既知の正規母集団の平均の信頼区間(x~-u(ε)σ/√n,x~+u(ε)σ/√n)に代入するだけ。

>>316
帰無仮説　μ=42.5、対立仮説　μ>42.5とおいて正規母集団の平均の分散既知の場合の片側検定。
x~>42.5+u(ε)σ/√nで仮説を棄却。
仮説が棄却されれば長くなったと言え、拡張計画を推進するべき、となる。

>>324
普通に変数変換なり、P((X+Y)/2<z)を求めて微分するなりして求めりゃいいが、かなりめんどくさい
場合分けが必要。
Z2=(X1+X2)/2は、f(z)=2(1-2|z|) (-1/2<=z<=1/2)かな。
Z3はかなりめんどくさい。がんばれ。
327 名前：１３２人目の素数さん [04/02/05 17:57]: 数学は全くの初心者の実家が手打ちのそば屋で働く者です。
うちでは蕎麦粉8割、小麦粉1.5割、中力粉0.5割の割合で粉を混ぜます。
このできたものが完全に混ざり合っているかを証明する方法ってありますか？

なんとなく毎日蕎麦を作っていて、ふと気になったもので。
統計とは関係ないのでしょうか？
328 名前：１３２人目の素数さん mailto:sage [04/02/05 19:00]: >>327
小麦粉と中力粉がどう違うのか説明せよ。いずれにせよ
数学はこの問題には無力。熱力学のエントロピーの
概念が近いが、それでも意味のある結論は出ないだろう。

割り粉に食紅で色をつけることでもできれば、それを混ぜて実験
できるが、粉に色をつける方法を思いつかない。水かけたらアウト
だしね。顕微鏡で見る手もあるが（小麦粉の粒子が大きいはず）
混ぜ方の良否はわからないだろう。

うん、あれ何度かきまぜたら混ぜ終わったといえるのか、よく
わかんないんだよね。昔の本職は材料を桶にいれて木の棒で
何度も何度もかきまぜたそうだ。
329 名前：１３２人目の素数さん mailto:sage [04/02/05 19:06]: >>324
問題の表記に変なところがあるが、問題自体は自明（というか、
よくあるやつ）なので、結果だけ出しておく。２変数の和の
pdfは三角分布（3角形）になる。底辺は [-1/2, 1/2] で面積
は１だから、高さはわかるよな。3変数の和はそれを少し崩した、
放物線を3個組み合わせた形になる。だんだん正規分布の形に
近づく。計算するには、分布をフーリエ変換してn乗して、
逆フーリエ変換するのだ。
330 名前：１３２人目の素数さん mailto:sage [04/02/05 23:24]: >>328
レスありがとうございます。
やっぱり統計学とは関係なかったんですね。
蕎麦ではないんだけど、昔聞いた話でなにかを混ぜた時に四等分して、
一つを更に四等分した物をサンプルにすると混ざり具合がわかると
聞いたことがあったんです。
こういうのは学術的になんて言うのか知りたかったというのもありまして。

小麦粉と中力粉の違いってのはウチでの単に呼び方で小麦粉＝強力粉
ってことです。スマソ。
ちなみにそれらの違いは粒子の大きさだけです。
331 名前：328 mailto:sage [04/02/06 00:24]: >>330
中力粉と強力粉の違いなら、そりゃ粒子の大きさじゃないぞ。
グルテン（たんぱく成分）の含有率の差だ。これ以上はスレ違い
にて省略。

４等分うんぬんは、一回の攪拌操作でどれだけの混合がなされて
いるかを定量化する試みだろう。木鉢に粉が 1kg 入っているとし
て、一回の攪拌ではそれを 100個に分割する、言い換えれば 10gの
小部分に分割する操作と仮定する。操作を n回くりかえして、結果
が粉の粒子の体積くらいまで分割されれば完全に混合されたと
いえるだろう。もし粉の 1粒を 1μgとすれば、
log(10^9)/log(10^2) = 9/2 = 4.5 で、4～5回の攪拌でまざって
しまう。けっこう早いものだね。
332 名前：１３２人目の素数さん [04/02/06 14:54]: すみません、質問いいですか？
わからない問題スレで誘導されました。
f(x)=exp[-(x-x_i)^2/2σ^2 + k*x]
というガウス型の関数の規格化をしたいんですが、手ほどきお願いします。
333 名前：１３２人目の素数さん [04/02/06 16:07]: >>332
まず、指数の部分を平方完成する。
-{(x-x_i)^2/(2σ^2)} + k*x
= -(1/(2σ^2)) { (x-x_i)^2 -(2σ^2)kx}
= -(1/(2σ^2)) { x^2 -2(x_i +kσ^2)x +(x_i)^2}
= -(1/(2σ^2)) { (x -(x_i +kσ^2))^2 -(2x_i kσ^2 + (kσ^2)^2) }
= (1/2){ 2 x_i k +(k^2)(σ^2)} -(1/(2σ^2)) (x -(x_i +kσ^2))^2
これの前半はxに関係無い項

f(x)=exp[-(x-x_i)^2/2σ^2 + k*x]
= exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-(1/(2σ^2)) (x -(x_i +kσ^2))^2)

y = x -(x_i +kσ^2)/((√2)σ)と置けば
f(x) = exp((1/2){ 2 x_i k +(k^2)(σ^2)} ) exp(-y^2)

なので、普通のガウス積分を使って正規化できる。
334 名前：332 [04/02/06 16:14]: >>333
ご丁寧な解説有難う御座います！
これで確率、期待値が計算できますぅ！
335 名前：316 [04/02/06 21:37]: >>326
遅くなりましたがどうもありがとうございます。
よろしければ次の問題もよろしくお願いします。

アメリカのある州の警察学校の女子生徒が、体育科目の男女合格率に
差があるとして雇用機会均等条例違反で訴えた。
女性は９人中６人が合格し、男性は３７人中３４人が合格した。
条例には、雇用昇進に関する各種のテストにおいて男性の合格率が
著しく高くならないように男女の合格率の許容される比を０．８と定めている。
果たしてこの科目に性差別があるといえるか。
また、合格率の許容比が１のときはどうか。
336 名前：１３２人目の素数さん [04/02/07 14:14]: 非線形混合モデルのレベル３ランダム効果の分散を、ラプラスでの近似に成功
したヤシはいるのだろうか？
337 名前：336 [04/02/08 07:16]: 反応なしか．．．ちょっと質問の出し方が唐突過ぎたか。
それではもうちょっと詳しく。

３レベル非線形混合モデル(Nonlinear Mixed Model)でロジットをリンク関数として
使っている。レベル１でのひとつの係数をランダム係数とし、レベル２で
その係数を（固定効果＋ランダム効果）とし、ランダム効果の分散を推定
する。さらにレベル２の固定効果をレベル３でまたまた（固定効果＋ランダム効果）
とし、ランダム効果の分散を推定する、というモデルなのですが．．．

一般的にはPQL (Penalized Quasi-Likelihood) で推定するのが早いけど、
バイアスが生じる。そこでラプラス方程式を応用して近似すると、
かなり推定値が良くなる。レベル2の分散の推定ではそれが応用された例が
HLMというソフトだ。

で、レベル3にラプラス近似を成功した人はいるのか？というのが質問だ。
もちろん質問するくらいなのでHLMでもレべル3の分散にはまだ応用して
いない。

もちろん正統な最尤法でえっちらとやれば、よい推定値が出るのだが何しろ遅い。
PQL+ラプラスで数分のものが最尤法では2、3日かかる。

何かこれに関して知っている人はいませんかぁ？
338 名前：１３２人目の素数さん [04/02/08 12:03]: 下のような計画(例)で薬剤の有用性を判定したいのですが。

ある疾患を患っている患者を40名集め、その患者に対して薬剤Xを投与する。
投与前および投与1週間後に下記のスコア表に基づき、重篤度を判定する。
(1.微弱 2.軽度　3.中程度 4.やや重篤 5.かなり重篤)
薬剤Xの投与が疾患に対して有効であるかどうかを検定せよ。

データ例
投与前　投与1週間後
　3　　　　　2　　　　　
　4　　　　　2
　4　　　　　3
　5　　　　　3
　4　　　　　1
　4　　　　　5
　3　　　　　1
……　　　　……

調べたところ、対応のあるt検定(1標本t検定)のノンパラメトリックバージョンの
検定をすればいいと分かりましたが、マン・ホイットニー検定は対応の無い検定(2標本型)にしか対応していないので、
ウィルコクソンの符号付順位和検定を使うのが妥当でしょうか？
339 名前：１３２人目の素数さん [04/02/08 15:41]: age
340 名前：１３２人目の素数さん mailto:sage [04/02/10 18:13]: 質問よいでしょうか。
部分空間へ射影したときの平均二条誤差を最小にする主成分分析で、
サンプルになるベクトルの要素が正の値をとる場合、
最大の固有値に対応する固有ベクトルの方向(又はその逆)に、
「必ず」平均値があると思うんですが、
あってますかね？
341 名前：１３２人目の素数さん mailto:sage [04/02/11 02:51]: >>338
妥当だと思います。
ただし、その計画では、薬剤が有効なのか、時間経過や心理的効果によるものなのかが、見分けがつきません。
大げさな例をあげると、風邪の人に薬剤を投与して１週間たてば、薬剤を投与していなくても、症状は改善する、ということです。
疾患が慢性的なものであるという知見があれば、時間経過の影響は考えなくてよいでしょう。
時間経過や心理的効果を除きたければ、
Ａ群　薬剤　Ｂ群　プラセボ　マン・ホイットニーの U 検定
勉強中の身のため、ご参考まで。
342 名前：１３２人目の素数さん [04/02/11 13:01]: >>341

>>338でつ。回答していただきありがとうございまつ。
慢性的な疾患(例えば、高脂血症や皮膚疾患や心疾患など)ならば
この方法で問題なさそうですね。
343 名前：340 mailto:sage [04/02/12 10:58]: 質問取り下げます。
何か根本的にわかっていないような気がします。
344 名前：１３２人目の素数さん [04/02/12 14:35]: χ二乗値が570になることってありますか？
電卓で計算しなきゃいけないレポートがあって自分で計算したら
570という数字が出てきてしまいますた…
345 名前：１３２人目の素数さん [04/02/12 22:39]: age
346 名前：１３２人目の素数さん mailto:sage [04/02/13 20:06]: >>344
期待値A:1, 実現値A:18, 期待値B:1, 実現値B:18, 自由度2-1=1
χ^2=(18-1)^2/1+(18-1)^2/1= (17^2)*2=578
347 名前：１３２人目の素数さん [04/02/13 20:08]: グラフを作ったとき各プロットの有意差の有無をアルファベット
を用いて表せと言われたのですが良くわかりません。
a,b,c...と書いてあれば各プロットに有意差があることがわかるのですが、
ab,bcdなどと書く意味やつけ方がわかりません。
どうか御教授下さい。
検索や文献をさがしても見つかりませんでした。
348 名前：１３２人目の素数さん [04/02/14 00:53]: 重回帰分析について質問よろしいでしょうか。

今、ある機械である製品を製造するとします。
その時の機械の条件や環境の条件を独立変数として、いくつかXを取り出します。
製造された製品の物性を目的変数Yとして、回帰式を計算するとします。
たとえば、変動する条件（独立変数）を4つ取り出したとして、回帰式で
表すと、
Y＝a＋b*X1＋c*X2＋d*X3＋e*X4＋ε
と表せます。この時の4つの独立変数X1～X4のうち、目的変数Yに最も
影響を及ぼしている独立変数を評価する方法はあるのでしょうか？
それぞれの独立変数の単位は異なるので、回帰係数で比較する事はできない
と思うのですが…、どうすればいいのでしょうか？
「Yに最も影響している条件（変数）は○○です」というような評価は可能でしょうか。

駄文申し訳ありません、、、どなたか教えてください
349 名前：１３２人目の素数さん [04/02/15 01:07]: あげ
350 名前：１３２人目の素数さん mailto:sage [04/02/15 19:18]: >>348
単位の影響を取り除きたければ、データを標準化（基準化）。
標準化偏回帰係数は，ある独立変数が 1 標準偏差変動したときに，標準化された従属変数が何単位変動するかを表す。

まず、影響と寄与はちがいます。。影響はＡ→Ｂ、寄与はＡ→←Ｂ。
標準化偏回帰係数によって、予測にどの程度各変数が寄与しているか？を見ることができる。
ただし、多重共線性に注意。
あと、予測（重回帰モデル）が妥当かどうか検証。

青木先生のページを参照
ttp://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/index.html
351 名前：348 [04/02/16 20:45]: >350
影響を見る場合は偏回帰係数を標準化する必要はないのですか？
352 名前：350 mailto:sage [04/02/17 03:19]: >351
標準化する必要があります。
細かいところを気にしなければ、標準化偏回帰係数を見ればよいです。
ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。

私がゴチャゴチャ言ってるのは、
重回帰分析は寄与がわかっても、因果（影響）はわからない！ということ。
回帰を学ぶ上で、寄与と因果は、しっかり区別しなくてはいけません。
影響を見るのは、因果的推測と言って、最新の研究。ま、基本は重回帰だけど。
353 名前：１３２人目の素数さん mailto:sage [04/02/17 15:31]: 統計学は全くの素人なのですが、疑問に思うことがあります。

www1.odn.ne.jp/youth-study/
このサイトで、高校生の生活と意識に関する調査というものについてです。

問7「あなたのクラスには、男子生徒と女子生徒の割合はどのくらいですか？」
という設問で、日本のデータを見ると43.9％が「ほぼ全員女子」で、
女子校のようです（男子のみは11.9％）。

そのため、
問10「あなたのクラスでは、次のことについて、男子と女子はどっちが多いですか？」
という問以下詳細15問の回答のうち、女子のデータは全て「女子が多い」となるのは、
当然のような気がします。

同じように問７のデータから、男子校（74.5％）、女子校（71.4％）から
サンプリングしたと思われる韓国のデータでは、問10の中の15問は
全て無回答の比率が50～70％になっているのは、異性がいないので
比較できないと判断したためと思えます。

この調査の「概要」を読むと、
問10の＜クラスの中の男子生徒と女子生徒の行動＞についての項目で、
>日本の女子生徒は「先生によく反抗する人」「校則をよく守らない人」に対して、
>「女子が多い」と肯定するのが特徴である。
とされていますが、どうも釈然としません。サンプルのかたよりからすると、
統計上、間違った解釈ではないのでしょうか。
354 名前：１３２人目の素数さん [04/02/17 20:54]: >352
なるほど。
どの説明変数が目的変数と関わりをもっているかを見るためには、
標準化偏回帰係数で比較して標準化偏回帰係数が最も大きい説明変数が
最も目的変数と関わりを持っているということですか。

あるサイトで”要因の絞り込み”という方法を見たのですが、
この方法で”目的変数と最も関わりを持っている説明変数”を
求める事はできますか？（標準化偏回帰係数ではなく、P値を見ているようですが）

ちなみにここです
ttp://202.245.103.49/kenshu/Sozai/Excel/statistic/analysis25.htm
355 名前：350 mailto:sage [04/02/18 06:34]: >354
変数選択の話ですね。
予測するのには、できるだけ変数が少なく相関が高い方が良いモデルとなります。
そこで、各偏回帰係数が０かどうかを検定します。
Ｐ値は、ある偏回帰係数が０である確率を表しています。
各偏回帰係数のＰ値を計算してみて、大きいものから削っていき、
最もよいモデルのところで止めます。

要するに、０に近い偏回帰係数を削っていくだけです。
多分、同じ結果になると思います。（０に近いところは順番が少し変わるかも。
変数選択して、最良のモデルを作ってから、標準化偏回帰係数で解釈。
コレが１番良いかと。
356 名前：１３２人目の素数さん [04/02/18 21:38]: 2336 名無しさんにズームイン！ sage諏訪 New! 04/02/18 21:27 ID:BynTAKDd
うわーーーーーーーー書けるっ！！！！書けますうぅぅぅぅぅぅぅ！！！！！！！！

2337 名無しさんにズームイン！ New! 04/02/18 21:27 ID:n8ilzDQ6
あ

2338 １００１ New! Over 1000 Thread
このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

2339 １００１ New! Over 1000 Thread
このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

2340 名無し募集中。。。 New! 04/02/18 21:27 ID:Ha+lJUyb
>>2000
おめ

おまいら！大変ですよ！この現象を統計学理論で説明して下さい！
W杯アジア地区第1次予選「日本×オマーン」 PART14
live8.2ch.net/test/read.cgi/liventv/1077105141/
357 名前：１３２人目の素数さん [04/02/19 18:55]: 発生確率１／６で、試行回数１０回の、標準偏差の式を教えてくだされ。
358 名前：１３２人目の素数さん [04/02/19 19:12]: >>357
何の標準偏差が知りたいの？
359 名前：１３２人目の素数さん [04/02/19 19:18]: >>358
当たりがでる確率が１／６のくじを、１０回くじ引きした場合の、
実際に起きた場合ではなく、理論的な標準偏差値の算出方法です。
質問のしかたが、悪いかもしれませんが・・・解るでしょうか？
360 名前：１３２人目の素数さん [04/02/20 00:06]: 統計超初心者なので簡単な質問かも知れませんが許して下さい。
実は明日レポート提出なので･･･

薬品Aを1000人に使ったとき、100人が副作用が出ました。
薬品Bでは1500人中、1000人が副作用がでました。
こういう場合に、統計学的に有意に薬品Aの方がよい、というにはどんな検定すればいいんでしょうか。
実際の数字はもっと確率が近いんです。
統計のソフトはエクセル統計を使ってます。
よろしくお願いします。
361 名前：１３２人目の素数さん mailto:sage [04/02/20 00:33]: よーし、統計初心者の漏れが惑わす回答をしちゃうぞ。

有意に「良い」ということは出来ないが、
母比率の差の検定とかでしょうか。

間違ってたらすまそ。一回くらい答えられる人になりたかったのよ。
362 名前：１３２人目の素数さん mailto:sage [04/02/20 00:49]: >353
集めた日本、アメリカ、、、のサンプルからの、
集めた日本、アメリカ、、、のサンプルの解釈としては間違ってはいないが、
そのサンプルが偏っているので、
その解釈を日本全体、アメリカ全体、、、の解釈としているところに
問題があるんではないでしょうか？

先日、ＴＶで、
「高学歴である裁判官は、同じ高学歴の被告をひいきしている。
その証拠に、死刑になった被告のうち高学歴の者は少ししかいない。
そういう統計が出てるんです。」
とか、なんとか、言っていた人がいたが、
確かに、死刑になった被告のうち高学歴の者は少ししかいないのは正しい解釈だろう。
だが、その解釈＝裁判官がひいきしている、という解釈はどうか？と。
それを調べたいならば、
高学歴の死刑になった被告／高学歴の死刑を求刑された被告
低学歴の死刑になった被告／低学歴の死刑を求刑された被告
を比較するべきだろう、と。
解釈が都合のいいように飛躍してるんですよね。
こうやって、統計の評判が落ちていくんだろうな、と思う今日この頃。
363 名前：１３２人目の素数さん [04/02/21 00:25]: 実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね？と言うか無意味ですよね？
364 名前：１３２人目の素数さん [04/02/21 02:46]: >>360
「t検定」でぐぐれ。
365 名前：１３２人目の素数さん mailto:sage [04/02/21 02:51]: >361
おしい。。。では、補足を。
２群の母比率の差の検定は、片側検定を定義できるので、
有意に「良い」と言えます。
366 名前：１３２人目の素数さん [04/02/21 11:27]: 363なんですが実際はどうなのでしょう？
コンサルタントが明らかに無意味な重回帰分析をしているようにしか思えないのです。
367 名前：１３２人目の素数さん [04/02/21 11:41]: 例えば民力データの

　　～１８歳　人口
１８～２３歳　人口
２３～２８歳　人口
２９～　　　　人口

４つの独立変数と

従属変数：売上高

を使って年齢別の要因分析をするなんてどう考えても変ですよね？
368 名前：１３２人目の素数さん mailto:sage [04/02/21 12:26]: >>365
そ、そっか＿|￣|○
(´-`).｡oO(いつかちゃんと答えられる人になれますように・・・)

>>360をt検定でやろうとするとどうなるんですかね？
t検定って平均値の差を検定するものだと思いこんでました。
369 名前：１３２人目の素数さん mailto:sage [04/02/22 11:36]: 統計学入門基礎統計学
東京大学教養学部統計学教室 (編集)

これと同程度か少しカンタンなことについて書かれた洋書があれば教えてください。
www.amazon.co.jp/exec/obidos/ASIN/4130420658/
370 名前：１３２人目の素数さん [04/02/22 13:32]: 367ですが私の質問はDQN過ぎますか？
371 名前：１３２人目の素数さん mailto:sage [04/02/22 22:12]: >367
363で
>実務上、重回帰分析で要因分析なんて相関関係があるから不可能ですよね？と言うか無意味ですよね？
相関関係があるから不可能？？意味がよくわからない
相関関係がわかるだけで、要因かどうかはわからないってことでしょうか？
367で
>例えば民力データの
>　　～１８歳　人口
>１８～２３歳　人口
>２３～２８歳　人口
>２９～　　　　人口
>４つの独立変数と
>従属変数：売上高
>を使って年齢別の要因分析をするなんてどう考えても変ですよね？
どう考えても？実務的な意見が欲しかったのでは？理論的な意見でもいいの？
どのように考えて、どこが変なのか？を示すべきかと。

質問の意図がはっきりしないことと、
実務家じゃないので、レス控えてました。
372 名前：１３２人目の素数さん [04/02/25 17:11]: 本当にあほな質問で泣きたくなるのですが、
標本と母集団の違いってはっきり一言で言うとなんでしょうか。
サンプルが２０個あっても３０個あっても標本なのでしょうか。
どなたかお答えください。
373 名前：１３２人目の素数さん mailto:sage [04/02/25 18:48]: A,B二つの工場から消費地へ製品を輸送する場合，輸送費はAから
消費地まで1トン当り6万円，Bからは1トン当り10万円かかるという。
工場の毎月の生産量はA工場は50トン，B工場は40トンである。
2工場から2工場から消費地へ合わせて65トン送りたい。輸送費を最小にするには
各工場から何トンずつ送ればよいか。

答えは分かるけど解き方がワカラン＿|￣|○
どなたか御教授願います･･･。
374 名前：１３２人目の素数さん mailto:sage [04/02/25 19:36]: よーしまた統計初心者の漏れが答えちゃうぞー！
今度こそはちゃんと答えられるようになってやる！

>>372
ある集団があったときに、サンプルとして取り出したものが「標本」で、
そのサンプルを取り出せる可能性をもつ物全てが「母集団」かしら。
一言で言うと、「母集団から取ったサンプルが標本」。

自分で読んでて何言ってるかわからんなぁ(^^;
20個30個あったとしても、それが集団の全てで無い限りは標本です。

>>373
線形計画法で解けるはずなので解いてみます。
375 名前：１３２人目の素数さん mailto:sage [04/02/25 19:46]: >>373
あれ？線形計画法以前の問題？
その条件だとA工場に最大量わりふったほうが安い？
何か別条件無いのかしら。
376 名前：１３２人目の素数さん mailto:sage [04/02/25 19:53]: >>375
線形計画法の問題なんですけど，これ以外他の条件無いんですよ。
おっしゃる通りAに最大量割り振った方が安いと思うんですけど，
線形計画法用いての課程が分からなくて･･･。
377 名前：１３２人目の素数さん mailto:sage [04/02/25 19:59]: やっぱ漏れが初心者過ぎて何か考え違いしてるのかなぁ・・・
こんなんじゃだめかしら？

　A工場から x （トン）、B工場から y （トン）送る
　輸送費を k
とします。すると、
　x + y = 65 ・・・(1)
　6x + 10y = k ・・・(2)
　x =< 50 , y =<40 ・・・(3)
が成り立ちます。
(1)をグラフで書くと y = -x + 65 上で [25,40]から[50,15]までになります。・・・(4)
ここで(2)式は y = -3/5 x + 1/10 k ・・・(5)より、
(4)と(5)が重なる範囲内で、kが最も小さい時を選べば良いのです。
従って、(50,15)の時にkが最小となり、
「輸送費はA工場から50トン、B工場から10トン送ったときに最小となる」
が導かれます。
378 名前：１３２人目の素数さん mailto:sage [04/02/25 20:01]: >>376
あ、やっぱりこれでいいんですか。
ってことでこれを参考にして下さいヽ(´ー｀)ﾉようやく答えられた

座標を表す括弧が[ ]と( )でありますけどまぁ気にしないで下さい。
379 名前：１３２人目の素数さん [04/02/25 20:07]: >>377-378
解説ありがとうございました！
似たような別問題があるのでそっちをこの方法でやってみます！
380 名前：１３２人目の素数さん mailto:sage [04/02/25 20:15]: いえいえ、またわからなかったらどうぞヽ(´ー｀)ﾉ

って>>377、最後の最後で間違えてるな＿|￣|○　B工場から15トンね
381 名前：１３２人目の素数さん mailto:sage [04/02/26 05:49]: >374
おしぃ。母集団と標本について補足を。
母集団から無作為に（ランダムに）抽出したものが標本です。
あと、わかりやすいように英語。
(parent) population 母集団
sample 標本
random sampling 無作為抽出
382 名前：372 [04/02/26 07:43]: 374さん、381さん、丁寧な解説ありがとうございました。

と言うことは、母集団か標本かを見分けるには、数を見るのではなく
内容を見るのですね。抽出したと書いてなければ、母集団として
判断してもいいのでしょうか。車の例などは、１０個であれば標本だと
わかるのですが（世界には１０個以上車があるから・・・ですよね？）
たとえば、バスケットボールの点数などはどうなんでしょうか。
１０回バスケットボールの記録を測れば、その１０回は母集団に
なると考えていいのですか。よろしくお願いします。
383 名前：381 mailto:sage [04/02/27 06:25]: >381
すいません、間違えました。
標本＝母集団から抽出したもの
標本は母集団から無作為に抽出されなければならない、でした。
>382
まず、
母集団＝知識・情報を得たいと考えている対象の全体

バスケットボールの点数の知識・情報を得たい。
バスケットボールの点数の全体は、０～∞。
母集団は、バスケットボールの点数０～∞。
標本は、１０個。
標本から母集団を推定。

有限母集団、無限母集団の話と、
母集団と標本の関係の話が絡んでます。
上は無限母集団の場合です。次に、有限母集団の方を考えてみましょう。

１シーズンのバスケットの点数の知識・情報を得たい。
１シーズンのバスケットの点数の全体は、そのまま。
母集団は１シーズンのバスケットの点数全体
標本をいくつかとる。
標本から母集団を推定。

結論、標本からじゃなくて、目的から母集団を決めましょう。
一般的なバスケットボールの点数を調べたければ、その１０回は標本。
その１０回のバスケットボールの点数を調べたければ、その１０回は母集団。
384 名前：372 mailto:sage [04/02/27 18:02]: 381さん、詳しい解説をありがとうございます。
これですっきりしました。くだらない質問にお付き合いくださって
本当にありがとうございます。ここに来てみて良かったです。
385 名前：自由度n-1 [04/02/28 11:00]: 初歩的な質問、且つ以前もこの手の話はでてきていたと思いますが、
自由度n-1の定義について、教えていただきたいと思います。
「n-1個の偏差を与えると残り1個は自動的に決まる」ようなことが
参考書に書かれてありますが、どうもピンと来ません。
具体的にはどういうことなのか、わかる方がおりましたら、
ご説明いただきたく思います。
宜しくお願いします。
386 名前：１３２人目の素数さん mailto:sage [04/02/28 12:54]: よーし今度こそ。

例えばn個のバラバラな数字(X1～Xn)があったとすると、
それらから平均値mが決定されますね。

さて、逆に、平均値mを固定したまま(X1～X(n-1))の数字を
自由に動かす、つまりn-1個の偏差を与えたとしても、
平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。

なぜならn個の数字の合計値は必ずm×nになっているからです。
合計値がm×nで、しかもn-1個の数が全て分かっていれば最後の一個は引き算で出せますよね。

やっぱおいら日本語下手だな(´･ω･`)統計以前の問題だ
387 名前：自由度n-1 [04/02/28 18:59]: >>386さん、ありがとうございます。
＞平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。
だいたいイメージはつかめました。
それでは、なぜ平方和などをn-1で割る必要があるのでしょうか。
nではなぜだめなのでしょうか。
宜しくお願い致します。
388 名前：１３２人目の素数さん mailto:sage [04/02/29 01:06]: >>387
どういたしまして。つたない日本語ですいません。

さて、今度は不偏分散についての質問ですね。
これに関しては、以前学校でレポートの課題として出されて、
おいらもだいぶ頑張って（ネットからパクリながら）解説を書きました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
[4 分散と不偏分散]のところと[6 余談（理由）]が役に立つかと。
恥ずかしいので今日の夕方くらいまでに消してしまう予定です。
あと、統計の先輩方、間違ってたらご指摘よろしくお願いいたします。
389 名前：１３２人目の素数さん [04/02/29 08:37]: >388
ほとんど完璧ですな．では，ちょいちょい修正を．
おかしいところは，
1.母平均μの説明が入っていない．
2.母分散σ^2は，ひとつの決まった値なので小文字だが，
標本分散と不偏標本分散は，確率変数なので，大文字．
3.母分散は値なので不偏母分散というものはない．不偏＝不偏推定量．
多分，
母平均，母分散は値．標本平均，標本分散，不偏標本分散は確率変数．
がごちゃごちゃになっていると思います．
母平均=E[標本平均]，母分散=E[不偏標本分散]です．

母分散が未知だから，標本から母分散を求めたい．
平均が母分散になる，できるだけ分散の小さい推定量を見つけたい
証明したいのは，
E[不偏標本分散]=E[n/n-1 標本分散]=母分散
　　前の=は不偏標本分散と標本分散の定義式を見ればすぐわかる．
390 名前：１３２人目の素数さん [04/02/29 08:39]: （続）
手直しすると，（注意．X~は標本平均のつもりです．
余談の最初に，
「母平均μ，母分散σ^2の母集団から，無作為にX1,X2,...,Xnを抽出すると，
X1,X2,...,Xnは，平均μ，分散σ^2の独立な確率変数となる．
よって，E[Xi]=μ,V[Xi]=E[(Xi-μ)^2]=σ^2 (i=1,2,...,n)」
を入れて，

E[S^2]=.............=1/n Σ(E[(Xi-μ)^2]) -E[(X~-μ)^2]
=1/n ΣV[Xi]　-V[X~]
ここで
V[X]=σ^2
V[X~]=....=σ^2/n
よって
E[S^2]=...=(n-1)/n σ^2
よって，
母分散＝n/(n-1) E[標本分散]
また，
E[不偏標本分散]=E[n/n-1標本分散]=母分散

ということは，不偏標本分散の平均は母分散になる．
よって，不偏標本分散は母分散の不偏推定量
391 名前：自由度n-1 [04/02/29 09:37]: >>388,389さん、あるがとうございます。
大分頭の中が整理されてきました。
つまり、言葉で表すと、
偏差平方和をnで割ると、かたよりをもってしまうため、
標本分散が母分散の不偏推定値であるためには、n-1で
割る必要があるということでしょうか。
ただの分散と不偏分散が頭の中でごっちゃになっていたようです。
392 名前：自由度n-1 [04/02/29 09:46]: >>391訂正
分散＝標本分散でしたね。
そうしますと、不偏標本分散が母分散の不偏推定量であるためには
n-1で割る必要がある、となるのですね。
失礼いたしました。
393 名前：１３２人目の素数さん [04/02/29 18:40]: >>352
遅レスだけど、

>ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。

注意しましょうと言うよりは、実務上、説明変数が３個以上あるとマルチ湖は避けられない。
標準化偏回帰係数を見ても意味がないのがほとんど。
394 名前：１３２人目の素数さん [04/02/29 19:13]: 重回帰分析で要因分析は無理ってことか・・・・・
395 名前：１３２人目の素数さん mailto:sage [04/02/29 23:51]: >352
相関の高い説明変数を削って、変数選択しててからでも、意味ないのでしょうか？
各説明変数の相関が低ければ、標準化偏回帰係数の意味があると思うのですが。
でも、削った説明変数の解釈に困るか。。。
共分散構造解析とかするんでしょうか？
396 名前：395 mailto:sage [04/02/29 23:52]: >352じゃなくて>393です。
397 名前：１３２人目の素数さん mailto:sage [04/03/01 01:32]: >>389
ご指摘ありがとうございます。

＞母平均，母分散は値．標本平均，標本分散，不偏標本分散は確率変数．
＞がごちゃごちゃになっていると思います．

まさにその通りでした・・・
いやはや、統計初心者を脱却するにはまだまだ時間がかかりそうです。

>>391=392
そういうことだと思います。

ではPDFは消してしまいますね。
398 名前：１３２人目の素数さん mailto:sage [04/03/02 00:08]: 相関の高い説明変数をいくら削っても、残った変数の相関係数はゼロじゃないでしょ？
それが２，３個だったらまだいいけど、それ以上になったら標準化偏回帰係数を見ても無駄。

事前に主成分分析をかましたりするんだけど複雑になりすぎる。
399 名前：１３２人目の素数さん mailto:sage [04/03/02 03:18]: なるほど。
主成分分析をかませば、相関０の説明変数を作れて、
それから、重回帰にかけて、
第１主成分、第２主成分、…の偏回帰係数を比較、
最も寄与の大きい説明変数はどれか？と言われると、困りますね。

だいたい、Ｘ１とＸ２が相関があれば、
Ｘ１の寄与が大きくなればＸ２の寄与も大きくなるから、
Ｘ１とＸ２の寄与が大きい、つまり、
説明変数の合成変数で出てくるのは、当然か。。。
400 名前：１３２人目の素数さん mailto:sage [04/03/02 03:30]: >348
今さらながらに思うと、
標準化した目的変数と各説明変数を単回帰にかけて相関係数を比較し、
最も相関の高い説明変数は、コレです。
と、言っても良かったのかも知れない。。。
２番目３番目と言われると困るが。。。どうなんでしょう？
401 名前：１３２人目の素数さん [04/03/02 20:59]: ただの興味本位なんだけど、学生？実務家？
402 名前：399と400 mailto:sage [04/03/02 22:07]: 学生です。
403 名前：１３２人目の素数さん [04/03/03 23:54]: 無作為標本についてお聞きしたいことがあります。

ある母集団のある薬の服用について調べたいときに、
その母集団の人々のリストを全て持っているとします。
当然ながら、どの人が服用していて、
どの人が服用してないかはわかりません。
その母集団のリストから無作為抽出にて標本を定めて、
その標本の方々に対して面接にて調査を行ったとします。
その際に、服用していないという方は、調査をやめにして、
服用しているという方のみに調査をして、調査結果をまとめたという、
この結果っていうのは、無作為標本に基づいた結果と言えるのでしょうか？

服用していない方には調査をやめにした、というところがひっかかって、
でも、その薬の飲む頻度とか服用期間とかを知りたい場合は、
服用していない人々に聞いても仕方がないので、っていう考え方もあるし、
果たしてこれって無作為標本に基づくのだろうかっていう疑問が出てきたのです。

説明をつけて教えて下さると幸いです。
よろしくお願い致します。
404 名前：１３２人目の素数さん mailto:sage [04/03/04 08:13]: 自信持って答えられるほどじゃないので、参考程度に。
まず、
母集団＝知識・情報を得たいと考えている対象の全体
です。
もちろん、母集団が、”そのリスト上の人々”で、
途中で調査をやめるというのは、無作為標本ではありません。
しかし、母集団＝”薬を服用しているそのリスト上の人々”と設定すると、
母集団からの無作為標本になると思います。
405 名前：１３２人目の素数さん [04/03/05 14:00]: 多次元尺度法でお手本になるようなプログラムソース
どこかにないかなと探してます。
C/C++だと一番読みやすいんですけど、知ってる方
いましたら、よろしくご教示ください。よろすく
406 名前：１３２人目の素数さん [04/03/09 01:44]: g
407 名前：１３２人目の素数さん mailto:sage [04/03/09 01:45]: 128
408 名前：１３２人目の素数さん [04/03/09 21:09]: 大変抽象的な質問で申し訳ありません。以下の質問に答えて頂ければ
幸いです。

ある検査機の不良品感知センサーが正常に作動しているかどうかを
確認するための実験を行いたいと考えております。実験の内容としては、
既知の不良品を良品に混ぜて、それを検査機に流し、既知の結果が得られる
かどうか、というものです。センサーが正常（異常）である、と言えるためには、
どのような実験系を組めばよろしいかと思いますでしょうか？

当方、統計の知識に乏しく、質問も的外れの気もしますが、
よろしくお願い致します。
409 名前：１３２人目の素数さん [04/03/10 13:23]: 区間推定の式に関する質問です。ｘ系列とｙ系列があって(x,y)のサンプル
とって、M次の多項式回帰したとすますね。つまり回帰式が
y=a0+a1*x+a2*x^2+.....+aM*x^M
でこの式から、あるxに対するyを推定するとします。
これ区間推定で y+-δ のように求めたいのですが、
δ=t_α/2*Se　ですよね。
で、それはいいのですが、Se（予測誤差の分散ていうの？）
どうやってもとめるのですかね。
Se=(Σ(y_hati_yi)^2/(N-2)*(1+1/n+(x-x_mean)^2/Σ(xi-x_mean))^2))^0.5
ってのあったんですが、これって回帰式がy=a+bxとかの時だけ
の気がするのですが、、、、何言ってるか分かる賢い人いたら
多項式の場合のＳｅの式教えてください。
410 名前：１３２人目の素数さん [04/03/10 13:57]: ↑ y_hati_yi ---> y_hat(回帰式からのｙ）- yi（実際の値）
411 名前：１３２人目の素数さん mailto:sage [04/03/10 14:49]: >>408
それって全数検査なの、それとも抜き取り？
412 名前：１３２人目の素数さん [04/03/10 15:19]: 412
413 名前：408 [04/03/10 21:03]: >>411さん、
全数検査で考えております。
要は的中率を求めるもので、センサーの精度を見たい訳です。
宜しくお願い致します。
414 名前：１３２人目の素数さん mailto:sage [04/03/18 01:13]: すいません、数学嫌いなもんで、ちょっと検討がつかないので質問します。
サンプル集団が二つあるとして、その分散の違いを見たいのです。
単純に不偏標準偏差をもとめて比較する以外に方法はありますか？
サンプルのデータのエラーを考慮して比較するぐらいしか思いつきません（涙）
415 名前：１３２人目の素数さん [04/03/22 15:58]: 浮上
416 名前：オラウータン [04/03/22 15:58]: ある集団の平均とその部分である集団の平均が違うとき、それが偶然では
なく違うってのは、どう計算したら良いのでしょうか？
417 名前：１３２人目の素数さん mailto:sage [04/03/22 21:42]: 両方とも正規分布に従うと仮定し、両方の平均が
同じである場合に、実際にそれだけのずれが出来る
確率を求めて、余りにも小さかったら（1%以下とか）
恐らく何か理由があって平均が違うのだろう、と
言うことになる。帰無仮説棄却。

あとは灯台出版会の本で勉強すれ。
418 名前：１３２人目の素数さん mailto:sage [04/03/23 00:57]: >>414
何がしたいのかそれだけではサッパリわからんが、
等分散性の検定をすればいいんじゃない？
そういう意味じゃないのか？
419 名前：１３２人目の素数さん [04/03/23 01:17]: >>408
2週間前だからもう調査したのかもしれないけど、
測定器の精度を調べるのにはMSAって方法が一般的となっている。
ISO9000準拠。

(R&R/TV)*100 (%)
420 名前：１３２人目の素数さん [04/03/24 01:31]: サイコロの目の出方がちゃんとしてるかどうか調べるには
どうやって調べればいいのでしょうか？
たとえば
1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6
って感じで目が出たとすると、
各目の出る確率は1/6で正しいのですが、
目の出方が普通じゃないですよね？順番に出てる。もっとランダムに出るべきなのに。
こういうのをおかしいって判定することはできるのでしょうか？
421 名前：１３２人目の素数さん mailto:sage [04/03/24 01:45]: >>420
「母比率の検定」でぐぐる
422 名前：１３２人目の素数さん mailto:sage [04/03/24 02:41]: >>421
母比率の検定では>>420のデータは異常なし？
423 名前：１３２人目の素数さん mailto:sage [04/03/24 02:55]: 母比率の検定では無理な気がするが…

普通にプロットして考えるといいのでは？
c管理図の要領。
「周期的に同じ傾向が現れる」というのは、
管理図では異常の可能性ありとみなす。

他には、
14連続交互増減、平均値以下（以上）が4連続以上出現、
連続6点増加（減少）、±１σ領域に点が集中（サイコロなら３，４）
このあたりは実際にどれほど起こらないか、
自分で確率を計算すればわかると思う。
424 名前：421 mailto:sage [04/03/24 02:57]: ごめん>>420最初の２行と最後の１行だけしか読んでなかった

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef