[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 02/24 22:49 / Filesize : 314 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド2



1 名前: ◆OHr6mNLYV6 [03/11/08 19:44]
(´Д`;三;´Д`)
語って下さい.偉大な統計学を...
質問にはやさしいお兄さんが答えてくれます.

前スレ
science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【 確率論・統計学の実用の仕方 】
science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたい その1/2
science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
science.2ch.net/test/read.cgi/math/1017042903/

375 名前:132人目の素数さん mailto:sage [04/02/25 19:46]
>>373
あれ?線形計画法以前の問題?
その条件だとA工場に最大量わりふったほうが安い?
何か別条件無いのかしら。

376 名前:132人目の素数さん mailto:sage [04/02/25 19:53]
>>375
線形計画法の問題なんですけど,これ以外他の条件無いんですよ。
おっしゃる通りAに最大量割り振った方が安いと思うんですけど,
線形計画法用いての課程が分からなくて・・・。


377 名前:132人目の素数さん mailto:sage [04/02/25 19:59]
やっぱ漏れが初心者過ぎて何か考え違いしてるのかなぁ・・・
こんなんじゃだめかしら?

 A工場から x (トン)、B工場から y (トン)送る
 輸送費を k
とします。すると、
 x + y = 65 ・・・(1)
 6x + 10y = k ・・・(2)
 x =< 50 , y =<40 ・・・(3)
が成り立ちます。
(1)をグラフで書くと y = -x + 65 上で [25,40]から[50,15]までになります。・・・(4)
ここで(2)式は y = -3/5 x + 1/10 k ・・・(5)より、
(4)と(5)が重なる範囲内で、kが最も小さい時を選べば良いのです。
従って、(50,15)の時にkが最小となり、
「輸送費はA工場から50トン、B工場から10トン送ったときに最小となる」
が導かれます。

378 名前:132人目の素数さん mailto:sage [04/02/25 20:01]
>>376
あ、やっぱりこれでいいんですか。
ってことでこれを参考にして下さいヽ(´ー`)ノようやく答えられた

座標を表す括弧が[ ]と( )でありますけどまぁ気にしないで下さい。

379 名前:132人目の素数さん [04/02/25 20:07]
>>377-378
解説ありがとうございました!
似たような別問題があるのでそっちをこの方法でやってみます!



380 名前:132人目の素数さん mailto:sage [04/02/25 20:15]
いえいえ、またわからなかったらどうぞヽ(´ー`)ノ

って>>377、最後の最後で間違えてるな_| ̄|○ B工場から15トンね

381 名前:132人目の素数さん mailto:sage [04/02/26 05:49]
>374
おしぃ。母集団と標本について補足を。
母集団から無作為に(ランダムに)抽出したものが標本です。
あと、わかりやすいように英語。
(parent) population 母集団
sample 標本
random sampling 無作為抽出

382 名前:372 [04/02/26 07:43]
374さん、381さん、丁寧な解説ありがとうございました。

と言うことは、母集団か標本かを見分けるには、数を見るのではなく
内容を見るのですね。抽出したと書いてなければ、母集団として
判断してもいいのでしょうか。車の例などは、10個であれば標本だと
わかるのですが(世界には10個以上車があるから・・・ですよね?)
たとえば、バスケットボールの点数などはどうなんでしょうか。
10回バスケットボールの記録を測れば、その10回は母集団に
なると考えていいのですか。よろしくお願いします。

383 名前:381 mailto:sage [04/02/27 06:25]
>381
すいません、間違えました。
標本=母集団から抽出したもの
標本は母集団から無作為に抽出されなければならない、でした。
>382
まず、
母集団=知識・情報を得たいと考えている対象の全体

バスケットボールの点数の知識・情報を得たい。
バスケットボールの点数の全体は、0〜∞。
母集団は、バスケットボールの点数0〜∞。
標本は、10個。
標本から母集団を推定。

有限母集団、無限母集団の話と、
母集団と標本の関係の話が絡んでます。
上は無限母集団の場合です。次に、有限母集団の方を考えてみましょう。

1シーズンのバスケットの点数の知識・情報を得たい。
1シーズンのバスケットの点数の全体は、そのまま。
母集団は1シーズンのバスケットの点数全体
標本をいくつかとる。
標本から母集団を推定。

結論、標本からじゃなくて、目的から母集団を決めましょう。
一般的なバスケットボールの点数を調べたければ、その10回は標本。
その10回のバスケットボールの点数を調べたければ、その10回は母集団。



384 名前:372 mailto:sage [04/02/27 18:02]
381さん、詳しい解説をありがとうございます。
これですっきりしました。くだらない質問にお付き合いくださって
本当にありがとうございます。ここに来てみて良かったです。

385 名前:自由度n-1 [04/02/28 11:00]
初歩的な質問、且つ以前もこの手の話はでてきていたと思いますが、
自由度n-1の定義について、教えていただきたいと思います。
「n-1個の偏差を与えると残り1個は自動的に決まる」ようなことが
参考書に書かれてありますが、どうもピンと来ません。
具体的にはどういうことなのか、わかる方がおりましたら、
ご説明いただきたく思います。
宜しくお願いします。


386 名前:132人目の素数さん mailto:sage [04/02/28 12:54]
よーし今度こそ。

例えばn個のバラバラな数字(X1〜Xn)があったとすると、
それらから平均値mが決定されますね。

さて、逆に、平均値mを固定したまま(X1〜X(n-1))の数字を
自由に動かす、つまりn-1個の偏差を与えたとしても、
平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。

なぜならn個の数字の合計値は必ずm×nになっているからです。
合計値がm×nで、しかもn-1個の数が全て分かっていれば最後の一個は引き算で出せますよね。

やっぱおいら日本語下手だな(´・ω・`)統計以前の問題だ

387 名前:自由度n-1 [04/02/28 18:59]
>>386さん、ありがとうございます。
>平均値mは固定されたままですから、最後の一個は逆算から自動的に決まります。
だいたいイメージはつかめました。
それでは、なぜ平方和などをn-1で割る必要があるのでしょうか。
nではなぜだめなのでしょうか。
宜しくお願い致します。




388 名前:132人目の素数さん mailto:sage [04/02/29 01:06]
>>387
どういたしまして。つたない日本語ですいません。

さて、今度は不偏分散についての質問ですね。
これに関しては、以前学校でレポートの課題として出されて、
おいらもだいぶ頑張って(ネットからパクリながら)解説を書きました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
[4 分散と不偏分散]のところと[6 余談(理由)]が役に立つかと。
恥ずかしいので今日の夕方くらいまでに消してしまう予定です。
あと、統計の先輩方、間違ってたらご指摘よろしくお願いいたします。

389 名前:132人目の素数さん [04/02/29 08:37]
>388
ほとんど完璧ですな.では,ちょいちょい修正を.
おかしいところは,
1.母平均μの説明が入っていない.
2.母分散σ^2は,ひとつの決まった値なので小文字だが,
標本分散と不偏標本分散は,確率変数なので,大文字.
3.母分散は値なので不偏母分散というものはない.不偏=不偏推定量.
多分,
母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数.
がごちゃごちゃになっていると思います.
母平均=E[標本平均],母分散=E[不偏標本分散]です.

母分散が未知だから,標本から母分散を求めたい.
平均が母分散になる,できるだけ分散の小さい推定量を見つけたい
証明したいのは,
E[不偏標本分散]=E[n/n-1 標本分散]=母分散
  前の=は不偏標本分散と標本分散の定義式を見ればすぐわかる.


390 名前:132人目の素数さん [04/02/29 08:39]
(続)
手直しすると,(注意.X~は標本平均のつもりです.
余談の最初に,
「母平均μ,母分散σ^2の母集団から,無作為にX1,X2,...,Xnを抽出すると,
X1,X2,...,Xnは,平均μ,分散σ^2の独立な確率変数となる.
よって,E[Xi]=μ,V[Xi]=E[(Xi-μ)^2]=σ^2 (i=1,2,...,n)」
を入れて,

E[S^2]=.............=1/n Σ(E[(Xi-μ)^2]) -E[(X~-μ)^2]
=1/n ΣV[Xi] -V[X~]
ここで
V[X]=σ^2
V[X~]=....=σ^2/n
よって
E[S^2]=...=(n-1)/n σ^2
よって,
母分散=n/(n-1) E[標本分散]
また,
E[不偏標本分散]=E[n/n-1標本分散]=母分散

ということは,不偏標本分散の平均は母分散になる.
よって,不偏標本分散は母分散の不偏推定量

391 名前:自由度n-1 [04/02/29 09:37]
>>388,389さん、あるがとうございます。
大分頭の中が整理されてきました。
つまり、言葉で表すと、
偏差平方和をnで割ると、かたよりをもってしまうため、
標本分散が母分散の不偏推定値であるためには、n-1で
割る必要があるということでしょうか。
ただの分散と不偏分散が頭の中でごっちゃになっていたようです。




392 名前:自由度n-1 [04/02/29 09:46]
>>391訂正
分散=標本分散でしたね。
そうしますと、不偏標本分散が母分散の不偏推定量であるためには
n-1で割る必要がある、となるのですね。
失礼いたしました。


393 名前:132人目の素数さん [04/02/29 18:40]
>>352
遅レスだけど、

>ただし、多重共線性に注意しましょう。結果がものすごく変わることがあります。

注意しましょうと言うよりは、実務上、説明変数が3個以上あるとマルチ湖は避けられない。
標準化偏回帰係数を見ても意味がないのがほとんど。




394 名前:132人目の素数さん [04/02/29 19:13]
重回帰分析で要因分析は無理ってことか・・・・・

395 名前:132人目の素数さん mailto:sage [04/02/29 23:51]
>352
相関の高い説明変数を削って、変数選択しててからでも、意味ないのでしょうか?
各説明変数の相関が低ければ、標準化偏回帰係数の意味があると思うのですが。
でも、削った説明変数の解釈に困るか。。。
共分散構造解析とかするんでしょうか?

396 名前:395 mailto:sage [04/02/29 23:52]
>352じゃなくて>393です。

397 名前:132人目の素数さん mailto:sage [04/03/01 01:32]
>>389
ご指摘ありがとうございます。

>母平均,母分散は値.標本平均,標本分散,不偏標本分散は確率変数.
>がごちゃごちゃになっていると思います.

まさにその通りでした・・・
いやはや、統計初心者を脱却するにはまだまだ時間がかかりそうです。

>>391=392
そういうことだと思います。

ではPDFは消してしまいますね。

398 名前:132人目の素数さん mailto:sage [04/03/02 00:08]
相関の高い説明変数をいくら削っても、残った変数の相関係数はゼロじゃないでしょ?
それが2,3個だったらまだいいけど、それ以上になったら標準化偏回帰係数を見ても無駄。

事前に主成分分析をかましたりするんだけど複雑になりすぎる。

399 名前:132人目の素数さん mailto:sage [04/03/02 03:18]
なるほど。
主成分分析をかませば、相関0の説明変数を作れて、
それから、重回帰にかけて、
第1主成分、第2主成分、…の偏回帰係数を比較、
最も寄与の大きい説明変数はどれか?と言われると、困りますね。

だいたい、X1とX2が相関があれば、
X1の寄与が大きくなればX2の寄与も大きくなるから、
X1とX2の寄与が大きい、つまり、
説明変数の合成変数で出てくるのは、当然か。。。

400 名前:132人目の素数さん mailto:sage [04/03/02 03:30]
>348
今さらながらに思うと、
標準化した目的変数と各説明変数を単回帰にかけて相関係数を比較し、
最も相関の高い説明変数は、コレです。
と、言っても良かったのかも知れない。。。
2番目3番目と言われると困るが。。。どうなんでしょう?

401 名前:132人目の素数さん [04/03/02 20:59]
ただの興味本位なんだけど、学生?実務家?

402 名前:399と400 mailto:sage [04/03/02 22:07]
学生です。

403 名前:132人目の素数さん [04/03/03 23:54]
無作為標本についてお聞きしたいことがあります。

ある母集団のある薬の服用について調べたいときに、
その母集団の人々のリストを全て持っているとします。
当然ながら、どの人が服用していて、
どの人が服用してないかはわかりません。
その母集団のリストから無作為抽出にて標本を定めて、
その標本の方々に対して面接にて調査を行ったとします。
その際に、服用していないという方は、調査をやめにして、
服用しているという方のみに調査をして、調査結果をまとめたという、
この結果っていうのは、無作為標本に基づいた結果と言えるのでしょうか?

服用していない方には調査をやめにした、というところがひっかかって、
でも、その薬の飲む頻度とか服用期間とかを知りたい場合は、
服用していない人々に聞いても仕方がないので、っていう考え方もあるし、
果たしてこれって無作為標本に基づくのだろうかっていう疑問が出てきたのです。

説明をつけて教えて下さると幸いです。
よろしくお願い致します。



404 名前:132人目の素数さん mailto:sage [04/03/04 08:13]
自信持って答えられるほどじゃないので、参考程度に。
まず、
母集団=知識・情報を得たいと考えている対象の全体
です。
もちろん、母集団が、”そのリスト上の人々”で、
途中で調査をやめるというのは、無作為標本ではありません。
しかし、母集団=”薬を服用しているそのリスト上の人々”と設定すると、
母集団からの無作為標本になると思います。

405 名前:132人目の素数さん [04/03/05 14:00]
多次元尺度法でお手本になるようなプログラムソース
どこかにないかなと探してます。
C/C++だと一番読みやすいんですけど、知ってる方
いましたら、よろしくご教示ください。よろすく

406 名前:132人目の素数さん [04/03/09 01:44]
g

407 名前:132人目の素数さん mailto:sage [04/03/09 01:45]
128

408 名前:132人目の素数さん [04/03/09 21:09]
大変抽象的な質問で申し訳ありません。以下の質問に答えて頂ければ
幸いです。

ある検査機の不良品感知センサーが正常に作動しているかどうかを
確認するための実験を行いたいと考えております。実験の内容としては、
既知の不良品を良品に混ぜて、それを検査機に流し、既知の結果が得られる
かどうか、というものです。センサーが正常(異常)である、と言えるためには、
どのような実験系を組めばよろしいかと思いますでしょうか?

当方、統計の知識に乏しく、質問も的外れの気もしますが、
よろしくお願い致します。





409 名前:132人目の素数さん [04/03/10 13:23]
区間推定の式に関する質問です。x系列とy系列があって(x,y)のサンプル
とって、M次の多項式回帰したとすますね。つまり回帰式が
y=a0+a1*x+a2*x^2+.....+aM*x^M
でこの式から、あるxに対するyを推定するとします。
これ区間推定で y+-δ のように求めたいのですが、
δ=t_α/2*Se ですよね。
で、それはいいのですが、Se(予測誤差の分散ていうの?)
どうやってもとめるのですかね。
Se=(Σ(y_hati_yi)^2/(N-2)*(1+1/n+(x-x_mean)^2/Σ(xi-x_mean))^2))^0.5
ってのあったんですが、これって回帰式がy=a+bxとかの時だけ
の気がするのですが、、、、何言ってるか分かる賢い人いたら
多項式の場合のSeの式教えてください。

410 名前:132人目の素数さん [04/03/10 13:57]
↑ y_hati_yi ---> y_hat(回帰式からのy)- yi(実際の値)

411 名前:132人目の素数さん mailto:sage [04/03/10 14:49]
>>408
それって全数検査なの、それとも抜き取り?

412 名前:132人目の素数さん [04/03/10 15:19]
412

413 名前:408 [04/03/10 21:03]
>>411さん、
全数検査で考えております。
要は的中率を求めるもので、センサーの精度を見たい訳です。
宜しくお願い致します。





414 名前:132人目の素数さん mailto:sage [04/03/18 01:13]
すいません、数学嫌いなもんで、ちょっと検討がつかないので質問します。
サンプル集団が二つあるとして、その分散の違いを見たいのです。
単純に不偏標準偏差をもとめて比較する以外に方法はありますか?
サンプルのデータのエラーを考慮して比較するぐらいしか思いつきません(涙)



415 名前:132人目の素数さん [04/03/22 15:58]
浮上

416 名前:オラウータン [04/03/22 15:58]
ある集団の平均とその部分である集団の平均が違うとき、それが偶然では
なく違うってのは、どう計算したら良いのでしょうか?

417 名前:132人目の素数さん mailto:sage [04/03/22 21:42]
両方とも正規分布に従うと仮定し、両方の平均が
同じである場合に、実際にそれだけのずれが出来る
確率を求めて、余りにも小さかったら(1%以下とか)
恐らく何か理由があって平均が違うのだろう、と
言うことになる。帰無仮説棄却。

あとは灯台出版会の本で勉強すれ。

418 名前:132人目の素数さん mailto:sage [04/03/23 00:57]
>>414
何がしたいのかそれだけではサッパリわからんが、
等分散性の検定をすればいいんじゃない?
そういう意味じゃないのか?

419 名前:132人目の素数さん [04/03/23 01:17]
>>408
2週間前だからもう調査したのかもしれないけど、
測定器の精度を調べるのにはMSAって方法が一般的となっている。
ISO9000準拠。

(R&R/TV)*100 (%)

420 名前:132人目の素数さん [04/03/24 01:31]
サイコロの目の出方がちゃんとしてるかどうか調べるには
どうやって調べればいいのでしょうか?
たとえば
1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6
って感じで目が出たとすると、
各目の出る確率は1/6で正しいのですが、
目の出方が普通じゃないですよね? 順番に出てる。もっとランダムに出るべきなのに。
こういうのをおかしいって判定することはできるのでしょうか?

421 名前:132人目の素数さん mailto:sage [04/03/24 01:45]
>>420
「母比率の検定」でぐぐる

422 名前:132人目の素数さん mailto:sage [04/03/24 02:41]
>>421
母比率の検定では>>420のデータは異常なし?

423 名前:132人目の素数さん mailto:sage [04/03/24 02:55]
母比率の検定では無理な気がするが…

普通にプロットして考えるといいのでは?
c管理図の要領。
「周期的に同じ傾向が現れる」というのは、
管理図では異常の可能性ありとみなす。

他には、
14連続交互増減、平均値以下(以上)が4連続以上出現、
連続6点増加(減少)、±1σ領域に点が集中(サイコロなら3,4)
このあたりは実際にどれほど起こらないか、
自分で確率を計算すればわかると思う。



424 名前:421 mailto:sage [04/03/24 02:57]
ごめん>>420最初の2行と最後の1行だけしか読んでなかった

425 名前:132人目の素数さん [04/03/25 19:55]
すいません、さんざん既出とは思いますが、統計学を学ぶにあたってバイブルや良書はありますでしょうか?
携帯なので過去ログは勘弁して下さい
私はまったくの統計学初学者です
できれば返答お願いしますm(__)m

426 名前:132人目の素数さん [04/03/26 00:51]
統計学入門
東京大学教養学部統計学教室編
東京大学出版会

427 名前:132人目の素数さん mailto:sage [04/03/26 02:06]
>>426
ありがとうございます!
早速明日探してきますm(__)m

428 名前:132人目の素数さん [04/03/27 01:56]
統計学を学ぶ先輩方に質問なのですが、
大学でやるような問題ならだいたい解ける、というレベルに達するまで一日何時間勉強して何ヵ月(または何年)かかりましたか?
もちろん個人差があると思いますのでだいたいで結構です
小学生みたいな質問ですが、これからの勉強の指標にしたいのでお願いします

429 名前:132人目の素数さん mailto:sage [04/03/27 03:04]
「大学でやるような問題がだいたい解ける」という書き方が本当に小学生みた・・ゲホンゲホン
とりあえず高卒程度の知識があるのなら、

1.一般教養課程で統計学の単位をとる→1〜2日
2.専門課程で統計学の単位をとる→数日
3.数学科以外(経済、工学、農学等)で統計学の知識を利用した論文を書く→数日〜数週間
4.数学科で統計学をテーマとした論文を書く→数ヶ月〜数年

ぐらい?誰か適当にフォローして。
因みに1と2は「本質的な理解をしてなくても単位が取れればいい」という場合の日数ねw

430 名前:132人目の素数さん [04/03/28 01:28]
基地外な宿題に答えてください。
20回サンプルされました。平均は10.432、標準偏差は3.237ですた。
(あ)98%信頼区間を求めよ ←こんなのはまあいい
(い)信頼区間を+-0.001にするには何回サンプル取ればいいか?
は?そんなん莫大なサンプル数になると思うんですが、、、
これはt分布表使うやり方でいいんですよねえ。
サンプル数変わっても平均と標準偏差は一定と仮定でいいんでせうか?
莫大な答えになって、こんなんでいいのかと思わせる問題はやめて
いただきたいのだが、、、

431 名前:132人目の素数さん mailto:sage [04/03/28 06:20]
計算してないから莫大って言うのがどれくらいか分からんが、
時間空間コストの現実性は対象依存だろ。

432 名前:132人目の素数さん [04/03/28 17:14]
大数の法則か。

433 名前:132人目の素数さん [04/03/30 16:01]
すいません、質問します。

一様最小分散不偏推定量と最小分散不偏推定量についての
違いというのはあるのでしょうか?

本によってはどちらかしか載っていなかったので、
ちょっと気になりました。くだらない質問ですがお願いします。



434 名前:132人目の素数さん [04/03/30 18:08]
>>425
どういう人かわかりませんので、>>426の東大出版会の
本でもいいかと思いますが、それが難しいようでしたら、
「はじめての統計学」鳥居泰彦著もよろしいかと思います。
社会人の人や、普段数学を全くやっていない学生に統計学を
したいと聞かれたときには、こっちのほうを勧めています。



435 名前:132人目の素数さん mailto:sage [04/03/30 20:44]
自分も母標準偏差と標本標準偏差でのn-1の疑問について
正確に理解せねばならなくなりました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
消えてしまったみたいですが・・・・何処かに良い説明がないものか

436 名前:132人目の素数さん mailto:sage [04/03/31 06:55]
>>435
あー、再アップしときました。
前回指摘された部分は直してません。

ご存じかと思いますが、もともとは分散用に書いたので、
適宜読み替えて下さい。

437 名前:132人目の素数さん mailto:sage [04/03/31 14:34]
アップありがとうございます
早速、拝見させていただきます

438 名前:132人目の素数さん [04/04/03 15:25]
医学的な評価(かなり重篤・重篤・やや問題あり・問題なし等)の解析を
する場合

かなり重篤:4
重篤:3
やや問題あり:2
問題なし:1
のスコアを重篤度に割り当てて

処理前と処置後を比較する場合(1群比較)⇒ウィルコクソンの符号付順位検定
実薬とプラセボを比較する場合(2群比較)⇒マン・ホイットニー検定(ウィルコクソンの順位和検定)
でOKですか?
また、スコアの割り当て方はこのように単純な割り当て方で大丈夫でしょうか?

439 名前:132人目の素数さん mailto:sage [04/04/04 15:31]
誘導されたのでこちらへ

例として言えば
1/100=100/10000
↑数学上は=なんでしょうが実際問題同じじゃないと思うのです

たとえば、なにか揉め事があったとして
100人の中の1人が自分の味方をしてくれるのと
10000人の中の100人が自分の味方をしてくれるのでは全然違うと思いませんか?

10発のうち1個玉が入ってるロシアンルーレットと
100発のうち10個玉が入ってるロシアンルーレットどっちを選びますか?


440 名前:132人目の素数さん [04/04/04 17:19]
>>439
分散を計算せんと。

441 名前:132人目の素数さん [04/04/04 18:15]
>>439
数学上はではなく
そこでの = は、平均値が等しいという意味。

何が等しいと言っているのかを指定しないと
意味がない。

例えば、単位の違うもの、
長さ = 面積
みたいなことはしてはいけないでしょ。
数学上でも、こういうのはしてはいけない。

割合とか、確率とかが等しいか否かというのは
平均値だけでは決まらないので
違うものだと感じるのも仕方ない。

442 名前:132人目の素数さん [04/04/09 23:06]
SDEに関する推定の問題って扱ってる人知ってますか?
ファイナンスで使いたいんですが・・・
あと,ジャンプのあるやつとか,推定できるんですか?

443 名前:132人目の素数さん [04/04/11 04:53]
最小二乗法(多項式近似)に関する質問。
ちょっと数学的センスが必要かも。

あるデータを多項式で近似しようとして、丸ごとだと、あんま近似よくない
から、区間をいくつかに分けてそこで多項式近似するとします。
区間の境界の点どうしますかね?区間ごとの多項式曲線無理やりつなげるの
はさすがによくない気がしますが。。。
正解は一つではなくてようはアイデアの問題でしょうが、
なかなかいいアイデアが浮かばない。。



444 名前:132人目の素数さん [04/04/13 03:56]
>443
ひとつのアイデアとしては、
X1<境界点X2<X3で、予測がx<X2でf(x)、X2<X3でg(x)のとき、
X1<x<X3の予測を
f(x)*p+g(x)*(1-p) ただし、p=(X3-x)/(X3-X1)
と重み付けしてやるとか。
滑らかにしたかったら、場合分けの範囲を被らせてやるとか。
でも、滑らかにしすぎると、場合分けした意味がなくなる予感。

445 名前:132人目の素数さん [04/04/13 04:41]
>442
専門じゃないので、かじっただけですが、
多分、SDE=Stochastic Differencial Equation(確率微分方程式)
のことだとして、とりあえず、
ファイナンス,確率微分方程式、(ジャンプ)
で、ぐぐってみると、どれだけの人がやってるかわかるかと。
伊藤さん、ブラックショールズさんとか余裕という人なら、すいません。


446 名前:132人目の素数さん [04/04/13 19:38]
>443
区分の境界点で、推定値が連続した値をとるようにした関数で、
スプライン関数というのがあるそうな。
ノンパラメトリック回帰の分野になると思われます。
カーネル関数を用いて局所的にやる方法もあるらしい。


447 名前:132人目の素数さん [04/04/13 21:29]
凸包の中から一様にサンプリングするアルゴリズムを
誰か考えてください。
お願いします。

448 名前:132人目の素数さん [04/04/14 02:31]
>438
昔は、1群比較でやっていましたが、今は、
処置前と処置後を比較する場合(1群比較)は、
治療以外の要因による見かけの治癒、軽快
例、心理学的作用(患者側、医者側ともに)、自然治癒軽快など、
による要因の作用を取り除けないので、
やはり、対照群を置く、2群比較でデザインするようです。
要するに、1群比較だと、治療以外の要因じゃないんですか?と突っ込まれても
反論できない。>意味ないじゃん

スコアの割り当ては、それだけじゃ、なんとも。
まぁ、普通はそれでいいと思いますが。

449 名前:132人目の素数さん [04/04/14 02:45]
>447
何がやりたいのかイマイチわからないんですが、
凸包の中の点に番号ふって、同じだけクジつくって、ひいて、その番号の点をサンプリング、とか
まぁ、PCで乱数発生させて、やるんだろうけど。


450 名前:初学者です。 [04/04/14 21:13]
多変量解析を1から勉強し始めたいと考えています。
ひとまず、深い内容は置いておき、「多変量解析で
何ができるのか」からまず知りたいと思っております。

どんな本から勉強すればよいのでしょうか。
お詳しい方おしえていただけないでしょうか。
お願いします。

ちなみに統計学は初歩程度の知識しかありません。


451 名前:132人目の素数さん [04/04/17 11:41]
ベイズの定理が載ってる確率に関する良い書籍って無いかなぁ?

452 名前:132人目の素数さん [04/04/17 11:52]
>>451
基本的な定理なので、大抵の本には載っています。

統計の本で
「統計学入門」東京大学出版会
あたりから読むといいかと思います。

確率論の本は、素人には難しいのであまりオススメしません。
一般の人がイメージするような確率は大抵は統計学です。
数学でいうところの確率論は、大学で学ぶ基本的な数学を知らないと理解できません。

453 名前:132人目の素数さん [04/04/17 11:58]
なるほど、確率論と統計学は違うと…なるほどなるほど




454 名前:132人目の素数さん mailto:age [04/04/17 12:05]
どなたか教えて下さい。
ベイズの定理を使った解と、ミニマックス法を使った解が
一致するという定理があったと思いますが、名前を忘れて
しまいました。
hall-steinの定理とか、なんとか、そういった雰囲気の名前
だったと思うのですが、はっきりと思い出せないのです。
よろしくお願いします。


455 名前:132人目の素数さん [04/04/17 12:25]
ここで質問するのは場違いかもしれませんが、
www.fsa.go.jp/inter/bis/bj_20010117_1e.pdf
のP101の426の算出式をEXCELの統計関数を利用して
算出しても、ドキュメントの通りになりません。
EXCEL算出式(PD=0.2)
976.5*NORMSDIST(1.043*NORMSINV(0.2)+0.766)*(1+0.47*((1-J204)/J204^0.44))=784.3
ドキュメント=479
統計関数の使用法が違っているのでしょうか。
ご存知の方いらっしゃいましたら、教えてください。

456 名前:132人目の素数さん [04/04/17 12:53]
>>455
マルチポスト
以後スルー

457 名前:132人目の素数さん mailto:sage [04/04/18 03:56]
>>450
ちょっと古いけど,
・柳井晴夫・岩坪秀一『複雑さに挑む科学−多変量解析入門』(講談社ブルーバックス)
が,事例も豊富で分かりやすいです.
ただし,この本をしっかりと理解するには,行列・ベクトルの知識が必要です.

もし,上の本が難しければ,やはり古い本ですが,
・古谷野亘『数学が苦手な人のための多変量解析ガイド』川島書店
などはどうでしょうか?

なお,この多変量解析については,心理学の分野で応用が
進んでいますので,心理板の心理統計スレで質問されると
有益な助言が得られるかもしれません.
心理統計のテキストでは,私はまだ未読ですが,
・南風原朝和『心理統計学の基礎』(有斐閣アルマ)
はよい評判を聞いています.

458 名前:132人目の素数さん [04/04/20 17:28]
統計学はおなかがいっぱいになりまつか?

459 名前:132人目の素数さん mailto:sage [04/04/20 23:37]
>458
応用次第では?

460 名前:132人目の素数さん [04/04/21 22:03]
学校の統計学の授業に全くついていけないんですけど、なんかいい本ないですか?
基礎の基礎からわかりやすく書いてる本がいいんですけど。


461 名前:132人目の素数さん [04/04/21 22:08]
>>460
>>426のじゃだめか?

462 名前:132人目の素数さん mailto:sage [04/04/22 00:45]
>>460
昭晃堂
統計学
は演習本だが説明も丁寧でわかりやすい。
初学者に向いている。
理系でということになると、共立出版・数理統計学の基礎(野田一雄著)クラスだろうか。

もう全く手も足も出ないということであれば、とりあえず日本実業出版社 統計・確率のしくみ(郡山彬)
でなれることを勧める。

463 名前:132人目の素数さん [04/04/22 04:13]
統計は、勉強すればするほど、だまされている気になってくるのは、
気のせいだろうか?




464 名前:132人目の素数さん mailto:sage [04/04/22 07:33]
>>460
・文系なのか,理系なのか?今何年生なのか?
・文系であれば,大学受験で数学を勉強したか?
・「学校の統計学の授業」というのは,一般教養の科目なのか,
 あるいは専門課程の科目なのか?
・今使っているテキストは何か?
といったあたりを書いてくれないと,答えようがない.


465 名前:132人目の素数さん [04/04/22 17:15]
xi=(X-Xm),yi=(Y-Ym),σ^2=pは既知である
Σxi^2=q,Σyi^2=r,Σxiyi=v
である。
Yi=α+βXi+uiのときの最小二乗推定量はa,b
1)β>0を検定せよ
2)β=1のときの第二種の過誤をもとめよ。

この2がわかりません。
かなり初歩的な問題ですみません。
P(U)=P(Hoを採択|H0が間違っている)
ということまではわかるのですが
具体的に求めることはできるのでしょうか?


466 名前:465 [04/04/22 17:17]
サンプル量は30でした。
有意水準は0.05です

467 名前:132人目の素数さん [04/04/22 20:34]
誘導されてきました。
統計処理が分からんす。

右手の握力を図ります。
その時、片手だけ握るのと両手一緒に握る場合の結果を処理したいと
思ってます。どこをどう処理すればよろしいでしょうか。
男子16人、女子16人を測ってます。

測定の仕方で有意差が出るかどうかからまず調べたいのでつが…

468 名前:132人目の素数さん [04/04/22 20:56]
>>467
>測定の仕方で有意差が出るかどうかからまず調べたいのでつが…

測定の仕方ってのは何?
有意差ってのは、何と何の差?

469 名前:132人目の素数さん [04/04/22 21:21]
測定の仕方
  1右だけ握った場合の右の握力
  2両方同時に握った場合の右の握力

  (つまりは右の握力)

有意差
 上記1と2の測定結果


です。はっきりいって私は統計のど素人です。
統計のサイト見てますが、よくわかりません。
迷惑でなかったら、入門に適したサイトとかも
紹介していただけると嬉しいです。

470 名前:132人目の素数さん [04/04/22 22:41]
近頃、確率の現実への対応問題を考えています。
統計によって導き出された仮説を現実問題へ適用する場合
 ・理想的コインの裏表について、何故同様に確からしいと言えるのか。
 ・ランダムサンプリングによって、何故母集団と近似できるのか。

などがありますが、これらはどうして一定の値(確率)に収束するのでしょうか?
科学哲学というか、確率の成立根拠を問うような質問になって申し訳ないです。

471 名前:132人目の素数さん mailto:sage [04/04/23 01:21]
教えて下さい。
グラフや表を作る時に、「全体のデータ個数」という意味で「N=」と書くじゃないですか。
この「N=」って何の略なんですか?ナンバー?



472 名前:132人目の素数さん [04/04/23 07:49]
>469
有意差の候補として、
平均値の差
分散の差
平均値の比
分散の比
とか、色々あります。
ま、多分、この場合は、平均値の差の検定だとして、
対応のある2群の平均値の差の検定。
青木先生の統計学自習ノートが便利かと。
ttp://aoki2.si.gunma-u.ac.jp/lecture/

473 名前:132人目の素数さん [04/04/23 08:54]
>470
まず、統計と確率はちがいます。統計は確率を利用させてもらっているだけです。
コインの問題。
表裏各々1/2の確率で出るコインを理想的コインと定義。
現実には、コインは理想コインではないから、
帰無仮説:表裏各々確率1/2
対立仮説:表裏各々確率1/2でない
有意水準5%で検定する。
検定量が棄却域に入れば、「表裏各々確率1/2ではない」
入らなければ、「表裏各々確率1/2ではないとは言えない」

要するに、本当に、表裏各々確率1/2ならば、
100回中95回は「表裏各々確率1/2ではないとは言えない」になるということ。
もし、検定量が棄却域に入らなければ、統計的には、
「表裏各々確率1/2ではないとは言えない」と解釈します。

以下は、自分の勝手な感覚ですが、
実際に有意ならば、統計的に有意になるだろう
要するに、統計的に有意だからと言って、実際に有意とは断言できないが、
他に統計的手法よりいい手法がないから、仕方なしに使っている
という感じでしょうか。そんな感じの論文を見かけたことがあります。

あと、言葉の定義が曖昧です。文系の方でしょうか。
根源的なことを問うなら、なおさら、定義を見直した方がいいと思います。



474 名前:132人目の素数さん mailto:sage [04/04/23 14:28]
>465
2)でβ=1のとき、って言ってるから、
P(II)=P(Hoを採択|β=1)
を求めてやる
帰無仮説β=0のときの検定量の分布と、
対立仮説β=1のときの検定量の分布は、ちょうど1ずれてて、
β=1のときの検定量の分布で棄却域に入らない確率を求めればよいはず

475 名前:132人目の素数さん [04/04/23 19:12]
>>473
回答ありがとうございます。
適当に質問してしまったようでご迷惑おかけします。

統計的な手法では、無視してもたいした問題のない
誤差があることを認めているわけですね。
そして、その仮説検定によって得られた信頼度に基づいての推測は
あくまで「有意」、または「近似」であるということですね。

さっき私の聞いたのは、根源的なことというより
言葉の使い方を聞くようなものになりますが、
例えば、理想的コインを延々と投げ続けて裏表を数える場合に
裏、表の相対度数がある一定の値(理論値)に収束を見せるような現象は
「ある”規則”に従っている」と言えるものなのでしょうか?
ある事象が特定の確率分布に従うことは、一種の”秩序”と
見なせるのかどうかということです。

言葉足らずでしたらすみません・・。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<314KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef