[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 02/24 22:49 / Filesize : 314 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド2



1 名前: ◆OHr6mNLYV6 [03/11/08 19:44]
(´Д`;三;´Д`)
語って下さい.偉大な統計学を...
質問にはやさしいお兄さんが答えてくれます.

前スレ
science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【 確率論・統計学の実用の仕方 】
science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたい その1/2
science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
science.2ch.net/test/read.cgi/math/1017042903/

411 名前:132人目の素数さん mailto:sage [04/03/10 14:49]
>>408
それって全数検査なの、それとも抜き取り?

412 名前:132人目の素数さん [04/03/10 15:19]
412

413 名前:408 [04/03/10 21:03]
>>411さん、
全数検査で考えております。
要は的中率を求めるもので、センサーの精度を見たい訳です。
宜しくお願い致します。



414 名前:132人目の素数さん mailto:sage [04/03/18 01:13]
すいません、数学嫌いなもんで、ちょっと検討がつかないので質問します。
サンプル集団が二つあるとして、その分散の違いを見たいのです。
単純に不偏標準偏差をもとめて比較する以外に方法はありますか?
サンプルのデータのエラーを考慮して比較するぐらいしか思いつきません(涙)



415 名前:132人目の素数さん [04/03/22 15:58]
浮上

416 名前:オラウータン [04/03/22 15:58]
ある集団の平均とその部分である集団の平均が違うとき、それが偶然では
なく違うってのは、どう計算したら良いのでしょうか?

417 名前:132人目の素数さん mailto:sage [04/03/22 21:42]
両方とも正規分布に従うと仮定し、両方の平均が
同じである場合に、実際にそれだけのずれが出来る
確率を求めて、余りにも小さかったら(1%以下とか)
恐らく何か理由があって平均が違うのだろう、と
言うことになる。帰無仮説棄却。

あとは灯台出版会の本で勉強すれ。

418 名前:132人目の素数さん mailto:sage [04/03/23 00:57]
>>414
何がしたいのかそれだけではサッパリわからんが、
等分散性の検定をすればいいんじゃない?
そういう意味じゃないのか?

419 名前:132人目の素数さん [04/03/23 01:17]
>>408
2週間前だからもう調査したのかもしれないけど、
測定器の精度を調べるのにはMSAって方法が一般的となっている。
ISO9000準拠。

(R&R/TV)*100 (%)



420 名前:132人目の素数さん [04/03/24 01:31]
サイコロの目の出方がちゃんとしてるかどうか調べるには
どうやって調べればいいのでしょうか?
たとえば
1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6
って感じで目が出たとすると、
各目の出る確率は1/6で正しいのですが、
目の出方が普通じゃないですよね? 順番に出てる。もっとランダムに出るべきなのに。
こういうのをおかしいって判定することはできるのでしょうか?

421 名前:132人目の素数さん mailto:sage [04/03/24 01:45]
>>420
「母比率の検定」でぐぐる

422 名前:132人目の素数さん mailto:sage [04/03/24 02:41]
>>421
母比率の検定では>>420のデータは異常なし?

423 名前:132人目の素数さん mailto:sage [04/03/24 02:55]
母比率の検定では無理な気がするが…

普通にプロットして考えるといいのでは?
c管理図の要領。
「周期的に同じ傾向が現れる」というのは、
管理図では異常の可能性ありとみなす。

他には、
14連続交互増減、平均値以下(以上)が4連続以上出現、
連続6点増加(減少)、±1σ領域に点が集中(サイコロなら3,4)
このあたりは実際にどれほど起こらないか、
自分で確率を計算すればわかると思う。

424 名前:421 mailto:sage [04/03/24 02:57]
ごめん>>420最初の2行と最後の1行だけしか読んでなかった

425 名前:132人目の素数さん [04/03/25 19:55]
すいません、さんざん既出とは思いますが、統計学を学ぶにあたってバイブルや良書はありますでしょうか?
携帯なので過去ログは勘弁して下さい
私はまったくの統計学初学者です
できれば返答お願いしますm(__)m

426 名前:132人目の素数さん [04/03/26 00:51]
統計学入門
東京大学教養学部統計学教室編
東京大学出版会

427 名前:132人目の素数さん mailto:sage [04/03/26 02:06]
>>426
ありがとうございます!
早速明日探してきますm(__)m

428 名前:132人目の素数さん [04/03/27 01:56]
統計学を学ぶ先輩方に質問なのですが、
大学でやるような問題ならだいたい解ける、というレベルに達するまで一日何時間勉強して何ヵ月(または何年)かかりましたか?
もちろん個人差があると思いますのでだいたいで結構です
小学生みたいな質問ですが、これからの勉強の指標にしたいのでお願いします

429 名前:132人目の素数さん mailto:sage [04/03/27 03:04]
「大学でやるような問題がだいたい解ける」という書き方が本当に小学生みた・・ゲホンゲホン
とりあえず高卒程度の知識があるのなら、

1.一般教養課程で統計学の単位をとる→1〜2日
2.専門課程で統計学の単位をとる→数日
3.数学科以外(経済、工学、農学等)で統計学の知識を利用した論文を書く→数日〜数週間
4.数学科で統計学をテーマとした論文を書く→数ヶ月〜数年

ぐらい?誰か適当にフォローして。
因みに1と2は「本質的な理解をしてなくても単位が取れればいい」という場合の日数ねw



430 名前:132人目の素数さん [04/03/28 01:28]
基地外な宿題に答えてください。
20回サンプルされました。平均は10.432、標準偏差は3.237ですた。
(あ)98%信頼区間を求めよ ←こんなのはまあいい
(い)信頼区間を+-0.001にするには何回サンプル取ればいいか?
は?そんなん莫大なサンプル数になると思うんですが、、、
これはt分布表使うやり方でいいんですよねえ。
サンプル数変わっても平均と標準偏差は一定と仮定でいいんでせうか?
莫大な答えになって、こんなんでいいのかと思わせる問題はやめて
いただきたいのだが、、、

431 名前:132人目の素数さん mailto:sage [04/03/28 06:20]
計算してないから莫大って言うのがどれくらいか分からんが、
時間空間コストの現実性は対象依存だろ。

432 名前:132人目の素数さん [04/03/28 17:14]
大数の法則か。

433 名前:132人目の素数さん [04/03/30 16:01]
すいません、質問します。

一様最小分散不偏推定量と最小分散不偏推定量についての
違いというのはあるのでしょうか?

本によってはどちらかしか載っていなかったので、
ちょっと気になりました。くだらない質問ですがお願いします。

434 名前:132人目の素数さん [04/03/30 18:08]
>>425
どういう人かわかりませんので、>>426の東大出版会の
本でもいいかと思いますが、それが難しいようでしたら、
「はじめての統計学」鳥居泰彦著もよろしいかと思います。
社会人の人や、普段数学を全くやっていない学生に統計学を
したいと聞かれたときには、こっちのほうを勧めています。



435 名前:132人目の素数さん mailto:sage [04/03/30 20:44]
自分も母標準偏差と標本標準偏差でのn-1の疑問について
正確に理解せねばならなくなりました。

ttp://trao2go.hp.infoseek.co.jp/toukei1.pdf
消えてしまったみたいですが・・・・何処かに良い説明がないものか

436 名前:132人目の素数さん mailto:sage [04/03/31 06:55]
>>435
あー、再アップしときました。
前回指摘された部分は直してません。

ご存じかと思いますが、もともとは分散用に書いたので、
適宜読み替えて下さい。

437 名前:132人目の素数さん mailto:sage [04/03/31 14:34]
アップありがとうございます
早速、拝見させていただきます

438 名前:132人目の素数さん [04/04/03 15:25]
医学的な評価(かなり重篤・重篤・やや問題あり・問題なし等)の解析を
する場合

かなり重篤:4
重篤:3
やや問題あり:2
問題なし:1
のスコアを重篤度に割り当てて

処理前と処置後を比較する場合(1群比較)⇒ウィルコクソンの符号付順位検定
実薬とプラセボを比較する場合(2群比較)⇒マン・ホイットニー検定(ウィルコクソンの順位和検定)
でOKですか?
また、スコアの割り当て方はこのように単純な割り当て方で大丈夫でしょうか?

439 名前:132人目の素数さん mailto:sage [04/04/04 15:31]
誘導されたのでこちらへ

例として言えば
1/100=100/10000
↑数学上は=なんでしょうが実際問題同じじゃないと思うのです

たとえば、なにか揉め事があったとして
100人の中の1人が自分の味方をしてくれるのと
10000人の中の100人が自分の味方をしてくれるのでは全然違うと思いませんか?

10発のうち1個玉が入ってるロシアンルーレットと
100発のうち10個玉が入ってるロシアンルーレットどっちを選びますか?




440 名前:132人目の素数さん [04/04/04 17:19]
>>439
分散を計算せんと。

441 名前:132人目の素数さん [04/04/04 18:15]
>>439
数学上はではなく
そこでの = は、平均値が等しいという意味。

何が等しいと言っているのかを指定しないと
意味がない。

例えば、単位の違うもの、
長さ = 面積
みたいなことはしてはいけないでしょ。
数学上でも、こういうのはしてはいけない。

割合とか、確率とかが等しいか否かというのは
平均値だけでは決まらないので
違うものだと感じるのも仕方ない。

442 名前:132人目の素数さん [04/04/09 23:06]
SDEに関する推定の問題って扱ってる人知ってますか?
ファイナンスで使いたいんですが・・・
あと,ジャンプのあるやつとか,推定できるんですか?

443 名前:132人目の素数さん [04/04/11 04:53]
最小二乗法(多項式近似)に関する質問。
ちょっと数学的センスが必要かも。

あるデータを多項式で近似しようとして、丸ごとだと、あんま近似よくない
から、区間をいくつかに分けてそこで多項式近似するとします。
区間の境界の点どうしますかね?区間ごとの多項式曲線無理やりつなげるの
はさすがによくない気がしますが。。。
正解は一つではなくてようはアイデアの問題でしょうが、
なかなかいいアイデアが浮かばない。。

444 名前:132人目の素数さん [04/04/13 03:56]
>443
ひとつのアイデアとしては、
X1<境界点X2<X3で、予測がx<X2でf(x)、X2<X3でg(x)のとき、
X1<x<X3の予測を
f(x)*p+g(x)*(1-p) ただし、p=(X3-x)/(X3-X1)
と重み付けしてやるとか。
滑らかにしたかったら、場合分けの範囲を被らせてやるとか。
でも、滑らかにしすぎると、場合分けした意味がなくなる予感。

445 名前:132人目の素数さん [04/04/13 04:41]
>442
専門じゃないので、かじっただけですが、
多分、SDE=Stochastic Differencial Equation(確率微分方程式)
のことだとして、とりあえず、
ファイナンス,確率微分方程式、(ジャンプ)
で、ぐぐってみると、どれだけの人がやってるかわかるかと。
伊藤さん、ブラックショールズさんとか余裕という人なら、すいません。


446 名前:132人目の素数さん [04/04/13 19:38]
>443
区分の境界点で、推定値が連続した値をとるようにした関数で、
スプライン関数というのがあるそうな。
ノンパラメトリック回帰の分野になると思われます。
カーネル関数を用いて局所的にやる方法もあるらしい。


447 名前:132人目の素数さん [04/04/13 21:29]
凸包の中から一様にサンプリングするアルゴリズムを
誰か考えてください。
お願いします。

448 名前:132人目の素数さん [04/04/14 02:31]
>438
昔は、1群比較でやっていましたが、今は、
処置前と処置後を比較する場合(1群比較)は、
治療以外の要因による見かけの治癒、軽快
例、心理学的作用(患者側、医者側ともに)、自然治癒軽快など、
による要因の作用を取り除けないので、
やはり、対照群を置く、2群比較でデザインするようです。
要するに、1群比較だと、治療以外の要因じゃないんですか?と突っ込まれても
反論できない。>意味ないじゃん

スコアの割り当ては、それだけじゃ、なんとも。
まぁ、普通はそれでいいと思いますが。

449 名前:132人目の素数さん [04/04/14 02:45]
>447
何がやりたいのかイマイチわからないんですが、
凸包の中の点に番号ふって、同じだけクジつくって、ひいて、その番号の点をサンプリング、とか
まぁ、PCで乱数発生させて、やるんだろうけど。




450 名前:初学者です。 [04/04/14 21:13]
多変量解析を1から勉強し始めたいと考えています。
ひとまず、深い内容は置いておき、「多変量解析で
何ができるのか」からまず知りたいと思っております。

どんな本から勉強すればよいのでしょうか。
お詳しい方おしえていただけないでしょうか。
お願いします。

ちなみに統計学は初歩程度の知識しかありません。


451 名前:132人目の素数さん [04/04/17 11:41]
ベイズの定理が載ってる確率に関する良い書籍って無いかなぁ?

452 名前:132人目の素数さん [04/04/17 11:52]
>>451
基本的な定理なので、大抵の本には載っています。

統計の本で
「統計学入門」東京大学出版会
あたりから読むといいかと思います。

確率論の本は、素人には難しいのであまりオススメしません。
一般の人がイメージするような確率は大抵は統計学です。
数学でいうところの確率論は、大学で学ぶ基本的な数学を知らないと理解できません。

453 名前:132人目の素数さん [04/04/17 11:58]
なるほど、確率論と統計学は違うと…なるほどなるほど


454 名前:132人目の素数さん mailto:age [04/04/17 12:05]
どなたか教えて下さい。
ベイズの定理を使った解と、ミニマックス法を使った解が
一致するという定理があったと思いますが、名前を忘れて
しまいました。
hall-steinの定理とか、なんとか、そういった雰囲気の名前
だったと思うのですが、はっきりと思い出せないのです。
よろしくお願いします。


455 名前:132人目の素数さん [04/04/17 12:25]
ここで質問するのは場違いかもしれませんが、
www.fsa.go.jp/inter/bis/bj_20010117_1e.pdf
のP101の426の算出式をEXCELの統計関数を利用して
算出しても、ドキュメントの通りになりません。
EXCEL算出式(PD=0.2)
976.5*NORMSDIST(1.043*NORMSINV(0.2)+0.766)*(1+0.47*((1-J204)/J204^0.44))=784.3
ドキュメント=479
統計関数の使用法が違っているのでしょうか。
ご存知の方いらっしゃいましたら、教えてください。

456 名前:132人目の素数さん [04/04/17 12:53]
>>455
マルチポスト
以後スルー

457 名前:132人目の素数さん mailto:sage [04/04/18 03:56]
>>450
ちょっと古いけど,
・柳井晴夫・岩坪秀一『複雑さに挑む科学−多変量解析入門』(講談社ブルーバックス)
が,事例も豊富で分かりやすいです.
ただし,この本をしっかりと理解するには,行列・ベクトルの知識が必要です.

もし,上の本が難しければ,やはり古い本ですが,
・古谷野亘『数学が苦手な人のための多変量解析ガイド』川島書店
などはどうでしょうか?

なお,この多変量解析については,心理学の分野で応用が
進んでいますので,心理板の心理統計スレで質問されると
有益な助言が得られるかもしれません.
心理統計のテキストでは,私はまだ未読ですが,
・南風原朝和『心理統計学の基礎』(有斐閣アルマ)
はよい評判を聞いています.

458 名前:132人目の素数さん [04/04/20 17:28]
統計学はおなかがいっぱいになりまつか?

459 名前:132人目の素数さん mailto:sage [04/04/20 23:37]
>458
応用次第では?



460 名前:132人目の素数さん [04/04/21 22:03]
学校の統計学の授業に全くついていけないんですけど、なんかいい本ないですか?
基礎の基礎からわかりやすく書いてる本がいいんですけど。


461 名前:132人目の素数さん [04/04/21 22:08]
>>460
>>426のじゃだめか?

462 名前:132人目の素数さん mailto:sage [04/04/22 00:45]
>>460
昭晃堂
統計学
は演習本だが説明も丁寧でわかりやすい。
初学者に向いている。
理系でということになると、共立出版・数理統計学の基礎(野田一雄著)クラスだろうか。

もう全く手も足も出ないということであれば、とりあえず日本実業出版社 統計・確率のしくみ(郡山彬)
でなれることを勧める。

463 名前:132人目の素数さん [04/04/22 04:13]
統計は、勉強すればするほど、だまされている気になってくるのは、
気のせいだろうか?


464 名前:132人目の素数さん mailto:sage [04/04/22 07:33]
>>460
・文系なのか,理系なのか?今何年生なのか?
・文系であれば,大学受験で数学を勉強したか?
・「学校の統計学の授業」というのは,一般教養の科目なのか,
 あるいは専門課程の科目なのか?
・今使っているテキストは何か?
といったあたりを書いてくれないと,答えようがない.


465 名前:132人目の素数さん [04/04/22 17:15]
xi=(X-Xm),yi=(Y-Ym),σ^2=pは既知である
Σxi^2=q,Σyi^2=r,Σxiyi=v
である。
Yi=α+βXi+uiのときの最小二乗推定量はa,b
1)β>0を検定せよ
2)β=1のときの第二種の過誤をもとめよ。

この2がわかりません。
かなり初歩的な問題ですみません。
P(U)=P(Hoを採択|H0が間違っている)
ということまではわかるのですが
具体的に求めることはできるのでしょうか?


466 名前:465 [04/04/22 17:17]
サンプル量は30でした。
有意水準は0.05です

467 名前:132人目の素数さん [04/04/22 20:34]
誘導されてきました。
統計処理が分からんす。

右手の握力を図ります。
その時、片手だけ握るのと両手一緒に握る場合の結果を処理したいと
思ってます。どこをどう処理すればよろしいでしょうか。
男子16人、女子16人を測ってます。

測定の仕方で有意差が出るかどうかからまず調べたいのでつが…

468 名前:132人目の素数さん [04/04/22 20:56]
>>467
>測定の仕方で有意差が出るかどうかからまず調べたいのでつが…

測定の仕方ってのは何?
有意差ってのは、何と何の差?

469 名前:132人目の素数さん [04/04/22 21:21]
測定の仕方
  1右だけ握った場合の右の握力
  2両方同時に握った場合の右の握力

  (つまりは右の握力)

有意差
 上記1と2の測定結果


です。はっきりいって私は統計のど素人です。
統計のサイト見てますが、よくわかりません。
迷惑でなかったら、入門に適したサイトとかも
紹介していただけると嬉しいです。



470 名前:132人目の素数さん [04/04/22 22:41]
近頃、確率の現実への対応問題を考えています。
統計によって導き出された仮説を現実問題へ適用する場合
 ・理想的コインの裏表について、何故同様に確からしいと言えるのか。
 ・ランダムサンプリングによって、何故母集団と近似できるのか。

などがありますが、これらはどうして一定の値(確率)に収束するのでしょうか?
科学哲学というか、確率の成立根拠を問うような質問になって申し訳ないです。

471 名前:132人目の素数さん mailto:sage [04/04/23 01:21]
教えて下さい。
グラフや表を作る時に、「全体のデータ個数」という意味で「N=」と書くじゃないですか。
この「N=」って何の略なんですか?ナンバー?



472 名前:132人目の素数さん [04/04/23 07:49]
>469
有意差の候補として、
平均値の差
分散の差
平均値の比
分散の比
とか、色々あります。
ま、多分、この場合は、平均値の差の検定だとして、
対応のある2群の平均値の差の検定。
青木先生の統計学自習ノートが便利かと。
ttp://aoki2.si.gunma-u.ac.jp/lecture/

473 名前:132人目の素数さん [04/04/23 08:54]
>470
まず、統計と確率はちがいます。統計は確率を利用させてもらっているだけです。
コインの問題。
表裏各々1/2の確率で出るコインを理想的コインと定義。
現実には、コインは理想コインではないから、
帰無仮説:表裏各々確率1/2
対立仮説:表裏各々確率1/2でない
有意水準5%で検定する。
検定量が棄却域に入れば、「表裏各々確率1/2ではない」
入らなければ、「表裏各々確率1/2ではないとは言えない」

要するに、本当に、表裏各々確率1/2ならば、
100回中95回は「表裏各々確率1/2ではないとは言えない」になるということ。
もし、検定量が棄却域に入らなければ、統計的には、
「表裏各々確率1/2ではないとは言えない」と解釈します。

以下は、自分の勝手な感覚ですが、
実際に有意ならば、統計的に有意になるだろう
要するに、統計的に有意だからと言って、実際に有意とは断言できないが、
他に統計的手法よりいい手法がないから、仕方なしに使っている
という感じでしょうか。そんな感じの論文を見かけたことがあります。

あと、言葉の定義が曖昧です。文系の方でしょうか。
根源的なことを問うなら、なおさら、定義を見直した方がいいと思います。

474 名前:132人目の素数さん mailto:sage [04/04/23 14:28]
>465
2)でβ=1のとき、って言ってるから、
P(II)=P(Hoを採択|β=1)
を求めてやる
帰無仮説β=0のときの検定量の分布と、
対立仮説β=1のときの検定量の分布は、ちょうど1ずれてて、
β=1のときの検定量の分布で棄却域に入らない確率を求めればよいはず

475 名前:132人目の素数さん [04/04/23 19:12]
>>473
回答ありがとうございます。
適当に質問してしまったようでご迷惑おかけします。

統計的な手法では、無視してもたいした問題のない
誤差があることを認めているわけですね。
そして、その仮説検定によって得られた信頼度に基づいての推測は
あくまで「有意」、または「近似」であるということですね。

さっき私の聞いたのは、根源的なことというより
言葉の使い方を聞くようなものになりますが、
例えば、理想的コインを延々と投げ続けて裏表を数える場合に
裏、表の相対度数がある一定の値(理論値)に収束を見せるような現象は
「ある”規則”に従っている」と言えるものなのでしょうか?
ある事象が特定の確率分布に従うことは、一種の”秩序”と
見なせるのかどうかということです。

言葉足らずでしたらすみません・・。

476 名前:469 [04/04/23 19:25]
>472さま
ありがとうございます。
さっそく平均値や分散の意味を調べ、
検定の意味を調べたいと思います。
紹介もしていただきありがたく思います。

477 名前:132人目の素数さん mailto:sage [04/04/23 23:55]
>475
大数の法則が適当かと。ベルヌーイさんの偉業です。
下のサイトでシミュレーションと証明があります。
関西学院高等部の丹羽先生のページ
ttp://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/toukeihy.htm

478 名前:132人目の素数さん [04/04/24 07:40]
なんつーかさー漏れから見るとさー
統計学ってどうもサイエンスじゃなくてさーエンジニアリング
って感じがするわけよ だってさー100%じゃないじゃん?
例えば5%の確率でそうならないことも予想さるわけでさー
命をかけられないわけよ怖くて
もっとこー漏れが風邪ひいてても鬱な気分になってても
もの凄く幸せな気分でいるときもおかまいなしに信用できる
結果じゃないと落ち着かないしそれを使ってさらなる複雑でかつ信用に足る論理展開ができないわけよ
この現象はこういう分布に従うとかってさー現象論につぐ現象論でしょ?
なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ?
物理学のように現象論から帰納っつーの?
最初はどうもこうなる事しかわからなかったが
細分化して突き詰めていって原子だとか
電子だとか量子だとか元々の原因を明らかにするんじゃなくて演繹ばっかでしょ?
そこに漏れはサイエンスをいまいち感じないわけよ
もう誰か統計学はエンジニアリングだって認めてくれれば
漏れも真面目に勉強しようかと思ってるんだよ
そうすれば2回も単位落とすことも無くなると思うんだよ

479 名前:132人目の素数さん mailto:sage [04/04/24 09:37]
その通り
統計学は理学部数学科には入れてもらえない
確率は入ってるけど
まじめに勉強しなはれ



480 名前:132人目の素数さん [04/04/24 10:01]
>>478
>なんでその分布に従うか厳密に証明できてないけどどうもなんべんやってもこういう分布だとかでしょ?

サイエンス全般に渡ってそう。
物理も例外ではなくそう。
サイエンスに厳密に証明できてることなど何も無い。
物理は世界中でなんべんやってもこういう実験結果だから
正しいというところが足場になってるわけで
そこが保てないと机上の空論になってしまう。
統計学はサイエンスの足場の重要な一部を成し、その意味では数学的である。

481 名前:132人目の素数さん [04/04/24 18:41]
>>477
分布に従うことを秩序や規則であると呼べるのでしょうか?
また逆に、統計における誤差の存在こそが秩序では?と思えるわけです・・。

>>480
そうですよね。どんな実証的科学でも
繰り返し実験で統計をとって有意水準にあるのなら
それは正しいと認めるわけですよね。

482 名前:478 [04/04/25 01:18]
統計学が大事だということはわかった
ナイチンゲールだかヘレンケラーだかが統計学を用いて
多くの人命を救ったというのもきいた
あとは統計学が科学か工学かだ
科学だというのなら漏れはまた単位を落とす
工学だというのなら漏れは割り切って勉強できるから単位はAだ

483 名前:132人目の素数さん [04/04/25 03:21]
>>478
 あなたは全くいいことをおっしゃる。
 日本統計学会の評議員の先生方でも、よくあなたのような
 ことをおっしゃいますよ。
 統計学は実学ですから、数学科とはちょっと違った
 ものかもしれません。
 もちろん、統計学の基礎は数学や確率論ですけど・・・。

>>481
 統計学では、「正しい」などとは言わないと思うなあ。
 有意かどうかは、検定による結果だけど、有意水準の
 決め方に論理性がない(5%とか1%とか)から、
 そんなに厳密なものではないし、
 正規分布に見える事象でも、データを多く集めると
 正規性のテストにとおらないからデータ数を少なくして
 テストして論文にしたりする。
 結局、実際の統計処理ってあいまいなところもあるんだよね。
 ただし、理論としての中心極限定理は美しいと思うよ。


484 名前:132人目の素数さん [04/04/25 03:23]
>>475
 コイン投げを続けた結果は、経験的確率といいます。
 理論的確率とは区別します。


485 名前:132人目の素数さん mailto:sage [04/04/25 14:15]
天気予報の降水確率の理論をお教え下さい。

486 名前:132人目の素数さん [04/04/25 17:05]
>>485
 天気図や、気圧配置を基にして行うのは、空間統計学の
 手法を使ったりするし、過去のデータからだったら、
 確率過程をつかったりするが、気象庁の使っている方法は、
 いろんなデータを見て、最終的には人が判断しているらしいね。
 細かいことは専門家でないからわからんけど・・・。



487 名前:132人目の素数さん mailto:sage [04/04/25 17:13]
漏れが知りたいのは気象のパラメータを最終的に10段階に統合する手法です。
どのような統計処理を施しているのかということ。

488 名前:132人目の素数さん mailto:sage [04/04/25 20:31]
>>487
ならば板違い。この辺で聞くべきだと思う。

天文・気象板 初心者質問すれ。PART XI
ttp://science2.2ch.net/test/read.cgi/sky/1077609048/

489 名前:132人目の素数さん mailto:sage [04/04/25 23:16]
ガウスの誤差関数の導出について詳しく書いてあるお勧めの参考書
ありませんか?



490 名前:132人目の素数さん mailto:sage [04/04/25 23:21]
検定(片側は除く)でサンプル数をかなり大きくしていくと必ず有意にできる。
理由は、検出力がUPして、どんな小さな差でも検出してしまうから。
だから、最近の論文は、イフェクトサイズが小さいと通らないらしい


491 名前:132人目の素数さん [04/04/28 08:33]
混乱してきたので教えてください。
え〜〜っとサンプルとってその値が、1.1,1.2,1.3,1.05,1.07
だったとしますね。(実際、値はどうでもいい)
で、1.09である信頼レベルってどれくらい?
という問題です。よろしくおねがいします。

492 名前:132人目の素数さん mailto:sage [04/04/28 16:35]
初学者ということで>>434で紹介していただいた「はじめての統計学」鳥居泰彦著を熟読しました。
次のステップに進みたいのですが、「統計学入門」東京大学出版会でよろしいでしょうか?

493 名前:132人目の素数さん mailto:sage [04/04/28 17:33]
よろしい

494 名前:132人目の素数さん mailto:sage [04/05/01 07:05]
>491
母分散がわからないので、不偏分散で代用して基準化。
すると、Student t分布に従う。
標本サイズ = 5
平均値 = 1.144 (1.144)
不偏分散 = 0.01093 (0.01093)
標準偏差 = 0.104547 (0.104546640309481)
1.09を基準化すると(1.09-1.144)/0.104547=-0.52
あとはt分布表を見ればp値が出てくる。正確にはソフトで計算。
1.09〜1.198は、だいたい40%くらいの信頼区間
ただし、区間推定では、p値の値自体はあまり意味がない

先に、有意水準を決めて、p値がそれより大きいか小さいか判断する。
つまり、先に、信頼区間を作ってから、標本がその区間に入っているかどうかを判断する。
信頼区間内外のどこらへんにあるかはあまり意味がない。

495 名前:132人目の素数さん mailto:sage [04/05/01 12:12]
訂正。標本じゃなくて、標本点。
書き忘れたけど、母平均の信頼区間の話ね。

496 名前:132人目の素数さん [04/05/02 13:09]
こちらにということですので、よろしくお願いします。
(1)確率変数X,Yはそれぞれ0,1,2の値をとる確率変数で、
以下の同時確率分布関数を持つものとする。
fX,Y(x,y)=1/(5(3−|x+y−2|))
このとき、E(X),V(X)およびC0V(X,Y)を求めよ。

(2)確率変数XとYは独立でともに区間[0,1]上の一様分布をもつ。
このとき、確率変数ZをZ=X^2+Yと定義するとき、
確率変数の組X,Zの存在範囲と同時密度関数
fX,Z(x,z)を求めよ。またZの密度関数fz(z)を求めよ。
よろしくお願いします。


497 名前:132人目の素数さん mailto:sage [04/05/04 05:43]
>496
(1)とりあえず、(X,Y)=(0,0),(0,1),....,(2,2)の確率をそれぞれ計算してみ?
(2)ヤコビアン使う公式、教科書で探してみ?


498 名前:132人目の素数さん [04/05/05 00:26]
質問です。
全くの文系人間で、この質問がスレ違いであるか否かにも自信がありません。
気が向いたら教えていただけると嬉しいです。

データが正規分布をとらない場合、正規変換を行う必要があるということなので
データを対数変換し、それでヒストグラムを作成してみました。
しかし元データのヒストグラムよりは正規分布の形に近づいてはいるのですが
凸凹していて、山のような形(分かりにくくてすみません)にはなりません。

しかも元データによるヒストグラムは「正の非対称が強い」状態であったのに
対数変換後のデータによるヒストグラムは、値が0の階級が多く「負の非対称」気味です。

最終的に正規分布をとるようにしたいのですが
どのような作業を行えばいいのでしょうか?

499 名前:132人目の素数さん [04/05/05 00:36]
search.auctions.yahoo.co.jp/jp/search/auc?p=%C5%FD%B7%D7&auccat=0&alocale=0jp&acc=jp
統計の本



500 名前:132人目の素数さん [04/05/06 07:51]
数学、統計の素人です。教えてください。
URLと本文の一部を以下にコピーしました。
最後の行に拡張係数と言う表があります。過誤採択リスク1%のとき1.9というやつです。
過誤採択リスクから拡張係数を計算で導くにはどんな計算式になるんでしょうか?
計算式がそうなる理由も要約的でかまいませんので教えてください

home.att.ne.jp/sea/tkn/operations/Operations-Stats.htm#変数サンプリング
(5)標本サイズの調整
仮定0%の誤表示率に基づく公式により標本サイズを決定しているので、誤表示発見の事実に基づいて標本サイズをは増加しなければなりません。
予期される誤表示がゼロではないときの修正されたサンプル数の公式は次の通りです。
AM = 予想誤表示
EF = 以下の表による拡張係数
  過誤採択のリスク
1% 5% 10% 15% 20%
拡張係数 1.9 1.6 1.5 1.4 1.3


501 名前:中川泰秀 [04/05/06 08:04]
牧浦健二先生は、関西学院大学時代に何年かけても、
この科目(統計学)だけは単位が取れなかったらしい。

502 名前:132人目の素数さん [04/05/06 23:36]
質問です。

B ~B
A 123456 223456
~A 23 45

のような要因Aを持っているグループと持っていないグループのサイズが違う
分割表をX二乗検定やフィッシャーの正確な検定をしても不具合はないでしょうか?

503 名前:  [04/05/06 23:39]
いま、2つの互いに独立な正規母集団N(μ1、(σ1)^2)、N’(μ2、(σ2)^2)から大きさがそれぞれN1、N2の互いに独立なサンプルをとる。
(a)仮説H0:μ1=μ2を仮説H1:μ1≠μ2に対し有意水準αで検定する手続きを述べよ
(b)N1+N2=Nのとき、この検定の検出力(H1が真のときH1と判定する確率)が最大となるようなN1,N2を求めよ。ただし、N1、N2は連続値をとるものとしてよい。

検出力の式の出し方がわかりません。お願いします。


504 名前:132人目の素数さん [04/05/08 20:20]
経験分布関数とはなんでしょうか?ベイズと関係があったりするのでしょうか・・・・

505 名前:132人目の素数さん mailto:sage [04/05/09 03:42]
>502
同総数で同程度に割り振ってある場合と比べると、検出力が下がる
ので、調べるときは、同程度に割り振ってある方が効率的
でも、総数が少ないよりはいい。効率は悪いが数で勝負みたいな

506 名前:132人目の素数さん mailto:sage [04/05/09 04:12]
>503
多分、σ1、σ2が既知だとして、話をすると、
平均差の推定量δ^=X~-Y~
帰無仮説の下で、δ^〜N(0,σ1^2/N1+σ2^2/N2)
よって、棄却域は{|δ^|>δ(α)}
対立仮説の下で、δ^〜N(μ1-μ2,σ1^2/N1+σ2^2/N2)
検出力はPr{|δ^|>δ(α)}
ということは、|μ1-μ2|がσ1^2/N1+σ2^2/N2に対して大きい方が検出力が高い
てことは、σ1^2/N1+σ2^2/N2を最小にすればよい。あとは、相加相乗平均

507 名前:132人目の素数さん mailto:sage [04/05/09 04:26]
>504
経験分布関数は、標本から作った分布関数
普通の分布関数は、理論から作った分布関数

コインを1000 回振って表は1裏は2を記録するという実験を行った結果
Xi 度数 相対度数 経験分布関数F(Xi)
1 457 457/1000 457/1000
2 543 543/1000 (457+543)/1000
Xi 確率 分布関数F(Xi)
1 1/2 1/2
2 1/2 1/2+1/2

508 名前:132人目の素数さん mailto:sage [04/05/09 21:27]
丁寧なレスありがとうございました。

509 名前:132人目の素数さん [04/05/13 00:59]
主成分分析の欠点について論述せよという課題で困っています。
どなたかうまく説明できないでしょうか?

初めて統計を学び始めたばかりでよくわかりませんでした。
よろしくお願いします。



510 名前:132人目の素数さん mailto:sage [04/05/13 01:37]
ランダムウォークの次の一歩って予測可能?

511 名前:132人目の素数さん [04/05/13 03:25]
>>510

あなたが言ってる予測可能の定義とは?
「ランダム」ウォークですよ。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<314KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef