統計学なんでもスレッド6
at MATH
1:132人目の素数さん
07/01/27 03:31:38
前スレ
統計学なんでもスレッド5
スレリンク(math板)
統計学なんでもスレッド4
スレリンク(math板)
統計学なんでもスレッド3
スレリンク(math板)
統計学なんでもスレッド2
スレリンク(math板)
統計学なんでもスレッド
スレリンク(math板)
関連スレ
= 統計解析フリーソフト R =
スレリンク(math板)
2:にょにょ ◆yxpks8XH5Y
07/01/27 09:23:35
今だ!2ゲットォォォォ!!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
∩ ∩
〜| ∪ | (´´
ヘノ ノ (´⌒(´
((つ ノ⊃≡≡≡(´⌒;;;≡≡≡
 ̄ ̄ ̄(´⌒(´⌒;;
ズズズズズ
3: ◆TuTO3UJe2Y
07/01/27 14:15:57
新スレでは答えます
4:132人目の素数さん
07/01/27 16:28:28
くんまー拡大!
5:132人目の素数さん
07/01/27 21:03:43
レポートで回帰分析の結果書くんだけど回帰分析にも帰無仮説ってあるの?
あれば書いた方がいいですか?
6: ◆TuTO3UJe2Y
07/01/27 21:53:16
>>5
場合による
あれば勿論書いた方がいいっていうか書かなきゃダメ
7:132人目の素数さん
07/01/28 05:47:59
【統計を】理系に多い血液型は何??【取ろう】
スレリンク(rikei板)
◆統計学について語るスレ
スレリンク(sim板)
【製薬企業】 ☆統計解析スレッド其の壱☆ 【CRO】
スレリンク(doctor板)
= 統計解析フリーソフト R 【第2章】 =
スレリンク(math板)
【●】 文部科学省 統計数理研究所 part2
スレリンク(math板)
統計ソフト統合スレッド−SPSS・SAS以外
スレリンク(psycho板)
心理統計スレッド3
スレリンク(psycho板)
統計学
スレリンク(sociology板)
8:132人目の素数さん
07/01/28 05:49:05
えらそうな住人〜経済学的統計と解析〜社会学板
スレリンク(sociology板)
なんで統計学者って経済学部出身者が多いの?
スレリンク(economics板)
統計・計量分析で一番使われてるソフトは?
スレリンク(economics板)
経済学で使う統計学スレッド
スレリンク(economics板)
統計・解析ソフトについて
スレリンク(bsoft板)
Data Mining (データマイニング) part 1
スレリンク(sim板)
【金鉱脈】データマイニングのスレ【発見】
スレリンク(linux板)
☆統計学が出来ないマーケティング学者☆
スレリンク(manage板)
9:132人目の素数さん
07/01/29 22:57:45
VARモデルについて、わかりやすく解説してある本などご存知でしたら教えていただけないですか?
10:132人目の素数さん
07/02/01 11:17:47
レポートの提出期限が過ぎたからか、静かだな…
11:132人目の素数さん
07/02/02 13:57:37
よく文章にでてくる
~ ind
の ind ってどんな意味?
Y(i) ~ ind Poisson(mu(i))みたいな
12:132人目の素数さん
07/02/02 15:25:03
independently
independently
identically
distributed
も
i.i.d.
と略して使うよ。
13:132人目の素数さん
07/02/02 15:56:54
independently了解です。助かります。
independent か induction かなーとか勝手におもってました。
14:132人目の素数さん
07/02/03 02:29:42
多変量T分布の分散と、
ウィシャート分布(多変量カイ2乗分布)の平均の求め方が載っている参考書か、
サイトしりませんか?
全くできません・・・
15:132人目の素数さん
07/02/03 03:19:54
統計学が科目としてある資格を教えてちょんまげ
16:132人目の素数さん
07/02/03 10:43:57
アクチュアリーとか統計士とか臭気判定士とかぐらいしか思いつかん。
公認会計士など選択に入っているのはまだまだあるやろな。
17:132人目の素数さん
07/02/04 01:11:29
離散型でも連続型でも、どんな分布だろうと、
確率分布関数は存在するけど
確率密度関数はあるとは限らない
これは正しいですか?
18:132人目の素数さん
07/02/04 01:31:45
正しいです。
19:132人目の素数さん
07/02/04 02:20:21
F分布で、F(m,n,α)=1/F(n,m,α)と本には書いてあるのに、F(m,n,α)=1/F(m,n,α)として例題は解いてます
どちらが正しいんですか?
20:132人目の素数さん
07/02/04 06:25:25
>>19
正しいのはF(m,n,α) = 1/F(n,m,1-α)
密度関数を適当に変数変換すれば簡単に証明できるよ
21:19
07/02/05 03:16:17
>>20
THANX
22:132人目の素数さん
07/02/07 15:28:51
最小二乗法の重みづけの計算方法がどうしてもわかりません
URLリンク(homepage3.nifty.com)
上のサイトに詳しく説明が書かれているのですが、計算部分がどうしてもうまくいきません。
ソフトを使った結果と全く違う結果になってしまいます。
問題は単純に(x,y)のデータ群があってこれに対応するy=ax+bの係数を導きたいです。
23:132人目の素数さん
07/02/07 21:58:27
丁寧ねえ……。思うとだろうとかはずとかが目立つページですな。
> 全体を通じて乱文となってしまいましたので、不明の点、不適切な表現等
> ございましたら 掲示版又はメールにてお知らせください。
って書いてあるんだから著者に尋ねたら?
24:132人目の素数さん
07/02/08 11:37:28
>>22
そのサイトの公式間違ってない?
記号の定義を俺が勘違いしたのかもしれないけど
書いてある通りに計算するとxの3次の項が出てくるんだが…
回帰式を y_{i} = ax_{i}+bとして、二乗誤差
f = \sum_{i=1}^{n} (y_{i} - ax_{i}-b)^{2}
の最小化を考える
これをa,bで偏微分して0とおくと
df/da = \sum_{i=1}^{n} -x_{i} * 2(y_{i} - ax_{i}-b) = 0
df/db = \sum_{i=1}^{n} -2(y_{i} - ax_{i}-b) = 0
となるから、これをa,bについて解く
すると
a = S_{xy} / S_{x}
b = \bar{y} - a\bar{x}
となる。
ただし、\bar{x},\bar{y}はそれぞれx,yの平均
S_{x}はxの分散、S_{xy}はxとyの共分散である。
こんな感じか?TeX使えないと数式書くの面倒だな
25:132人目の素数さん
07/02/08 18:40:49
はじめまして。生物板から来ました。
あっちの板でちょっとお祭りになっています。
前スレスレリンク(life板:179-番)
今スレスレリンク(life板)
最近世間をにぎわした灯台工学研究科の捏造事件がありましたが、実は2ちゃんではあの事件と同じぐらいの有名な捏造疑惑が知られていました。
この捏造王子が当時いつお縄になるかとみなワクテカしてたけど、長く海外逃亡していて忘れちゃってました。
ところが最近この捏造王子がテニュアトラック教員として帰国することになり、お祭りになったという次第です。
現在、この捏造王子の過去の仕事のあやしさを住人たちが検証している最中といったところです。
そこでそのあやしいデータのひとつとして以下のページにでてくるグラフが話題になっています。
URLリンク(www.brain.riken.go.jp)
培養した細胞に3種類のタンパク質を組み合わせを作って導入しその効果を見たというものです。
ところがこのグラフが我々ナマモノ屋から見てきれい過ぎるのです。
特に5%程度の差が矛盾なく観察されるためには膨大な観察数が必要だと考えます。
ただ生データが示されておらず、簡単な検証方法を思いつきません。
そこでこのスレの専門家の方にひとつご助力を賜りに参りました。
どうかよろしくお願い申し上げます。mOm
参考レススレリンク(life板:50番)
長文陳謝 orz
26:132人目の素数さん
07/02/08 21:00:08
この↑問題、なにとぞ統計スレの先生方のお力をお貸しくださいOrz
このままでは日本は捏造大国になってしまいます。
27:132人目の素数さん
07/02/08 22:44:25
ローリング相関ってなんですか?
28:132人目の素数さん
07/02/08 23:06:07
データの捏造方法
1 べつのサンプルのデータにするかえる
2 自分で数字をいじる
3 統計資料から拝借してラベルを付け替える
29:132人目の素数さん
07/02/08 23:23:29
>>28
すいませんがよくわからないのでもう少し具体的に説明していただけませんか?
30:132人目の素数さん
07/02/08 23:27:42
>>29
いや>>28さんは質問してるんじゃない?
捏造王子は間違いなく2をやってます。
何とか検証する方法は無いでしょうか?
31:132人目の素数さん
07/02/08 23:45:19
出現する数字の分布が正規分布でない
32:132人目の素数さん
07/02/08 23:52:12
データの中に自分のサインを残している
33:132人目の素数さん
07/02/09 00:00:47
>>25
データ数が分からないことには何とでも言えそう。
回帰分析でそれぞれの効果を推定するときれいに出るが、
それを仮に真値としたとき偶然このデータが得られる確率は
データ数に依存します。最も無理のない結果のための
データ数は各群350ぐらいと出ました。
(そのときの確率は0.11ぐらい。当てはまり過ぎと言われない確率0.05を
超えるのは大体データ数150以上が必要です。)
細胞のデータと言うことですからこのぐらいの数は取っているのでは?
34:132人目の素数さん
07/02/09 00:20:21
>>33
ありがとうございます。
データ数を何に相当すると考えるかで少し違いますが、通常は培養皿ごとに計数して、
複数の培養皿からの数値で平均を取って検定します。
つまりデータ数は培養皿数に相当すると考えられます。
そして150も350もほぼ不可能な培養皿の数(通常は多くて10)です!!
35:132人目の素数さん
07/02/09 00:51:57
統計量Sn、Tnは漸近的に同値であり、また、Snは分布関数Fに分布収束するとする。
このときTnもFに分布収束する。
という命題を証明したいのですが、糸口がつかめません。
どなたかヒントだけでもいいので教えていただけませんでしょうか?
36:132人目の素数さん
07/02/09 00:53:44
>>28,>>31-33
皆様さきほどは急いでいて御礼が不充分で申し訳ありませんでした。本当に感謝しております。m0m
現在、頂いた回答を向こうのスレに貼って、向こうで実験系に詳しい人たちとの議論待ちです。
その結果また何か分からないことや私の事実誤認があったらお手数をおかけして恐縮ですが
再度ご相談に参ります。よろしくお願いいたします。
37:132人目の素数さん
07/02/09 01:17:27
>>34
また見に来るだろうから書いておくが、そんなに少ないならこんな感じ。
各群10個:p=0.00005530468
各群20個:p=0.0004044062
各群30個:p=0.001247549
各群40個:p=0.002702961
各群50個:p=0.004825427
もちろん推定された効果通りにきれいな真値であるわけではない可能性も
あるので上記のp値の計算は額面通りには受け取れません。
ただし、交互作用まで分散分析をかけると各効果はp=0.05ぐらいで
効いているのに対して交互作用はどれもp=0.2ぐらいできれいに
効いていないと出るので線形性は抜群なのですけどね。
38:132人目の素数さん
07/02/09 01:21:58
>>37
自己レス。
培養皿の効果が0, 1ならその通りなのだが、
それをある程度の細かさで分類しているならデータ数は培養皿数とは
言えないだろう。皿が10個としてその程度が1/15区切りでつけられるのなら
ぎりぎりOKとなるかな。
39:132人目の素数さん
07/02/09 05:44:51
>>35
xをTnの連続点とすし、εを任意の整数とする。
Pr{Tn<=x}=Pr{Tn<=x, |Sn-Tn|<ε}+Pr{Tn<=x, |Sn-Tn|>=ε}
40:35
07/02/09 08:37:20
>>39
ありがとうございます。
それを参考にして考えてみます。
41:132人目の素数さん
07/02/09 21:15:02
>>33,37
自己レス。
計算を間違ってた。_| ̄|○
n=350のときのp値は0.385だった。0.5までいくにはn=400ぐらい必要。
0.05を超えるのはn=150過ぎだが、小さいときの表は次のように修正。
各群10個:p=0.000002530724
各群20個:p=0.00003769463
各群30個:p=0.0001776871
各群40個:p=0.000523022
各群50個:p=0.001189512
結局一つの皿でどのぐらいの精度の結果を得ているか次第です。
10個だとやはり5%刻みぐらいのデータが得られていないと
だめでしょう。
42:132人目の素数さん
07/02/09 21:36:35
SPSSやJMPを使った集統計が三度の飯の次くらいに好きなんだが、
こんなオイラを雇ってくれる奇特な研究室はないかな。
43:132人目の素数さん
07/02/09 22:03:29
>>42
おしい!三度のメシより、だったら家で雇ったのに。
あとRな。
44:132人目の素数さん
07/02/10 22:31:00
集統計屋さん、うちの研究室にはいるよ@年収600マン・ポスドク・野心なしの主婦。
さくさくやってくれるんで、ボス以下全員すごく助かってる。
売り込んでみたら?
45:132人目の素数さん
07/02/10 23:22:31
>>41
統計スレの神
本当にありがとうございます。みな深く感謝しています。
ちょっと若干1名場外乱闘で粘着があり、とばっちりで不快な思いをさ
せたかも知れず申し訳ありません。
向こうはダミーで、こちらに書き込みさせてください。
ご指摘の件はもういちど良く考えて見ます。捏造王子たちが適当に
直線を引いた可能性が高くなってきたと思っています。
もひとつ質問なのですが、捏造王子たちはこのグラフの隣り合う区画
同士の平均値の差が統計的に有為である、としているようです。これ
はt検定ですが、この隣り合う二群間での平均値の差の検定に必要な
サンプル数を彼らは満たせているでしょうか?
誤解があったら申し訳ありません。
よろしくお願いします。
46:132人目の素数さん
07/02/10 23:23:55
葛西そこそこでヴィドはヴィドったwww
47:46
07/02/10 23:24:42
すいません、誤爆しました
48:132人目の素数さん
07/02/11 00:34:07
>>45
せっかく作ったのでこちらに載せときます。
乱数で見るデータの例です。
1500個を150個ずつ群にまとめた場合
0.427 0.387 0.367 0.433 0.420 0.380 0.380 0.393 0.360 0.313
300個を30個ずつ群にまとめた場合
0.633 0.500 0.333 0.367 0.567 0.467 0.467 0.300 0.333 0.367
もしデータが入手できて各群300個ぐらいしかないのに挙動が1500個のときと
同じ程度なら(そうでないと棄却はできないはず)
二項分布の方に疑いが行きます。
49:132人目の素数さん
07/02/11 05:46:32
国立医学部一年の般教で統計やってます
圧倒的に意味が不明
母比率とか意味不明
なんで偏差平方和をnで割ったら分散じゃないの?
50:132人目の素数さん
07/02/11 11:00:42
それじゃ一昔前の高卒にも劣るよ
51:132人目の素数さん
07/02/11 12:52:52
>>50
だって授業なんて聞いてないし笑
説明ヨロ☆
52:132人目の素数さん
07/02/11 13:35:14
>>51
聞いてなくても本読めばわかるだろ笑
53:132人目の素数さん
07/02/11 14:02:02
>>52
大学の過去問しかない…笑
54:132人目の素数さん
07/02/11 14:24:29
>>49
授業で使ってる教科書に書いてあるんじゃね?
宿題の答え聞かれてる気がするからあまり詳しく答えたくないけど…
nでなくn-1で割るのは推定値の不偏性(推定値の平均が真の値になるという性質)を満たすため
偏差平方和の平均値出してみな
55:132人目の素数さん
07/02/11 14:39:25
URLリンク(phi.ypu.jp)
56:132人目の素数さん
07/02/11 15:12:14
>>54
ありがとう!
教科書はないんだ。
授業中にもらうしょぼいプリントだけ。当然どっかいった笑
宿題じゃなくて後期試験の科目なんだよね
友達からプリント借りて調べてみよう。
統計を勉強する上でコツみたいなの教えてください笑
57:132人目の素数さん
07/02/11 20:19:44
平均と期待値の違いってなんですか?
58:132人目の素数さん
07/02/11 23:03:43
完備十分統計量は最小十分統計量であるということを証明したいんですが、なかなか証明ができません。
証明の道筋をどなたか教えてください。
59:質問です。
07/02/15 19:57:02
>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。
>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。
(Wikipedia項目リンク)より転載。
ということは、スロットマシンの腕がどんなに良い人でも、控除率を3%〜15%より下げるのは無理だということですか?
また、ヘタクソな人がやれば、控除率は3%〜15%よりかなり上がるということでしょうか?
あと基本的な質問ですが、控除率が2%のギャンブルというのは、簡単に言えば
100円を元手に無限回挑戦し続けると、元手が98円に減るということですか?
60:132人目の素数さん
07/02/16 00:30:33
>>59
控除率が正のものを無限回やったら破産しますがな。w
61:132人目の素数さん
07/02/16 00:34:01
人が無限回できることって無限小の距離を移動することとかですか
62:質問です。
07/02/16 20:45:00
>>60
どうも根本的なところを勘違いしていたようですね。
ではこういうことでしょうか?
控除率が2%のギャンブルを一回やると、当然、元手が増える人も減る人もいるが、
参加した全員の平均をとってみると、元手の98%に減ったという結果になるということですか?
また、控除率が2%のギャンブルというのは、参加した全員の掛けた金の合計の2%が確実に親のポッポに入るということでいいの
でしょうか?
また変な勘違いをしていたら教えてください。
63:132人目の素数さん
07/02/16 21:18:32
>>62
手数料という表現からすると概ねそれでよいのでしょう。
ただし、なんらかの必要経費が生じるものだとそれがそのまま利益という
訳ではないのでしょうが。
64:132人目の素数さん
07/02/16 21:31:29
文鳥が好きで煙草を吸わない30代独身男性は、
日本国内に何人くらいいると考えられますか?
65:質問です。
07/02/18 11:55:27
>>63
レスありがとうございます。
だいたい分かりかけてきました。最後の質問にしたいと思いますが、
>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。
>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。
(Wikipedia項目リンク)より転載。
”プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
ミスのない完全なプレーを行うことを前提とする。 ”
と、いうことは、スロットの腕がどんなに良い人でも控除率を3%以下に下げるのは不可能であり、
素人がやると、もちろん控除率は腕の良い人より上がるということでしょうか?
66:132人目の素数さん
07/02/18 21:17:26
>>65
まだ勘違いしてますよ。
控除率はどのプレーヤーに対しても一律で貸せられる場所代や税金のようなものです。
どんなに上手にプレーをしても、控除率は変わりません。
ただ、上手にプレーすれば、下手くそにプレーするよりも、最終的に手元に残る金額は多くなりますが。しかしこれは控除率とは何ら関係のないものです。
67:132人目の素数さん
07/02/20 16:08:47
統計学って
ある確率が1%以下であるなら、それは絶対におかしいと決めるような学問なの?
68:132人目の素数さん
07/02/20 16:54:05
ベータ分布のパーセント点を求める近似式をcで作らなきゃいかんのだが
どうやるんだ?
69:132人目の素数さん
07/02/20 21:01:57
>>68
数値計算のアルゴリズム本(e.g. 奥村さんのアルゴリズム事典
URLリンク(oku.edu.mie-u.ac.jp))を探すか、
フリーの有り物(e.g. dcdflib.c)を使う。
70:132人目の素数さん
07/02/20 22:24:04
分らない問題スレで核心にせまるレスが付かなかったため、
統計スレの皆様、お力添えくださいm(_ _)m
■問題
A君とB君は互いに相手よりもテニスが強いと言い張ります。
そこで、10試合をして勝敗によりどちらのほうが強いか決めようということになりました。
統計学的に有意に強いと認められるには、どちらかが何勝すれば良いでしょうか。
ただし、引き分けは無いものとする。
■自分で考えた答え(合っていますか?)
A君とB君の勝敗の組み合わせ数は2^10=1024通り
10試合のうちA君が8勝する組み合わせ数は10!/(8!2!)=45通り
10試合のうちA君が9勝する組み合わせ数は10!/(9!1!)=10通り
10試合のうちA君が10勝する組み合わせ数は10!/(10!0!)=1通り
従ってA君とB君が互角と仮定すると
A君が8勝以上する確率は(45+10+1)/1024≒0.055
A君が9勝以上する確率は(10+1)/1024≒0.011
統計学的に有意に強いと認められるには、互角となりうる危険率を5%以下にする必要があるから 9勝以上しないといけない。
この解答は合っていますか?
71:132人目の素数さん
07/02/20 22:36:56
>>69
ありがとう。やっぱり不完全ベータ関数を計算してニュートンで求めるしかないのかな?
72:132人目の素数さん
07/02/20 23:08:18
>>71
Handbook of Mathematical functions には近似式載ってる。
けど、精度書いてない。
dcdflib.c の cdfbet() は、逆分布関数も計算できる。
73:132人目の素数さん
07/02/20 23:38:15
統計超・超初心者のとっちょです。
ある生産工程の不良率(良品率)を調査するために製品を10個抜き取り、寸法を
測定しました。結果は以下の通りです(単位:mm)。
2,2,2,2,2,3,3,3,4,5 平均:2.8 標準偏差:1.0
製品規格は下限規格のみで1mm以上です。上限規格はありません。
分布の形状は右側(値の大きい)に裾野の広い分布であり、工程の設備能力からも
合点のいくところで、偏ったサンプリングをしているとは考えにくいです。
こんな分布をしている場合の工程不良率を算出しようとした場合、どのように算出
したら良いのでしょうか?当HPのポアソン分布等を拝見したのですが、初心者の私
には、ポアソン分布を使って良いものか否か分からない状況です。
こんな私にご教授頂ければ幸いです。よろしくお願いします。
74:132人目の素数さん
07/02/20 23:50:26
>>72
サンクス。これはつかえそう!
75:132人目の素数さん
07/02/22 20:59:46
>>73
ポアソン分布はサッカーの得点みたく離散型データの場合。
その場合は、測定精度が粗くて値の種類が少ないから、
データの相対度数分布をそのまま確率分布(の推定値)として使うのが吉。
つまり理論分布なんぞイラネ。
76:132人目の素数さん
07/02/22 21:38:27
いきなりすいません。必死で探してるんですが正確度の計算方法が
わかりません。
今まで人の目で数えていたものを機械で数えようとしています。
人の目で数えたものと機械で数えた数字の正確さを表す数値として
正確度というのがあるのことまではこぎつけたのですが、その計算式が
わかりません。
どなたか教えていただけませんか?
77:132人目の素数さん
07/02/23 05:01:21
すいません。統計学初学者です。
正規分布の加法性でわからないことがございます。
1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2)
2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2)
正規分布を足しても引いても、
平均はそれぞれ、足されるあるいは引かれますが、
なぜ、分散だけはどちらも足されるのでしょうか?
分散は引くことは出来ないものなのでしょうか?
よろしくお願いいたします。
78:132人目の素数さん
07/02/23 11:42:23
>>76
統計学全体で通じる「正確度」なんてありません。応用している各分野で
系統誤差を使いやすいように数値化しています。例えば、測定値の平均を
から実際の値を引いたものなどを使います。
関係している工学の人に「正確度」「精密度」についてきいてください。
79:132人目の素数さん
07/02/23 11:59:52
>>77
式のイメージではなく、分散とはどういう数かをまず考えてみてください。
2つの正規分布は無相関なので、定義にしたがって分散を計算すると和に
なります。
2つの確率変数の間に相関があれば、分散は和にはなりません。例えば、
極端な場合で u2 = - u1 という関係があるとすると、分散は 0 になっ
てしまいます。この場合でも、分散を引いている訳ではありません。
教科書で「共分散」というのを調べてみてください。
80:77
07/02/24 05:20:39
>>79
ありがとうございました。
共分散勉強します。
81:132人目の素数さん
07/02/27 18:54:14
院に行って統計勉強する場合どこがおすすめ?学部は早慶です。
82:132人目の素数さん
07/02/28 18:15:46
>>81
やりたい専門決めている?
それに合った教員が居るところにすれば…
無ければ、そのまま上に行った方がいいかもね。
83:132人目の素数さん
07/03/04 19:27:17
お前ら、Zipの法則について語れ
84:132人目の素数さん
07/03/04 20:00:47
zipか、なつかしいなあ。100MBでも文書ファイルだけなら充分大容量だったのだが。
Zipf?
それは語れない。
85:83
07/03/05 13:39:43
>>84
細かいこと気にする奴だなwまぁ、いいさ。
で、俺は勉強中なんだけど、世界の人口や日本の人口で試してみた
(計算はExcelね)。
興味深い結果が得られているけど、面倒くさいので報告しない。
まずは計算して見れ〜
86:132人目の素数さん
07/03/05 16:07:27
>>85
あれは経験則ではないの?
ビジネス書なんかによくある80-20の法則なんかと同類の話ではないの?
87:83
07/03/05 17:04:06
>>86
よくわからん。俺は単にExcelで計算して遊んでいるだけ(笑
88:よろしく。
07/03/06 04:34:29
ベイズの定理の重要性について、
できましたら、短文にてご説明願えたらと思います。
89:132人目の素数さん
07/03/06 09:56:24
,,,--─===─ヽ/へ
/iiiiiiiiiiiiii彡≡≡≡|≡ヾ ヽ
iiiiiiiiiiiiiiiiiii彡≡≡≡≡|≡ミミヾ丶
iiiiiiiiiiiiiiiiiiii/ ̄ ̄ ̄ ̄ ̄ ̄\ミiiiiiヽ
iiiiiiiiiiiiiiiiii/ \iiiiiiiゞ
iiiiiiiiiiii/ \iiヽ
iiiiiiiiiiiiiii《 ━━'/ ヽ━━ ヽミヽ
...iiiiiiiiii彡/ __,.:: :: __ ヽiiiii|
..iiiiiiiiiiiii》| ::: |iiiii|
iiiiiiiiiiiiiiii|, |iii|
..iiiiiiiiiiiiiiiiii, ( ● ● ) .|iiii|
iiiiiiiiiiiiiiiiiiiiiii 》━━《 |iiiii| Bayesなんて、プッ
iiiiiiiiiiiiiii《《《ヽ 》 / ̄ ̄\ 《 |iiiiiiii|
iiiiiiiii《《《《《《《《 《《 \ ̄ ̄/ 》》 |iiiiiiiiiii|
iiiiiiiiiiii《《《《《《《《《《《 》》  ̄ ̄ 《《 》》》》》iiiii|
iiiiiiiiii《《《《《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》iii|
iiiiiiiiiiiiiii巛巛巛巛巛巛巛巛巛》》》》》》》》》》》》》》IIII
iiiiiiiiiiiiiiiiiiiiii巛巛巛巛巛巛巛巛》》》》》》》》》》》》iiiiiii
90:132人目の素数さん
07/03/06 14:57:51
>>86
ランダムネットワークを仮定すると、ネットワーク上の簡単な値が
Zipf分布に従うことが理論的に証明されている。
ただ、とてもランダムネットワークとは思えないようなものや、
複雑な値についてもZipfの法則が成立するのは興味深いところ。
くりこみみたいな手法でなんか議論できないかなあとは思ってる。
91:132人目の素数さん
07/03/06 16:25:48
cross-validation法は、残差を用いた推定より、
どういった点で優れているのでしょうか?
92:132人目の素数さん
07/03/07 15:10:54
お願いします!
1、800人の学生のうち、622人がカメラ付き携帯電話を所持していました。
この結果から実際に全学生中75%以上の学生がカメラ付き携帯を所持しているという仮説を
有意水準0.05で検定せよ。
2、次の値は、48年と88年における小1身長のデータから計算されたものである。等分散が仮定できるものとして、
2群の母平均に差があるかいなかを有意水準0.05で検定せよ。
48年→ データ数30、標本平均108、標本分散15
88年→ データ数30、標本平均117、標本分散21
計算途中の結果付きで回答してもらえると嬉しいです。
93:132人目の素数さん
07/03/07 15:16:29
>>92はマルチ
だいたい数字が違うだけの同じ練習問題が普通に載ってると思うが。
94:132人目の素数さん
07/03/07 15:21:20
今時分にレポート提出の大学もあるんだね。
95:132人目の素数さん
07/03/08 15:55:17
今日成績を受け取りに言ったのですが、
卒業するのに単位がどうしてもあと1教科分2単位必要なのです。
3月中にレポートでもなんでもします。
単位を取得させてもらえないでしょうか。
ご検討のほど、どうかよろしくおねがいします。
96:132人目の素数さん
07/03/08 16:36:09
最近では、レポートの主要部分をネットからのコピペした場合、
不正行為とみなすところが増えている。不正行為の場合、その
期の全単位消失といった処分が多いはず。
だから、ここに答えを書くと卒業がより遠くなって、かわいそ
うなので、みんな書いちゃだめだよ。
ということで、教科書をよく読んで、自力でがんばってね。
97:132人目の素数さん :
07/03/08 17:50:20
基本的な質問かと思いますが、本などに解説がないのでお聞きしたいです。
尺度水準の説明で、名義尺度は名前や職業など任意に割り振られたデータで
和を計算したり平均を出しても意味がないとの説明が多いのですが、
例えば携帯のアンケート調査で、機種を選ぶ際に重視した機能をひとつお選びください
で、1.ディスプレイの大きさ 2.カメラの画素数 3.文字変換機能 4.セキュリティ機能
5.その他 があり、その結果、1が40%、2が25%、3が20%、4が10%、その他が5%
という結果となった場合、選択肢は名義尺度なので、解釈時に
ユーザが機種選びに重視した項目の順位は1位ディスプレイ、2位カメラの画素数といった
表現やディスプレイの大きさは文字変換機能の2倍重視されている、といった
表現が間違いということになるのでしょうか?
どなたかご教授ください
98:132人目の素数さん
07/03/08 18:49:31
>>97
平均を求めるとはその例だと
1*0.4+2*0.25+3*0.2+4*0.1+5*0.05=2.15
と計算し、カメラの画素数と文字機能変換の
間辺りを重視していますというようなとんちんかんなことを
することです。
単なる順位付けや比較は名義尺度で行っても全然
問題ありません。
99:132人目の素数さん
07/03/08 22:10:43
経済分析のための統計的方法 岩田 暁一
と
確率・統計入門 小針 あき宏
ってどっちがいいですか?
100:132人目の素数さん
07/03/08 22:33:35
>>99
まず、目的を書いてくれ。教科書としてのタイプがちがうから、
答えようがない。
101:132人目の素数さん
07/03/08 23:01:18
経済学部です。それを考えると最初のがいいんですけど、
ファイナンスやりたくて数学の勉強もしてるから、下のほうがいいのかぁと
102:132人目の素数さん
07/03/09 10:02:39
両方やるってどうだろう。とりあえず最初に少しぐらい
分からなくてもいいやって方針で小針ワールドを味合って
から、岩田でゴチゴチと。
103:132人目の素数さん :
07/03/09 17:21:51
>>98
ご回答ありがとうございます。
胸のつかえが取れました。
104:132人目の素数さん
07/03/11 21:48:04
369
105:132人目の素数さん
07/03/12 19:08:45
変数xおよびyが
それぞれ平均値30および20、
標準偏差が10および6、をもつ確率変数である場合、
x=x+2y の標準偏差を求めよ。ただし、xとyの相関係数は0とする。
ってあるんだが、どう解いていけばいいかわからねぇ・・・
解く方向性だけ教えてくれ。
106:132人目の素数さん
07/03/13 02:51:57
x,yの相関係数は0ってことはx,yは独立ってこと。
だから、確率変数の和の分散を求めるにはそれぞれの分散を足せば出る。
それぞれの分散は平均値と標準偏差から出る(2yの方は係数が絡むことをお忘れなく)。
x+2yの分散が得られたらあとはそれを元に求める標準偏差を計算すればよい。
107:132人目の素数さん
07/03/13 09:58:33
>>106
相関係数0だからって独立とは限らんのだが…。
計算上は独立であることは使わないので同じになるけど。
108:132人目の素数さん
07/03/14 02:00:44
>x=x+2y の標準偏差を求めよ。
両辺から x を引き
0 = 2y
両辺を 2 で割ると
y = 0
故に、確率変数 y が 0 の時の標準偏差を求めれば良い。
y の値としてゼロのみを考える条件付き分布問題だから、、、
Ans, 標準偏差ゼロ
109:105
07/03/14 13:15:43
そう解くだったんだ。教科書見てもわからなかったから悶えてたw
Thanks!
110:132人目の素数さん
07/03/14 19:49:31
マジで信じたんかよ。w
111:132人目の素数さん
07/03/19 22:13:22
誤差と残差の違いって何ですか?
112:132人目の素数さん
07/03/20 12:59:29
残差(residual)は、測定値と推定値の差で、説明できない残り。
誤差(error)は、真の値と推定値や測定値の差が本来なのだけど、
真の値なんか分からないから統計使うので、
(とりあえず値)±(統計誤差)の範囲に真の値が入る確率が95%に
なるように計算した「統計誤差」か、「とりあえずの値の標準
偏差」かどちらかを言うことが多い。
113:132人目の素数さん
07/03/24 08:02:50
別スレ
スレリンク(math板)
で、
統計学=Kolmogorovの確率論+Fisherの最尤法
と言い切っているんですが、これって普通ですか?
そうでないなら、別の言い方ってありますか?
114:KingOfUniverse ◇667la1PjK2 ◆OYFsVKEYdw
07/03/24 08:08:45
ないね。
115:132人目の素数さん
07/03/24 09:39:17
>>113
そんな単純でないのは確かだな。多変量解析は別と言っている時点で
今の統計学の半分は捨ててるし。
また、少なくとも「Neyman, Pearsonの基準」がないと検定ができない。
116:132人目の素数さん
07/03/24 09:56:13
>>113
無理は承知で一言で答えよ。
と言うことならば、「なるほど」と思う。
対案を言えと言われれば困るので。
117:132人目の素数さん
07/03/24 14:20:39
>>115
すまんが、良く分からん。もう少しkwsk。
118:132人目の素数さん
07/03/24 17:22:09
>>117
Wikipediaの「ネイマン・ピアソンの補題」を見よ。
119:132人目の素数さん
07/03/25 05:19:14
>>115 「Neyman, Pearsonの基準」がないと検定ができない? 最尤比検定
>>113
オレなら
統計学=Fisherの最尤法 + 回帰分析
これなら
ニュートン力学=慣性系 + 「f=ma」 +作用反作用
と比較できる。
統計学に「Kolmogorovの確率論」 を加えるのは、
ニュートン力学に「微分方程式論」を加えるのと同じで、不要。
120:132人目の素数さん
07/03/25 11:03:12
>>115
Neyman-Pearson は単なる補題だしこれを統計学の前提条件のように
扱うのはおかしいのでは?Uniformly Most Powerful test(一様最強力
検定)を最良のテストとみなしていること自体は、前提条件と言えない
こともない。もっとも、Decision theoryの一般的な枠組みを統計学の
基礎と考えた方がすっきりするように思う。
Kolmogorovは、統計学の数学的基礎として必要だろう。少なくとも
収束概念を数学的に扱うためには必要。Fisherの最尤法は、確かに
統計学の非常に多くの場所で使われているのは事実だが、あくまで
それは統計学の一部分であって、最尤法なしに統計学が全く成り立
たないわけではないのではない。
121:132人目の素数さん
07/03/25 11:05:14
>>14
了解です。
122:132人目の素数さん
07/03/25 12:54:52
>>113〜>>120
今のところ>>119に賛成するが、すこし勉強してから、その理由を言いたい。
「統計学の公理的アプローチ」
というような内容の本があれば、どなたか教えてくれませんか?
(物理のたいていの本は「法則」が最初に宣言されていて、公理的である)
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白い。
123:132人目の素数さん
07/03/25 13:03:48
いまのところ>>119に賛成だが、もうすこししっかり考えたい。
どなたか
「統計学の公理的アプローチ」
というような内容の本を知っているなら、教えてくれませんか?
(物理の本はたいていは「法則」が最初に宣言されていて、公理的といえる)
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白いと思う。
124:132人目の素数さん
07/03/25 13:05:50
122=123 誤操作で、すみません。
125:120
07/03/25 13:34:13
誤>>全く成り立たないわけではないのではない。
正>>全く成り立たないわけではない。
すまそ。
126:132人目の素数さん
07/03/25 15:28:36
>>119 最尤比検定 → 尤度比検定 スマソ
127:132人目の素数さん
07/03/25 23:00:45
初学者なんですが
回帰分析、分散分析、多変量解析について
理解しやすい本て何かありますか?
128:132人目の素数さん
07/03/25 23:58:14
この話題でこんなに盛り上がるとはな。
「Neyman, Pearsonの基準」をあげたのは検定の基礎だからで、
元の>>113の考えが純粋数学のように公理として必要なものを
あげる立場と考えたから。
統計学は記述統計と推測統計に分かれ、推測統計が推定と検定で
成り立っていることに異論はないだろう。その中で記述統計は
データの整理であり、公理といったものとなじまない。
そうすると推定の基礎が最尤法で、検定の基礎がネイマン・ピアソンと
するとなんとなくよさそうに思った。(尤度比検定でも実際棄却域をどう取るかは
それと無縁ではいられない。>>120の言うように広く言えばDecision theoryを
取り入れるべきということだ。)
>>119のような考えは公理としてではなく統計学の中心的な方法は何?
というコンセプトであろう。公理よりこの方がすっきりするように感じるのは
統計学がやはり応用数学だからなんだろうか。
129:132人目の素数さん
07/03/26 04:49:12
Decision theoryでは一般的すぎると思うが。
もうすこし具体的に、「Decision theory の中の○○」と言わなければ(ry
130:132人目の素数さん
07/03/26 11:02:20
同意
「Decision theoryの一般的な枠組み」=「統計学の一般的な枠組み」
じゃあ意味ないからね。
また、違うとしても
Decision theory= ○○ + △△
と答えないと、言葉のすり替えになってしうのでは?
131:132人目の素数さん
07/03/26 11:11:29
○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○
このレスをみたあなたは・・・3日から7日に
ラッキーなことが起きるでしょう。片思いの人と両思いになったり
成績や順位が上ったりetc...でもこのレスをコピペして別々のスレに
5個貼り付けてください。貼り付けなかったら今あなたが1番起きてほしくないことが起きてしまうでしょう。
コピペするかしないかはあなた次第...
○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○
132:132人目の素数さん
07/03/26 15:45:06
>>129, >>130
確かにそうだな。それでは、
統計学=Kolmogorovの確率論+リスクの最小化原理
では、どうだろう。
仮説検定に関しては、Neyman-Pearson Lemma がUMP test
がリスク最小化の十分条件であることから必然的に導けるし、
推定に関しては、不偏性、有効性に関しては直接的に定式化できる。
漸近的性質に関しても、リスクのsequenceを考えることでほぼ解決できるように思う。
(自分は、漸近正規性とかに関してそういう枠組みで考えたことはないけど。。。)
最尤法に関しても、推定値の近傍があるリスクを最小化する統計量として
位置づけられるのでは?
思いつきで書いてるので、どこまで正しいか分からん。
133:132人目の素数さん
07/03/27 01:04:00
>>132
すごいな。推定も検定も一緒に処理しようというわけか。
それだと多変量解析も範疇に入れられそうだ。
数学的にリスク最小化原理の一般化ができれば
統計学も公理系の上に乗っていると主張できるかな?
134:132人目の素数さん
07/03/27 06:01:20
>>132はノーベル賞だね。
135:132人目の素数さん
07/03/27 06:30:17
>>132
すげぇ〜。 Fisherの再来だぁ〜。
136:132人目の素数さん
07/03/27 08:31:20
統計学のパラダイムシフト
137:132人目の素数さん
07/03/27 18:45:36
>>132
統計学最大の問題(統計学の公理化)が2ちゃんねるで解かれるとは・・・
138:132人目の素数さん
07/03/28 03:24:33
>>132
リスク関数の決め方に恣意性が・・・
139:132
07/03/28 15:48:49
>>138
残るね。
ただ私が思ったのは、もうちょっとDecision Theoryの立場から
様々な統計学の手法をまとめれば、数学的にすっきりするし、
各手法の位置づけや関係が整理できるんじゃないかということ。
140:132人目の素数さん
07/03/28 22:49:03
>>139
同意
そんな本があったら買うね。
言いだしっぺの君が書いてよ。
141:132人目の素数さん
07/03/29 07:53:41
>>140 書けねーよ
142:132人目の素数さん
07/03/29 08:39:02
. ,イ/〃 ヾ= 、
_,,r-‐''"´ ^ `N /l/ `ヽ
彡 法学部 N! l `、
,, -‐- ,,-彡 l ヽ 医学部 l` ´ ``‐ 、
彡´ | ,,w,,wヽヽ ,, | 薬学部 `ヽ
_彡 政経部 | //レ/ハl/ハ\ヾー _,, ,,r,,/lヾ | }
ハl/ ,/ハlヾヾ,l、 /三f、,,_ _,ヾニ_ ____彡ノノノノノ_ヾヾ | ,l、 、 l___
/レ /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽ 哲学 \_
l`=l fモチ)_{´ヽl!l :l l ll !l `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ / \
ヾ}弋_シl弋 ヽl ヽ- ヽl lゝ__,ノ | ゞ___ノl/l / l `~゙´ lァノ (●
) \
ヾl `' `''´lヽ ─ /l\l l、, l_ノ 〈 _ l!ノ_人__) |
}\  ̄ ̄ ,ィl \  ̄ / l l ___ / ─ 丿 ⌒´ ,/
,/\ \__// \ \___/ ,,-''\|\ _ /|\ - / |、 / ,|、
-‐' \_,,-‐'\ `ヽ、 ,,r' /| \ / .| \__/ ,,rヽ‐-‐ '' / l`ヽ
,,-‐'' \ /\/\ / \. \____/ /\ ,,-‐'' /\ ,/ l ヽ
-‐''´ \/ }゙ _,,,‐''\ \ / /l\‐'' / `ヽ、_ l
143:132
07/03/29 14:23:29
書けないですね。
とりあえず、過去にそんなこと試みた人はいないのかな?
ちょっと、まわりに聞いてみよう。。。
144:132人目の素数さん
07/03/29 14:58:29
. ,イ/〃 ヾ= 、
_,,r-‐''"´ ^ `N /l/ `ヽ
彡 法学部 N! l `、
,, -‐- ,,-彡 l ヽ 医学部 l` ´ ``‐ 、
彡´ | ,,w,,wヽヽ ,, | 薬学部 `ヽ
_彡 政経部 | //レ/ハl/ハ\ヾー _,, ,,r,,/lヾ | }
ハl/ ,/ハlヾヾ,l、 /三f、,,_ _,ヾニ_ ____彡ノノノノノ_ヾヾ | ,l、 、 l___
/レ /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽほっ統計学\_
l`=l fモチ)_{´ヽl!l :l l ll !l `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ / \
ヾ}弋_シl弋 ヽl ヽ- ヽl lゝ__,ノ | ゞ___ノl/l / l `~゙´ lァノ (● ) \
ヾl `' `''´lヽ ─ /l\l l、, l_ノ 〈 _ l!ノ_人__) |
}\  ̄ ̄ ,ィl \  ̄ / l l ___ / ─ 丿 ⌒´ ,/
,/\ \__// \ \___/ ,,-''\|\ _ /|\ - / |、 / ,|、
-‐' \_,,-‐'\ `ヽ、 ,,r' /| \ / .| \__/ ,,rヽ‐-‐ '' / l`ヽ
,,-‐'' \ /\/\ / \. \____/ /\ ,,-‐'' /\ ,/ l ヽ
-‐''´ \/ }゙ _,,,‐''\ \ / /l\‐'' / `ヽ、_ l
145:132人目の素数さん
07/03/30 08:12:50
>>143
「統計学の公理的構成」が統計学最大の問題であることを、
非専門家たちに知らしめただけでも君の功績は学位論文以上だよ。
この辺りを読んで、君を乗り越える若い才能が出てくることを期待しよう。
146:132人目の素数さん
07/03/30 19:50:26
t検定でふたつの集合の平均値が同じかどうか調べる時、
同じだという帰無仮説を危険率5%で棄却されなかった事をもって
「同じだ」と言っていいんでしょうか?なんかやり方が逆のような気が
147:132人目の素数さん
07/03/30 22:05:34
>>146
同等性検定でぐぐれ
148:132人目の素数さん
07/03/31 05:32:17
>>146
帰無仮説が棄却されないとほんとは何も言えないんだけど、
しばしばそのように解釈されてしまう。
149:KingOfUniverse ◆667la1PjK2
07/03/31 09:56:31
対立仮説が棄却されるかどうか。
150:132人目の素数さん
07/03/31 14:14:36
一般には対立仮説は棄却されうるが、>>146のケースでは無理。
151:132人目の素数さん
07/03/31 22:49:41
>>112
>誤差(error)は・・「とりあえずの値の標準偏差」かどちらかを言う・・・
「とりあえずの値の標準偏差」って、標準誤差のことですか?
152:132人目の素数さん
07/04/01 02:44:49
>>148
Neyman-Pearson Lemma の方の検定なら、パラメータに関する「仮説」と「対立仮説」しかないので
「採択」と「棄却」が明確に成立する。
Neyman-Pearson検定論やWaldのDecision Theory は、「帰無仮説」という考え方を捨てて初めて成立する。
この立場での検定なら >>149が正しい。
帰無仮説を重視するのは Fisher流の有意性検定で、逆にこちらは明確な対立仮説を設定しない。
パラメータだけでなく、検定時の確率モデル全体が「帰無仮説」に含まれているためだ。
例えば、散開星団が「星団」であることを統計的に検証するために、「天空上に星が一様に分布する」
という帰無仮説を立てる。そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」
であり、このような広いモデル選択は、Neyman-Pearson検定論では記述できない。
いまの統計学のテキストは、この辺の区別が無く、グッチャグチャに書かれているのがほとんど。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4121日前に更新/204 KB
担当:undef