統計学なんでもスレッ ..
39:132人目の素数さん
07/11/19 21:11:28
>>30
>適当なデータを放り込んで分析してみると・・・
重回帰分析演習上達に適当なデータを開示しているWebページを、何例か
紹介願えませんか。
40:132人目の素数さん
07/11/20 08:34:38
>>39
とりあえず有名どころ。
URLリンク(kdd.ics.uci.edu)
41:132人目の素数さん
07/11/20 16:28:03
どなたか教えてください。
お願いしします。
母集団分布における確率空間についての質問です。
身長の統計調査を例にとる. 国民全体( N 人) をU とおき, その上の確率Q を
Q[u] =1/N , u ∈ U
とする. ここで確率空間(U,Q) が得られたので,
Y (u) = u 個人の身長, u ∈ U
として(U,Q) 上の確率変数を定義する. このY (u) の分布が母集団分布である.
つぎに, U からu1, u2, ・ ・ ・ , un のn 人を無作為に選び, 標本調査を行う. その標本を
w ≡ (u1, u2, ・ ・ ・ , un)
として, 次のように新しい確率空間(Ω,F,P) を与える:
Ω ≡ {w = (u1, ・ ・ ・ , un) : u1 ∈ U, ・ ・ ・ , un ∈ U}
P[w] =(1/N)^n
最後の(1/N)がn乗になる理由が分かりません。
どなたか詳しく、分かり易く教えていただけないでしょうか。
お願いします。
42:132人目の素数さん
07/11/20 16:31:45
>>38
カイ二乗検定をした後で有意差を検定するってことは、
ペア毎に差を比べるってことかな?
その場合、風船の大きさが針ごとに正規分布してるかどうかが問題になるね。
サンプルがかなり大きければあまり気にしなくても良いけど。
正規分布を仮定するなら2標本のt検定だし、
そうでないなら変数変換をしてt検定するか、
変数変換せずにWilcoxon ranksum test をやる。
全ての変数をまとめて検定するっていうのなら、
正規分布ならANOVA、一般の場合はKruskal-Wallis testとかかな。
その場合、全体的に差が有意かどうかしか分からない。
43:132人目の素数さん
07/11/20 16:36:05
>>41
問題文には書いてないけど「重複を許して」「順番も区別して」
n人を選ぶって意味だからでしょ。
44:38
07/11/20 17:04:32
>>42氏どうも
つれた風船の大きさと針の関係をU検定する場合
2つのグループ間での検定となりますよね?
大と中、大と小、大と極小、中と小、中と極小、小と極小(この6個の組み合わせ)
これについてそれぞれU検定をかけて、例えば大>中、中>小、大>小(それぞれp<0.05)となったとしてこの場合、大>中>小(p<0.05)という判断でいいのでしょうか?
45:41
07/11/20 18:43:41
>>43
回答ありがとうございます。
何故、重複を許しても大丈夫なのでしょうか?
母集団の重複を許すと、この場合、国民ですので、同じ人を選ぶことになってしまいます。
そこがわからなくて(^^;
46:132人目の素数さん
07/11/21 00:41:26
1「そう思う」2「どちらかと言えばそう思う」3「わからない」
4「どちらかといえばそう思わない」5「そう思わない」
という選択肢で質問した場合、
「わからない」を除外したもので、1と2で「そう思うと回答したもの」
と4と5で「そう思わないと回答したもの」と考えてカイの二乗検定を
行ってもいいのでしょうか?
47:132人目の素数さん
07/11/21 03:03:46
標準正規確率変数XについてP(|X|=∞)は、ほとんど確実に0ですよね?
48:132人目の素数さん
07/11/21 04:09:50
>>45
私も同じ人を選ぶのはおかしいと思うが、
そういう設定なのだから仕方ない。
もしかしたら、母集団に対して標本が極端に少なく、
重複する可能性が極めて低いので気にしていないのかも。
>>46
問題ない。
>>47
正規分布のsupportは(-∞,∞)だから、P(|X|=∞)=0だろ。
49:132人目の素数さん
07/11/21 04:16:12
>>44
大>中>小が全て有意だと言うのは分かるけど、
まとめてp<0.05って書くのはちょっと気になるなあ。
全ての不等号は水準5%で有意、とかきちんと書いた方がいいんじゃ。
ちなみに>>42も含めこのスレ>>30以降の回答が今のところ全部自分。。
50:132人目の素数さん
07/11/21 09:38:03
>>48
ありがとうございます!
(P(|X|=∞)を質問した人間です。)
いやいや、正規分布を誤解してましたm(__)m
51:132人目の素数さん
07/11/21 15:11:01
つか、そもそも任意の実数 a について、P(X=a) = 0 だろ。
あと ∞ という数は無いから、lim[a→∞] P(|X|=a) = 0 な。
52:132人目の素数さん
07/11/21 15:12:05
>>>46
>問題ない。
まとめるならなぜわけて回答させたんだよ??ってつっこみうるのは問題
53:132人目の素数さん
07/11/21 20:03:18
>>51
そもそも、大数の強法則を考えれば、即座でしたね…。
チェビシェフの不等式→ボレル・カンテリの補題という王道パターンからでも示せる事に気が付きましたm(__)m(間違っていなければ。)
てことは、期待値が有限の確率変数は確率1で有限値しか取らないってことになりますか?
54:132人目の素数さん
07/11/21 21:50:46
>>52
解析する段階でメンドクサクなったからです。
本など見るとまとめた方がやりやすいと書いてありましたし。
55:132人目の素数さん
07/11/22 01:32:16
>>51は、何か根本的な勘違いをしている気がする。
測度論的な統計学を勉強する前にもうちょっと
基本的な数学のトレーニングをした方がいいんじゃない?
>期待値が有限の確率変数は確率1で
>有限値しか取らないってことになりますか?
これは正しい。
56:132人目の素数さん
07/11/22 01:37:03
>>52
きちんと考えればmultiple testingの問題なんだろうけど、
厳密な立証を求められる医薬系以外でそこまで問題にされることは
少ないのでは。
事後的なサーベイ程度なら、むしろ、区分をしすぎることによる
カイ二乗検定の近似誤差の方が問題だろ。
そんな場合には、Fisher's exact test を使う。
57:132人目の素数さん
07/11/22 09:48:41
>>55
>>53です。どうもありがとうございますm(__)m
私は理系の人間では無いのですが、知っていなければ恥ずかしいような内容なだけに、疑問が解消されて良かったです。勘違いをして二年ほど過ごしていたようです…。
58:132人目の素数さん
07/11/22 12:17:59
これアンカーミス?↓
55 :132人目の素数さん:2007/11/22(木) 01:32:16
>>51は、何か根本的な勘違いをしている気がする。
56>むしろ、区分をしすぎることによるカイ二乗検定の近似誤差の方が問題だろ。
だから何で区分して質問しておいて後でまとめちゃうんだよ、って
59:132人目の素数さん
07/11/22 13:04:29
>>58
54でも答えてますけど、統計の本には2×5では大変なので
まとめて「そう思う」「分らない」「そう思わない」と
2×3にした方がいいと書いてあったのですが・・・。
60:132人目の素数さん
07/11/22 13:11:23
>>58
目的は有意差をみることだからまとめることには別に問題はない。
ただまとめ方自体が恣意的だと、正しい検定にならない。
61:132人目の素数さん
07/11/22 15:10:30
いろいろ分類していった結果
25人と5人とか30人と10人とかになってしまいました(一応有意差あり)
こんな小さなサンプルで有意差出しても大丈夫なんでしょうか?
62:132人目の素数さん
07/11/22 17:06:35
>59 書名は?
>60 まとめることの是非ではなく、1〜5で答えさせたことの是非
63:132人目の素数さん
07/11/22 17:11:37
URLリンク(sociology.jugem.jp)
URLリンク(www.okayama-u.ac.jp)
2.2.8.数量データを無理やりカテゴリー分けする
独立変数や従属変数が連続変量であるにもかかわらず,それらを“上,中,下”群のように分けて分析することをいう.
たとえば,調査の段階で具体的な年齢を質問しているにもかかわらず,分析の段階では“30歳以上”群と“30歳未満”群
に分けて各群の得点の差を検定したり頻度のχ2検定をしたうえで,“○○については年齢による差が認められた”というよ
うに結論を下している発表を聞いたことがある.これとは別に,大学生に不安検査を行ない,不安得点に応じて“高不安群”
,“中不安群”,“低不安群”に分けて分析をしている発表を聞いたことがある.これらの例は少なくとも3つの問題点を含
んでいる.1つは2.2.7にも述べたように,事後的に作為的なカテゴリー分けが行なわれる可能性があること,第2に,連続
変量がもつ種々の貴重な情報をわざわざ捨てていることである.
64:132人目の素数さん
07/11/22 18:26:06
>>62
>60
学部生の論文なので勘弁して下さい。
65:132人目の素数さん
07/11/22 20:13:01
pが0.06とか0.05・・・
になる時って有意差はないが
大きな差があったとか言ってもいいのですか?
66:132人目の素数さん
07/11/23 15:10:29
age
67:132人目の素数さん
07/11/23 16:18:35
>>63
まあ、統計っていうのは正しい手法が自明なものではないので、
具体的なモデルを提示しない批判はあまり意味がない。
二つの順序変量の場合は、上の方で述べたように
Wilcoxon exact testあたりを使うのが
情報のロスは少ないかも知れないとは思う。
ちなみにリンクの一つ目の書は「順序変量を誤って連続変量と
みなした人」を想定して批判をするという意味のないことを
やっていると思う。書評を読んだだけなので断定的なことは
言えないが。
68:132人目の素数さん
07/11/25 17:43:10
仮説検定をやっているんですけど、t値とp値が有意水準を片方だけ満たして
片方だけみたさないことってありますか?初心者ですいません
69:132人目の素数さん
07/11/26 05:23:15
>>68
ないです。そもそもt値からp値を計算しているので。
70:132人目の素数さん
07/11/26 16:25:50
Rで学ぶデータマイニングII
URLリンク(www.amazon.co.jp)
を買おうかどうしようか迷ってるんだけど、
使った人はいるだろうか。
卒論の時系列解析の参考にしようかなと思ってる。
SとRは1年間大学で学んだし、web の R-tips はよく見るから
上記のIは買ってない。
71:132人目の素数さん
07/11/26 16:41:53
Rスレで聞いた方がいいんじゃない?
72:132人目の素数さん
07/11/26 16:49:22
うん…。書き込んで数学板検索してるうちにそう思った…。
マルチになるけど、Rスレにも書き込もうと思う。
もちろん、このスレも1週間はROMるから、
返事もらえてたらすごく嬉しい。ありがとう >>71
73:132人目の素数さん
07/11/28 16:09:52
test
URLリンク(www.uploda.net)
74:132人目の素数さん
07/11/29 08:44:08
つり橋効果の実験で、つり橋を渡っている時にたのめば65%、
渡ってからすこし後だと37%の男性が〜というデータがありますが、
その内訳が23人中7人で37%、20人中13人で65%となっており、
サンプル数が少なすぎる気もするのですが統計学的にはどうなのでしょうか。
75:132人目の素数さん
07/11/29 09:14:56
何を頼むの?
76:132人目の素数さん
07/11/29 09:16:15
>>70
あの本に入ってるコードでGARCHはできるけど、使いたいモデルによるかも?
何がしたい??
77:132人目の素数さん
07/11/29 09:34:18
>>75
連絡先をおしえてくれとかそんなことです。
78:132人目の素数さん
07/11/29 10:45:08
!がよくわかんね
79:132人目の素数さん
07/11/29 11:39:25
>>77
携帯で頼む訳ね
展望台からとか
80:132人目の素数さん
07/11/29 12:10:17
wikipにリンクあった
URLリンク(www.fpce.uc.pt)
81:132人目の素数さん
07/11/29 17:34:00
>>74
Fisher's exact test で、
p-value を計算してみたら、、、
おっと学校の宿題には答えない約束だったw
82:132人目の素数さん
07/12/02 00:12:08
C言語かC++で仮説検定とか推定の計算をしたいのですが、
標準ライブラリにはχ2乗分布の累積密度関数などが入っていません。
統計処理用ライブラリやソースを公開しているサイトや書籍はありませんか?
83:132人目の素数さん
07/12/02 15:17:29
相関係数を計算する上での前提条件に正規性は必要ですか?
また他の前提条件はあればご教授をお願いします。
84:132人目の素数さん
07/12/02 17:15:40
>>82
URLリンク(www.alglib.net)
本は Numerical Recipes in C(++) とか。
>>83
相関係数の定義に必要なのは分散・共分散だけ。
85:132人目の素数さん
07/12/03 03:05:00
>>84
ありがとうございます。
前提条件はなしですか。
以下自分なりに調べてみたところ、注意すべき点としては、
直線性、外れ値を調べたほうがよいとありました。
直線性、外れ値を調べる方法で数値で判定する方法
(プログラムして自動で判定したい)があれば教えていただけないでしょうか?
86:132人目の素数さん
07/12/04 02:29:09
>>84
ありがとうございます。
amazonで注文してみます。
87:132人目の素数さん
07/12/04 23:43:51
比率(変化率)の統計を求めるのは、統計学的に
許されるのでしょうか?
つまり、
値A1,A2・・・An
値B1,B2・・・Bn
があった時、Ai,Bi間の変化率[%] Ci = 100*(Bi-Ai)/Ai が
A,Bと同じくn個あったとき、このCの標準偏差や分散を求める
ということです。
88:132人目の素数さん
07/12/05 00:17:08
>>87
よく使うよ。
株式や企業の収益率の変化とかが代表例かな。
89:132人目の素数さん
07/12/05 20:39:33
>>88
さんきゅう
90:132人目の素数さん
07/12/05 21:16:08
>>88
企業価値相関、算出しとる?
91:132人目の素数さん
07/12/05 23:08:01
>>90
ごめん。やったことない。
92:132人目の素数さん
07/12/06 18:17:12
統計を勉強し始めたばかりなのですが、よく出てくる「ordination」という単語の日本語訳がよくわかりません。
いろいろ調べて意味はなんとなくわかってきたのですが、日本語にする時にどうすればいいのか分かりません。
初歩的な質問で申し訳ありませんが、どなたか教えていただけないでしょうか?
93:132人目の素数さん
07/12/06 19:59:29
多変量解析
94:132人目の素数さん
07/12/06 21:34:09
>>92
ordinalを行うという名詞だな。順序づけ。
でも一般には単にオーディネーション。
95:132人目の素数さん
07/12/07 11:37:03
>>92.93
ありがとうございます!
辞書で調べてもキリストとか出てきてさっぱりだったんですが、もとは「ordinal」だったんですね!
例えば
「ordination diagram」 順序付けした図
「ordination axis」 順序付けした軸
「canonical ordination」 標準的な順序付け
ってなるんでしょうか?
96:132人目の素数さん
07/12/07 13:31:01
携帯電話に関するのアンケートに協力してください。
2,3分で終わりますんで、、、
URLリンク(www.efeel.to)
卒論で多変量解析をするため
回答数が必要なのでよろしくお願いします。
97:132人目の素敵さん
07/12/10 23:29:02
信頼係数と信頼区間の幅の関係ってどう説明したらいいんですかね?
あと交互作用効果ってどんな効果ですか?
98:132人目の素数さん
07/12/11 00:32:31
正方形の同じ一点にaとbがあります。ここを始点とし、コインが表ならa裏ならb
を隣の点に右回りで動かします。
この場合、n回目に二つとも同じ点にある確率を求めよ。
99:132人目の素数さん
07/12/11 06:06:28
統計学を勉強し始めなのですが、検定(?)という習ってない分野に入り、
「感染者230人のうち110人はその伝染病で2年後には死んでしまう。
2年後に死んでいる可能性は半々である(α=0、5)という仮説を検定しなさい。」
という問題でさっそくつまづいてます。どう解き始めるのですか?
簡単過ぎだと思われるのかわからないんですが、決して釣りではないです。
どなたか教えてください。お願いします。
100:132人目の素数さん
07/12/11 13:49:51
>>99
「2年後に死んでいる可能性は半々である」という帰無仮説の下で
230人のうち何人死ぬかどうかの分布を求める(例えば、最も可能性
が高いのは115人)。サンプルサイズが割りと大きいから正規分布で
近似すると良い。そして、死者が110人以下になる確率がどのくらい
あるのかを計算し、それが一定基準以下だったら帰無仮説を棄却
すればよい。
101:132人目の素数さん
07/12/11 21:30:28
ビジネス統計学という授業の問題です…教えてください…
1.以下の9個の2変数データ(x,y)を用いて問に答えよ。
(−4,16)(−3,9)(−2,4)(−1,1)(0,0)(1,1)(2,4)(3,9)(4,16)
(1)xとyそれぞれの平均値と分散を求めよ。
(2)散布図を描け。
(3)これらのデータを用いて相関係数を計算したところ、その値は0であった。この相関係
数と(2)で描いた散布図を参考にxとyの関係について分かることを述べよ。
2.平均20、分散9の正規分布における以下の範囲には全体の何%が含まれるか。
(1)20〜23 (2)22.4〜24.8 (3)17〜21.2
102:132人目の素数さん
07/12/11 21:31:53
竹中平蔵【びんぼうゆすりみたいな状態】になる
インタビューで竹中の担当の読売新聞記者が全裸で穴にバイブを入れたまま殺された?自殺した?ことなど
を、全部竹中にぶつけると【びんぼうゆすりみたいな状態】になった。
9.15 リチャード・コシミズ東京講演会 全編 (3時間24分)
【びんぼうゆすりみたいな状態】になった話は16分から
URLリンク(www.asyura2.com)
もと総理が過去に3人を殺した話もでてくる
103:132人目の素数さん
07/12/11 21:34:37
>>101
自分で解いてから質問しろかす
104:132人目の素数さん
07/12/11 22:17:56
100さんわかりやすい説明ありがとうございます。
105:132人目の素数さん
07/12/12 10:51:43
いや、100は片側検定だが・・・
106:132人目の素数さん
07/12/12 13:03:20
>>105
そうだけど、この場合に限ればどっちみち対称だから閾値だけの問題。
107:132人目の素数さん
07/12/12 17:16:11
そこまでわかるなら99を書くはずがない
108:132人目の素数さん
07/12/12 20:27:37
数学系の学生で、今外れ値について勉強しています。外れ値を見つける方法として、グラブスの方法、トンプソンの方法、増山の方法をよく見つけたのですが他によく使われている方法はありますか?
あと、トンプソン、増山の方法の中身(その式でなぜ外れ値が検証できるか)を説明しているサイトや文献あれば教えてもらえますか?よろしくお願いします。
109:132人目の素数さん
07/12/13 05:17:36
>>98
斬か式で解く問題だね。大学入試に出る。東大京大が好きそうな問題だな。
n回目に同じになるためにはn-1回目は隣合っている&遅れてる方が動く必要がある。
n回目に同じ位置にいる確率をA(n)、一つはなれている確率B(n)、二つはなれている確率C(n)とすると、
A(n)=0×A(n-1)+(1/2)^2×B(n-1)+0×C(n-1)
B(n)=1/2×A(n-1)+0×B(n-1)+1/2×C(n-1)
C(n)=0×A(n-1)+1/2×B(n-1)+0×C(n-1)
この3式からA(n)についての斬か式を作る。
A(n)=(1/2)^3×A(n-2)+(1/2)^3×C(n-2)
まずこれを解く、
A(n)=1/8×A(n-2)+1/8×C(n-2)
比例定数1/8の斬か式より
A(n)=〜………@
同様にC(n)についても解く。
C(n)=〜………@
@AよりA(n)=〜
110:132人目の素数さん
07/12/13 05:19:53
>>101
あまりに基礎すぎる。
自分でやったほうがいい。
111:132人目の素数さん
07/12/13 07:57:25
>>101は単発質問スレ立てし
その直後に、ここに書き込みとな(マルチ)
誰か教えてください…
スレリンク(math板)
もう数学板に来なくていい
ってか氏ね
112:132人目の素数さん
07/12/14 00:05:58
時系列解析のゼミに入ってるんですが、もしかしてこの分野ってマイナー気味ですか?
113:132人目の素数さん
07/12/14 01:29:38
>>109
ありがとうございました
114:132人目の素数さん
07/12/14 01:59:49
俺だったら2項分布を mod 4 で集計しようとするけどね
115:132人目の素数さん
07/12/14 18:24:54
合ってますでしょうか。
↓
ある模擬試験に 5000 人が受験したところ,
その成績は,平均値 65 点,標準偏差 10 点の正規分布に従った。
(1) ある生徒が,75 点以上 85 点以下である確率を求めよ。
(2) この試験において,上位 5 %に入るためには,何点以上あればよいか。
(3) この試験において,順位が 100 番以内に入るためには,何点以上あればよいか。
問題文はつまりN(65,10^2)であり、
標準正規分布をz、この問題の正規分布をuと置く。
(1)
P(75<_x<_85)
zに変換して
P(1<=z<_2)
=P(0<=z<=2)-P(0<=z<=1) 正規分布表より
=0.477-0.341=0.136
答え 13.6%
116:115
07/12/14 18:25:29
(2)
P(z<=u)=0.05となるuを探せばよいので、
P(0<=z<=u)=0.5-0.05=0.45
正規分布表からu=1.64
uからzへの変換式から
(x-65)/10=1.64
これを解いて
72.9点
答え 72.9点以上あればよい
(3)
100/5000=0.02
P(z<=u)=0.02
となるuを探す。
P(0<=z<=u)=0.5-0.02=0.48
分布表より0.48は2.05。これを変換式に代入し、
(x-65)/10=2.05
x=85.5
答え 85.5点以上あればよい
117:132人目の素数さん
07/12/14 19:09:55
片側しか見ていないから×
118:132人目の素数さん
07/12/14 22:07:24
あるデータを収集し、その分析をしなくてはいけません。
SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。
ランダムにN=40のサンプルを2群に分けました。
属性が等質であることは確認しました。
介入群と対照群の2群に対して、
介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。
介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。
教えてちゃんですみません。
よろしくおねがいします。
119:132人目の素数さん
07/12/15 02:22:52
>>117
意味分からん。>>115-116であってると思うけど。
120:132人目の素数さん
07/12/15 02:31:27
>>118
各時点で比較したいだけなら、単なる二標本の検定でしょ?
普通にWilcoxon exact rank sum テストとかをやればよいのでは。
やり方がよく分かんなかったら
無理矢理順序尺度を二値の変数にして、
カイ二乗検定とかでも大丈夫かも。
121:118
07/12/15 12:53:38
>>120
ありがとうございます。
私の書き方が不足していたのですが、
最終的に「介入することで○○分後の尺度に変化が見られる」という結果を導き出したいと思っています。
となると、
1.2群それぞれの時間経過に伴う尺度の変化についてRepeated Measures ANOVAをして
2.それで前後の値が変化したといえるのかどうかについて検討し
2.さらにその各時点ごとにWilcoxon exact rank sum testをしてそれが2群で違うといえるのかを見る
・・・・・・ということでよろしいのでしょうか?
本当に本当に初歩的な質問でごめんなさい。
決して釣りではありませんので、よろしくお願いいたします。
122:132人目の素数さん
07/12/15 15:56:29
>>121
うーん、きれいな定式化は難しそうな問題だなあ。
分析方法は結構主観によるところが大きいと思う。
自分だったら、ひとまず全部の情報を一つのモデルに盛り込むのは
難しいと考えて二時点間だけの比較をする。
(例:直前と直後、直前と5分後、直前と10分後...と試して、
最終的に、どの時点間で差が有意になるのか見ればよい。)
でもって、順序尺度の2時点間の差を連続な変量とみなせるのか
単なる順序尺度の差とみて「改善、不変、悪化」くらいに分ける
べきなのかを考えて、適切なモデルを選択する。
あとは、単なる2標本の検定。
頑張ればもうちょっと凝ったモデルも可能なのかも知れないけど。
123:132人目の素数さん
07/12/16 07:51:09
国友 ゲンダイ統計学 日経文庫
が書店においてない。
大学の図書館にも置いてないのにはびっくりした。
124:118
07/12/16 13:22:38
>>122
レスが送れてすみませんでした。
なるほど、そうですよね。
とても貴重なアドバイスをありがとうございます。
頑張ってみます。すごく感謝しています。
125:132人目の素数さん
07/12/19 19:31:18
サンプルが1つずつしかない表(4行×2列、1行目、1列目はラベル)のサンプル間の有意差の求め方ってありますか?
ソフトはエクセル統計を使ってます
126:132人目の素数さん
07/12/19 19:44:25
A大学は卒業生の就職率について、文科系、理科系ともにB大学よりも高いと宣伝している。
このことはA大学全体でB大学よりも就職率が高いことを意味するか。
問題文からして、意味しなさそうなのですが理由がわかりません。ヒントでいいので教えて
頂きたいです。お願いします。
127:132人目の素数さん
07/12/20 00:58:44
文系、理系各々の就職率から、大学全体(文+理)の就職率を求める式を導く。
128:132人目の素数さん
07/12/20 01:05:35
A 文系 1/1 =100%
理系 29/99 =28%
B 文系 9000/9900<100%
理系 20/100 =20%
全体では
A 30%
B 90.2%
反例
129:132人目の素数さん
07/12/20 02:21:44
>>125
データは、3行一列ってこと?
単に、「3つのグループの発生割合が同一」という帰無仮説を
検定したいだけなら、カイ二乗検定をすればよいのでは。
例えば、(15,10,5) がデータなら、(10,10,10)を期待値として
カイ二乗統計量を計算。
130:132人目の素数さん
07/12/20 08:15:32
>>127,128
ありがとうございます。
Bは就職率の高いほうに人数が偏っているってことですね。
131:132人目の素数さん
07/12/20 09:51:14
>>130
反例は一例だから、一応、一般化して解いた方がよい。
たぶん違う大学同士の異なる学科の人数の関係が問題になってくると。
132:132人目の素数さん
07/12/20 11:15:05
>>129
ありがとうございます。
データは3行1列です
カイ二乗検定は正規分布していなくても使えるんですか?
133:132人目の素数さん
07/12/20 13:30:19
>>132
「正規分布してる」って何のこと言ってるんだよ。
主語くらいちゃんと書いてくれ。
>>125の「サンプルが1つずつしかない表」
というのも意味が良く分からないし。
134:132人目の素数さん
07/12/20 14:46:40
CANOCOでCCAをしたいんですが、日本語で説明しているいいサイトないですかね?
135:132人目の素数さん
07/12/22 00:05:27
対応のない2元配置の分散分析を行おうと思っていたデータを
各群それぞれ Shapiro-Wilk 検定にかけてみたら全てアウトでした.
それでノンパラメトリックな方法でやろうと思うのですが,
この場合どんな方法が適当でしょうか?
136:132人目の素数さん
07/12/22 00:51:46
>>135
Friedman検定でないの?
137:132人目の素数さん
07/12/23 15:21:23
正規確率プロット図をEXCELで描きたいのです。
基準化したデータをx軸まではわかります。
y軸に順位に応じた期待する値を入れるとあるのですが、『順位』という言葉に引っ掛かっています。
どのように図を描けばよいのでしょうか?
138:132人目の素数さん
07/12/23 19:52:09
現時点で世界的標準と呼べる確率・統計の本ってどれ?
139:132人目の素数さん
07/12/23 20:17:26
fumio hayashi
Econometrics
140:132人目の素数さん
07/12/24 04:12:54
計量経済信者うぜぇ
141:132人目の素数さん
07/12/24 04:21:02
日本人の書いた世界的な本なら、Ikeda・Watanabeか?
142:132人目の素数さん
07/12/24 05:44:56
重回帰分析を実施する前に、
◆正規性検定(歪度、尖度)で調べる→不可なら変数変換
◆直線性(散布図)→不可なら変数変換
と上記2つを満たすために変数変換する手順、方法をご教授お願いします。
143:132人目の素数さん
07/12/25 07:40:12
>>142
実際のところどうなんだろ?
まず重回帰分析をやって決定係数をだした後に、マルチコ、外れ値、正規性や直線性を決定係数で判断しながら変数変換するのかな。
家にあった5冊の書籍を確認したが手順がわからないね。
144:132人目の素数さん
07/12/25 16:10:05
統計ソフトの英文マニュアルを読んでいます。
CON-file
の「CON」は何の略字でしょうか?
145:132人目の素数さん
07/12/25 22:10:24
キツネ
146:132人目の素数さん
07/12/26 02:17:00
池田渡辺ってだれよ?
147:132人目の素数さん
07/12/26 02:45:54
スタンダードは
ホーエルでは?
148:132人目の素数さん
07/12/26 02:46:29
Fumio Hayashiこそ世界の林です
豊田先生の著書なんかもいいかもしれんね。
149:132人目の素数さん
07/12/26 04:07:57
だから、林は計量経済学であって、確率・統計じゃないだろ。
計量経済学って結局確率・統計の深い所まで書いてないだろ?
渡辺信三を知らないのか?
150:132人目の素数さん
07/12/27 07:31:25
重回帰分析の手順って確立されていないということですか?
151:132人目の素数さん
07/12/27 16:52:25
今数理統計学を大学で履修してるんですけど、
全く理解しないで暗記だけでテスト受けてる感じです。。。
知識詰め込むだけの数学はつまらなくてしょうがないです。
皆さんはどうやって数理統計を勉強してますか?
なにかおすすめの参考書などありますか?
大体有名な分布やそれらの積率母関数の求め方はちゃんと頭に入ってるんで、
これを生かしたいんです。
152:132人目の素数さん
07/12/27 17:43:36
★★小泉純一郎と安倍晋三は朝鮮人★★
コピペして各板に貼り付けよう 知人にも話そう
小泉純一郎
・戦前大臣を務めた祖父小泉又次郎は純粋な日本人とされる。だが、純一郎の帰化朝鮮人である父が鮫島姓を買い取り
又次郎の娘をたぶらかして婿として小泉家に入る そこで小泉家は帰化朝鮮人である純一郎の父に乗っ取られた
参照Wikipedia項目リンク 上下くっけて
%8F%E6%B3%89%E7%B4%94%E4%B9%9F
・父親の純也は、鹿児島東加世田の朝鮮部落の出身者といわれる 日大卒業名簿には、純也の日本名はなく、
見知らぬ朝鮮名が書かれているという
純也は朝鮮人の帰国事業、地上の楽園計画の初代会長であった
・結婚後、子供をもうけ即離婚した宮本佳代子は在日企業エスエス製薬創業者の孫
・小泉の元秘書官の名前は飯島勲←注目 帰化朝鮮人
・派閥のドン森喜朗も生粋の朝鮮人 ←森も帰化人がよく使う通名
・小泉は、横須賀のヤクザ、稲川会と関係が深い
安倍晋三
・岸家 毛利元就が陶晴賢と厳島沖で戦い大勝を収めた際、寝返って毛利方についた船の
調達人が「ガン」と称する帰化人であったという 毛利はその功績によって「ガン」を
田布施周辺の代官に召したてた このガンを岸家の先祖とする説がある
・祖父岸信介が文鮮明と共に 反共団体 国際勝共連合(統一教会)を設立
・官房長官時代統一教会「合同結婚式」に祝電を送り、話題に
・安倍のスポンサーは、下関の朝鮮人パチンコ業者である
・グリコ森永事件時、明らかになった帰化朝鮮人企業森永のご令嬢と結婚
・そのわが国のファーストレディーは電通(会長成田豊、半島生まれの帰化人)勤務という分かりやすい
経歴の持ち主の朝鮮の血筋
・韓国、中国の留学生に日本の企業に入ってもらうために住居費分、学費免除分、生活費など月計20万〜30万円相当の支給
日本人のワーキングプア層を全く省みない また帰化系在日系朝鮮人が日本の企業で技術を盗み、半島の現代などの企業に
伝授していることが深刻な問題になっている
153:132人目の素数さん
07/12/27 18:06:11
>>151
統計数理はあとで役立つ。
基礎トレだから手抜きせずマジにもならずやっとくのが吉。
154:132人目の素数さん
07/12/28 01:01:26
すみません重回帰分析を行っているのですが
定数項を含む場合と含まない場合で相当結果が違ってきます。
特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。
また、説明変数のt値なども両者で相当な違いが見られます。
定数項を含む場合の寄与率の導出等については文献があるのですが
定数項を含まない場合についてがどうしてもよくわかりません。
なぜこのような事になるのか・・・
また、どちらの結果を使うのがよいのか・・・(定数項を分析の際入れるか)
どなたかご教授頂けないでしょうか?
155:132人目の素数さん
07/12/28 01:10:34
>>154
目的因子と説明因子の関係が原点を通るか通らないかで判断する。
156:132人目の素数さん
07/12/28 03:03:19
>>138
graduate の入門レベルの本だと、統計学やる人向けはこんな感じ。
測度論:Billingsley, "Probability and Measure"
推定:Lehmann and Casella, "Theory of Point Estimation"
検定:Lehmann and Romano, "Testing Statistical Hypotheses"
Lehmannの2冊は古いし測度論的な記述が完全に一般化されてない箇所も
あるけど、総合的にはこれを超える本はないような気がする。
Bayesとかは詳しく知らん。
回帰分析や分散分析は、なかなかいい本がない。
(昔に書かれた数学的に細かい本ならあるが。)
確率論に関しては、
Durrett "Probability: Theory and Example"
Kai Lai Chung "A Course in Probability Theory"
Kallenberg "Foundations of Modern Probability"
あたりか?
Durrettは簡潔な教科書スタイルの本だがギャップも多く難しい
という評判、Kai Lai Chungは評判はいいがやや記法が古い。
Kallenbergは辞書のような本。
補足、追加、反対意見などある人ヨロ。
157:132人目の素数さん
07/12/28 11:06:27
>>155
ありがとうございます
つまり仮定しているモデル式に定数項が含まれないなら
定数項を含まないモデルで解析という事でしょうか?
158:132人目の素数さん
07/12/28 13:19:11
>>157
まぁそういうこと。
xが0の時yは0なら定数項はなし(原点を通るから比例関係)
159:132人目の素数さん
07/12/28 18:53:06
勝手にモデルを決めたら、結果を認めて貰えない。
一般に線形回帰モデルは定数項付きなので、
何かの理由で定数項無しの特殊なモデルを使いたい場合は、
まず定数項が統計的に有意じゃないことを示す必要がある。
160:132人目の素数さん
07/12/29 07:36:36
どうか、お願いします。
バリマックス回転したいんですが、エクセルしかなく、
さっきR言語をインストールしたんですがさっぱりわかりません。
R言語のサイトで
URLリンク(aoki2.si.gunma-u.ac.jp)
が紹介されていて、この関数を入れるとバリマックス回転ができるそうなんですが
ここの関数を使おうとしてもなぜか正常に表示されず、使用することができません。
どうか、何か、妙案を出していただけませんか?
お願いします。
161:132人目の素数さん
07/12/29 12:38:08
>>160
Rのスレで質問したほうがすぐに答えてくれると思う
162:160
07/12/30 09:04:36
了解です。
163:132人目の素数さん
07/12/30 21:27:39
信頼区間の信頼率と被覆確率について教えてください。
信頼率というのは、
例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは
「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか?
また、被覆確率というのは、
ある文献では信頼率と同じことと説明されていて、
他所では「作られた信頼区間の中に母数の推定量が入る確率」である、
と説明されていました。
これはどちらが正しいのでしょうか?
164:132人目の素数さん
07/12/30 23:22:22
「信頼率」は「信頼係数」のことかな?
だと本来は同じ。
しかし二項分布とかポアソン分布などの離散型確率変数の場合、
正確な信頼区間は作れない。
よって名目上の信頼係数と実際の被覆確率とが違うのは普通。
165:132人目の素数さん
07/12/31 00:37:27
正規分布の問題で
高1男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。
このとき、無作為に男と女を1人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。
(実際の問題には平均、分散の具体的数字が入ってます)
というのがあって、解き方がわからないんですけど
どなたかアドバイスお願いします。
166:132人目の素数さん
07/12/31 00:52:21
ヒント:差 Y-X の分布
167:132人目の素数さん
07/12/31 01:14:52
>>166
アドバイスありがとうございます。
Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。
行き詰まったのでまた明日考えることにします。
168:132人目の素数さん
07/12/31 10:30:51
>>165
Xとなる確率はわかる。
YがX以上となる確率もわかる。
最後にXで積分すると全体の確率がでる。
169:132人目の素数さん
07/12/31 19:36:35
>>168
で、正規分布の密度関数の二重積分まで行って、
お手上げになる。
それが解けるようなヤシは、そもそも質問しないから。
170:132人目の素数さん
07/12/31 19:43:09
>>167
Ganbarin sai yoh !
171:132人目の素数さん
07/12/31 20:13:07
べき分布について詳しく書いてあるようなページはないですかね?
もしくは本でも良いんですが
172:132人目の素数さん
08/01/01 16:38:29
>>169
> で、正規分布の密度関数の二重積分まで行って、
> お手上げになる。
つまり、その二重積分のやり方を教えればいいということか。
173:132人目の素数さん
08/01/01 18:24:41
統計学を独学するのにいいテキストを探しています
候補としては東大出版の基礎統計学I 統計学入門か
統計学のための数学入門30講を考えているのですが
評判というか使い勝手はどうなのか教えていただけないでしょうか?
上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです
よろしくお願いします
174:132人目の素数さん
08/01/01 18:49:02
後者は統計を学ぶためのあくまで「数学」の本だよ
数学がわかるなら必要なし
175:132人目の素数さん
08/01/01 22:52:51
>>173
候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176:ふ
08/01/01 23:09:35
〉173
学部はどこなの?
数学はどのていどわかるの?
いままで読んだ統計学の本は?
統計学を学ぶ目的は?
いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177:132人目の素数さん
08/01/01 23:31:40
173です 説明不足だったことを反省しています
>>176
経済学部なので数学は半端に知っているという程度です(問題演習はそこそこできるが、証明はできません)
統計の本は読んだことがありません
授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています
最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました
>>175
上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした
>>174
統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178:132人目の素数さん
08/01/01 23:35:47
173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。
専門分野 教育学
数学理解 高校のころ2Bやって以来数年間触ってないので、ところどころ忘れている(3Cは未履修)。
既読書籍 「社会の見方、測り方―計量社会学への招待」
「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹
あとは、講義等で講師が自前で作成した教材等。
学ぶ目的 数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。
お手数しますが、何かお勧め頂けると有難いです。
宜しくお願いします。
179:132人目の素数さん
08/01/01 23:49:10
>>177
統計学を勉強する目的は何ですか?
研究、資格試験などありますが。
180:132人目の素数さん
08/01/02 00:34:18
私は最近統計の勉強を始めた者です。
テキストは東大出版会の統計学入門を使ってます。
この本に書いてることで疑問があるのですが、
『母平均を推定する問題では、母分散が既知なら正規分布、
母分散が未知ならt分布を使う。
母分散を推定する問題ではカイ二乗分布を使う。』
という理解でよいでしょうか?
この理解ではダメな問題があったので、理解が正しいか教えてください。
181:ふ
08/01/02 01:23:11
〉177
困りましたね。
本来、統計学は独学の困難な学問ですからね。
文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。
面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。
だれか先生につかないと。
182:132人目の素数さん
08/01/02 01:43:14
>>180
正規分布ならOK.
推定の一般論について読めばそれの理解がよくないことがわかる。
183:132人目の素数さん
08/01/02 02:58:44
>>177
東大の統計学入門は、初心者向けの商品カタログみたいな感じだから
独学には向かないと思うよ。そのレベルなら
蓑谷 千凰彦「統計学入門」東京図書
がいいかも。もっと数学的でも良ければ、
竹村 彰通「現代数理統計学」創文社
とか。
184:132人目の素数さん
08/01/02 06:43:36
統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185:132人目の素数さん
08/01/02 07:56:36
>>177
統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。
統計は確率論の1つの応用分野である。で、確率論をやるのなら線型代数、微積分
及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。1)線型代数:岩波基礎
数学講座の線型空間、2)微積分:岩波基礎数学講座の解析入門1〜4、3)集合と
位相:岩波の現代数学概説1、2。その中でとりわけ重要なのは微積分、集合と位相
である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、
「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概
説2」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。
これとほぼ並行して、次のことをやる。
1:線型代数の穴埋め。
これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「2次形式」で十分。
2:少々の抽象代数。現代数学概説1の群、環、体あたりを読んでみよう。
3:複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき
或いは必要になったときに読んでいけばよい。
4:関数解析。お勧めは「岩波基礎数学講座の関数解析」。
5:Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門5」。
6:微分方程式。お勧めは岩波講座の現代数学への入門の
「力学と微分方程式」、「熱・波動と微分方程式」 あたり。
7:岩波講座応用数学。色々読んでみるとよい。役に立つ筈。
ついでに言えば、腕力も鍛えておいた方がよい。
186:132人目の素数さん
08/01/02 12:17:30
>>182 教えてもらってありがとうございます。
とりあえず今の理解でおおまかには大丈夫なら、
まず先に全体を終わらせるよう先に進めます。
187:132人目の素数さん
08/01/02 13:29:57
>>186
大丈夫なのは正規分布の母平均の推定の場合に限ります。
東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。
漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの
統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188:132人目の素数さん
08/01/02 14:10:47
東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。
噛めば分かるのだが、すっと理解できるようには書いてない。
内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189:132人目の素数さん
08/01/02 14:50:15
系列範疇法について質問があります。
各カテゴリーの相対頻度と等しい面積を持つように
正規分布を分割したいのですが、
具体的にどうすればどうすればよいのでしょうか。
190:132人目の素数さん
08/01/02 19:32:13
>>180って他のスレで酷い質問しててワロタんだがw
191:132人目の素数さん
08/01/03 03:15:42
移動平均の最適パラメータってどうやって求めるんですか?
192:132人目の素数さん
08/01/03 06:24:38
変数XがA-B群間のt検定では有意差が出ないのに
判別分析(ステップワイズ法)ではA-B群の判別に寄与する変数として投入される
ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ,なんだかしっくりこない
193:132人目の素数さん
08/01/03 18:32:56
コーシー分布の平均値って事実上ゼロでしょ?
194:132人目の素数さん
08/01/03 21:37:43
>>193
「事実上」ってなんだ
195:132人目の素数さん
08/01/03 21:50:06
>>192
散布図を描くとするでしょ
右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。
横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。
こういうのでどうでしょうか
196:132人目の素数さん
08/01/03 22:52:06
>>193
左右対称な分布なら 平均 = 中央値 と定義すればそう。
197:132人目の素数さん
08/01/03 23:01:51
>>193
平均と中央値をごちゃごちゃにしてはだめです。
平均と中央値は中心という概念では同じですが、定義は全く違います。
198:132人目の素数さん
08/01/04 13:15:44
コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない?
199:132人目の素数さん
08/01/04 14:47:30
>>195
あー,なるほど,そう言われるとよく分かる.
200:132人目の素数さん
08/01/04 17:16:13
>>198
コーシー分布にしたがってランダムに数を生成させる方法を述べよ
仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201:132人目の素数さん
08/01/04 18:42:25
>>198 >>200
コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。
あと位置と尺度を一般化したコーシー分布、例えば
Wikipedia項目リンク
の母数は、「母平均」や「母標準偏差」ではない。
母平均も母分散も存在しないからね。
また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。
というか、そもそも推定している対象が存在しない。
コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。
つまり、裾長分布の兆候を持つデータの位置母数推定で、
標本平均を使うのは危険。経験的には、外れ値を除外したり、
両端を一定率で除外した調整平均が使われている。
一方、正規分布など特定の分布では少し効率が悪いが、
「標本中央値なら常に安全」という教訓になるのがコーシー。
202:132人目の素数さん
08/01/04 18:49:11
コーシー分布にしたがってランダムに数を生成させる方法はある。
まず、(-∞, +∞)の一様分布の確率変数p(x)を用意する(ただし、厳密な意味ではこれが一番難しい)。
あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、
q(y)=Σp(φ(y))・dφ(y)/dy
で定義されるq(y)で数を生成すればOK。ただし、x=φ(y)は二価関数なので、単調増加の領域と
単調減少の領域に分けてΣを計算すれば良い。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4819日前に更新/90 KB
担当:undef