統計学なんでもスレッド7
at MATH
1:132人目の素数さん
07/10/24 08:52:19
理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。
前スレ:
統計学なんでもスレッド6
スレリンク(math板)
統計学なんでもスレッド5
スレリンク(math板)
統計学なんでもスレッド4
スレリンク(math板)
統計学なんでもスレッド3
スレリンク(math板)
統計学なんでもスレッド2
スレリンク(math板)
統計学なんでもスレッド
スレリンク(math板)
関連スレ:
統計学なんて数学じゃないだろ
スレリンク(math板)
= 統計解析フリーソフト R 【第2章】 =
スレリンク(math板)
=統計解析= SASプログラミング
スレリンク(math板)
2:にょにょ ◆yxpks8XH5Y
07/10/24 11:52:44
今だ!2ゲットォオ
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´
∧∧ ) (´⌒(´
⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
 ̄ ̄ (´⌒(´⌒;;
ズザーーーーーッ
3:132人目の素数さん
07/10/26 16:29:07
統計学って、どんなもん?
過去スレは見れないし、他のスレは無いし。
アンケートとか世論調査とか信頼できるの??
4:132人目の素数さん
07/11/03 21:41:30
>>1
他板版関連スレ
◆統計学について語るスレ
スレリンク(sim板)
心理統計スレッド3
スレリンク(psycho板)
統計ソフト統合スレッド−SPSS・SAS以外
スレリンク(psycho板)
統計解析ソフト
URLリンク(ebi.2ch.net)
5:132人目の素数さん
07/11/05 22:59:13
つり針が10本ついている仕掛け(さびき)で魚をつりました。
使ったさびきは3種類(赤、白、黒)
それぞれで釣った回数は、赤10回、白3回、黒5回
釣れた魚は
赤が(5、3、4、8、1、0、2、1、5、7匹
白が(3、2、6)匹
黒が(7、5、4、7、8)匹
赤・白・黒の「さびき」で魚の釣れる割合に有意差があるかを知りたい。
【手順】期待値を求める。期待値と実測値の差を二乗して期待値で割ったものの総和を求める=これがカイ二乗検定
ということらしいのですが、そもそも期待値の出し方がわかりません。
どなたかアドバイス頂けないでしょうか?
6:132人目の素数さん
07/11/06 00:12:06
>>5
まず帰無仮説をたてろ。
帰無仮説が支持される場合は、どのサビキに何匹の
魚が釣れると予想されるか考えろ。
7:5
07/11/06 07:26:10
>>6様
帰無仮説というと、この場合「さびき」の種類で魚の釣れる割合に「差がない」ということですよね。
赤・白・黒のどれでも同じ割合でつれるはず と。
そうすると期待値は、10本針で10回、3回、5回で述べ180針つかい、つれた数が総計78匹
釣れる割合は43.3%
この割合に比べて、赤・白・黒がどうかとみていくのでしょうか?
やはり期待値というのがまだ理解できておりません・・・
8:132人目の素数さん
07/11/06 08:53:10
>>7
%ではなくて、各サビキ1回で釣れる魚の数を考えて
みると良い。
帰無仮説が採択される時に予測される魚の数が期待値。
各サビキで1回に釣れる魚の数(算術平均)
-------------------------
赤 白 黒
-------------------------
実測値 3.60 3.66 6.20
期待値 ? ? ?
-------------------------
9:5
07/11/06 09:16:53
赤・白・黒で差がないとすると
延べ18回つって78匹=1回で4.33匹つれるはず。
しかしこれでは、全部同じになってしまいます。
う〜ん・・すいません。どうも平均と期待値がごっちゃになってますね。
10:132人目の素数さん
07/11/06 12:50:32
>>9
カイ自乗適合度検定だったら、こんな風に考える。
腹を空かせて食いつき、"必ず"針に掛かってしまう78匹の魚が居る。
いま海の中には、餌の付いた赤・白・黒、色とりどりの針が
10:3:5の比で存在する。
1匹目:さあ、どの色に掛かろうかな?
2匹目:さあ、どの色に掛かろうかな?
・・・
78匹目:さあ、どの色に掛かろうかな?
帰無仮説の下で考えた、赤・白・黒の針に各々掛かるであろう魚の数が、期待度数。
観測度数は>>5から計算してちょ。
11:5
07/11/06 15:07:43
>>10様
赤にかかるのは、18分の10の確率、すなわち78匹いれば43匹が赤にかかるはず。
同様に白なら13匹、黒なら22匹かかるはず。
これが期待値でしょうか?
期待度数、観測度数と期待値、観測値というのはまた別物なのでしょうか?
理解ができなくて申し訳ないです。
12:132人目の素数さん
07/11/06 15:42:00
やっとスレが伸びてると思ったら釣りか。
13:5
07/11/06 23:01:59
釣りではないのですが、>>11の最後から2行目は反射的にかいてしまったので忘れてください。
例)サイコロを振ったときにでる目の期待値というのなら、
1x(1/6)+2x(1/6)・・・6x(1/6)=3.5というのは理解できるのですが
この場合、延べ180針を使い、赤に100針中36尾、白に30針中11尾、黒に50針中31尾、合計78針で(102針はつれなかった)釣れた。
もし赤白黒で差がないのであれば、赤なら全体180針の内100針を占めており、その割合はすなわち釣れた78尾中の割合になるはず
釣れる期待値:赤(100/180)*78=43、白(30/180)*78、黒(50/180)*78
釣れない期待値も同様に求めて、(期待値-実測値)^2/期待値の総和=カイ二乗値(9.828・・・)
こういう考えでしょうか?
どこが間違っているのか、なんかすっきりしません。
アドバイスお願いいたします。
14:10
07/11/08 02:53:12
>>13
なら分割表かな?
赤 白 黒 計
釣れた 36 11 31 78
釣れない 64 19 19 102
計 100 30 50 180
結果(釣れた、釣れない)が、サビキの色(赤、白、黒)と独立かどうかを検定。
上の数値が観測度数。期待度数の計算は教科書とか見てね。
てかホントの話だよね?練習問題とかでなく、、、
15:132人目の素数さん
07/11/08 05:29:28
AR()とかARIMA()とかを勉強しているのですが、いまいち分かりにくいです。
SPSSではなく、Rをつかって勉強しているのですが、
「SPSSによる線型混合モデルとその手順 石村 貞夫¥ 3,360」
って分かりやすいですか?
どなたかよろしくお願いします。
16:132人目の素数さん
07/11/09 19:13:22
robust statisticsについて
最良の本は?
英語でもよし
ちゃんとわかりやすいのね
専門家じゃないので
17:16
07/11/09 20:42:27
てかrobust statistics
って新しい分野なのかな?
18:132人目の素数さん
07/11/10 13:32:36
>>16
一つの分野になってたとは知らなかった。
Wiki に参考文献含めて解説でてるけど、それじゃダメ?
URLリンク(en.wikipedia.org)
19:16
07/11/10 22:35:05
俺は本読むの遅いんで
なるべく良書を最初から読みたい
洋書の良書って
よくわからんのだよね
しかもマイナーそうだし
だれか情報を
20:132人目の素数さん
07/11/10 22:35:50
フエラーを詠めばいい
21:16
07/11/10 22:46:55
>>18
Good books on robust statistics include those by Huber (1981), Hampel et al (1986)
and Rousseeuw and Leroy (1987). A modern treatment is given by Maronna et al (2006).
Huber's book is quite theoretical, whereas the book by Rousseew and Leroy is very
practical (although the sections discussing software are rather out of date, the bulk
of the book is still very relevant). Hampel et al (1987) and Maronna et al (2006) fall
somewhere in the middle ground. All four of these are recommended reading,
though Maronna et al is the most up to date.
practicalってやつがいいかな???
あんま理論的(ルべーグとか)なのはよくわからんしな
22:132人目の素数さん
07/11/15 09:06:41
尤度比って何ですか?
23:132人目の素数さん
07/11/15 09:07:11
あげ
24:132人目の素数さん
07/11/15 13:57:30
>>22
二つの仮説H_1, H_2 があって、
その密度関数をf_1, f_2 とするとき、
f_1(x)/f_2(x) のこと。
観測値xに対してこの値が大きければ
H_1 の方が正しいモデルである可能性が高い。
25:132人目の素数さん
07/11/15 19:35:55
簡易な本に掲載されているやり方ではなく統計のプロがやる手順を知りたいのです。
目的は『予測すること』。目的変数は1個、説明変数は複数個です。
自分で調べてわかっている範囲を手順を記載します。間違っている、もしくは足りない箇所があれば教えてください。
【関係確認→変数変換】まず目的変数と説明変数の散布図を確認し、関係を把握する。
線形ならOK、非線形(単調増加)なら変数変換する、非線形(二次式以上)なら?
つぎに、分布の正規性をヒストグラムで確認し、違うならBox-Cox変換する。
これでデータ準備完了?
【手法の選択】
@もし変数変換しても改善しないならノンパラメトリック分析を選択する。
A変数変換で改善したならパラメトリック分析を実施。この場合(線形?)重回帰分析?を選択。
(OLS回帰とGLS回帰の選択方法がどんなときにどちらを選択するか教えてください)
次に多重共線性を調べ変数除去する。(逐次法、増減法)
準備が整ったので解析を実施。
不備な点をご指摘お願いします。
26:132人目の素数さん
07/11/15 19:39:04
実装関連の信頼性解析について調べ始めているところです。
早速ですが,メディアンランク法の
F(t)=(Σri-0.3)/(n+0.4)
の0.3,0.4とは何でしょうか。
27:132人目の素数さん
07/11/16 16:46:45
そもそも回帰分析の一般的方法が
1レスで収まるくらいなら苦労しないよ。
まあ、何点かコメント。
散布図を確認するのはいい心掛けだけど、そこでは、
まず異常値があるかどうかをチェックすべきだろうな。
あった場合にその扱いをどうするかは場合による。
それから、サンプルは本当に独立性を満たしているか?
満たしていなければ、いろんな方法でモデルを工夫
しなければいけない。
回帰分析では最終的な誤差の分布が問題なのであって、
元の変数の分布はモデルの正当性とは関係がない。
なので、最初に変数変換をすればOKというわけではなく
実際に回帰してみて、モデルの診断を行うという試行錯誤を
せざるをえない。
その他、いろいろな問題が生じうるが、
当然ながら全部は書ききれない。
28:132人目の素数さん
07/11/17 06:42:41
>>25
>不備な点・・・
回帰分析の回帰診断ステップが、ごっそり脱落していますが。残差の分布や
寄与率の大小を点検するステップが。
>自分で調べてわかっている範囲を手順を・・・
学校では講義がなく、何かの事情で独学を始めたということですか?
統計分野の知識素養があれば独学も楽しからずやでしょうが、大変ですね。
29:25
07/11/17 09:43:12
>>27
>それから、サンプルは本当に独立性を満たしているか?
これは項目間の独立性(多重共線性問題)のことでしょうか?
>>28
>学校では講義がなく、何かの事情で独学を始めたということですか?
実務で使う必要性がでてきたのです。もともと数学や統計の勉強は好きなので楽しんでやってますよ。
「回帰診断」で検索かけたらいろいろな情報がでてきましたのでまた調べてみます。
私にとっては回答頂いた文章の中で知らない単語がでてくるだけで、調べるヒントになるのです。
ありがとうございます。
30:27
07/11/17 13:07:59
いやいや、例えばある病気について100の症例を調べるにしても、
もし同じ人が2回その病気にかかって2回カウントされていたら、
その2つの症例は独立とはいえないでしょ。そういう時は、パラメータ
の信頼区間が独立なサンプルの場合に比べて大きくなったりする。
別の例をあげると、時系列や空間データの場合には隣り合うサンプルが
相関していることが多い。
蛇足だけど、統計って教科書読んでるだけだとなかなか感覚が
掴めない。適当なデータを放り込んで分析してみるといろいろ
分かってくるよ。
31:132人目の素数さん
07/11/17 17:48:54
>>30
>空間データの場合には隣り合うサンプルが
> 相関していることが多い。
今分析対称のデータはこれに当てはまります。
1つの板の中に場所を表す番地1〜40があり、その各番地の複数データがサンプルです。
これの対策は何かあるのでしょうか?
32:132人目の素数さん
07/11/18 16:52:14
マクネマーとカイの二乗検定ってエクセルでできるんですか?
33:132人目の素数さん
07/11/18 16:53:45
四択の選択肢の質問で
個人属性ごとに有意差つける
場合どのような検定を行えばいいのですか?
34:132人目の素数さん
07/11/19 00:14:58
age
35:132人目の素数さん
07/11/19 04:15:09
>>32
カイ二乗検定は、chitest()で出来る。
McNemar検定そのものは、エクセルにはないが、
chidistを使えば統計量は簡単な関数で書けるし、
p値は、chiinvを使えば出せる。
まずはエクセルのヘルプを見るべし。
36:132人目の素数さん
07/11/19 04:40:19
>>33
4つの選択肢が順位尺度か否かによる。
順位尺度でないなら、単なるchi square test(サンプル数が
少なければFisher's exact test)でOK。この場合、選択肢
と個人属性が独立であるかだけを検定することになる。
順位尺度なら、通常はどの個人属性がより大きい値をとって
いるかに興味があるはず。この場合は、属性をペアにして、
値の大小を比べるテストをした方が良い。例えば、A,B,C
の3つの属性があるなら、AとB、AとC、BとCを各々比べる。
私が知っているのは
Wilcoxon ranksum testにおいて同順位のサンプルによる影響を
補正したWilcoxon exact test。他にも方法があるかも知れない。
もしこれが難しすぎるなら、4つの選択肢を適当なところで
区切って二値の変数にしてしまえば、通常のカイ二乗検定で
大小を検定できる。
37:132人目の素数さん
07/11/19 04:48:01
>>31
同じ地点の複数サンプルだけを補正したいなら、
repeated measure ANOVA (mixed effect modelの一種)
を使えば、同一地点からのサンプルの相関を補正できる。
地理的な位置から来る相関を考慮するモデルは、
spatial statistics (空間統計学)と呼ばれる分野の人が
やってるらしいが、私は詳しくは知らない。
38:132人目の素数さん
07/11/19 18:21:26
同一の母集団から、4つの方法でサンプルを採取した場合に方法ごとに取れるサンプルに有意な差があるかを検定する場合、何検定を使えばよいのでしょうか?
【具体例】
大小様々な水風船が無限に入ってるプールで針を大・中・小・極小と4種類つかって風船を釣ってみた。
このとき釣れる水風船の大きさや数と針の間に関係があるかどうか。そして針ごとに有意な差があるかどうかを検定したい。
関係の有無はカイ二乗検定でいいかなとおもうのですが、針ごとに有意な差があるかどうかは何をつかうべきでしょうか?
39:132人目の素数さん
07/11/19 21:11:28
>>30
>適当なデータを放り込んで分析してみると・・・
重回帰分析演習上達に適当なデータを開示しているWebページを、何例か
紹介願えませんか。
40:132人目の素数さん
07/11/20 08:34:38
>>39
とりあえず有名どころ。
URLリンク(kdd.ics.uci.edu)
41:132人目の素数さん
07/11/20 16:28:03
どなたか教えてください。
お願いしします。
母集団分布における確率空間についての質問です。
身長の統計調査を例にとる. 国民全体( N 人) をU とおき, その上の確率Q を
Q[u] =1/N , u ∈ U
とする. ここで確率空間(U,Q) が得られたので,
Y (u) = u 個人の身長, u ∈ U
として(U,Q) 上の確率変数を定義する. このY (u) の分布が母集団分布である.
つぎに, U からu1, u2, ・ ・ ・ , un のn 人を無作為に選び, 標本調査を行う. その標本を
w ≡ (u1, u2, ・ ・ ・ , un)
として, 次のように新しい確率空間(Ω,F,P) を与える:
Ω ≡ {w = (u1, ・ ・ ・ , un) : u1 ∈ U, ・ ・ ・ , un ∈ U}
P[w] =(1/N)^n
最後の(1/N)がn乗になる理由が分かりません。
どなたか詳しく、分かり易く教えていただけないでしょうか。
お願いします。
42:132人目の素数さん
07/11/20 16:31:45
>>38
カイ二乗検定をした後で有意差を検定するってことは、
ペア毎に差を比べるってことかな?
その場合、風船の大きさが針ごとに正規分布してるかどうかが問題になるね。
サンプルがかなり大きければあまり気にしなくても良いけど。
正規分布を仮定するなら2標本のt検定だし、
そうでないなら変数変換をしてt検定するか、
変数変換せずにWilcoxon ranksum test をやる。
全ての変数をまとめて検定するっていうのなら、
正規分布ならANOVA、一般の場合はKruskal-Wallis testとかかな。
その場合、全体的に差が有意かどうかしか分からない。
43:132人目の素数さん
07/11/20 16:36:05
>>41
問題文には書いてないけど「重複を許して」「順番も区別して」
n人を選ぶって意味だからでしょ。
44:38
07/11/20 17:04:32
>>42氏どうも
つれた風船の大きさと針の関係をU検定する場合
2つのグループ間での検定となりますよね?
大と中、大と小、大と極小、中と小、中と極小、小と極小(この6個の組み合わせ)
これについてそれぞれU検定をかけて、例えば大>中、中>小、大>小(それぞれp<0.05)となったとしてこの場合、大>中>小(p<0.05)という判断でいいのでしょうか?
45:41
07/11/20 18:43:41
>>43
回答ありがとうございます。
何故、重複を許しても大丈夫なのでしょうか?
母集団の重複を許すと、この場合、国民ですので、同じ人を選ぶことになってしまいます。
そこがわからなくて(^^;
46:132人目の素数さん
07/11/21 00:41:26
1「そう思う」2「どちらかと言えばそう思う」3「わからない」
4「どちらかといえばそう思わない」5「そう思わない」
という選択肢で質問した場合、
「わからない」を除外したもので、1と2で「そう思うと回答したもの」
と4と5で「そう思わないと回答したもの」と考えてカイの二乗検定を
行ってもいいのでしょうか?
47:132人目の素数さん
07/11/21 03:03:46
標準正規確率変数XについてP(|X|=∞)は、ほとんど確実に0ですよね?
48:132人目の素数さん
07/11/21 04:09:50
>>45
私も同じ人を選ぶのはおかしいと思うが、
そういう設定なのだから仕方ない。
もしかしたら、母集団に対して標本が極端に少なく、
重複する可能性が極めて低いので気にしていないのかも。
>>46
問題ない。
>>47
正規分布のsupportは(-∞,∞)だから、P(|X|=∞)=0だろ。
49:132人目の素数さん
07/11/21 04:16:12
>>44
大>中>小が全て有意だと言うのは分かるけど、
まとめてp<0.05って書くのはちょっと気になるなあ。
全ての不等号は水準5%で有意、とかきちんと書いた方がいいんじゃ。
ちなみに>>42も含めこのスレ>>30以降の回答が今のところ全部自分。。
50:132人目の素数さん
07/11/21 09:38:03
>>48
ありがとうございます!
(P(|X|=∞)を質問した人間です。)
いやいや、正規分布を誤解してましたm(__)m
51:132人目の素数さん
07/11/21 15:11:01
つか、そもそも任意の実数 a について、P(X=a) = 0 だろ。
あと ∞ という数は無いから、lim[a→∞] P(|X|=a) = 0 な。
52:132人目の素数さん
07/11/21 15:12:05
>>>46
>問題ない。
まとめるならなぜわけて回答させたんだよ??ってつっこみうるのは問題
53:132人目の素数さん
07/11/21 20:03:18
>>51
そもそも、大数の強法則を考えれば、即座でしたね…。
チェビシェフの不等式→ボレル・カンテリの補題という王道パターンからでも示せる事に気が付きましたm(__)m(間違っていなければ。)
てことは、期待値が有限の確率変数は確率1で有限値しか取らないってことになりますか?
54:132人目の素数さん
07/11/21 21:50:46
>>52
解析する段階でメンドクサクなったからです。
本など見るとまとめた方がやりやすいと書いてありましたし。
55:132人目の素数さん
07/11/22 01:32:16
>>51は、何か根本的な勘違いをしている気がする。
測度論的な統計学を勉強する前にもうちょっと
基本的な数学のトレーニングをした方がいいんじゃない?
>期待値が有限の確率変数は確率1で
>有限値しか取らないってことになりますか?
これは正しい。
56:132人目の素数さん
07/11/22 01:37:03
>>52
きちんと考えればmultiple testingの問題なんだろうけど、
厳密な立証を求められる医薬系以外でそこまで問題にされることは
少ないのでは。
事後的なサーベイ程度なら、むしろ、区分をしすぎることによる
カイ二乗検定の近似誤差の方が問題だろ。
そんな場合には、Fisher's exact test を使う。
57:132人目の素数さん
07/11/22 09:48:41
>>55
>>53です。どうもありがとうございますm(__)m
私は理系の人間では無いのですが、知っていなければ恥ずかしいような内容なだけに、疑問が解消されて良かったです。勘違いをして二年ほど過ごしていたようです…。
58:132人目の素数さん
07/11/22 12:17:59
これアンカーミス?↓
55 :132人目の素数さん:2007/11/22(木) 01:32:16
>>51は、何か根本的な勘違いをしている気がする。
56>むしろ、区分をしすぎることによるカイ二乗検定の近似誤差の方が問題だろ。
だから何で区分して質問しておいて後でまとめちゃうんだよ、って
59:132人目の素数さん
07/11/22 13:04:29
>>58
54でも答えてますけど、統計の本には2×5では大変なので
まとめて「そう思う」「分らない」「そう思わない」と
2×3にした方がいいと書いてあったのですが・・・。
60:132人目の素数さん
07/11/22 13:11:23
>>58
目的は有意差をみることだからまとめることには別に問題はない。
ただまとめ方自体が恣意的だと、正しい検定にならない。
61:132人目の素数さん
07/11/22 15:10:30
いろいろ分類していった結果
25人と5人とか30人と10人とかになってしまいました(一応有意差あり)
こんな小さなサンプルで有意差出しても大丈夫なんでしょうか?
62:132人目の素数さん
07/11/22 17:06:35
>59 書名は?
>60 まとめることの是非ではなく、1〜5で答えさせたことの是非
63:132人目の素数さん
07/11/22 17:11:37
URLリンク(sociology.jugem.jp)
URLリンク(www.okayama-u.ac.jp)
2.2.8.数量データを無理やりカテゴリー分けする
独立変数や従属変数が連続変量であるにもかかわらず,それらを“上,中,下”群のように分けて分析することをいう.
たとえば,調査の段階で具体的な年齢を質問しているにもかかわらず,分析の段階では“30歳以上”群と“30歳未満”群
に分けて各群の得点の差を検定したり頻度のχ2検定をしたうえで,“○○については年齢による差が認められた”というよ
うに結論を下している発表を聞いたことがある.これとは別に,大学生に不安検査を行ない,不安得点に応じて“高不安群”
,“中不安群”,“低不安群”に分けて分析をしている発表を聞いたことがある.これらの例は少なくとも3つの問題点を含
んでいる.1つは2.2.7にも述べたように,事後的に作為的なカテゴリー分けが行なわれる可能性があること,第2に,連続
変量がもつ種々の貴重な情報をわざわざ捨てていることである.
64:132人目の素数さん
07/11/22 18:26:06
>>62
>60
学部生の論文なので勘弁して下さい。
65:132人目の素数さん
07/11/22 20:13:01
pが0.06とか0.05・・・
になる時って有意差はないが
大きな差があったとか言ってもいいのですか?
66:132人目の素数さん
07/11/23 15:10:29
age
67:132人目の素数さん
07/11/23 16:18:35
>>63
まあ、統計っていうのは正しい手法が自明なものではないので、
具体的なモデルを提示しない批判はあまり意味がない。
二つの順序変量の場合は、上の方で述べたように
Wilcoxon exact testあたりを使うのが
情報のロスは少ないかも知れないとは思う。
ちなみにリンクの一つ目の書は「順序変量を誤って連続変量と
みなした人」を想定して批判をするという意味のないことを
やっていると思う。書評を読んだだけなので断定的なことは
言えないが。
68:132人目の素数さん
07/11/25 17:43:10
仮説検定をやっているんですけど、t値とp値が有意水準を片方だけ満たして
片方だけみたさないことってありますか?初心者ですいません
69:132人目の素数さん
07/11/26 05:23:15
>>68
ないです。そもそもt値からp値を計算しているので。
70:132人目の素数さん
07/11/26 16:25:50
Rで学ぶデータマイニングII
URLリンク(www.amazon.co.jp)
を買おうかどうしようか迷ってるんだけど、
使った人はいるだろうか。
卒論の時系列解析の参考にしようかなと思ってる。
SとRは1年間大学で学んだし、web の R-tips はよく見るから
上記のIは買ってない。
71:132人目の素数さん
07/11/26 16:41:53
Rスレで聞いた方がいいんじゃない?
72:132人目の素数さん
07/11/26 16:49:22
うん…。書き込んで数学板検索してるうちにそう思った…。
マルチになるけど、Rスレにも書き込もうと思う。
もちろん、このスレも1週間はROMるから、
返事もらえてたらすごく嬉しい。ありがとう >>71
73:132人目の素数さん
07/11/28 16:09:52
test
URLリンク(www.uploda.net)
74:132人目の素数さん
07/11/29 08:44:08
つり橋効果の実験で、つり橋を渡っている時にたのめば65%、
渡ってからすこし後だと37%の男性が〜というデータがありますが、
その内訳が23人中7人で37%、20人中13人で65%となっており、
サンプル数が少なすぎる気もするのですが統計学的にはどうなのでしょうか。
75:132人目の素数さん
07/11/29 09:14:56
何を頼むの?
76:132人目の素数さん
07/11/29 09:16:15
>>70
あの本に入ってるコードでGARCHはできるけど、使いたいモデルによるかも?
何がしたい??
77:132人目の素数さん
07/11/29 09:34:18
>>75
連絡先をおしえてくれとかそんなことです。
78:132人目の素数さん
07/11/29 10:45:08
!がよくわかんね
79:132人目の素数さん
07/11/29 11:39:25
>>77
携帯で頼む訳ね
展望台からとか
80:132人目の素数さん
07/11/29 12:10:17
wikipにリンクあった
URLリンク(www.fpce.uc.pt)
81:132人目の素数さん
07/11/29 17:34:00
>>74
Fisher's exact test で、
p-value を計算してみたら、、、
おっと学校の宿題には答えない約束だったw
82:132人目の素数さん
07/12/02 00:12:08
C言語かC++で仮説検定とか推定の計算をしたいのですが、
標準ライブラリにはχ2乗分布の累積密度関数などが入っていません。
統計処理用ライブラリやソースを公開しているサイトや書籍はありませんか?
83:132人目の素数さん
07/12/02 15:17:29
相関係数を計算する上での前提条件に正規性は必要ですか?
また他の前提条件はあればご教授をお願いします。
84:132人目の素数さん
07/12/02 17:15:40
>>82
URLリンク(www.alglib.net)
本は Numerical Recipes in C(++) とか。
>>83
相関係数の定義に必要なのは分散・共分散だけ。
85:132人目の素数さん
07/12/03 03:05:00
>>84
ありがとうございます。
前提条件はなしですか。
以下自分なりに調べてみたところ、注意すべき点としては、
直線性、外れ値を調べたほうがよいとありました。
直線性、外れ値を調べる方法で数値で判定する方法
(プログラムして自動で判定したい)があれば教えていただけないでしょうか?
86:132人目の素数さん
07/12/04 02:29:09
>>84
ありがとうございます。
amazonで注文してみます。
87:132人目の素数さん
07/12/04 23:43:51
比率(変化率)の統計を求めるのは、統計学的に
許されるのでしょうか?
つまり、
値A1,A2・・・An
値B1,B2・・・Bn
があった時、Ai,Bi間の変化率[%] Ci = 100*(Bi-Ai)/Ai が
A,Bと同じくn個あったとき、このCの標準偏差や分散を求める
ということです。
88:132人目の素数さん
07/12/05 00:17:08
>>87
よく使うよ。
株式や企業の収益率の変化とかが代表例かな。
89:132人目の素数さん
07/12/05 20:39:33
>>88
さんきゅう
90:132人目の素数さん
07/12/05 21:16:08
>>88
企業価値相関、算出しとる?
91:132人目の素数さん
07/12/05 23:08:01
>>90
ごめん。やったことない。
92:132人目の素数さん
07/12/06 18:17:12
統計を勉強し始めたばかりなのですが、よく出てくる「ordination」という単語の日本語訳がよくわかりません。
いろいろ調べて意味はなんとなくわかってきたのですが、日本語にする時にどうすればいいのか分かりません。
初歩的な質問で申し訳ありませんが、どなたか教えていただけないでしょうか?
93:132人目の素数さん
07/12/06 19:59:29
多変量解析
94:132人目の素数さん
07/12/06 21:34:09
>>92
ordinalを行うという名詞だな。順序づけ。
でも一般には単にオーディネーション。
95:132人目の素数さん
07/12/07 11:37:03
>>92.93
ありがとうございます!
辞書で調べてもキリストとか出てきてさっぱりだったんですが、もとは「ordinal」だったんですね!
例えば
「ordination diagram」 順序付けした図
「ordination axis」 順序付けした軸
「canonical ordination」 標準的な順序付け
ってなるんでしょうか?
96:132人目の素数さん
07/12/07 13:31:01
携帯電話に関するのアンケートに協力してください。
2,3分で終わりますんで、、、
URLリンク(www.efeel.to)
卒論で多変量解析をするため
回答数が必要なのでよろしくお願いします。
97:132人目の素敵さん
07/12/10 23:29:02
信頼係数と信頼区間の幅の関係ってどう説明したらいいんですかね?
あと交互作用効果ってどんな効果ですか?
98:132人目の素数さん
07/12/11 00:32:31
正方形の同じ一点にaとbがあります。ここを始点とし、コインが表ならa裏ならb
を隣の点に右回りで動かします。
この場合、n回目に二つとも同じ点にある確率を求めよ。
99:132人目の素数さん
07/12/11 06:06:28
統計学を勉強し始めなのですが、検定(?)という習ってない分野に入り、
「感染者230人のうち110人はその伝染病で2年後には死んでしまう。
2年後に死んでいる可能性は半々である(α=0、5)という仮説を検定しなさい。」
という問題でさっそくつまづいてます。どう解き始めるのですか?
簡単過ぎだと思われるのかわからないんですが、決して釣りではないです。
どなたか教えてください。お願いします。
100:132人目の素数さん
07/12/11 13:49:51
>>99
「2年後に死んでいる可能性は半々である」という帰無仮説の下で
230人のうち何人死ぬかどうかの分布を求める(例えば、最も可能性
が高いのは115人)。サンプルサイズが割りと大きいから正規分布で
近似すると良い。そして、死者が110人以下になる確率がどのくらい
あるのかを計算し、それが一定基準以下だったら帰無仮説を棄却
すればよい。
101:132人目の素数さん
07/12/11 21:30:28
ビジネス統計学という授業の問題です…教えてください…
1.以下の9個の2変数データ(x,y)を用いて問に答えよ。
(−4,16)(−3,9)(−2,4)(−1,1)(0,0)(1,1)(2,4)(3,9)(4,16)
(1)xとyそれぞれの平均値と分散を求めよ。
(2)散布図を描け。
(3)これらのデータを用いて相関係数を計算したところ、その値は0であった。この相関係
数と(2)で描いた散布図を参考にxとyの関係について分かることを述べよ。
2.平均20、分散9の正規分布における以下の範囲には全体の何%が含まれるか。
(1)20〜23 (2)22.4〜24.8 (3)17〜21.2
102:132人目の素数さん
07/12/11 21:31:53
竹中平蔵【びんぼうゆすりみたいな状態】になる
インタビューで竹中の担当の読売新聞記者が全裸で穴にバイブを入れたまま殺された?自殺した?ことなど
を、全部竹中にぶつけると【びんぼうゆすりみたいな状態】になった。
9.15 リチャード・コシミズ東京講演会 全編 (3時間24分)
【びんぼうゆすりみたいな状態】になった話は16分から
URLリンク(www.asyura2.com)
もと総理が過去に3人を殺した話もでてくる
103:132人目の素数さん
07/12/11 21:34:37
>>101
自分で解いてから質問しろかす
104:132人目の素数さん
07/12/11 22:17:56
100さんわかりやすい説明ありがとうございます。
105:132人目の素数さん
07/12/12 10:51:43
いや、100は片側検定だが・・・
106:132人目の素数さん
07/12/12 13:03:20
>>105
そうだけど、この場合に限ればどっちみち対称だから閾値だけの問題。
107:132人目の素数さん
07/12/12 17:16:11
そこまでわかるなら99を書くはずがない
108:132人目の素数さん
07/12/12 20:27:37
数学系の学生で、今外れ値について勉強しています。外れ値を見つける方法として、グラブスの方法、トンプソンの方法、増山の方法をよく見つけたのですが他によく使われている方法はありますか?
あと、トンプソン、増山の方法の中身(その式でなぜ外れ値が検証できるか)を説明しているサイトや文献あれば教えてもらえますか?よろしくお願いします。
109:132人目の素数さん
07/12/13 05:17:36
>>98
斬か式で解く問題だね。大学入試に出る。東大京大が好きそうな問題だな。
n回目に同じになるためにはn-1回目は隣合っている&遅れてる方が動く必要がある。
n回目に同じ位置にいる確率をA(n)、一つはなれている確率B(n)、二つはなれている確率C(n)とすると、
A(n)=0×A(n-1)+(1/2)^2×B(n-1)+0×C(n-1)
B(n)=1/2×A(n-1)+0×B(n-1)+1/2×C(n-1)
C(n)=0×A(n-1)+1/2×B(n-1)+0×C(n-1)
この3式からA(n)についての斬か式を作る。
A(n)=(1/2)^3×A(n-2)+(1/2)^3×C(n-2)
まずこれを解く、
A(n)=1/8×A(n-2)+1/8×C(n-2)
比例定数1/8の斬か式より
A(n)=〜………@
同様にC(n)についても解く。
C(n)=〜………@
@AよりA(n)=〜
110:132人目の素数さん
07/12/13 05:19:53
>>101
あまりに基礎すぎる。
自分でやったほうがいい。
111:132人目の素数さん
07/12/13 07:57:25
>>101は単発質問スレ立てし
その直後に、ここに書き込みとな(マルチ)
誰か教えてください…
スレリンク(math板)
もう数学板に来なくていい
ってか氏ね
112:132人目の素数さん
07/12/14 00:05:58
時系列解析のゼミに入ってるんですが、もしかしてこの分野ってマイナー気味ですか?
113:132人目の素数さん
07/12/14 01:29:38
>>109
ありがとうございました
114:132人目の素数さん
07/12/14 01:59:49
俺だったら2項分布を mod 4 で集計しようとするけどね
115:132人目の素数さん
07/12/14 18:24:54
合ってますでしょうか。
↓
ある模擬試験に 5000 人が受験したところ,
その成績は,平均値 65 点,標準偏差 10 点の正規分布に従った。
(1) ある生徒が,75 点以上 85 点以下である確率を求めよ。
(2) この試験において,上位 5 %に入るためには,何点以上あればよいか。
(3) この試験において,順位が 100 番以内に入るためには,何点以上あればよいか。
問題文はつまりN(65,10^2)であり、
標準正規分布をz、この問題の正規分布をuと置く。
(1)
P(75<_x<_85)
zに変換して
P(1<=z<_2)
=P(0<=z<=2)-P(0<=z<=1) 正規分布表より
=0.477-0.341=0.136
答え 13.6%
116:115
07/12/14 18:25:29
(2)
P(z<=u)=0.05となるuを探せばよいので、
P(0<=z<=u)=0.5-0.05=0.45
正規分布表からu=1.64
uからzへの変換式から
(x-65)/10=1.64
これを解いて
72.9点
答え 72.9点以上あればよい
(3)
100/5000=0.02
P(z<=u)=0.02
となるuを探す。
P(0<=z<=u)=0.5-0.02=0.48
分布表より0.48は2.05。これを変換式に代入し、
(x-65)/10=2.05
x=85.5
答え 85.5点以上あればよい
117:132人目の素数さん
07/12/14 19:09:55
片側しか見ていないから×
118:132人目の素数さん
07/12/14 22:07:24
あるデータを収集し、その分析をしなくてはいけません。
SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。
ランダムにN=40のサンプルを2群に分けました。
属性が等質であることは確認しました。
介入群と対照群の2群に対して、
介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。
介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。
教えてちゃんですみません。
よろしくおねがいします。
119:132人目の素数さん
07/12/15 02:22:52
>>117
意味分からん。>>115-116であってると思うけど。
120:132人目の素数さん
07/12/15 02:31:27
>>118
各時点で比較したいだけなら、単なる二標本の検定でしょ?
普通にWilcoxon exact rank sum テストとかをやればよいのでは。
やり方がよく分かんなかったら
無理矢理順序尺度を二値の変数にして、
カイ二乗検定とかでも大丈夫かも。
121:118
07/12/15 12:53:38
>>120
ありがとうございます。
私の書き方が不足していたのですが、
最終的に「介入することで○○分後の尺度に変化が見られる」という結果を導き出したいと思っています。
となると、
1.2群それぞれの時間経過に伴う尺度の変化についてRepeated Measures ANOVAをして
2.それで前後の値が変化したといえるのかどうかについて検討し
2.さらにその各時点ごとにWilcoxon exact rank sum testをしてそれが2群で違うといえるのかを見る
・・・・・・ということでよろしいのでしょうか?
本当に本当に初歩的な質問でごめんなさい。
決して釣りではありませんので、よろしくお願いいたします。
122:132人目の素数さん
07/12/15 15:56:29
>>121
うーん、きれいな定式化は難しそうな問題だなあ。
分析方法は結構主観によるところが大きいと思う。
自分だったら、ひとまず全部の情報を一つのモデルに盛り込むのは
難しいと考えて二時点間だけの比較をする。
(例:直前と直後、直前と5分後、直前と10分後...と試して、
最終的に、どの時点間で差が有意になるのか見ればよい。)
でもって、順序尺度の2時点間の差を連続な変量とみなせるのか
単なる順序尺度の差とみて「改善、不変、悪化」くらいに分ける
べきなのかを考えて、適切なモデルを選択する。
あとは、単なる2標本の検定。
頑張ればもうちょっと凝ったモデルも可能なのかも知れないけど。
123:132人目の素数さん
07/12/16 07:51:09
国友 ゲンダイ統計学 日経文庫
が書店においてない。
大学の図書館にも置いてないのにはびっくりした。
124:118
07/12/16 13:22:38
>>122
レスが送れてすみませんでした。
なるほど、そうですよね。
とても貴重なアドバイスをありがとうございます。
頑張ってみます。すごく感謝しています。
125:132人目の素数さん
07/12/19 19:31:18
サンプルが1つずつしかない表(4行×2列、1行目、1列目はラベル)のサンプル間の有意差の求め方ってありますか?
ソフトはエクセル統計を使ってます
126:132人目の素数さん
07/12/19 19:44:25
A大学は卒業生の就職率について、文科系、理科系ともにB大学よりも高いと宣伝している。
このことはA大学全体でB大学よりも就職率が高いことを意味するか。
問題文からして、意味しなさそうなのですが理由がわかりません。ヒントでいいので教えて
頂きたいです。お願いします。
127:132人目の素数さん
07/12/20 00:58:44
文系、理系各々の就職率から、大学全体(文+理)の就職率を求める式を導く。
128:132人目の素数さん
07/12/20 01:05:35
A 文系 1/1 =100%
理系 29/99 =28%
B 文系 9000/9900<100%
理系 20/100 =20%
全体では
A 30%
B 90.2%
反例
129:132人目の素数さん
07/12/20 02:21:44
>>125
データは、3行一列ってこと?
単に、「3つのグループの発生割合が同一」という帰無仮説を
検定したいだけなら、カイ二乗検定をすればよいのでは。
例えば、(15,10,5) がデータなら、(10,10,10)を期待値として
カイ二乗統計量を計算。
130:132人目の素数さん
07/12/20 08:15:32
>>127,128
ありがとうございます。
Bは就職率の高いほうに人数が偏っているってことですね。
131:132人目の素数さん
07/12/20 09:51:14
>>130
反例は一例だから、一応、一般化して解いた方がよい。
たぶん違う大学同士の異なる学科の人数の関係が問題になってくると。
132:132人目の素数さん
07/12/20 11:15:05
>>129
ありがとうございます。
データは3行1列です
カイ二乗検定は正規分布していなくても使えるんですか?
133:132人目の素数さん
07/12/20 13:30:19
>>132
「正規分布してる」って何のこと言ってるんだよ。
主語くらいちゃんと書いてくれ。
>>125の「サンプルが1つずつしかない表」
というのも意味が良く分からないし。
134:132人目の素数さん
07/12/20 14:46:40
CANOCOでCCAをしたいんですが、日本語で説明しているいいサイトないですかね?
135:132人目の素数さん
07/12/22 00:05:27
対応のない2元配置の分散分析を行おうと思っていたデータを
各群それぞれ Shapiro-Wilk 検定にかけてみたら全てアウトでした.
それでノンパラメトリックな方法でやろうと思うのですが,
この場合どんな方法が適当でしょうか?
136:132人目の素数さん
07/12/22 00:51:46
>>135
Friedman検定でないの?
137:132人目の素数さん
07/12/23 15:21:23
正規確率プロット図をEXCELで描きたいのです。
基準化したデータをx軸まではわかります。
y軸に順位に応じた期待する値を入れるとあるのですが、『順位』という言葉に引っ掛かっています。
どのように図を描けばよいのでしょうか?
138:132人目の素数さん
07/12/23 19:52:09
現時点で世界的標準と呼べる確率・統計の本ってどれ?
139:132人目の素数さん
07/12/23 20:17:26
fumio hayashi
Econometrics
140:132人目の素数さん
07/12/24 04:12:54
計量経済信者うぜぇ
141:132人目の素数さん
07/12/24 04:21:02
日本人の書いた世界的な本なら、Ikeda・Watanabeか?
142:132人目の素数さん
07/12/24 05:44:56
重回帰分析を実施する前に、
◆正規性検定(歪度、尖度)で調べる→不可なら変数変換
◆直線性(散布図)→不可なら変数変換
と上記2つを満たすために変数変換する手順、方法をご教授お願いします。
143:132人目の素数さん
07/12/25 07:40:12
>>142
実際のところどうなんだろ?
まず重回帰分析をやって決定係数をだした後に、マルチコ、外れ値、正規性や直線性を決定係数で判断しながら変数変換するのかな。
家にあった5冊の書籍を確認したが手順がわからないね。
144:132人目の素数さん
07/12/25 16:10:05
統計ソフトの英文マニュアルを読んでいます。
CON-file
の「CON」は何の略字でしょうか?
145:132人目の素数さん
07/12/25 22:10:24
キツネ
146:132人目の素数さん
07/12/26 02:17:00
池田渡辺ってだれよ?
147:132人目の素数さん
07/12/26 02:45:54
スタンダードは
ホーエルでは?
148:132人目の素数さん
07/12/26 02:46:29
Fumio Hayashiこそ世界の林です
豊田先生の著書なんかもいいかもしれんね。
149:132人目の素数さん
07/12/26 04:07:57
だから、林は計量経済学であって、確率・統計じゃないだろ。
計量経済学って結局確率・統計の深い所まで書いてないだろ?
渡辺信三を知らないのか?
150:132人目の素数さん
07/12/27 07:31:25
重回帰分析の手順って確立されていないということですか?
151:132人目の素数さん
07/12/27 16:52:25
今数理統計学を大学で履修してるんですけど、
全く理解しないで暗記だけでテスト受けてる感じです。。。
知識詰め込むだけの数学はつまらなくてしょうがないです。
皆さんはどうやって数理統計を勉強してますか?
なにかおすすめの参考書などありますか?
大体有名な分布やそれらの積率母関数の求め方はちゃんと頭に入ってるんで、
これを生かしたいんです。
152:132人目の素数さん
07/12/27 17:43:36
★★小泉純一郎と安倍晋三は朝鮮人★★
コピペして各板に貼り付けよう 知人にも話そう
小泉純一郎
・戦前大臣を務めた祖父小泉又次郎は純粋な日本人とされる。だが、純一郎の帰化朝鮮人である父が鮫島姓を買い取り
又次郎の娘をたぶらかして婿として小泉家に入る そこで小泉家は帰化朝鮮人である純一郎の父に乗っ取られた
参照Wikipedia項目リンク 上下くっけて
%8F%E6%B3%89%E7%B4%94%E4%B9%9F
・父親の純也は、鹿児島東加世田の朝鮮部落の出身者といわれる 日大卒業名簿には、純也の日本名はなく、
見知らぬ朝鮮名が書かれているという
純也は朝鮮人の帰国事業、地上の楽園計画の初代会長であった
・結婚後、子供をもうけ即離婚した宮本佳代子は在日企業エスエス製薬創業者の孫
・小泉の元秘書官の名前は飯島勲←注目 帰化朝鮮人
・派閥のドン森喜朗も生粋の朝鮮人 ←森も帰化人がよく使う通名
・小泉は、横須賀のヤクザ、稲川会と関係が深い
安倍晋三
・岸家 毛利元就が陶晴賢と厳島沖で戦い大勝を収めた際、寝返って毛利方についた船の
調達人が「ガン」と称する帰化人であったという 毛利はその功績によって「ガン」を
田布施周辺の代官に召したてた このガンを岸家の先祖とする説がある
・祖父岸信介が文鮮明と共に 反共団体 国際勝共連合(統一教会)を設立
・官房長官時代統一教会「合同結婚式」に祝電を送り、話題に
・安倍のスポンサーは、下関の朝鮮人パチンコ業者である
・グリコ森永事件時、明らかになった帰化朝鮮人企業森永のご令嬢と結婚
・そのわが国のファーストレディーは電通(会長成田豊、半島生まれの帰化人)勤務という分かりやすい
経歴の持ち主の朝鮮の血筋
・韓国、中国の留学生に日本の企業に入ってもらうために住居費分、学費免除分、生活費など月計20万〜30万円相当の支給
日本人のワーキングプア層を全く省みない また帰化系在日系朝鮮人が日本の企業で技術を盗み、半島の現代などの企業に
伝授していることが深刻な問題になっている
153:132人目の素数さん
07/12/27 18:06:11
>>151
統計数理はあとで役立つ。
基礎トレだから手抜きせずマジにもならずやっとくのが吉。
154:132人目の素数さん
07/12/28 01:01:26
すみません重回帰分析を行っているのですが
定数項を含む場合と含まない場合で相当結果が違ってきます。
特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。
また、説明変数のt値なども両者で相当な違いが見られます。
定数項を含む場合の寄与率の導出等については文献があるのですが
定数項を含まない場合についてがどうしてもよくわかりません。
なぜこのような事になるのか・・・
また、どちらの結果を使うのがよいのか・・・(定数項を分析の際入れるか)
どなたかご教授頂けないでしょうか?
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4803日前に更新/90 KB
担当:undef