[表示 : 全て 最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 11/25 00:14 / Filesize : 90 KB / Number-of Response : 277
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド7



1 名前:132人目の素数さん [2007/10/24(水) 08:52:19 ]
理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。

前スレ:
統計学なんでもスレッド6
science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
science.2ch.net/test/read.cgi/math/1012782106/
関連スレ:
統計学なんて数学じゃないだろ
science6.2ch.net/test/read.cgi/math/1173876727/
= 統計解析フリーソフト R 【第2章】 =
science6.2ch.net/test/read.cgi/math/1152449095/
=統計解析= SASプログラミング
science6.2ch.net/test/read.cgi/math/1184762259/

4 名前:132人目の素数さん [2007/11/03(土) 21:41:30 ]
>>1
他板版関連スレ
◆統計学について語るスレ
science6.2ch.net/test/read.cgi/sim/1012828891/
心理統計スレッド3
academy6.2ch.net/test/read.cgi/psycho/1160242677/
統計ソフト統合スレッド−SPSS・SAS以外
academy6.2ch.net/test/read.cgi/psycho/1012801769/
統計解析ソフト
ebi.2ch.net/rikei/kako/980/980470707.html

5 名前:132人目の素数さん [2007/11/05(月) 22:59:13 ]
つり針が10本ついている仕掛け(さびき)で魚をつりました。
使ったさびきは3種類(赤、白、黒)
それぞれで釣った回数は、赤10回、白3回、黒5回
釣れた魚は
赤が(5、3、4、8、1、0、2、1、5、7匹
白が(3、2、6)匹
黒が(7、5、4、7、8)匹

赤・白・黒の「さびき」で魚の釣れる割合に有意差があるかを知りたい。

【手順】期待値を求める。期待値と実測値の差を二乗して期待値で割ったものの総和を求める=これがカイ二乗検定

ということらしいのですが、そもそも期待値の出し方がわかりません。

どなたかアドバイス頂けないでしょうか?

6 名前:132人目の素数さん mailto:sage [2007/11/06(火) 00:12:06 ]
>>5
まず帰無仮説をたてろ。
帰無仮説が支持される場合は、どのサビキに何匹の
魚が釣れると予想されるか考えろ。

7 名前:5 mailto:sage [2007/11/06(火) 07:26:10 ]
>>6
帰無仮説というと、この場合「さびき」の種類で魚の釣れる割合に「差がない」ということですよね。
赤・白・黒のどれでも同じ割合でつれるはず と。

そうすると期待値は、10本針で10回、3回、5回で述べ180針つかい、つれた数が総計78匹
釣れる割合は43.3%

この割合に比べて、赤・白・黒がどうかとみていくのでしょうか?

やはり期待値というのがまだ理解できておりません・・・


8 名前:132人目の素数さん mailto:sage [2007/11/06(火) 08:53:10 ]
>>7
%ではなくて、各サビキ1回で釣れる魚の数を考えて
みると良い。
帰無仮説が採択される時に予測される魚の数が期待値。

各サビキで1回に釣れる魚の数(算術平均)
-------------------------
    赤  白  黒
-------------------------
実測値 3.60 3.66 6.20
期待値 ?  ?  ?
-------------------------


9 名前:5 mailto:sage [2007/11/06(火) 09:16:53 ]
赤・白・黒で差がないとすると
延べ18回つって78匹=1回で4.33匹つれるはず。

しかしこれでは、全部同じになってしまいます。
う〜ん・・すいません。どうも平均と期待値がごっちゃになってますね。

10 名前:132人目の素数さん [2007/11/06(火) 12:50:32 ]
>>9
カイ自乗適合度検定だったら、こんな風に考える。
腹を空かせて食いつき、"必ず"針に掛かってしまう78匹の魚が居る。
いま海の中には、餌の付いた赤・白・黒、色とりどりの針が
10:3:5の比で存在する。

1匹目:さあ、どの色に掛かろうかな?
2匹目:さあ、どの色に掛かろうかな?
・・・
78匹目:さあ、どの色に掛かろうかな?

帰無仮説の下で考えた、赤・白・黒の針に各々掛かるであろう魚の数が、期待度数。
観測度数は>>5から計算してちょ。

11 名前:5 mailto:sage [2007/11/06(火) 15:07:43 ]
>>10
赤にかかるのは、18分の10の確率、すなわち78匹いれば43匹が赤にかかるはず。
同様に白なら13匹、黒なら22匹かかるはず。
これが期待値でしょうか?

期待度数、観測度数と期待値、観測値というのはまた別物なのでしょうか?
理解ができなくて申し訳ないです。

12 名前:132人目の素数さん [2007/11/06(火) 15:42:00 ]
やっとスレが伸びてると思ったら釣りか。



13 名前:5 mailto:sage [2007/11/06(火) 23:01:59 ]
釣りではないのですが、>>11の最後から2行目は反射的にかいてしまったので忘れてください。

例)サイコロを振ったときにでる目の期待値というのなら、
1x(1/6)+2x(1/6)・・・6x(1/6)=3.5というのは理解できるのですが

この場合、延べ180針を使い、赤に100針中36尾、白に30針中11尾、黒に50針中31尾、合計78針で(102針はつれなかった)釣れた。
もし赤白黒で差がないのであれば、赤なら全体180針の内100針を占めており、その割合はすなわち釣れた78尾中の割合になるはず
釣れる期待値:赤(100/180)*78=43、白(30/180)*78、黒(50/180)*78
釣れない期待値も同様に求めて、(期待値-実測値)^2/期待値の総和=カイ二乗値(9.828・・・)

こういう考えでしょうか?

どこが間違っているのか、なんかすっきりしません。
アドバイスお願いいたします。




14 名前:10 [2007/11/08(木) 02:53:12 ]
>>13
なら分割表かな?

        赤   白   黒   計
釣れた    36  11  31  78
釣れない  64  19  19 102
計      100  30  50 180

結果(釣れた、釣れない)が、サビキの色(赤、白、黒)と独立かどうかを検定。
上の数値が観測度数。期待度数の計算は教科書とか見てね。

てかホントの話だよね?練習問題とかでなく、、、

15 名前:132人目の素数さん [2007/11/08(木) 05:29:28 ]
AR()とかARIMA()とかを勉強しているのですが、いまいち分かりにくいです。
SPSSではなく、Rをつかって勉強しているのですが、
「SPSSによる線型混合モデルとその手順 石村 貞夫¥ 3,360」
って分かりやすいですか?
どなたかよろしくお願いします。


16 名前:132人目の素数さん [2007/11/09(金) 19:13:22 ]
robust statisticsについて
最良の本は?
英語でもよし
ちゃんとわかりやすいのね
専門家じゃないので

17 名前:16 mailto:sage [2007/11/09(金) 20:42:27 ]
てかrobust statistics 
って新しい分野なのかな?

18 名前:132人目の素数さん mailto:sage [2007/11/10(土) 13:32:36 ]
>>16
一つの分野になってたとは知らなかった。
Wiki に参考文献含めて解説でてるけど、それじゃダメ?

en.wikipedia.org/wiki/Robust_statistics

19 名前:16 [2007/11/10(土) 22:35:05 ]
俺は本読むの遅いんで
なるべく良書を最初から読みたい
洋書の良書って
よくわからんのだよね
しかもマイナーそうだし
だれか情報を

20 名前:132人目の素数さん [2007/11/10(土) 22:35:50 ]
フエラーを詠めばいい

21 名前:16 [2007/11/10(土) 22:46:55 ]
>>18
Good books on robust statistics include those by Huber (1981), Hampel et al (1986)
and Rousseeuw and Leroy (1987). A modern treatment is given by Maronna et al (2006).
Huber's book is quite theoretical, whereas the book by Rousseew and Leroy is very
practical (although the sections discussing software are rather out of date, the bulk
of the book is still very relevant). Hampel et al (1987) and Maronna et al (2006) fall
somewhere in the middle ground. All four of these are recommended reading,
though Maronna et al is the most up to date.

practicalってやつがいいかな???
あんま理論的(ルべーグとか)なのはよくわからんしな

22 名前:132人目の素数さん mailto:sage [2007/11/15(木) 09:06:41 ]
尤度比って何ですか?



23 名前:132人目の素数さん [2007/11/15(木) 09:07:11 ]
あげ

24 名前:132人目の素数さん mailto:sage [2007/11/15(木) 13:57:30 ]
>>22
二つの仮説H_1, H_2 があって、
その密度関数をf_1, f_2 とするとき、
f_1(x)/f_2(x) のこと。
観測値xに対してこの値が大きければ
H_1 の方が正しいモデルである可能性が高い。


25 名前:132人目の素数さん [2007/11/15(木) 19:35:55 ]
簡易な本に掲載されているやり方ではなく統計のプロがやる手順を知りたいのです。
目的は『予測すること』。目的変数は1個、説明変数は複数個です。
自分で調べてわかっている範囲を手順を記載します。間違っている、もしくは足りない箇所があれば教えてください。
【関係確認→変数変換】まず目的変数と説明変数の散布図を確認し、関係を把握する。
線形ならOK、非線形(単調増加)なら変数変換する、非線形(二次式以上)なら?
つぎに、分布の正規性をヒストグラムで確認し、違うならBox-Cox変換する。
これでデータ準備完了?
【手法の選択】
@もし変数変換しても改善しないならノンパラメトリック分析を選択する。
A変数変換で改善したならパラメトリック分析を実施。この場合(線形?)重回帰分析?を選択。
(OLS回帰とGLS回帰の選択方法がどんなときにどちらを選択するか教えてください)
次に多重共線性を調べ変数除去する。(逐次法、増減法)
準備が整ったので解析を実施。

不備な点をご指摘お願いします。


26 名前:132人目の素数さん [2007/11/15(木) 19:39:04 ]
実装関連の信頼性解析について調べ始めているところです。
早速ですが,メディアンランク法の
F(t)=(Σri-0.3)/(n+0.4)
の0.3,0.4とは何でしょうか。

27 名前:132人目の素数さん mailto:sage [2007/11/16(金) 16:46:45 ]
そもそも回帰分析の一般的方法が
1レスで収まるくらいなら苦労しないよ。
まあ、何点かコメント。

散布図を確認するのはいい心掛けだけど、そこでは、
まず異常値があるかどうかをチェックすべきだろうな。
あった場合にその扱いをどうするかは場合による。

それから、サンプルは本当に独立性を満たしているか?
満たしていなければ、いろんな方法でモデルを工夫
しなければいけない。

回帰分析では最終的な誤差の分布が問題なのであって、
元の変数の分布はモデルの正当性とは関係がない。
なので、最初に変数変換をすればOKというわけではなく
実際に回帰してみて、モデルの診断を行うという試行錯誤を
せざるをえない。

その他、いろいろな問題が生じうるが、
当然ながら全部は書ききれない。

28 名前:132人目の素数さん mailto:sage [2007/11/17(土) 06:42:41 ]
>>25
>不備な点・・・
回帰分析の回帰診断ステップが、ごっそり脱落していますが。残差の分布や
寄与率の大小を点検するステップが。
>自分で調べてわかっている範囲を手順を・・・
学校では講義がなく、何かの事情で独学を始めたということですか?
統計分野の知識素養があれば独学も楽しからずやでしょうが、大変ですね。

29 名前:25 [2007/11/17(土) 09:43:12 ]
>>27
>それから、サンプルは本当に独立性を満たしているか?
これは項目間の独立性(多重共線性問題)のことでしょうか?

>>28
>学校では講義がなく、何かの事情で独学を始めたということですか?
実務で使う必要性がでてきたのです。もともと数学や統計の勉強は好きなので楽しんでやってますよ。
「回帰診断」で検索かけたらいろいろな情報がでてきましたのでまた調べてみます。
私にとっては回答頂いた文章の中で知らない単語がでてくるだけで、調べるヒントになるのです。

ありがとうございます。


30 名前:27 mailto:sage [2007/11/17(土) 13:07:59 ]
いやいや、例えばある病気について100の症例を調べるにしても、
もし同じ人が2回その病気にかかって2回カウントされていたら、
その2つの症例は独立とはいえないでしょ。そういう時は、パラメータ
の信頼区間が独立なサンプルの場合に比べて大きくなったりする。

別の例をあげると、時系列や空間データの場合には隣り合うサンプルが
相関していることが多い。

蛇足だけど、統計って教科書読んでるだけだとなかなか感覚が
掴めない。適当なデータを放り込んで分析してみるといろいろ
分かってくるよ。

31 名前:132人目の素数さん mailto:sage [2007/11/17(土) 17:48:54 ]
>>30
>空間データの場合には隣り合うサンプルが
> 相関していることが多い。
今分析対称のデータはこれに当てはまります。
1つの板の中に場所を表す番地1〜40があり、その各番地の複数データがサンプルです。
これの対策は何かあるのでしょうか?

32 名前:132人目の素数さん [2007/11/18(日) 16:52:14 ]
マクネマーとカイの二乗検定ってエクセルでできるんですか?



33 名前:132人目の素数さん [2007/11/18(日) 16:53:45 ]
四択の選択肢の質問で
個人属性ごとに有意差つける
場合どのような検定を行えばいいのですか?

34 名前:132人目の素数さん [2007/11/19(月) 00:14:58 ]
age

35 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:15:09 ]
>>32
カイ二乗検定は、chitest()で出来る。
McNemar検定そのものは、エクセルにはないが、
chidistを使えば統計量は簡単な関数で書けるし、
p値は、chiinvを使えば出せる。
まずはエクセルのヘルプを見るべし。

36 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:40:19 ]
>>33
4つの選択肢が順位尺度か否かによる。

順位尺度でないなら、単なるchi square test(サンプル数が
少なければFisher's exact test)でOK。この場合、選択肢
と個人属性が独立であるかだけを検定することになる。

順位尺度なら、通常はどの個人属性がより大きい値をとって
いるかに興味があるはず。この場合は、属性をペアにして、
値の大小を比べるテストをした方が良い。例えば、A,B,C
の3つの属性があるなら、AとB、AとC、BとCを各々比べる。
私が知っているのは
Wilcoxon ranksum testにおいて同順位のサンプルによる影響を
補正したWilcoxon exact test。他にも方法があるかも知れない。
もしこれが難しすぎるなら、4つの選択肢を適当なところで
区切って二値の変数にしてしまえば、通常のカイ二乗検定で
大小を検定できる。

37 名前:132人目の素数さん mailto:sage [2007/11/19(月) 04:48:01 ]
>>31
同じ地点の複数サンプルだけを補正したいなら、
repeated measure ANOVA (mixed effect modelの一種)
を使えば、同一地点からのサンプルの相関を補正できる。

地理的な位置から来る相関を考慮するモデルは、
spatial statistics (空間統計学)と呼ばれる分野の人が
やってるらしいが、私は詳しくは知らない。


38 名前:132人目の素数さん [2007/11/19(月) 18:21:26 ]
同一の母集団から、4つの方法でサンプルを採取した場合に方法ごとに取れるサンプルに有意な差があるかを検定する場合、何検定を使えばよいのでしょうか?
【具体例】
大小様々な水風船が無限に入ってるプールで針を大・中・小・極小と4種類つかって風船を釣ってみた。
このとき釣れる水風船の大きさや数と針の間に関係があるかどうか。そして針ごとに有意な差があるかどうかを検定したい。
関係の有無はカイ二乗検定でいいかなとおもうのですが、針ごとに有意な差があるかどうかは何をつかうべきでしょうか?



39 名前:132人目の素数さん [2007/11/19(月) 21:11:28 ]
>>30
>適当なデータを放り込んで分析してみると・・・
重回帰分析演習上達に適当なデータを開示しているWebページを、何例か
紹介願えませんか。

40 名前:132人目の素数さん [2007/11/20(火) 08:34:38 ]
>>39
とりあえず有名どころ。
kdd.ics.uci.edu/

41 名前:132人目の素数さん [2007/11/20(火) 16:28:03 ]
どなたか教えてください。
お願いしします。

母集団分布における確率空間についての質問です。

身長の統計調査を例にとる. 国民全体( N 人) をU とおき, その上の確率Q を
Q[u] =1/N , u ∈ U
とする. ここで確率空間(U,Q) が得られたので,
Y (u) = u 個人の身長, u ∈ U
として(U,Q) 上の確率変数を定義する. このY (u) の分布が母集団分布である.
つぎに, U からu1, u2, ・ ・ ・ , un のn 人を無作為に選び, 標本調査を行う. その標本を
w ≡ (u1, u2, ・ ・ ・ , un)
として, 次のように新しい確率空間(Ω,F,P) を与える:
Ω ≡ {w = (u1, ・ ・ ・ , un) : u1 ∈ U, ・ ・ ・ , un ∈ U}

P[w] =(1/N)^n

最後の(1/N)がn乗になる理由が分かりません。

どなたか詳しく、分かり易く教えていただけないでしょうか。
お願いします。

42 名前:132人目の素数さん [2007/11/20(火) 16:31:45 ]
>>38
カイ二乗検定をした後で有意差を検定するってことは、
ペア毎に差を比べるってことかな?

その場合、風船の大きさが針ごとに正規分布してるかどうかが問題になるね。
サンプルがかなり大きければあまり気にしなくても良いけど。
正規分布を仮定するなら2標本のt検定だし、
そうでないなら変数変換をしてt検定するか、
変数変換せずにWilcoxon ranksum test をやる。

全ての変数をまとめて検定するっていうのなら、
正規分布ならANOVA、一般の場合はKruskal-Wallis testとかかな。
その場合、全体的に差が有意かどうかしか分からない。







43 名前:132人目の素数さん [2007/11/20(火) 16:36:05 ]
>>41
問題文には書いてないけど「重複を許して」「順番も区別して」
n人を選ぶって意味だからでしょ。

44 名前:38 mailto:sage [2007/11/20(火) 17:04:32 ]
>>42氏どうも
つれた風船の大きさと針の関係をU検定する場合
2つのグループ間での検定となりますよね?
大と中、大と小、大と極小、中と小、中と極小、小と極小(この6個の組み合わせ)
これについてそれぞれU検定をかけて、例えば大>中、中>小、大>小(それぞれp<0.05)となったとしてこの場合、大>中>小(p<0.05)という判断でいいのでしょうか?


45 名前:41 [2007/11/20(火) 18:43:41 ]
>>43

回答ありがとうございます。
何故、重複を許しても大丈夫なのでしょうか?
母集団の重複を許すと、この場合、国民ですので、同じ人を選ぶことになってしまいます。

そこがわからなくて(^^;

46 名前:132人目の素数さん [2007/11/21(水) 00:41:26 ]
1「そう思う」2「どちらかと言えばそう思う」3「わからない」
4「どちらかといえばそう思わない」5「そう思わない」
という選択肢で質問した場合、
「わからない」を除外したもので、1と2で「そう思うと回答したもの」
と4と5で「そう思わないと回答したもの」と考えてカイの二乗検定を
行ってもいいのでしょうか?

47 名前:132人目の素数さん [2007/11/21(水) 03:03:46 ]
標準正規確率変数XについてP(|X|=∞)は、ほとんど確実に0ですよね?

48 名前:132人目の素数さん [2007/11/21(水) 04:09:50 ]
>>45
私も同じ人を選ぶのはおかしいと思うが、
そういう設定なのだから仕方ない。
もしかしたら、母集団に対して標本が極端に少なく、
重複する可能性が極めて低いので気にしていないのかも。
>>46
問題ない。
>>47
正規分布のsupportは(-∞,∞)だから、P(|X|=∞)=0だろ。

49 名前:132人目の素数さん [2007/11/21(水) 04:16:12 ]
>>44
大>中>小が全て有意だと言うのは分かるけど、
まとめてp<0.05って書くのはちょっと気になるなあ。
全ての不等号は水準5%で有意、とかきちんと書いた方がいいんじゃ。

ちなみに>>42も含めこのスレ>>30以降の回答が今のところ全部自分。。

50 名前:132人目の素数さん [2007/11/21(水) 09:38:03 ]
>>48
ありがとうございます!
(P(|X|=∞)を質問した人間です。)
いやいや、正規分布を誤解してましたm(__)m

51 名前:132人目の素数さん [2007/11/21(水) 15:11:01 ]
つか、そもそも任意の実数 a について、P(X=a) = 0 だろ。
あと ∞ という数は無いから、lim[a→∞] P(|X|=a) = 0 な。

52 名前:132人目の素数さん [2007/11/21(水) 15:12:05 ]
>>>46
>問題ない。

まとめるならなぜわけて回答させたんだよ??ってつっこみうるのは問題



53 名前:132人目の素数さん [2007/11/21(水) 20:03:18 ]
>>51
そもそも、大数の強法則を考えれば、即座でしたね…。
チェビシェフの不等式→ボレル・カンテリの補題という王道パターンからでも示せる事に気が付きましたm(__)m(間違っていなければ。)
てことは、期待値が有限の確率変数は確率1で有限値しか取らないってことになりますか?

54 名前:132人目の素数さん [2007/11/21(水) 21:50:46 ]
>>52
解析する段階でメンドクサクなったからです。
本など見るとまとめた方がやりやすいと書いてありましたし。

55 名前:132人目の素数さん mailto:sage [2007/11/22(木) 01:32:16 ]
>>51は、何か根本的な勘違いをしている気がする。
測度論的な統計学を勉強する前にもうちょっと
基本的な数学のトレーニングをした方がいいんじゃない?

>期待値が有限の確率変数は確率1で
>有限値しか取らないってことになりますか?

これは正しい。

56 名前:132人目の素数さん mailto:sage [2007/11/22(木) 01:37:03 ]
>>52
きちんと考えればmultiple testingの問題なんだろうけど、
厳密な立証を求められる医薬系以外でそこまで問題にされることは
少ないのでは。

事後的なサーベイ程度なら、むしろ、区分をしすぎることによる
カイ二乗検定の近似誤差の方が問題だろ。
そんな場合には、Fisher's exact test を使う。

57 名前:132人目の素数さん [2007/11/22(木) 09:48:41 ]
>>55
>>53です。どうもありがとうございますm(__)m
私は理系の人間では無いのですが、知っていなければ恥ずかしいような内容なだけに、疑問が解消されて良かったです。勘違いをして二年ほど過ごしていたようです…。

58 名前:132人目の素数さん [2007/11/22(木) 12:17:59 ]
これアンカーミス?↓
55 :132人目の素数さん:2007/11/22(木) 01:32:16
>>51は、何か根本的な勘違いをしている気がする。

56>むしろ、区分をしすぎることによるカイ二乗検定の近似誤差の方が問題だろ。
だから何で区分して質問しておいて後でまとめちゃうんだよ、って

59 名前:132人目の素数さん [2007/11/22(木) 13:04:29 ]
>>58
54でも答えてますけど、統計の本には2×5では大変なので
まとめて「そう思う」「分らない」「そう思わない」と
2×3にした方がいいと書いてあったのですが・・・。

60 名前:132人目の素数さん [2007/11/22(木) 13:11:23 ]
>>58
目的は有意差をみることだからまとめることには別に問題はない。
ただまとめ方自体が恣意的だと、正しい検定にならない。


61 名前:132人目の素数さん [2007/11/22(木) 15:10:30 ]
いろいろ分類していった結果
25人と5人とか30人と10人とかになってしまいました(一応有意差あり)
こんな小さなサンプルで有意差出しても大丈夫なんでしょうか?

62 名前:132人目の素数さん [2007/11/22(木) 17:06:35 ]
>59 書名は?
>60 まとめることの是非ではなく、1〜5で答えさせたことの是非



63 名前:132人目の素数さん [2007/11/22(木) 17:11:37 ]
sociology.jugem.jp/?eid=182
www.okayama-u.ac.jp/user/hasep/articles/1994/9407Hasegawa/9407Hasegawa.html
2.2.8.数量データを無理やりカテゴリー分けする
 独立変数や従属変数が連続変量であるにもかかわらず,それらを“上,中,下”群のように分けて分析することをいう.
 たとえば,調査の段階で具体的な年齢を質問しているにもかかわらず,分析の段階では“30歳以上”群と“30歳未満”群
に分けて各群の得点の差を検定したり頻度のχ2検定をしたうえで,“○○については年齢による差が認められた”というよ
うに結論を下している発表を聞いたことがある.これとは別に,大学生に不安検査を行ない,不安得点に応じて“高不安群”
,“中不安群”,“低不安群”に分けて分析をしている発表を聞いたことがある.これらの例は少なくとも3つの問題点を含
んでいる.1つは2.2.7にも述べたように,事後的に作為的なカテゴリー分けが行なわれる可能性があること,第2に,連続
変量がもつ種々の貴重な情報をわざわざ捨てていることである.

64 名前:132人目の素数さん [2007/11/22(木) 18:26:06 ]
>>62
>60
学部生の論文なので勘弁して下さい。


65 名前:132人目の素数さん [2007/11/22(木) 20:13:01 ]
pが0.06とか0.05・・・
になる時って有意差はないが
大きな差があったとか言ってもいいのですか?

66 名前:132人目の素数さん [2007/11/23(金) 15:10:29 ]
age

67 名前:132人目の素数さん mailto:sage [2007/11/23(金) 16:18:35 ]
>>63
まあ、統計っていうのは正しい手法が自明なものではないので、
具体的なモデルを提示しない批判はあまり意味がない。
二つの順序変量の場合は、上の方で述べたように
Wilcoxon exact testあたりを使うのが
情報のロスは少ないかも知れないとは思う。

ちなみにリンクの一つ目の書は「順序変量を誤って連続変量と
みなした人」を想定して批判をするという意味のないことを
やっていると思う。書評を読んだだけなので断定的なことは
言えないが。


68 名前:132人目の素数さん [2007/11/25(日) 17:43:10 ]
仮説検定をやっているんですけど、t値とp値が有意水準を片方だけ満たして
片方だけみたさないことってありますか?初心者ですいません

69 名前:132人目の素数さん mailto:sage [2007/11/26(月) 05:23:15 ]
>>68
ないです。そもそもt値からp値を計算しているので。

70 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:25:50 ]
Rで学ぶデータマイニングII
ttp://www.amazon.co.jp/dp/4861671981/
を買おうかどうしようか迷ってるんだけど、
使った人はいるだろうか。

卒論の時系列解析の参考にしようかなと思ってる。
SとRは1年間大学で学んだし、web の R-tips はよく見るから
上記のIは買ってない。

71 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:41:53 ]
Rスレで聞いた方がいいんじゃない?

72 名前:132人目の素数さん mailto:sage [2007/11/26(月) 16:49:22 ]
うん…。書き込んで数学板検索してるうちにそう思った…。
マルチになるけど、Rスレにも書き込もうと思う。
もちろん、このスレも1週間はROMるから、
返事もらえてたらすごく嬉しい。ありがとう >>71



73 名前:132人目の素数さん mailto:sage [2007/11/28(水) 16:09:52 ]
test

ttp://www.uploda.net/cgi/uploader2/index.php?file_id=0000045121.jpg

74 名前:132人目の素数さん [2007/11/29(木) 08:44:08 ]
つり橋効果の実験で、つり橋を渡っている時にたのめば65%、
渡ってからすこし後だと37%の男性が〜というデータがありますが、
その内訳が23人中7人で37%、20人中13人で65%となっており、
サンプル数が少なすぎる気もするのですが統計学的にはどうなのでしょうか。

75 名前:132人目の素数さん [2007/11/29(木) 09:14:56 ]
何を頼むの?

76 名前:132人目の素数さん [2007/11/29(木) 09:16:15 ]
>>70
あの本に入ってるコードでGARCHはできるけど、使いたいモデルによるかも?
何がしたい??


77 名前:132人目の素数さん [2007/11/29(木) 09:34:18 ]
>>75
連絡先をおしえてくれとかそんなことです。

78 名前:132人目の素数さん [2007/11/29(木) 10:45:08 ]
!がよくわかんね

79 名前:132人目の素数さん [2007/11/29(木) 11:39:25 ]
>>77
携帯で頼む訳ね
展望台からとか

80 名前:132人目の素数さん [2007/11/29(木) 12:10:17 ]
wikipにリンクあった
www.fpce.uc.pt/nucleos/niips/novoplano/ps1/documentos/dutton&aron1974.pdf


81 名前:132人目の素数さん mailto:sage [2007/11/29(木) 17:34:00 ]
>>74
Fisher's exact test で、
p-value を計算してみたら、、、
おっと学校の宿題には答えない約束だったw

82 名前:132人目の素数さん [2007/12/02(日) 00:12:08 ]
C言語かC++で仮説検定とか推定の計算をしたいのですが、
標準ライブラリにはχ2乗分布の累積密度関数などが入っていません。
統計処理用ライブラリやソースを公開しているサイトや書籍はありませんか?



83 名前:132人目の素数さん [2007/12/02(日) 15:17:29 ]
相関係数を計算する上での前提条件に正規性は必要ですか?
また他の前提条件はあればご教授をお願いします。

84 名前:132人目の素数さん [2007/12/02(日) 17:15:40 ]
>>82
www.alglib.net/specialfunctions/distributions/chisquare.php
本は Numerical Recipes in C(++) とか。

>>83
相関係数の定義に必要なのは分散・共分散だけ。

85 名前:132人目の素数さん mailto:sage [2007/12/03(月) 03:05:00 ]
>>84
ありがとうございます。
前提条件はなしですか。
以下自分なりに調べてみたところ、注意すべき点としては、
直線性、外れ値を調べたほうがよいとありました。
直線性、外れ値を調べる方法で数値で判定する方法
(プログラムして自動で判定したい)があれば教えていただけないでしょうか?

86 名前:132人目の素数さん mailto:sage [2007/12/04(火) 02:29:09 ]
>>84
ありがとうございます。
amazonで注文してみます。

87 名前:132人目の素数さん [2007/12/04(火) 23:43:51 ]
比率(変化率)の統計を求めるのは、統計学的に
許されるのでしょうか? 

つまり、
値A1,A2・・・An
値B1,B2・・・Bn

があった時、Ai,Bi間の変化率[%] Ci = 100*(Bi-Ai)/Ai が
A,Bと同じくn個あったとき、このCの標準偏差や分散を求める
ということです。

88 名前:132人目の素数さん mailto:sage [2007/12/05(水) 00:17:08 ]
>>87
よく使うよ。
株式や企業の収益率の変化とかが代表例かな。

89 名前:132人目の素数さん mailto:sage [2007/12/05(水) 20:39:33 ]
>>88
さんきゅう

90 名前:132人目の素数さん mailto:sage [2007/12/05(水) 21:16:08 ]
>>88
企業価値相関、算出しとる?

91 名前:132人目の素数さん mailto:sage [2007/12/05(水) 23:08:01 ]
>>90
ごめん。やったことない。


92 名前:132人目の素数さん [2007/12/06(木) 18:17:12 ]
統計を勉強し始めたばかりなのですが、よく出てくる「ordination」という単語の日本語訳がよくわかりません。
いろいろ調べて意味はなんとなくわかってきたのですが、日本語にする時にどうすればいいのか分かりません。
初歩的な質問で申し訳ありませんが、どなたか教えていただけないでしょうか?




93 名前:132人目の素数さん [2007/12/06(木) 19:59:29 ]
多変量解析

94 名前:132人目の素数さん [2007/12/06(木) 21:34:09 ]
>>92
ordinalを行うという名詞だな。順序づけ。
でも一般には単にオーディネーション。

95 名前:132人目の素数さん [2007/12/07(金) 11:37:03 ]
>>92.93

ありがとうございます!
辞書で調べてもキリストとか出てきてさっぱりだったんですが、もとは「ordinal」だったんですね!

例えば
「ordination diagram」  順序付けした図
「ordination axis」   順序付けした軸
「canonical ordination」 標準的な順序付け

ってなるんでしょうか?



96 名前:132人目の素数さん [2007/12/07(金) 13:31:01 ]
携帯電話に関するのアンケートに協力してください。
2,3分で終わりますんで、、、

www.efeel.to/survey/cellularxphone/

卒論で多変量解析をするため
回答数が必要なのでよろしくお願いします。

97 名前:132人目の素敵さん [2007/12/10(月) 23:29:02 ]
信頼係数と信頼区間の幅の関係ってどう説明したらいいんですかね?
あと交互作用効果ってどんな効果ですか?

98 名前:132人目の素数さん [2007/12/11(火) 00:32:31 ]
正方形の同じ一点にaとbがあります。ここを始点とし、コインが表ならa裏ならb
を隣の点に右回りで動かします。
この場合、n回目に二つとも同じ点にある確率を求めよ。

99 名前:132人目の素数さん [2007/12/11(火) 06:06:28 ]
統計学を勉強し始めなのですが、検定(?)という習ってない分野に入り、

「感染者230人のうち110人はその伝染病で2年後には死んでしまう。
2年後に死んでいる可能性は半々である(α=0、5)という仮説を検定しなさい。」

という問題でさっそくつまづいてます。どう解き始めるのですか?
簡単過ぎだと思われるのかわからないんですが、決して釣りではないです。
どなたか教えてください。お願いします。

 

100 名前:132人目の素数さん [2007/12/11(火) 13:49:51 ]
>>99
「2年後に死んでいる可能性は半々である」という帰無仮説の下で
230人のうち何人死ぬかどうかの分布を求める(例えば、最も可能性
が高いのは115人)。サンプルサイズが割りと大きいから正規分布で
近似すると良い。そして、死者が110人以下になる確率がどのくらい
あるのかを計算し、それが一定基準以下だったら帰無仮説を棄却
すればよい。

101 名前:132人目の素数さん [2007/12/11(火) 21:30:28 ]
ビジネス統計学という授業の問題です…教えてください…



1.以下の9個の2変数データ(x,y)を用いて問に答えよ。
 
(−4,16)(−3,9)(−2,4)(−1,1)(0,0)(1,1)(2,4)(3,9)(4,16)

(1)xとyそれぞれの平均値と分散を求めよ。

(2)散布図を描け。

(3)これらのデータを用いて相関係数を計算したところ、その値は0であった。この相関係
数と(2)で描いた散布図を参考にxとyの関係について分かることを述べよ。



2.平均20、分散9の正規分布における以下の範囲には全体の何%が含まれるか。
(1)20〜23 (2)22.4〜24.8 (3)17〜21.2


102 名前:132人目の素数さん [2007/12/11(火) 21:31:53 ]
竹中平蔵【びんぼうゆすりみたいな状態】になる

インタビューで竹中の担当の読売新聞記者が全裸で穴にバイブを入れたまま殺された?自殺した?ことなど
を、全部竹中にぶつけると【びんぼうゆすりみたいな状態】になった。

9.15 リチャード・コシミズ東京講演会 全編 (3時間24分)
【びんぼうゆすりみたいな状態】になった話は16分から
www.asyura2.com/

もと総理が過去に3人を殺した話もでてくる




103 名前:132人目の素数さん mailto:sage [2007/12/11(火) 21:34:37 ]
>>101
自分で解いてから質問しろかす

104 名前:132人目の素数さん [2007/12/11(火) 22:17:56 ]
100さんわかりやすい説明ありがとうございます。







[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<90KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef