統計学なんでもスレッド2

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 02/24 22:49 / Filesize : 314 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド2

1 名前： ◆OHr6mNLYV6 [03/11/08 19:44]: (´Д｀;三;´Д｀)
語って下さい．偉大な統計学を．．．
質問にはやさしいお兄さんが答えてくれます．

前スレ
science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【　確率論・統計学の実用の仕方　】
science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたいその1/2
science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
science.2ch.net/test/read.cgi/math/1017042903/
929 名前：１３２人目の素数さん [04/09/28 01:53:22]: 例えば平均身長は普通の身長っていうことになる？
930 名前：１３２人目の素数さん mailto:sage [04/09/28 10:15:23]: 子供が0.97人いる家庭は平均的だが異常だぞ
931 名前：１３２人目の素数さん mailto:sage [04/09/28 10:22:09]: 普通と平均がほぼ同じ意味で使われる場合と、そうでない場合がある。
932 名前：１３２人目の素数さん mailto:sage [04/09/28 10:30:27]: >>929
実際に1000人分くらいサンプルをとってみて、
全員の身長から算出された平均値が
ちょうど170cmだったとする。

171以上が499人、169以下が500人だった。
んで、ちょうど170cmが一人だけいた。

170の人の身長は平均的だと言えても、普通だと言える？
普通って言葉の意味は、多義的すぎておぼつかないんじゃないかな。
933 名前：１３２人目の素数さん [04/09/28 23:27:41]: >>932 でも身長の場合そんなにばらつきがないんじゃないかな？平均身長が170だとするとやっぱり170前後が一番多いんじゃないの？
934 名前：１３２人目の素数さん mailto:sage [04/09/29 08:27:20]: 母数の平均が普通といえるんじゃないだろうか
935 名前：１３２人目の素数さん [04/09/29 21:26:12]: >>934 母数の平均とは？
936 名前：１３２人目の素数さん mailto:sage [04/09/29 23:43:11]: 母平均
937 名前：１３２人目の素数さん [04/09/30 00:01:00]: 日本のサラリーマンの賃金構造を調べるために、20才から30才の会社員40人を対象に調査を行なった。質問内容は次のとおりである。
基本給、性別、勤続年数、企業規模、学歴
そこで、基本給がどう決定されるかを見るために、回帰モデル、

を考える。ただし、各変数は次のとおりである。
WAGE：基本給。単位は円。
SEX：性別。男ならSEX=1、女ならSEX=0である。
CAREER：勤続年数。
SMALL：企業規模。中小企業ならSMALL=1、大企業ならSMALL=0である。
EUDC：学歴。大卒ならEUDC=1、高卒ならEUDC=0である。
次の問いに答えよ。
(1) パラメータ ~ の値をデータより推定しなさい。
938 名前：１３２人目の素数さん [04/09/30 00:03:08]: WAGESEXCAREERSMALLEDUC
215,7001411
242,1001611
253,7001711
162,9001011
185,5001211
135,5001010
292,50011110
・・・・・

エクセルでどうやら求めるようなんですが、
どうやったらでるんでしょうか？
自分で計算していたんですが、数字が合わなくなって挫折しました。
推定しろって書いてあったので、自分で計算じゃだめなようです。
939 名前：１３２人目の素数さん [04/09/30 00:07:50]: あ、大事なところがでてませんでした。
回帰モデル
WAGE＝B0＋B1×SEX＋B2×CAREER＋B3×SMALL＋B4×EDUC

WAGE　　　SEX　　　CAREER　　SMALL　　　EDUC
215,700　1　　　　4　　　　　1　　　　1
242,100　1　　　　6　　　　　1　　　　1
253,700　1　　　　7　　　　　1　　　　1
162,900　１　　　　0　　　　1　　　　1
185,500　1　　　　2　　　　1　　　　　1
135,500　1　　　　0　　　　1　　　　　0
940 名前：１３２人目の素数さん mailto:sage [04/09/30 11:18:06]: 宿題は自分でやりましょう
941 名前：１３２人目の素数さん [04/09/30 12:19:03]: 分析ツールの回帰分析でやればいいじゃん
942 名前：１３２人目の素数さん [04/09/30 12:22:40]: ツール→分析ツール→回帰分析

「入力Y範囲」にwageのデータ
「入力X範囲」に説明変数のデータ　→OK
943 名前：１３２人目の素数さん mailto:sage [04/09/30 23:36:36]: >>942
そんなツールがあったんですか・・
どうやってやるかわからず、
今日締め切りだったのであきらめますたorz
944 名前：１３２人目の素数さん mailto:sage [04/10/01 01:05:31]: まずググれよ・・・
945 名前：１３２人目の素数さん [04/10/01 02:36:55]: たまに25，75パーセンタイル値に利用される
Tukeyのヒンジについて訊きたいのですが、

イメージ的には、
・中央値と最小値の｢中間の順位の値｣が
Tukeyのヒンジによる25パーセント点
・中央値と最大値の｢中間の順位の値｣が
Tukeyのヒンジによる75パーセント点という感じでしょうか？

だれかノンパラ統計量に詳しい人の解説キボン。
946 名前：１３２人目の素数さん [04/10/01 17:27:30]: N面体のサイコロがあって、それを最大K回投げる。
1の目が出たら、S回投げる回数から減算する。
投げれなくなったら終了する。
1の目がx回でる確率f(x)を求めよ。
という問題なのですが、
N=300 K=3000 S=100で1万回シミュレート実験はしてみたのですが、
実際にf(x)はどのような式になるのでしょうか？
近似できる分布はないでしょうか？
ご指導お願いいたします。
947 名前：１３２人目の素数さん mailto:sage [04/10/01 22:16:51]: >>946
問題設定がよくわからないのだが。
N,K,Sは固定だよね。
とりあえずN面体のサイコロ投げて、1が出たら何か減らすのはわかった。

Kは終了条件で、
サイコロの目が１出るたびにマイナスSしていって、
現在の試行数（仮にt）がt>Ktのときに終了するってこと？
（Kｔは試行数tのときの終了回数）
948 名前：１３２人目の素数さん mailto:sage [04/10/02 06:17:44]: >>946
分布は難しいな…。
とりあえず、S=1のときの1が出る回数の期待値は、
(1/(N+1)^2)(1-(-1/N)^K)+K/(N+1)
となった。
949 名前：１３２人目の素数さん mailto:sage [04/10/03 22:00:23]: ブルー・バックスに豊田秀樹なる人物が何冊か書いてるが、どうなの？
偶然開いたページに「連続だから微分可能」とあって、のけぞったんだが。
950 名前：１３２人目の素数さん [04/10/03 22:42:04]
951 名前：１３２人目の素数さん [04/10/04 08:17:13]: 豊田秀樹は早稲田の文学部の先生
心理学の視点からマーケティングのデータ分析とかしているような希ガス
952 名前：１３２人目の素数さん [04/10/05 22:13:10]: 分散分析と等分散の検定ってどう違うの？
いま、２つの群のバラツキが異なると言えるかどうか調べたいんだけど、どちらの検定方法を使えばいいのか教えてください。
953 名前：１３２人目の素数さん mailto:sage [04/10/05 22:27:11]: >>952
2つの群のばらつきが異なるかどうかは、等分散の検定(F検定)で調べられます。
分散分析は2つ以上の群の平均値が同じであるかどうかを調べる検定です。
954 名前：１３２人目の素数さん [04/10/05 22:31:25]: >>953
平均値が同じかどうか調べるのにｔ検定ってありますよね。
分散分析は、言葉どおり「分散」＝「ばらつき」も調べるってことでは、ないのでしょうか？
955 名前：１３２人目の素数さん mailto:sage [04/10/05 22:43:36]: >>954
t検定は2群の平均値が同じかどうかを調べる検定です。
もしもt検定が両側検定だったら、2群の場合の分散分析と同じ結果(p値)をはじき出します。
確か、t統計量の2乗が分散分析のF統計量になたはず。
因みに、2群以上のばらつきが同じかどうかを調べる検定にはバートレットの検定というものがあります。
956 名前：１３２人目の素数さん mailto:sage [04/10/05 22:46:04]: 自己レスです。

> t検定は2群の平均値が同じかどうかを調べる検定です。
すみません、これはもうご存知ですね。
957 名前：１３２人目の素数さん [04/10/05 22:52:57]: >>955
なるほど、ｔ検定と分散分析の関係、よくわかりました。ありがとうございます。
どうも、「分散」分析ということばに惑わされていたみたいです。
958 名前：１３２人目の素数さん mailto:sage [04/10/05 23:11:01]: >>957
統計学ではまぎらわしい名前が多いようです。
共分散分析はべつに共分散を分析しているわけでもないし、
共分散構造分析なんていう似たようなものもあるし。
959 名前：１３２人目の素数さん [04/10/08 12:09:36]: 言語学の研究と統計に関して、質問があります。
どなたかわかる方、教えてください。

たとえば、現在の若者を対象にして、
ある状況ごとに、若者言葉「XX]を使用するかしないかを質問し、
状況ごとの有為差の有無を見たい場合って、
統計は、パラメトリックなのでしょうか？
それとも、ノンパラメトリックでしょうか？

言語使用の場合、文法ルールや、社会的習慣（社会言語学的ルール）
などによって、ある程度、規制されると思うので、
はたして、正規分布を前提に考えていいものかどうか
迷ってしまいます。
はたして、文法に規制される言語使用は、
歪度や尖度に特徴のある正規分布と考えていいのでしょうか？
960 名前：１３２人目の素数さん mailto:sage [04/10/08 21:54:35]: >>959
まず、考えられる一番単純な解析方法は｢言語使用の有無｣と、2水準の「状況｣を用いた
カイ２乗検定。カイ２乗検定がパラメトリックか、ノンパラメトリックかは、あまり聞いたことがありません。
これはパラメトリックかな？分布には、「標準正規分布に従う確率変数」を２乗した変数の分布(カイ２乗分布)が使われています。
そして、「社会的習慣」が言語使用に影響を与えていると考えられる場合には、、色々と考えられるのですが、
「社会的習慣｣を共変量としたロジスティック回帰分析。もう一つ挙げるとすると、
（こっちのほうが理論的にはきれいかな？)「社会的習慣｣を変量効果とした、ロジスティック変量効果モデル。
961 名前：959 [04/10/09 01:04:11]: ＞960

早速のお返事をどうもありがとうございました。
自力で、統計を勉強しているので、大変助かります。

カイ二乗は、使ったことがあるので、何とかなりそうです。
ロジスティック回帰分析＆ロジスティック変量効果モデルは、
正直言って、何のことだかさっぱりわからないので、統計の本を読んで、
頑張って勉強します。

あと、すみません、もう少しお伺いしたいことがあるのですが、
実は、言語使用状況が３つあるのですが、カイ二乗を
3回繰り返す形でも大丈夫でしょうか？　
ちなみに、データは対応のある形です。
962 名前：959 [04/10/09 01:11:00]: 連続の質問で、すみません。
できれば、もう一つお伺いしたいことがあります。

言語使用の有無と、その言語を使用した場合のイメージ
を関連付けたい場合は、どのような手法がいいのでしょうか？
具体的には、XXという若者言葉を使うか否かを質問し、
同時に、その言葉を使った場合のイメージも聞いて、
言語を使用する子はどういうイメージで話し、
使わない子は、その言葉にどういうイメージを持っているかというのを
調べたいのです。
どの統計手法が適切なのか、ご享受いただけると、
大変ありがたいです。
963 名前：１３２人目の素数さん mailto:sage [04/10/09 01:27:37]: >>959
ちょっと違うかもしれないけど、
chaidという手法を調べてみてはどうでしょう。
964 名前：１３２人目の素数さん [04/10/09 02:30:53]: >>961
帰無仮説の設定によってはカイ二乗検定を3回繰り返すという方法も考えられると思います。
ですが、もしもそれらの検定の内、「1回でも有意ならば有意」とするのでしたら「検定の多重性」という問題が起きてきます。
959さんは次のどちらを主張したいですか？それによって検定手法は変わってきます。
1．「状況Aと状況B、状況Cにおける言葉の使用率」は、「全て同じ使用率」ではない。
2．「状況AとB」、「BとC」、「CとA」の内、いずれかの使用率が異なる。

>>962
それぞれの状況において、イメージAは○%、イメージBは×%、イメージCは△%と考えていく方法が考えられます。

>>963
その方法は、それぞれの状況での割合を把握するときには使えると思いますが、検定は行っていませんね。
965 名前：959 (961& 962) [04/10/09 15:40:49]: > 963
早速のレスをいただき、どうもありがとうございました。　
chaidですね。検定をするかどうかは、まだ決めていませんので、
（データと、私の理解力次第になると思いますが、）
勉強してみます。
966 名前：959 (961& 962) [04/10/09 15:41:39]: > 964

早速、レスをいただき、どうもありがとうございました。
主張したいのは、２．の各2水準間での検定です。
（全ての言語使用状況間において有意差がでなくてもいいので。。）
ということは、カイ二乗を３回繰り返しても大丈夫ということですよね。

それから、言語使用の有無とイメージの関係の分析を
難しく考えていたので、コレスポンド分析など
使ったこともない手法が必要なのかと思っていたのですが、
おかげさまで、すっきり＆安心しました。

いろいろとご享受いただき、
大変助かりました。
どうもありがとうございました。
967 名前：１３２人目の素数さん [04/10/09 16:22:15]: >>951
ふーん。使い方はともかく細部は信用しない方が良さそう。
968 名前：964 mailto:sage [04/10/09 16:48:51]: >>966
もしもカイ二乗検定を3回繰り返すのでしたら964にも書いた、「検定の多重性」という問題が起こってきます。
帰無仮説（A）、（B）、（C）の内、一つでも有意ならば有意とするとなると、実際にはあらかじめ決めた有意水準よりも大きい値で検定を行っていることになってしまいます。
つまり、有意ではないのに有意だといってしまう可能性が出てくるのです。
これを防ぐために色々な方法が考えられます。一番単純な方法は「ボンフェローニの調整」。
それぞれの検定から出てきたP値をそれぞれ3倍して、それから有意水準で検定を行うという方法です。
でも、この「ボンフェローニの調整」は検定の数が多くなればなるほど有意であるのに有意ではないといってしまう傾向があるので注意が必要です。
今回のように検定の数が3つぐらいだったら使用に耐えうるでしょう。
969 名前：１３２人目の素数さん [04/10/09 17:23:07]: 統計は解析くらいの知識しか使ってないのにマジ難しいと思う。
数学的にある程度わかっても調査とか経験しないとよくは
わからない模様。
970 名前：１３２人目の素数さん mailto:sage [04/10/09 20:47:58]: ３群の比較を３回の対比較で行うなら、各々の検定の有意水準は
全体の有意水準の1/2にしてもよい（1/3にする必要は無い）、はず。
971 名前：１３２人目の素数さん mailto:sage [04/10/10 04:07:37]: >>970
それは多重比較の何と言う手法ですか？
972 名前：１３２人目の素数さん mailto:sage [04/10/10 11:25:35]: >>971
たしか、Holm の方法。
973 名前：１３２人目の素数さん mailto:sage [04/10/11 18:07:47]: >>972
Holmの方法を使っても、初めから全体の有意水準の1/2で検定をできないようです。
まず全体の有意水準の1/3で、P値が一番小さいものを棄却できてから。

それと、k群の比率の差の検定にはライアンの方法というものがあるようです。
ttp://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/Pmul-Ryan.html
974 名前：１３２人目の素数さん [04/10/11 19:38:07]: 次スレ
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
975 名前：kmath1107@yahoo.co.jp mailto:kmath1107@yahoo.co.jp [04/10/11 20:25:00]: 658 : LettersOfLiberty ◆rCz1Zr6hLw ：04/10/09 07:20:23
うんち食いたい十万差し上げます。
659 ：LettersOfLiberty ◆rCz1Zr6hLw：04/10/09 12:04:28
>>658
振込先おしえれ。
660 ：LettersOfLiberty ◆rCZIZG7cQU ：04/10/09 12:06:41
そうだ、早く教えろ
661 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/09 12:06:46
Re:>659 それじゃあ、私にメール送ってくれ。アドレスは、kmath1107@yahoo.co.jp
976 名前：１３２人目の素数さん mailto:sage [04/10/11 21:10:15]: 荒らしめ！！消えろ！
977 名前：１３２人目の素数さん mailto:sage [04/10/11 22:05:15]: P(X|X)って１ですか、それともP(X)？
978 名前：１３２人目の素数さん mailto:sage [04/10/11 22:11:18]: >>977
1
979 名前：１３２人目の素数さん mailto:sage [04/10/11 22:13:27]: どんな場合でも？
980 名前：１３２人目の素数さん mailto:sage [04/10/11 22:16:18]: すみません。では、P(X)って条件付き確率の形式で書くとどうなるの？かけない?
981 名前：１３２人目の素数さん mailto:sage [04/10/11 22:18:56]: >>979
そう、どんな場合でも。
　　P(X|X) = P(X∩X) / P(X)
ここで、
　　X∩X = X
だから、
　　P(X|X) = P(X) / P(X) = 1
982 名前：１３２人目の素数さん mailto:sage [04/10/11 22:20:57]: P(X|1)?
983 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:25:23]: Re:>981 さて、P(X)=0のときはどうする？
984 名前：１３２人目の素数さん mailto:sage [04/10/11 22:26:35]: どうなるんですか？
985 名前：１３２人目の素数さん mailto:sage [04/10/11 22:36:06]: P(X|X)が不定ってどういう意味？
986 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:37:56]: Re:>985 いや、P(A|B)の定義はP(A∩B)/P(B)ではない。条件付期待値の定義を誰かupしてくれ。
987 名前：１３２人目の素数さん mailto:sage [04/10/11 22:39:48]: >>986
普通の集合の条件付確率のこと聞いてるんだろ？
それでいいじゃないか。
988 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:40:00]: 条件付期待値を定義するのには、
部分集合の上での確率測度が必要なのだが、
あれってどうやって作るんだっけ？
存在することは分かっているらしいけど。
989 名前：１３２人目の素数さん mailto:sage [04/10/11 22:40:04]: ぜひ、おねがいします。
990 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:41:01]: Re:>987
P(B)>0ならば、P(A|B)=P(A∩B)/P(B)で問題ない。
この式では困るのは、P(B)=0のときだ。
991 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:43:21]: 条件付確率P(A|B)は、条件付期待値E[1_A|B]のことで、
条件付期待値E[X|B]は、何らかの確率測度Qがあって∫_{B}XdQ
で定義されるのだが、このQはどうするんだっけ？
992 名前：１３２人目の素数さん mailto:sage [04/10/11 22:43:26]: P(X)=0からP(X)>0になるような場合に困ってるんです。
993 名前：１３２人目の素数さん mailto:sage [04/10/11 22:46:28]: その辺の事情がわかる本をおしえていただくのでもいいのですが。
994 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:47:38]: Re:>993 私は講義で条件付確率の話を聞いた。
995 名前：１３２人目の素数さん mailto:sage [04/10/11 22:48:18]: >>992
一応聞くが、Xは集合だろ？
確率変数じゃないよな？
996 名前：１３２人目の素数さん mailto:sage [04/10/11 22:49:00]: 後者です。
997 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:50:11]: Re:>996 後者って何？確率変数XでP(X|X)なんて見たこと無い。
998 名前：１３２人目の素数さん mailto:sage [04/10/11 22:50:15]: P(X|Y)についてもP(Y)=0のときは同じ問題になりますか？
999 名前：LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:51:20]: Re:>998 P(Y)>0なら簡単なんだけどね。
1000 名前：１３２人目の素数さん mailto:sage [04/10/11 22:51:37]: 三百三十八日三時間七分。
1001 名前：１００１ [Over 1000 Thread]: このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef