統計学なんでもスレッド7

[表示 : 全て最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 11/25 00:14 / Filesize : 90 KB / Number-of Response : 277
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド7

1 名前：１３２人目の素数さん [2007/10/24(水) 08:52:19 ]: 理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。

前スレ：
統計学なんでもスレッド6
science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
science.2ch.net/test/read.cgi/math/1012782106/
関連スレ：
統計学なんて数学じゃないだろ
science6.2ch.net/test/read.cgi/math/1173876727/
＝　統計解析フリーソフト　Ｒ　【第２章】　＝
science6.2ch.net/test/read.cgi/math/1152449095/
=統計解析= SASプログラミング
science6.2ch.net/test/read.cgi/math/1184762259/
75 名前：１３２人目の素数さん [2007/11/29(木) 09:14:56 ]: 何を頼むの？
76 名前：１３２人目の素数さん [2007/11/29(木) 09:16:15 ]: >>70
あの本に入ってるコードでGARCHはできるけど、使いたいモデルによるかも？
何がしたい？？
77 名前：１３２人目の素数さん [2007/11/29(木) 09:34:18 ]: >>75
連絡先をおしえてくれとかそんなことです。
78 名前：１３２人目の素数さん [2007/11/29(木) 10:45:08 ]: ！がよくわかんね
79 名前：１３２人目の素数さん [2007/11/29(木) 11:39:25 ]: >>77
携帯で頼む訳ね
展望台からとか
80 名前：１３２人目の素数さん [2007/11/29(木) 12:10:17 ]: wikipにリンクあった
www.fpce.uc.pt/nucleos/niips/novoplano/ps1/documentos/dutton&aron1974.pdf
81 名前：１３２人目の素数さん mailto:sage [2007/11/29(木) 17:34:00 ]: >>74
Fisher's exact test で、
p-value を計算してみたら、、、
おっと学校の宿題には答えない約束だったw
82 名前：１３２人目の素数さん [2007/12/02(日) 00:12:08 ]: C言語かC++で仮説検定とか推定の計算をしたいのですが、
標準ライブラリにはχ2乗分布の累積密度関数などが入っていません。
統計処理用ライブラリやソースを公開しているサイトや書籍はありませんか？
83 名前：１３２人目の素数さん [2007/12/02(日) 15:17:29 ]: 相関係数を計算する上での前提条件に正規性は必要ですか？
また他の前提条件はあればご教授をお願いします。
84 名前：１３２人目の素数さん [2007/12/02(日) 17:15:40 ]: >>82
www.alglib.net/specialfunctions/distributions/chisquare.php
本は Numerical Recipes in C(++) とか。

>>83
相関係数の定義に必要なのは分散・共分散だけ。
85 名前：１３２人目の素数さん mailto:sage [2007/12/03(月) 03:05:00 ]: >>84
ありがとうございます。
前提条件はなしですか。
以下自分なりに調べてみたところ、注意すべき点としては、
直線性、外れ値を調べたほうがよいとありました。
直線性、外れ値を調べる方法で数値で判定する方法
（プログラムして自動で判定したい）があれば教えていただけないでしょうか？
86 名前：１３２人目の素数さん mailto:sage [2007/12/04(火) 02:29:09 ]: >>84
ありがとうございます。
amazonで注文してみます。
87 名前：１３２人目の素数さん [2007/12/04(火) 23:43:51 ]: 比率（変化率）の統計を求めるのは、統計学的に
許されるのでしょうか？　

つまり、
値A1，A2・・・An
値B1，B2・・・Bn

があった時、Ai，Bi間の変化率[%] Ci = 100*(Bi-Ai)/Ai　が
A，Bと同じくn個あったとき、このCの標準偏差や分散を求める
ということです。
88 名前：１３２人目の素数さん mailto:sage [2007/12/05(水) 00:17:08 ]: >>87
よく使うよ。
株式や企業の収益率の変化とかが代表例かな。
89 名前：１３２人目の素数さん mailto:sage [2007/12/05(水) 20:39:33 ]: >>88
さんきゅう
90 名前：１３２人目の素数さん mailto:sage [2007/12/05(水) 21:16:08 ]: >>88
企業価値相関、算出しとる？
91 名前：１３２人目の素数さん mailto:sage [2007/12/05(水) 23:08:01 ]: >>90
ごめん。やったことない。
92 名前：１３２人目の素数さん [2007/12/06(木) 18:17:12 ]: 統計を勉強し始めたばかりなのですが、よく出てくる「ordination」という単語の日本語訳がよくわかりません。
いろいろ調べて意味はなんとなくわかってきたのですが、日本語にする時にどうすればいいのか分かりません。
初歩的な質問で申し訳ありませんが、どなたか教えていただけないでしょうか？
93 名前：１３２人目の素数さん [2007/12/06(木) 19:59:29 ]: 多変量解析
94 名前：１３２人目の素数さん [2007/12/06(木) 21:34:09 ]: >>92
ordinalを行うという名詞だな。順序づけ。
でも一般には単にオーディネーション。
95 名前：１３２人目の素数さん [2007/12/07(金) 11:37:03 ]: >>92.93

ありがとうございます！
辞書で調べてもキリストとか出てきてさっぱりだったんですが、もとは「ordinal」だったんですね！

例えば
「ordination diagram」　順序付けした図
「ordination axis」　　　順序付けした軸
「canonical ordination」標準的な順序付け

ってなるんでしょうか？
96 名前：１３２人目の素数さん [2007/12/07(金) 13:31:01 ]: 携帯電話に関するのアンケートに協力してください。
２，３分で終わりますんで、、、

www.efeel.to/survey/cellularxphone/

卒論で多変量解析をするため
回答数が必要なのでよろしくお願いします。
97 名前：１３２人目の素敵さん [2007/12/10(月) 23:29:02 ]: 信頼係数と信頼区間の幅の関係ってどう説明したらいいんですかね？
あと交互作用効果ってどんな効果ですか？
98 名前：１３２人目の素数さん [2007/12/11(火) 00:32:31 ]: 正方形の同じ一点にaとbがあります。ここを始点とし、コインが表ならa裏ならb
を隣の点に右回りで動かします。
この場合、n回目に二つとも同じ点にある確率を求めよ。
99 名前：１３２人目の素数さん [2007/12/11(火) 06:06:28 ]: 統計学を勉強し始めなのですが、検定(？)という習ってない分野に入り、

「感染者２３０人のうち１１０人はその伝染病で２年後には死んでしまう。
２年後に死んでいる可能性は半々である(α＝０、５)という仮説を検定しなさい。」

という問題でさっそくつまづいてます。どう解き始めるのですか？
簡単過ぎだと思われるのかわからないんですが、決して釣りではないです。
どなたか教えてください。お願いします。

　
100 名前：１３２人目の素数さん [2007/12/11(火) 13:49:51 ]: >>99
「２年後に死んでいる可能性は半々である」という帰無仮説の下で
230人のうち何人死ぬかどうかの分布を求める（例えば、最も可能性
が高いのは115人）。サンプルサイズが割りと大きいから正規分布で
近似すると良い。そして、死者が110人以下になる確率がどのくらい
あるのかを計算し、それが一定基準以下だったら帰無仮説を棄却
すればよい。
101 名前：１３２人目の素数さん [2007/12/11(火) 21:30:28 ]: ビジネス統計学という授業の問題です…教えてください…

１．以下の９個の２変数データ（ｘ，ｙ）を用いて問に答えよ。
　
（－４，１６）（－３，９）（－２，４）（－１，１）（０，０）（１，１）（２，４）（３，９）（４，１６）

（１）ｘとｙそれぞれの平均値と分散を求めよ。

（２）散布図を描け。

（３）これらのデータを用いて相関係数を計算したところ、その値は０であった。この相関係
数と（２）で描いた散布図を参考にｘとｙの関係について分かることを述べよ。

２．平均２０、分散９の正規分布における以下の範囲には全体の何％が含まれるか。
（１）２０～２３　（２）２２．４～２４．８　（３）１７～２１．２
102 名前：１３２人目の素数さん [2007/12/11(火) 21:31:53 ]: 竹中平蔵【びんぼうゆすりみたいな状態】になる

インタビューで竹中の担当の読売新聞記者が全裸で穴にバイブを入れたまま殺された？自殺した？ことなど
を、全部竹中にぶつけると【びんぼうゆすりみたいな状態】になった。

9.15 リチャード･コシミズ東京講演会全編　（3時間24分）
【びんぼうゆすりみたいな状態】になった話は16分から
www.asyura2.com/

もと総理が過去に３人を殺した話もでてくる
103 名前：１３２人目の素数さん mailto:sage [2007/12/11(火) 21:34:37 ]: >>101
自分で解いてから質問しろかす
104 名前：１３２人目の素数さん [2007/12/11(火) 22:17:56 ]: 100さんわかりやすい説明ありがとうございます。
105 名前：１３２人目の素数さん [2007/12/12(水) 10:51:43 ]: いや、100は片側検定だが・・・
106 名前：１３２人目の素数さん [2007/12/12(水) 13:03:20 ]: >>105
そうだけど、この場合に限ればどっちみち対称だから閾値だけの問題。
107 名前：１３２人目の素数さん [2007/12/12(水) 17:16:11 ]: そこまでわかるなら99を書くはずがない
108 名前：１３２人目の素数さん [2007/12/12(水) 20:27:37 ]: 数学系の学生で、今外れ値について勉強しています。外れ値を見つける方法として、グラブスの方法、トンプソンの方法、増山の方法をよく見つけたのですが他によく使われている方法はありますか？
あと、トンプソン、増山の方法の中身(その式でなぜ外れ値が検証できるか)を説明しているサイトや文献あれば教えてもらえますか？よろしくお願いします。
109 名前：１３２人目の素数さん [2007/12/13(木) 05:17:36 ]: >>98
斬か式で解く問題だね。大学入試に出る。東大京大が好きそうな問題だな。
n回目に同じになるためにはn-1回目は隣合っている&遅れてる方が動く必要がある。
n回目に同じ位置にいる確率をA(n)、一つはなれている確率B(n)、二つはなれている確率C(n)とすると、
A(n)=0×A(n-1)+(1/2)^2×B(n-1)+0×C(n-1)
B(n)=1/2×A(n-1)+0×B(n-1)+1/2×C(n-1)
C(n)=0×A(n-1)+1/2×B(n-1)+0×C(n-1)
この3式からA(n)についての斬か式を作る。
A(n)=(1/2)^3×A(n-2)+(1/2)^3×C(n-2)
まずこれを解く、
A(n)=1/8×A(n-2)+1/8×C(n-2)
比例定数1/8の斬か式より
A(n)=～………①
同様にC(n)についても解く。
C(n)=～………①
①②よりA(n)=～
110 名前：１３２人目の素数さん mailto:sage [2007/12/13(木) 05:19:53 ]: >>101
あまりに基礎すぎる。
自分でやったほうがいい。
111 名前：１３２人目の素数さん mailto:sage [2007/12/13(木) 07:57:25 ]: >>101は単発質問スレ立てし
その直後に、ここに書き込みとな（マルチ）

誰か教えてください…
science6.2ch.net/test/read.cgi/math/1197375253/

もう数学板に来なくていい
ってか氏ね
112 名前：１３２人目の素数さん [2007/12/14(金) 00:05:58 ]: 時系列解析のゼミに入ってるんですが、もしかしてこの分野ってマイナー気味ですか？
113 名前：１３２人目の素数さん mailto:sage [2007/12/14(金) 01:29:38 ]: >>109
ありがとうございました
114 名前：１３２人目の素数さん mailto:sage [2007/12/14(金) 01:59:49 ]: 俺だったら２項分布を mod 4　で集計しようとするけどね
115 名前：１３２人目の素数さん [2007/12/14(金) 18:24:54 ]: 合ってますでしょうか。
↓
ある模擬試験に 5000 人が受験したところ，
その成績は，平均値 65 点，標準偏差 10 点の正規分布に従った。
(1)　ある生徒が，75 点以上 85 点以下である確率を求めよ。
(2)　この試験において，上位 5 %に入るためには，何点以上あればよいか。
(3)　この試験において，順位が 100 番以内に入るためには，何点以上あればよいか。

問題文はつまりN(65,10^2)であり、
標準正規分布をz、この問題の正規分布をuと置く。
(1)
P(75<_x<_85)
zに変換して
P(1<=z<_2)
=P(0<=z<=2)-P(0<=z<=1) 正規分布表より
=0.477-0.341=0.136

答え　13.6%
116 名前：115 [2007/12/14(金) 18:25:29 ]: (2)
P(z<=u)=0.05となるuを探せばよいので、
P(0<=z<=u)=0.5-0.05=0.45
正規分布表からu=1.64
uからzへの変換式から
(x-65)/10=1.64
これを解いて
72.9点

答え　72.9点以上あればよい

(3)
100/5000=0.02
P(z<=u)=0.02
となるuを探す。
P(0<=z<=u)=0.5-0.02=0.48

分布表より0.48は2.05。これを変換式に代入し、
(x-65)/10=2.05
x=85.5

答え　85.5点以上あればよい
117 名前：１３２人目の素数さん [2007/12/14(金) 19:09:55 ]: 片側しか見ていないから×
118 名前：１３２人目の素数さん mailto:sage [2007/12/14(金) 22:07:24 ]: あるデータを収集し、その分析をしなくてはいけません。
SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。

ランダムにN=40のサンプルを2群に分けました。
属性が等質であることは確認しました。
介入群と対照群の2群に対して、
介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。
介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。

教えてちゃんですみません。
よろしくおねがいします。
119 名前：１３２人目の素数さん mailto:sage [2007/12/15(土) 02:22:52 ]: >>117
意味分からん。>>115-116であってると思うけど。
120 名前：１３２人目の素数さん mailto:sage [2007/12/15(土) 02:31:27 ]: >>118
各時点で比較したいだけなら、単なる二標本の検定でしょ？
普通にWilcoxon exact rank sum テストとかをやればよいのでは。

やり方がよく分かんなかったら
無理矢理順序尺度を二値の変数にして、
カイ二乗検定とかでも大丈夫かも。
121 名前：118 mailto:sage [2007/12/15(土) 12:53:38 ]: >>120
ありがとうございます。
私の書き方が不足していたのですが、
最終的に「介入することで○○分後の尺度に変化が見られる」という結果を導き出したいと思っています。

となると、
1．2群それぞれの時間経過に伴う尺度の変化についてRepeated　Measures　ANOVAをして
2．それで前後の値が変化したといえるのかどうかについて検討し
2．さらにその各時点ごとにWilcoxon exact rank sum testをしてそれが2群で違うといえるのかを見る
・・・・・・ということでよろしいのでしょうか？

本当に本当に初歩的な質問でごめんなさい。
決して釣りではありませんので、よろしくお願いいたします。
122 名前：１３２人目の素数さん mailto:sage [2007/12/15(土) 15:56:29 ]: >>121
うーん、きれいな定式化は難しそうな問題だなあ。
分析方法は結構主観によるところが大きいと思う。

自分だったら、ひとまず全部の情報を一つのモデルに盛り込むのは
難しいと考えて二時点間だけの比較をする。
（例：直前と直後、直前と５分後、直前と１０分後...と試して、
最終的に、どの時点間で差が有意になるのか見ればよい。)

でもって、順序尺度の２時点間の差を連続な変量とみなせるのか
単なる順序尺度の差とみて「改善、不変、悪化」くらいに分ける
べきなのかを考えて、適切なモデルを選択する。

あとは、単なる２標本の検定。

頑張ればもうちょっと凝ったモデルも可能なのかも知れないけど。
123 名前：１３２人目の素数さん mailto:sage [2007/12/16(日) 07:51:09 ]: 国友　ｹﾞﾝﾀﾞｲ統計学　日経文庫
が書店においてない。

大学の図書館にも置いてないのにはびっくりした。
124 名前：118 mailto:sage [2007/12/16(日) 13:22:38 ]: >>122
レスが送れてすみませんでした。
なるほど、そうですよね。
とても貴重なアドバイスをありがとうございます。
頑張ってみます。すごく感謝しています。
125 名前：１３２人目の素数さん [2007/12/19(水) 19:31:18 ]: サンプルが１つずつしかない表（4行×2列、1行目、1列目はラベル）のサンプル間の有意差の求め方ってありますか？
ソフトはエクセル統計を使ってます
126 名前：１３２人目の素数さん mailto:sage [2007/12/19(水) 19:44:25 ]: A大学は卒業生の就職率について、文科系、理科系ともにＢ大学よりも高いと宣伝している。
このことはA大学全体でＢ大学よりも就職率が高いことを意味するか。

問題文からして、意味しなさそうなのですが理由がわかりません。ヒントでいいので教えて
頂きたいです。お願いします。
127 名前：１３２人目の素数さん mailto:sage [2007/12/20(木) 00:58:44 ]: 文系、理系各々の就職率から、大学全体（文＋理）の就職率を求める式を導く。
128 名前：１３２人目の素数さん [2007/12/20(木) 01:05:35 ]: A 文系 1/1　＝100%
理系 29/99　＝28%

B 文系 9000/9900＜100%
理系 20/100 ＝20%

全体では
A ３０%
Ｂ９０.２%

反例
129 名前：１３２人目の素数さん mailto:sage [2007/12/20(木) 02:21:44 ]: >>125
データは、３行一列ってこと？
単に、「３つのグループの発生割合が同一」という帰無仮説を
検定したいだけなら、カイ二乗検定をすればよいのでは。
例えば、(15,10,5) がデータなら、(10,10,10)を期待値として
カイ二乗統計量を計算。
130 名前：１３２人目の素数さん mailto:sage [2007/12/20(木) 08:15:32 ]: >>127,128
ありがとうございます。
Bは就職率の高いほうに人数が偏っているってことですね。
131 名前：１３２人目の素数さん [2007/12/20(木) 09:51:14 ]: >>130
反例は一例だから、一応、一般化して解いた方がよい。
たぶん違う大学同士の異なる学科の人数の関係が問題になってくると。
132 名前：１３２人目の素数さん [2007/12/20(木) 11:15:05 ]: >>129
ありがとうございます。
データは3行1列です
カイ二乗検定は正規分布していなくても使えるんですか？
133 名前：１３２人目の素数さん mailto:sage [2007/12/20(木) 13:30:19 ]: >>132
「正規分布してる」って何のこと言ってるんだよ。
主語くらいちゃんと書いてくれ。
>>125の「サンプルが１つずつしかない表」
というのも意味が良く分からないし。
134 名前：１３２人目の素数さん [2007/12/20(木) 14:46:40 ]: ＣＡＮＯＣＯでＣＣＡをしたいんですが、日本語で説明しているいいサイトないですかね？
135 名前：１３２人目の素数さん mailto:sage [2007/12/22(土) 00:05:27 ]: 対応のない2元配置の分散分析を行おうと思っていたデータを
各群それぞれ Shapiro-Wilk 検定にかけてみたら全てアウトでした．
それでノンパラメトリックな方法でやろうと思うのですが，
この場合どんな方法が適当でしょうか？
136 名前：１３２人目の素数さん mailto:sage [2007/12/22(土) 00:51:46 ]: >>135
Friedman検定でないの？
137 名前：１３２人目の素数さん [2007/12/23(日) 15:21:23 ]: 正規確率ﾌﾟﾛｯﾄ図をEXCELで描きたいのです。
基準化したﾃﾞｰﾀをx軸まではわかります。
y軸に順位に応じた期待する値を入れるとあるのですが、『順位』という言葉に引っ掛かっています。
どのように図を描けばよいのでしょうか？
138 名前：１３２人目の素数さん mailto:sage [2007/12/23(日) 19:52:09 ]: 現時点で世界的標準と呼べる確率・統計の本ってどれ？
139 名前：１３２人目の素数さん mailto:sage [2007/12/23(日) 20:17:26 ]: fumio hayashi

Econometrics
140 名前：１３２人目の素数さん [2007/12/24(月) 04:12:54 ]: 計量経済信者うぜぇ
141 名前：１３２人目の素数さん [2007/12/24(月) 04:21:02 ]: 日本人の書いた世界的な本なら、Ikeda・Watanabeか？
142 名前：１３２人目の素数さん [2007/12/24(月) 05:44:56 ]: 重回帰分析を実施する前に、
◆正規性検定（歪度、尖度）で調べる→不可なら変数変換
◆直線性（散布図）→不可なら変数変換
と上記2つを満たすために変数変換する手順、方法をご教授お願いします。
143 名前：１３２人目の素数さん [2007/12/25(火) 07:40:12 ]: >>142
実際のところどうなんだろ？
まず重回帰分析をやって決定係数をだした後に、マルチコ、外れ値、正規性や直線性を決定係数で判断しながら変数変換するのかな。
家にあった5冊の書籍を確認したが手順がわからないね。
144 名前：１３２人目の素数さん [2007/12/25(火) 16:10:05 ]: 統計ソフトの英文マニュアルを読んでいます。

CON-file

の「CON」は何の略字でしょうか？
145 名前：１３２人目の素数さん [2007/12/25(火) 22:10:24 ]: キツネ
146 名前：１３２人目の素数さん mailto:sage [2007/12/26(水) 02:17:00 ]: 池田渡辺ってだれよ？
147 名前：１３２人目の素数さん mailto:sage [2007/12/26(水) 02:45:54 ]: スタンダードは
ホーエルでは？
148 名前：１３２人目の素数さん mailto:sage [2007/12/26(水) 02:46:29 ]: Fumio Hayashiこそ世界の林です

豊田先生の著書なんかもいいかもしれんね。
149 名前：１３２人目の素数さん [2007/12/26(水) 04:07:57 ]: だから、林は計量経済学であって、確率・統計じゃないだろ。
計量経済学って結局確率・統計の深い所まで書いてないだろ？

渡辺信三を知らないのか？
150 名前：１３２人目の素数さん [2007/12/27(木) 07:31:25 ]: 重回帰分析の手順って確立されていないということですか？
151 名前：１３２人目の素数さん [2007/12/27(木) 16:52:25 ]: 今数理統計学を大学で履修してるんですけど、
全く理解しないで暗記だけでテスト受けてる感じです。。。
知識詰め込むだけの数学はつまらなくてしょうがないです。
皆さんはどうやって数理統計を勉強してますか？
なにかおすすめの参考書などありますか？
大体有名な分布やそれらの積率母関数の求め方はちゃんと頭に入ってるんで、
これを生かしたいんです。
152 名前：１３２人目の素数さん [2007/12/27(木) 17:43:36 ]: 　★★小泉純一郎と安倍晋三は朝鮮人★★
コピペして各板に貼り付けよう　知人にも話そう
小泉純一郎　
・戦前大臣を務めた祖父小泉又次郎は純粋な日本人とされる。だが、純一郎の帰化朝鮮人である父が鮫島姓を買い取り
　又次郎の娘をたぶらかして婿として小泉家に入る　そこで小泉家は帰化朝鮮人である純一郎の父に乗っ取られた
　参照ja.wikipedia.org/wiki/%E5%B0 上下くっけて
%8F%E6%B3%89%E7%B4%94%E4%B9%9F
・父親の純也は、鹿児島東加世田の朝鮮部落の出身者といわれる　日大卒業名簿には、純也の日本名はなく、
　見知らぬ朝鮮名が書かれているという　
　純也は朝鮮人の帰国事業、地上の楽園計画の初代会長であった
・結婚後、子供をもうけ即離婚した宮本佳代子は在日企業エスエス製薬創業者の孫
・小泉の元秘書官の名前は飯島勲←注目　帰化朝鮮人
・派閥のドン森喜朗も生粋の朝鮮人 ←森も帰化人がよく使う通名
・小泉は、横須賀のヤクザ、稲川会と関係が深い
安倍晋三
・岸家毛利元就が陶晴賢と厳島沖で戦い大勝を収めた際、寝返って毛利方についた船の
　調達人が「ガン」と称する帰化人であったという　毛利はその功績によって「ガン」を
　田布施周辺の代官に召したてた　このガンを岸家の先祖とする説がある
・祖父岸信介が文鮮明と共に反共団体　国際勝共連合（統一教会）を設立
・官房長官時代統一教会「合同結婚式」に祝電を送り、話題に
・安倍のスポンサーは、下関の朝鮮人パチンコ業者である
・グリコ森永事件時、明らかになった帰化朝鮮人企業森永のご令嬢と結婚
・そのわが国のファーストレディーは電通（会長成田豊、半島生まれの帰化人）勤務という分かりやすい
　経歴の持ち主の朝鮮の血筋
・韓国、中国の留学生に日本の企業に入ってもらうために住居費分、学費免除分、生活費など月計２０万～３０万円相当の支給
　日本人のワーキングプア層を全く省みない　また帰化系在日系朝鮮人が日本の企業で技術を盗み、半島の現代などの企業に
　伝授していることが深刻な問題になっている　
153 名前：１３２人目の素数さん [2007/12/27(木) 18:06:11 ]: >>151
統計数理はあとで役立つ。
基礎トレだから手抜きせずマジにもならずやっとくのが吉。
154 名前：１３２人目の素数さん [2007/12/28(金) 01:01:26 ]: すみません重回帰分析を行っているのですが
定数項を含む場合と含まない場合で相当結果が違ってきます。
特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。
また、説明変数のt値なども両者で相当な違いが見られます。
定数項を含む場合の寄与率の導出等については文献があるのですが
定数項を含まない場合についてがどうしてもよくわかりません。
なぜこのような事になるのか・・・
また、どちらの結果を使うのがよいのか・・・（定数項を分析の際入れるか）
どなたかご教授頂けないでしょうか？
155 名前：１３２人目の素数さん mailto:sage [2007/12/28(金) 01:10:34 ]: >>154
目的因子と説明因子の関係が原点を通るか通らないかで判断する。
156 名前：１３２人目の素数さん [2007/12/28(金) 03:03:19 ]: >>138
graduate の入門レベルの本だと、統計学やる人向けはこんな感じ。
測度論：Billingsley, "Probability and Measure"
推定：Lehmann and Casella, "Theory of Point Estimation"
検定：Lehmann and Romano, "Testing Statistical Hypotheses"
Lehmannの２冊は古いし測度論的な記述が完全に一般化されてない箇所も
あるけど、総合的にはこれを超える本はないような気がする。
Bayesとかは詳しく知らん。
回帰分析や分散分析は、なかなかいい本がない。
（昔に書かれた数学的に細かい本ならあるが。）

確率論に関しては、
Durrett "Probability: Theory and Example"
Kai Lai Chung "A Course in Probability Theory"
Kallenberg　"Foundations of Modern Probability"
あたりか？
Durrettは簡潔な教科書スタイルの本だがギャップも多く難しい
という評判、Kai Lai Chungは評判はいいがやや記法が古い。
Kallenbergは辞書のような本。

補足、追加、反対意見などある人ヨロ。
157 名前：１３２人目の素数さん [2007/12/28(金) 11:06:27 ]: >>155
ありがとうございます
つまり仮定しているモデル式に定数項が含まれないなら
定数項を含まないモデルで解析という事でしょうか？
158 名前：１３２人目の素数さん mailto:sage [2007/12/28(金) 13:19:11 ]: >>157
まぁそういうこと。
xが0の時yは0なら定数項はなし（原点を通るから比例関係）
159 名前：１３２人目の素数さん mailto:sage [2007/12/28(金) 18:53:06 ]: 勝手にモデルを決めたら、結果を認めて貰えない。
一般に線形回帰モデルは定数項付きなので、
何かの理由で定数項無しの特殊なモデルを使いたい場合は、
まず定数項が統計的に有意じゃないことを示す必要がある。
160 名前：１３２人目の素数さん [2007/12/29(土) 07:36:36 ]: どうか、お願いします。
バリマックス回転したいんですが、エクセルしかなく、
さっきR言語をインストールしたんですがさっぱりわかりません。
R言語のサイトで
ttp://aoki2.si.gunma-u.ac.jp/R/src/all.R
が紹介されていて、この関数を入れるとバリマックス回転ができるそうなんですが
ここの関数を使おうとしてもなぜか正常に表示されず、使用することができません。
どうか、何か、妙案を出していただけませんか？
お願いします。
161 名前：１３２人目の素数さん mailto:sage [2007/12/29(土) 12:38:08 ]: >>160
Rのスレで質問したほうがすぐに答えてくれると思う
162 名前：160 mailto:sage [2007/12/30(日) 09:04:36 ]: 了解です。
163 名前：１３２人目の素数さん mailto:sage [2007/12/30(日) 21:27:39 ]: 信頼区間の信頼率と被覆確率について教えてください。

信頼率というのは、
例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは
「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか？

また、被覆確率というのは、
ある文献では信頼率と同じことと説明されていて、
他所では「作られた信頼区間の中に母数の推定量が入る確率」である、
と説明されていました。
これはどちらが正しいのでしょうか？
164 名前：１３２人目の素数さん mailto:sage [2007/12/30(日) 23:22:22 ]: 「信頼率」は「信頼係数」のことかな？
だと本来は同じ。
しかし二項分布とかポアソン分布などの離散型確率変数の場合、
正確な信頼区間は作れない。
よって名目上の信頼係数と実際の被覆確率とが違うのは普通。
165 名前：１３２人目の素数さん mailto:sage [2007/12/31(月) 00:37:27 ]: 正規分布の問題で
高１男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。
このとき、無作為に男と女を１人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。
（実際の問題には平均、分散の具体的数字が入ってます）
というのがあって、解き方がわからないんですけど
どなたかアドバイスお願いします。
166 名前：１３２人目の素数さん mailto:sage [2007/12/31(月) 00:52:21 ]: ヒント：差 Y-X の分布
167 名前：１３２人目の素数さん mailto:sage [2007/12/31(月) 01:14:52 ]: >>166
アドバイスありがとうございます。
Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。
行き詰まったのでまた明日考えることにします。
168 名前：１３２人目の素数さん mailto:sage [2007/12/31(月) 10:30:51 ]: >>165
Xとなる確率はわかる。
YがX以上となる確率もわかる。
最後にXで積分すると全体の確率がでる。
169 名前：１３２人目の素数さん [2007/12/31(月) 19:36:35 ]: >>168
で、正規分布の密度関数の二重積分まで行って、
お手上げになる。
それが解けるようなヤシは、そもそも質問しないから。
170 名前：１３２人目の素数さん mailto:? [2007/12/31(月) 19:43:09 ]: >>167
Ganbarin sai yoh !
171 名前：１３２人目の素数さん mailto:sage [2007/12/31(月) 20:13:07 ]: べき分布について詳しく書いてあるようなページはないですかね？
もしくは本でも良いんですが
172 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 16:38:29 ]: >>169
＞で、正規分布の密度関数の二重積分まで行って、
＞お手上げになる。
つまり、その二重積分のやり方を教えればいいということか。
173 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 18:24:41 ]: 統計学を独学するのにいいテキストを探しています
候補としては東大出版の基礎統計学I 統計学入門か
統計学のための数学入門30講を考えているのですが
評判というか使い勝手はどうなのか教えていただけないでしょうか？
上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです
よろしくお願いします
174 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 18:49:02 ]: 後者は統計を学ぶためのあくまで「数学」の本だよ
数学がわかるなら必要なし
175 名前：１３２人目の素数さん [2008/01/01(火) 22:52:51 ]: >>173
候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176 名前：ふ [2008/01/01(火) 23:09:35 ]: 〉173
学部はどこなの？
数学はどのていどわかるの？
いままで読んだ統計学の本は？
統計学を学ぶ目的は？

いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 23:31:40 ]: 173です　説明不足だったことを反省しています
>>176
経済学部なので数学は半端に知っているという程度です（問題演習はそこそこできるが、証明はできません）
統計の本は読んだことがありません
授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています
最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました

>>175
上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした

>>174
統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178 名前：１３２人目の素数さん mailto:sage [2008/01/01(火) 23:35:47 ]: 173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。

専門分野　教育学
数学理解　高校のころ２Bやって以来数年間触ってないので、ところどころ忘れている(３Cは未履修)。
既読書籍　「社会の見方、測り方―計量社会学への招待」
　　　　　　　「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹
　　　　　　　あとは、講義等で講師が自前で作成した教材等。
学ぶ目的　数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。

お手数しますが、何かお勧め頂けると有難いです。
宜しくお願いします。
179 名前：１３２人目の素数さん [2008/01/01(火) 23:49:10 ]: >>177
統計学を勉強する目的は何ですか？
研究、資格試験などありますが。
180 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 00:34:18 ]: 私は最近統計の勉強を始めた者です。
テキストは東大出版会の統計学入門を使ってます。
この本に書いてることで疑問があるのですが、
『母平均を推定する問題では、母分散が既知なら正規分布、
母分散が未知ならt分布を使う。
母分散を推定する問題ではカイ二乗分布を使う。』
という理解でよいでしょうか？
この理解ではダメな問題があったので、理解が正しいか教えてください。
181 名前：ふ [2008/01/02(水) 01:23:11 ]: 〉177
困りましたね。
本来、統計学は独学の困難な学問ですからね。
文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。
面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。
だれか先生につかないと。
182 名前：１３２人目の素数さん [2008/01/02(水) 01:43:14 ]: >>180
正規分布ならＯＫ．
推定の一般論について読めばそれの理解がよくないことがわかる。
183 名前：１３２人目の素数さん [2008/01/02(水) 02:58:44 ]: >>177
東大の統計学入門は、初心者向けの商品カタログみたいな感じだから
独学には向かないと思うよ。そのレベルなら
　蓑谷千凰彦「統計学入門」東京図書
がいいかも。もっと数学的でも良ければ、
　竹村彰通「現代数理統計学」創文社
とか。
184 名前：１３２人目の素数さん [2008/01/02(水) 06:43:36 ]: 統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185 名前：１３２人目の素数さん [2008/01/02(水) 07:56:36 ]: >>177

統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。
統計は確率論の１つの応用分野である。で、確率論をやるのなら線型代数、微積分
及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。１)線型代数：岩波基礎
数学講座の線型空間、２)微積分：岩波基礎数学講座の解析入門１～４、３)集合と
位相：岩波の現代数学概説１、２。その中でとりわけ重要なのは微積分、集合と位相
である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、
「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概
説２」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。
これとほぼ並行して、次のことをやる。

１：線型代数の穴埋め。
これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「２次形式」で十分。
２：少々の抽象代数。現代数学概説１の群、環、体あたりを読んでみよう。
３：複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき
或いは必要になったときに読んでいけばよい。
４：関数解析。お勧めは「岩波基礎数学講座の関数解析」。
５：Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門５」。
６：微分方程式。お勧めは岩波講座の現代数学への入門の
「力学と微分方程式」、「熱・波動と微分方程式」　　　　あたり。
７：岩波講座応用数学。色々読んでみるとよい。役に立つ筈。

ついでに言えば、腕力も鍛えておいた方がよい。
186 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 12:17:30 ]: >>182 教えてもらってありがとうございます。

とりあえず今の理解でおおまかには大丈夫なら、
まず先に全体を終わらせるよう先に進めます。
187 名前：１３２人目の素数さん [2008/01/02(水) 13:29:57 ]: >>186
大丈夫なのは正規分布の母平均の推定の場合に限ります。

東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。
漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの
統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 14:10:47 ]: 東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。
噛めば分かるのだが、すっと理解できるようには書いてない。
内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189 名前：１３２人目の素数さん [2008/01/02(水) 14:50:15 ]: 系列範疇法について質問があります。
各カテゴリーの相対頻度と等しい面積を持つように
正規分布を分割したいのですが、
具体的にどうすればどうすればよいのでしょうか。
190 名前：１３２人目の素数さん mailto:sage [2008/01/02(水) 19:32:13 ]: >>180って他のスレで酷い質問しててﾜﾛﾀんだがw
191 名前：１３２人目の素数さん [2008/01/03(木) 03:15:42 ]: 移動平均の最適パラメータってどうやって求めるんですか？
192 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 06:24:38 ]: 変数XがA-B群間のt検定では有意差が出ないのに
判別分析（ステップワイズ法）ではA-B群の判別に寄与する変数として投入される

ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ，なんだかしっくりこない
193 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 18:32:56 ]: コーシー分布の平均値って事実上ゼロでしょ？
194 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 21:37:43 ]: >>193
「事実上」ってなんだ
195 名前：１３２人目の素数さん mailto:sage [2008/01/03(木) 21:50:06 ]: >>192
散布図を描くとするでしょ
右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。
横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。
こういうのでどうでしょうか
196 名前：１３２人目の素数さん [2008/01/03(木) 22:52:06 ]: >>193
左右対称な分布なら　平均 = 中央値　と定義すればそう。
197 名前：１３２人目の素数さん [2008/01/03(木) 23:01:51 ]: >>193
平均と中央値をごちゃごちゃにしてはだめです。
平均と中央値は中心という概念では同じですが、定義は全く違います。
198 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 13:15:44 ]: コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない？
199 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 14:47:30 ]: >>195
あー，なるほど，そう言われるとよく分かる．
200 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 17:16:13 ]: >>198
コーシー分布にしたがってランダムに数を生成させる方法を述べよ
仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201 名前：１３２人目の素数さん [2008/01/04(金) 18:42:25 ]: >>198　>>200
コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。

あと位置と尺度を一般化したコーシー分布、例えば
ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%82%B7%E3%83%BC%E5%88%86%E5%B8%83
の母数は、「母平均」や「母標準偏差」ではない。
母平均も母分散も存在しないからね。

また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。
というか、そもそも推定している対象が存在しない。
コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。

つまり、裾長分布の兆候を持つデータの位置母数推定で、
標本平均を使うのは危険。経験的には、外れ値を除外したり、
両端を一定率で除外した調整平均が使われている。
一方、正規分布など特定の分布では少し効率が悪いが、
「標本中央値なら常に安全」という教訓になるのがコーシー。
202 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 18:49:11 ]: コーシー分布にしたがってランダムに数を生成させる方法はある。
まず、（-∞, +∞）の一様分布の確率変数p(x)を用意する（ただし、厳密な意味ではこれが一番難しい）。
あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、
q(y)=Σp(φ(y))・dφ(y)/dy
で定義されるq(y)で数を生成すればＯＫ。ただし、x=φ(y)は二価関数なので、単調増加の領域と
単調減少の領域に分けてΣを計算すれば良い。
203 名前：１３２人目の素数さん [2008/01/04(金) 18:55:38 ]: >>202
それ合ってんの？
204 名前：202 mailto:sage [2008/01/04(金) 18:57:21 ]: >>203
知らんｗ
205 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 19:00:33 ]: (-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか？
206 名前：１３２人目の素数さん [2008/01/04(金) 19:00:37 ]: >>204
何だ知ったかか
207 名前：１３２人目の素数さん [2008/01/04(金) 19:07:15 ]: 何で無駄に(-∞, +∞)で考えてんだよ
もっと効率よくしろ
208 名前：202 mailto:sage [2008/01/04(金) 19:09:23 ]: >>206
小針の確率・統計入門のP49§3確率変数の変換に書いてある
209 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 19:12:22 ]: 標準正規の比や一様分布のtanで生成するだけだろ
210 名前：201 mailto:sage [2008/01/04(金) 19:20:40 ]: 訂正
×arctan 変換で作れるよ。
○ tan 変換で作れるよ。

ｽﾏｿ。逆が２回出てくる関係なので、書く時に確かめずに勘違いした；
211 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 20:33:57 ]: 理論的に生成可能かどうかは問題ではない
問題は生成した数からどうやって>>198の言う平均を計算するかだ
そもそもこの計算自体が既に不可能だろうという話
212 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 20:48:33 ]: 実測値の算術平均なら何の問題もなく計算できます
213 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 21:27:51 ]: >>212
>>198の検証をたのむ
214 名前：１３２人目の素数さん mailto:sage [2008/01/04(金) 23:59:26 ]: だーかーらー
コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。
どれだけ大標本でもだ。つまり平均取っても無意味。

>>198は「標本平均は必ず確率収束する」と思ってる厨房ｗ
215 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 07:16:26 ]: 「事実上の平均」に面白い定義を与えられるかどうかだな。

乱数を[-d,d]にtruncateした上で平均を取って極限をとり、
最後にd→∞にしてみるとか？
216 名前：１３２人目の素数さん [2008/01/05(土) 10:53:42 ]: クイズ問題のサイトを作ろうと思っているのですが、
１万のクイズを、複数の人に自由に解かせるとして、
(クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、
一度、解くのをやめ、後でまた解いても良い。)
どのような公式で、ランキングをつけたら良いのでしょうか。
例えば、単純確率だと１０問中５問正解した人と、
１００問中５０問正解した人は、同じランクになりますが、
果たして、これは、同じランクで良いのでしょうか。
そうすると、１問中１問正解した人は、いつも１位となってしまいます。
何か、良い公式がないでしょうか。

よろしくお願いします。
217 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 13:20:23 ]: 単純に
正解数－不正解数
じゃダメ？
218 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 15:16:41 ]: >>216
検定の考え方を使えば多少は重み付けも出来るが
明確に順序をつけるのは無理だろう

ゲームとして割りきるなら
　正答率*正答率*回答数
くらいで良いんじゃないかと思う。
理論的根拠は無い。
219 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 18:26:36 ]: >>216
乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の
事象を n 回独立に繰り返した時の二項分布になるとする。
この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。
仮に１問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。

正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、
マハラノビス距離空間上のランキングが得られる。

ｐの推定値は、参加者全員の正解数合計 / 解いた問題数合計
が良いけど、それだと毎回ランキングが変化する。
問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。
220 名前：１３２人目の素数さん mailto:sage [2008/01/05(土) 20:20:15 ]: >>215
コーシーの主値
221 名前：219 [2008/01/06(日) 18:34:11 ]: >>216
数値例が無かったので補足。

選択式の回答方式だと思うので、すべて「４択」だとしよう。
そうすると、「でたらめに答えて」当たる確率は　p=1/4。
この時 μ = n/4、σ = (√n√3 )/ 4。
z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。

n　　　　　　x　　　　　　　z　　　　　 D（偏差値）
1　　　　　　1　　　　　 1.22　　　　　62　 …　１問中１問
10　　　　　 5　　　　　 0.65　　　　　56　 …　１0問中 5問
100　　　　 50　　　　　2.04　　　　　70　 …　１00問中 50問
1000　　　 500　　　　 6.45　　　　　115　…　１000問中 500問

・正規分布近似を使っていることになるので、精度条件として
　だいたい np≧5 （p≦1/2）または n(1-p)≧5 （p>1/2）が必要。
　よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。
・偏差値 D が使用する有効精度内で同じ場合には、問題数 n
　の大きい方を上位とする。

※１次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。
222 名前：１３２人目の素数さん [2008/01/06(日) 19:18:40 ]: くだらん。
正解数－不正解数の方がよっぽど役にたつ。
223 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 19:47:21 ]: >>222
Ａは、１００問全問正解（正解率１００％）で１００　－　０　＝　１００。
Bは、２００問中１５１問正解（正解率７５．５％）で１５１　－　４９　＝　１０２。
B　＞　A　でいいのか？
224 名前：１３２人目の素数さん [2008/01/06(日) 19:53:31 ]: いい。
１００問正解の時点で、Ａは残りの４９問を正解する確証がどこにもないから、
ランキングとしては151問正解のＢよりも低くランキングされるのが妥当。
225 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 19:54:36 ]: 上位一割くらいしか表示しないなら>>218がシンプルでいい
>>219みたいになると仮定の妥当性とかいろいろ面倒だからな
226 名前：１３２人目の素数さん [2008/01/06(日) 19:55:45 ]: ただし、問題文ごとに独立性がないのなら話は別。
過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら
単純な正答率によるランキングが妥当。
227 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:05:22 ]: 224=226です。
228 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:07:18 ]: 俺が野球チームの監督なら、２００打席１５１安打のバッターと、
１００打席全安打のバッターなら後者を使うけどな
229 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:14:35 ]: 何が正しい計量と判断できるかは、問題文（群）の構成に強く依存する。
問題文の独立性が保障される様な理想的な構成なら、正解数－不正解数が正しい計量となる。
が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。
230 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:27:48 ]: >>226, >>229 が言ってるのは、「独立性」ではなく「異質性」だな。
つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。
量子力学の問題の次は文学の問題とか、、、
しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ
231 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:31:06 ]: クイズという問題をどうとらえるかだが、
あらかじめ確定した操作をランダムな順序で対象に実行して
その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。
と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。
232 名前：１３２人目の素数さん [2008/01/06(日) 20:33:04 ]: こういう話題が出てきてwktkしてきた
>>180-215のような低レベルな話より断然興味深い
233 名前：１３２人目の素数さん mailto:sage [2008/01/06(日) 20:54:08 ]: 出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。
ネイマン・ピアソンの考え方に従うか
ベイズの考え方に従うか
両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって
どういう統計量で判断するかが決まる。
234 名前：219=221 mailto:sage [2008/01/07(月) 00:52:43 ]: >>225
「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの
回答方式なら、>>218 でも良いよ。なぜなら

　z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p))

において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、

　y = x/√n - np

で回答者同士を比較しているのと同じ。この値は p → 0 の時

　y → x/√n = (√n) (x/n) = (√回答数)・正答率

なので、自乗すれば >>218 の指標になる。

※知能や知識は、完全不確実状態（混沌）からどれだけ確実状態（秩序）
に近づいたかで計るのが、情報量的な考え方。
ただし、誤知能や誤知識という方向への脳内秩序もアリなので、
「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。
235 名前：234 mailto:sage [2008/01/07(月) 00:59:44 ]: ×　y = x/√n - np
○　y = x/√n - (√n)p
236 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 18:36:12 ]: >>234
それが>>225でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。
そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、
結局のところ意味があるのはpに依存しない部分だけというわけだ。

お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ
237 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 21:24:23 ]: すみません、お教えください。4群の共分散分析をやっていて、
回帰直線の傾きが有意に違う、という結果を得ています。
で、１つのグループAを除いて3群で検定すると傾きに有意差は見られません。
グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、
ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか？
238 名前：234 [2008/01/07(月) 21:36:34 ]: >>236
まあまあ抑えてｗ、たかがクイズのランキングの話。
で、（初等教科書的な）二項分布モデルが気に入らないようだけど、
こう考えればどうかな？

クイズの回答はすべて選択式で、選択肢の数は常にM個とする。
また出題時に、選択肢の順序は乱数でかき混ぜる。

別室に居る見えない回答者にクイズを出題して、その答えのみから
回答者がサイコロのような乱数器（完全無知脳）を使っているか、自分自身
（幾分の知能を保有）でマジに答えているかを判定する。
もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、
記述言語は HTML+Javascript で十分だろう。OSは何でも良いｗ

この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。
したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、
>>219, >>234-235 の尺度を使うことなる。

つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。
不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。
239 名前：238=234 mailto:sage [2008/01/07(月) 21:47:00 ]: × 使うことなる。 ○ 使うことになる。
240 名前：１３２人目の素数さん mailto:sage [2008/01/07(月) 22:11:03 ]: >>237
ボンフェローニでAと他の群がすべて棄却され、
他の群同士は棄却されないならそれでいいんじゃない？
（ボンフェローニだと補正がきつすぎてAと他の群で
棄却されないものが出てくるのなら問題だが。）
241 名前：237 mailto:sage [2008/01/07(月) 23:39:27 ]: >>240
ありがとうございます。方法としては間違ってないと知り、安心しました。
仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、
ttp://www.human.tsukuba.ac.jp/~percept/index.php?ANOVA%B7%AF%2F%C2%BF%BD%C5%C8%E6%B3%D3%A4%CE%CA%FD%CB%A1
を見つけました。群馬大の青木先生の掲示板では、シダックの方法？というのが出ていたのですが、
解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。
もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。
１－（１－α）^（１／ｋ）がシダックの不等式なんでしょうか？
242 名前：１３２人目の素数さん [2008/01/08(火) 01:41:49 ]: 連続型確率関数Xの確率密度関数が
f(x)=1 (0≦x≦1)
の場合で
X=e^-Y/2
とするときのYの確率密度関数の求め方ってどうすればいいですか？
243 名前：１３２人目の素数さん [2008/01/08(火) 01:45:01 ]: 変数変換の公式を調べてそれを使うだけだろ
別に何も変わったところがない
244 名前：１３２人目の素数さん [2008/01/08(火) 01:49:00 ]: >>242まで辿り着いてここでつまってしまったんです
245 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 01:50:00 ]: >>243で書いてある通り、調べればすぐわかることだから自分で解決してみな
246 名前：242 [2008/01/08(火) 02:06:12 ]: 何か勘違いしてたみたいで簡単にできました
お騒がせしてすいませんでした
247 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 02:06:18 ]: また試験のシーズンか、、、
248 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 02:17:51 ]: 試験に囚われてはならない。
自分のペースで学習することが大切だ。

試験で良い点を取ったからと言って
本当の実力が付いているとは限らない。
249 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 23:35:10 ]: >>241
シダックは使える条件があるからいいのかな？
大体4群だとボンフェローニで0.0125で
シダックで0.012741だからあまり大差ないね。
そのページのHolmの方法なんかいいんじゃない？
Shafferの方法は表がいるしね。
250 名前：１３２人目の素数さん mailto:sage [2008/01/08(火) 23:45:15 ]: 　　　　2007年11月のウェブサイト利用統計
--------------------------------------------------
　　　　　　　　順位　　延べ利用時間　利用者数
　　　　　　　　　　　　　(万時間)　　　(万人)
--------------------------------------------------
某Yahoo! 　　　1位→1位　 12549
某楽天市場　　3位→2位　　2164
某ミクシィ　　2位→3位　　1669
某YouTube　　　4位→4位　　1495　　　　　　動画投稿
某ニコニコ動画　?→5位　　1249　　　 386　動画投稿
某FC2　　　　　9位→6位　　 960　　　　　　ブログ制作支援
某Google 　　　7位→7位　　 794　　＞2000
2ちゃんねる　　5位→8位　　 751　　　　　　掲示板
某goo　　　　　8位→9位　　645　　　1800
某msn　　　　　6位→10位　　628
---------------------------------------------------
251 名前：237, 241 mailto:sage [2008/01/09(水) 18:38:41 ]: >>249
レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、
という状態だったので、それを参考にすすめる事にしました。
ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。
その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、
という事でしょうか？
（後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです）
252 名前：１３２人目の素数さん mailto:sage [2008/01/09(水) 22:49:14 ]: >>251
シダックの不等式は書かれてないが、それに基づく有意水準の調整は
>>241で合ってるよ。>>249もそれで計算しただけだしね。
ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を
使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど
確信はないなあ。
>>249で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで
進めないと効果はないかもね。
253 名前：１３２人目の素数さん mailto:sage [2008/01/10(木) 00:24:36 ]: 鼻の炎症はビエン、では耳の炎症は？
254 名前：１３２人目の素数さん mailto:sage [2008/01/10(木) 01:10:26 ]: 　━━━━━┓　　　　　　　　　　　　　　　　　　　　　　　　　＿＿＿＿
　　　　　　┃　　　　　　　　　　　　　　　　　　　　　　　　／　　　　　　＼
　　　　　　 ┃┏┳┛┃┃┃　　　　　　　,,..--――--／　　　　　　　　　＼
　━━━━━┛　 ┃　　 ┏┛　　　　　　　|　　ヾ==＿_＿ヽ　　　　　　　　　＼
　　 ┏┻━　　　　　　　　　　　　　　　　　　ヾ　　　　:::::::::::::====＼　　　　　　　 |
　　 ┃┣┓┣┓　　　━━┓╋　　 ┣　　　｀ー--／　　　　　　ミ(⌒)　　　　 /
　┏┛　　╋　　━┓ 　 ┏┛┃━┏╋　　　＿　　ヽ, )　　　　　　ﾐﾉ ~ﾚ-r -‐､/
　　　　 ━┻━　　┛ 　 ┗━　 ━┗┛　　/　　ヽ. <_　　　　　　　ノ__　 i　i　i〉〉
　　　　　━　　　　　　　　　　　　　　　　　／ヽ　　　}<´　　　　　　/ ヽ､　/_/_/ﾚ′
┏━━╋　　　　　　　　　　　　　,.-､／　　,.>-‐'" { ＿.......:::::::: ヽ､⊿)ﾄ´ ´　ヽ:;ヽ:;:-:;:-､.
┃　━ ┃　　　　┃┃　　　　　 ,,..‐'ヾ_j　 ,..<　　　　　`ー､::::::::　　/;:￣:;i　　　　ヽ､;:_;:;:;:;:;;:
┃┏┓╋　　 ┃　　　　　　,.-'"､ヽ､ |::::/ /　　　　　　/;:;:ヽ　　ノ;:;:;:;:;:;:i　　　　　　＼ヽ
┛┗┛┗┃┃┃　　　　　 i.／ヽヽ |ﾉ　　!´　　　　　 /;:;:;:;:;|　（;;／j;:;:;:;:;ヽ_　　　ﾉ　　|
　┛┗━┛ 　 ┗━┛　　（__／ヽjノ　／　　　　　　/;:;:;:;:;:;|､　　（;:;ﾉ;:;:;:;:;:;:/＼　　　　|
　 ┳━┳　　　　　　　　　／ヽ　　　／　┏━━┓ |;:;:;:;:;;/　ヽー'/;:;ﾉ;:;:;:;:/　 |＼　　 |
┏╋━╋┓　　 ┏┛　　　　|　　　|　　　　　 ┃ ）;:）;/　　　　　||（;:;:;:;/|　　ヽ､＼　|
┗╋━╋┛　 ┏┛　　 ╋ 　┃ ┃　┃ 　　　 ┃ ;:;::;:ヽ　　　　　|:　ヽ;:;:ヾ　　　ヽ__ﾉ
　 ┻━┻┃┃┗┓　　┃ 　　 ┃　┃ 　 ┏━┛
　┛┗━┛ 　　 ┗┓　┏╋ 　 ┗　　　 ┃
　　　　　　　　　　 ┗┛　　　　　　　┏┓
　　　　　　　　　　　　　　　　　　　　　　　　┗┛
255 名前：251 mailto:sage [2008/01/10(木) 01:31:44 ]: >>252
>共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない
なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。
256 名前：32と35 [2008/01/10(木) 02:04:32 ]: コックス比例ハザードモデルについてお教えください。

予後推定因子を解析する際の事ですが
単変量解析をする際に、交互作用のある因子は除こうと思うのですが
SPSS でその因子の抽出の仕方を教えてください。

イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む
必要があると思います。

もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか？
257 名前：１３２人目の素数さん [2008/01/11(金) 19:59:43 ]: 「絶対計算」という本を図書館で借りて読んだ。

要点は、絶対計算したほうが良い、という感じで
なかなかいい本だった。
258 名前：統計 [2008/01/11(金) 21:11:39 ]: 文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。
アンケートを使ってどんな（容姿・性格）の人が好感をもたれるのかをやりたなぁと考えています。
259 名前：１３２人目の素数さん [2008/01/11(金) 21:11:59 ]: Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX－μはN(0、1二乗)に従う。
N(0、1二乗)についてP(1.5<=σ分のX－μ)＝0.07、
P(0.5<=σ分のX－μ)＝0.31である。
あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、
μ＋1.5σ<=Xの生徒は5段階評価の5、
μ＋0.5σ<=X<=μ＋1.5σの生徒は4、
μ－0.5σ<=X<=μ＋0.5σの生徒は3をつけるとする。
この時5をもらうのは全体の()％、
4をもらうのは全体の()％、
3をもらうのは全体の()％である。

分かりにくくてすみません。とりあえず5をもらうのが7％というのまでわかりました。どなたかお願いします。
260 名前：１３２人目の素数さん mailto:sage [2008/01/11(金) 22:04:40 ]: 5が7%だとわかったのに何で4と3がわからないんだ？
5で計算したのと同じようにやればいいだろ。
261 名前：１３２人目の素数さん [2008/01/11(金) 22:44:57 ]: 4が24％で3が38％ですかね？
間違ってたらご指摘ください…。
262 名前：１３２人目の素数さん mailto:sage [2008/01/12(土) 13:14:22 ]: すいません、無相関の検定って何でしょうか？
初心者丸出しの質問ですみません。
263 名前：１３２人目の素数さん mailto:sage [2008/01/12(土) 14:21:27 ]: >>257
山形浩生が訳してるやつ？
結構おもろいよね
264 名前：１３２人目の素数さん [2008/01/12(土) 15:20:48 ]: >>262
単回帰の傾きゼロ検定
265 名前：１３２人目の素数さん [2008/01/12(土) 15:22:57 ]: >>258

統計数理研究所のHPで教員の業績を調べると、適当なテーマが見つかるよ。
副所長が『女子学生の飲み物調査』で論文を書いているとか。
266 名前：１３２人目の素数さん [2008/01/12(土) 21:26:58 ]: すいません、質問させてください。

繰り返しのない二元配置（または乱塊方、反復測定一元配置分散分析）
で分析できるデータを、多重比較したいのです。

そもそもそういうやり方がないので、ボンフェローニの補正を行いたいのですが、
この場合、対応のあるｔ検定を繰り返して有意水準を補正すればよいのですか。
それとも、対応のないｔ検定を繰り返せばよいのでしょうか。

ご意見くださいますでしょうか。
267 名前：１３２人目の素数さん [2008/01/15(火) 21:21:41 ]: >>262
普通に相関係数の検定でいいのでは。
268 名前：１３２人目の素数さん [2008/01/15(火) 21:29:11 ]: 変数変換について質問します。
0近傍で変化がなく、X軸のマイナス側はマイナスの値、X軸のﾌﾟﾗｽ側はﾌﾟﾗｽの値の方に増加する（TANを平たくしたような関数）
ような変数変換がしたいのですが、
ロジスティック関数を90度回転したような変換を扱うにはどうしたらよいでしょうか？
269 名前：１３２人目の素数さん mailto:sage [2008/01/15(火) 23:12:43 ]: tanを平たくした関数やロジスティック関数を90度回転させた関数で変換すればよい
270 名前：１３２人目の素数さん [2008/01/17(木) 08:18:16 ]: 目的はある値を予測することです。
外れ値の多いﾃﾞｰﾀの場合、回帰分析は回帰直線が外れ値に影響されます。
外れ値の多いﾃﾞｰﾀの場合、回帰分析は不適でしょうか？
1.不適なら分析手法は何を使うべきでしょうか？
2.また回帰分析で可能な場合外れ値分析や除去して回帰分析した予測をすると
予測の時に目的変数が未知の外れ値がきたときに予測精度が悪くなります。
どのように対処したらよいでしょうか？
271 名前：１３２人目の素数さん mailto:sage [2008/01/17(木) 20:44:18 ]: >>270
>外れ値の多いﾃﾞｰﾀの場合、回帰分析は不適でしょうか？
外れ値の多いﾃﾞｰﾀというのは、通常の１次線形回帰分析での寄与率が
何%程度なのかな？80%未満なら、その回帰式を予測式に使うのは避ける
べきではないかな。
>1.不適なら分析手法は何を使うべきでしょうか？
偏回帰線図を見て、非線形傾向なら高次回帰分析にかけてみるとよいのでは。
応答曲面法をメニューに有する数万円のソフトもあるからね。
272 名前：１３２人目の素数さん mailto:sage [2008/01/17(木) 23:09:06 ]: 2は考え違い。
外れ値に対する予測精度を高めるということは
誤差に追従させるというのと同じ。
273 名前：１３２人目の素数さん mailto:sage [2008/01/18(金) 00:02:15 ]: >>270
ロバスト回帰を使えば？
274 名前：１３２人目の素数さん [2008/01/18(金) 13:20:34 ]: >>271
40項目あり、単回帰での寄与率は大きい方から45、30、20、18、、10、9、～です。
偏回帰線図とは散布図のことでしょうか？調べてもわかりませんでした。
275 名前：１３２人目の素数さん mailto:sage [2008/01/18(金) 19:04:42 ]: >>274
>40項目あり、単回帰での寄与率は・・・
40項目とは収集データの組み数のことでしょうが、重回帰でなく単回帰というと
説明変数が１種類だけなのですか？
>偏回帰線図とは・・・
ThinkSTAT等の重回帰分析ソフトで偏回帰プロットと呼ばれている散布図の
ことです。Excelの回帰分析だと観測値グラフが似ています。
276 名前：１３２人目の素数さん [2008/01/18(金) 22:44:10 ]: ttp://www.vipper.net/vip437256.zip.html
誰かこの回答の仕方があっているか教えてくれませんか？
教科書とか持ってないんで調べようがないので。。。

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef