1 名前:132人目の素数さん [2007/10/24(水) 08:52:19 ] 理論的な話題から実務上の疑問点まで。 学校の宿題は自分で考えましょう。 前スレ: 統計学なんでもスレッド6 science6.2ch.net/test/read.cgi/math/1169836298/ 統計学なんでもスレッド5 science5.2ch.net/test/read.cgi/math/1145362721/ 統計学なんでもスレッド4 science4.2ch.net/test/read.cgi/math/1123896809/ 統計学なんでもスレッド3 science3.2ch.net/test/read.cgi/math/1097491056/ 統計学なんでもスレッド2 science3.2ch.net/test/read.cgi/math/1068288283/ 統計学なんでもスレッド science.2ch.net/test/read.cgi/math/1012782106/ 関連スレ: 統計学なんて数学じゃないだろ science6.2ch.net/test/read.cgi/math/1173876727/ = 統計解析フリーソフト R 【第2章】 = science6.2ch.net/test/read.cgi/math/1152449095/ =統計解析= SASプログラミング science6.2ch.net/test/read.cgi/math/1184762259/
151 名前:132人目の素数さん [2007/12/27(木) 16:52:25 ] 今数理統計学を大学で履修してるんですけど、 全く理解しないで暗記だけでテスト受けてる感じです。。。 知識詰め込むだけの数学はつまらなくてしょうがないです。 皆さんはどうやって数理統計を勉強してますか? なにかおすすめの参考書などありますか? 大体有名な分布やそれらの積率母関数の求め方はちゃんと頭に入ってるんで、 これを生かしたいんです。
152 名前:132人目の素数さん [2007/12/27(木) 17:43:36 ] ★★小泉純一郎と安倍晋三は朝鮮人★★ コピペして各板に貼り付けよう 知人にも話そう 小泉純一郎 ・戦前大臣を務めた祖父小泉又次郎は純粋な日本人とされる。だが、純一郎の帰化朝鮮人である父が鮫島姓を買い取り 又次郎の娘をたぶらかして婿として小泉家に入る そこで小泉家は帰化朝鮮人である純一郎の父に乗っ取られた 参照ja.wikipedia.org/wiki/%E5%B0 上下くっけて %8F%E6%B3%89%E7%B4%94%E4%B9%9F ・父親の純也は、鹿児島東加世田の朝鮮部落の出身者といわれる 日大卒業名簿には、純也の日本名はなく、 見知らぬ朝鮮名が書かれているという 純也は朝鮮人の帰国事業、地上の楽園計画の初代会長であった ・結婚後、子供をもうけ即離婚した宮本佳代子は在日企業エスエス製薬創業者の孫 ・小泉の元秘書官の名前は飯島勲←注目 帰化朝鮮人 ・派閥のドン森喜朗も生粋の朝鮮人 ←森も帰化人がよく使う通名 ・小泉は、横須賀のヤクザ、稲川会と関係が深い 安倍晋三 ・岸家 毛利元就が陶晴賢と厳島沖で戦い大勝を収めた際、寝返って毛利方についた船の 調達人が「ガン」と称する帰化人であったという 毛利はその功績によって「ガン」を 田布施周辺の代官に召したてた このガンを岸家の先祖とする説がある ・祖父岸信介が文鮮明と共に 反共団体 国際勝共連合(統一教会)を設立 ・官房長官時代統一教会「合同結婚式」に祝電を送り、話題に ・安倍のスポンサーは、下関の朝鮮人パチンコ業者である ・グリコ森永事件時、明らかになった帰化朝鮮人企業森永のご令嬢と結婚 ・そのわが国のファーストレディーは電通(会長成田豊、半島生まれの帰化人)勤務という分かりやすい 経歴の持ち主の朝鮮の血筋 ・韓国、中国の留学生に日本の企業に入ってもらうために住居費分、学費免除分、生活費など月計20万〜30万円相当の支給 日本人のワーキングプア層を全く省みない また帰化系在日系朝鮮人が日本の企業で技術を盗み、半島の現代などの企業に 伝授していることが深刻な問題になっている
153 名前:132人目の素数さん [2007/12/27(木) 18:06:11 ] >>151 統計数理はあとで役立つ。 基礎トレだから手抜きせずマジにもならずやっとくのが吉。
154 名前:132人目の素数さん [2007/12/28(金) 01:01:26 ] すみません重回帰分析を行っているのですが 定数項を含む場合と含まない場合で相当結果が違ってきます。 特に寄与率は定数項を含む方が小さく、含まない方が大きくなります。 また、説明変数のt値なども両者で相当な違いが見られます。 定数項を含む場合の寄与率の導出等については文献があるのですが 定数項を含まない場合についてがどうしてもよくわかりません。 なぜこのような事になるのか・・・ また、どちらの結果を使うのがよいのか・・・(定数項を分析の際入れるか) どなたかご教授頂けないでしょうか?
155 名前:132人目の素数さん mailto:sage [2007/12/28(金) 01:10:34 ] >>154 目的因子と説明因子の関係が原点を通るか通らないかで判断する。
156 名前:132人目の素数さん [2007/12/28(金) 03:03:19 ] >>138 graduate の入門レベルの本だと、統計学やる人向けはこんな感じ。 測度論:Billingsley, "Probability and Measure" 推定:Lehmann and Casella, "Theory of Point Estimation" 検定:Lehmann and Romano, "Testing Statistical Hypotheses" Lehmannの2冊は古いし測度論的な記述が完全に一般化されてない箇所も あるけど、総合的にはこれを超える本はないような気がする。 Bayesとかは詳しく知らん。 回帰分析や分散分析は、なかなかいい本がない。 (昔に書かれた数学的に細かい本ならあるが。) 確率論に関しては、 Durrett "Probability: Theory and Example" Kai Lai Chung "A Course in Probability Theory" Kallenberg "Foundations of Modern Probability" あたりか? Durrettは簡潔な教科書スタイルの本だがギャップも多く難しい という評判、Kai Lai Chungは評判はいいがやや記法が古い。 Kallenbergは辞書のような本。 補足、追加、反対意見などある人ヨロ。
157 名前:132人目の素数さん [2007/12/28(金) 11:06:27 ] >>155 ありがとうございます つまり仮定しているモデル式に定数項が含まれないなら 定数項を含まないモデルで解析という事でしょうか?
158 名前:132人目の素数さん mailto:sage [2007/12/28(金) 13:19:11 ] >>157 まぁそういうこと。 xが0の時yは0なら定数項はなし(原点を通るから比例関係)
159 名前:132人目の素数さん mailto:sage [2007/12/28(金) 18:53:06 ] 勝手にモデルを決めたら、結果を認めて貰えない。 一般に線形回帰モデルは定数項付きなので、 何かの理由で定数項無しの特殊なモデルを使いたい場合は、 まず定数項が統計的に有意じゃないことを示す必要がある。
160 名前:132人目の素数さん [2007/12/29(土) 07:36:36 ] どうか、お願いします。 バリマックス回転したいんですが、エクセルしかなく、 さっきR言語をインストールしたんですがさっぱりわかりません。 R言語のサイトで ttp://aoki2.si.gunma-u.ac.jp/R/src/all.R が紹介されていて、この関数を入れるとバリマックス回転ができるそうなんですが ここの関数を使おうとしてもなぜか正常に表示されず、使用することができません。 どうか、何か、妙案を出していただけませんか? お願いします。
161 名前:132人目の素数さん mailto:sage [2007/12/29(土) 12:38:08 ] >>160 Rのスレで質問したほうがすぐに答えてくれると思う
162 名前:160 mailto:sage [2007/12/30(日) 09:04:36 ] 了解です。
163 名前:132人目の素数さん mailto:sage [2007/12/30(日) 21:27:39 ] 信頼区間の信頼率と被覆確率について教えてください。 信頼率というのは、 例えば信頼率95%の場合には、複数の信頼区間を計算したうちでは 「真値を含む信頼区間」が95%ある、ということで間違いないでしょうか? また、被覆確率というのは、 ある文献では信頼率と同じことと説明されていて、 他所では「作られた信頼区間の中に母数の推定量が入る確率」である、 と説明されていました。 これはどちらが正しいのでしょうか?
164 名前:132人目の素数さん mailto:sage [2007/12/30(日) 23:22:22 ] 「信頼率」は「信頼係数」のことかな? だと本来は同じ。 しかし二項分布とかポアソン分布などの離散型確率変数の場合、 正確な信頼区間は作れない。 よって名目上の信頼係数と実際の被覆確率とが違うのは普通。
165 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:37:27 ] 正規分布の問題で 高1男の身長X、女の身長Yがそれぞれ別な正規分布Nに従い分布する。 このとき、無作為に男と女を1人ずつ選ぶとき、女の方の身長が高い確率を求めなさい。 (実際の問題には平均、分散の具体的数字が入ってます) というのがあって、解き方がわからないんですけど どなたかアドバイスお願いします。
166 名前:132人目の素数さん mailto:sage [2007/12/31(月) 00:52:21 ] ヒント:差 Y-X の分布
167 名前:132人目の素数さん mailto:sage [2007/12/31(月) 01:14:52 ] >>166 アドバイスありがとうございます。 Y-Xの分布を出してみましたが、これをどう使えばいいかわからないです・・。 行き詰まったのでまた明日考えることにします。
168 名前:132人目の素数さん mailto:sage [2007/12/31(月) 10:30:51 ] >>165 Xとなる確率はわかる。 YがX以上となる確率もわかる。 最後にXで積分すると全体の確率がでる。
169 名前:132人目の素数さん [2007/12/31(月) 19:36:35 ] >>168 で、正規分布の密度関数の二重積分まで行って、 お手上げになる。 それが解けるようなヤシは、そもそも質問しないから。
170 名前:132人目の素数さん mailto:? [2007/12/31(月) 19:43:09 ] >>167 Ganbarin sai yoh !
171 名前:132人目の素数さん mailto:sage [2007/12/31(月) 20:13:07 ] べき分布について詳しく書いてあるようなページはないですかね? もしくは本でも良いんですが
172 名前:132人目の素数さん mailto:sage [2008/01/01(火) 16:38:29 ] >>169 > で、正規分布の密度関数の二重積分まで行って、 > お手上げになる。 つまり、その二重積分のやり方を教えればいいということか。
173 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:24:41 ] 統計学を独学するのにいいテキストを探しています 候補としては東大出版の基礎統計学I 統計学入門か 統計学のための数学入門30講を考えているのですが 評判というか使い勝手はどうなのか教えていただけないでしょうか? 上のテキスト以上にいいテキストがあれば紹介していただけるとありがたいです よろしくお願いします
174 名前:132人目の素数さん mailto:sage [2008/01/01(火) 18:49:02 ] 後者は統計を学ぶためのあくまで「数学」の本だよ 数学がわかるなら必要なし
175 名前:132人目の素数さん [2008/01/01(火) 22:52:51 ] >>173 候補としてあがっているテキストが全くオススメでないことだけ教えておく。
176 名前:ふ [2008/01/01(火) 23:09:35 ] 〉173 学部はどこなの? 数学はどのていどわかるの? いままで読んだ統計学の本は? 統計学を学ぶ目的は? いつも思うのだが、単に統計学の入門書を教えてくれと書かれても答えようがないよ。
177 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:31:40 ] 173です 説明不足だったことを反省しています >>176 経済学部なので数学は半端に知っているという程度です(問題演習はそこそこできるが、証明はできません) 統計の本は読んだことがありません 授業も受けたのですが、まじめに受けていなかったので基礎から復習したいと思っています 最近統計がおもしろそうだと思ったので、理論的に筋の通った本を紹介していただこうと思って数学板で質問しました >>175 上に挙げたテキストはアマゾンで評価の高そうなものをセレクトしたつもりでした >>174 統計をやるにあたって、数学も理論的に押さえておくべきだろうと思い、上記のテキストを選びました
178 名前:132人目の素数さん mailto:sage [2008/01/01(火) 23:35:47 ] 173ではないのですが、もし以下のような場合であればどのような書籍がお勧めでしょうか。 専門分野 教育学 数学理解 高校のころ2Bやって以来数年間触ってないので、ところどころ忘れている(3Cは未履修)。 既読書籍 「社会の見方、測り方―計量社会学への招待」 「違いを見ぬく統計学―実験計画と分散分析入門」豊田秀樹 あとは、講義等で講師が自前で作成した教材等。 学ぶ目的 数学的な基礎付けが弱いまま手法として丸飲みしてきているため、数学的にきちんとした理解がしたい。統計の利用方法は社会統計よりになると思います。 お手数しますが、何かお勧め頂けると有難いです。 宜しくお願いします。
179 名前:132人目の素数さん [2008/01/01(火) 23:49:10 ] >>177 統計学を勉強する目的は何ですか? 研究、資格試験などありますが。
180 名前:132人目の素数さん mailto:sage [2008/01/02(水) 00:34:18 ] 私は最近統計の勉強を始めた者です。 テキストは東大出版会の統計学入門を使ってます。 この本に書いてることで疑問があるのですが、 『母平均を推定する問題では、母分散が既知なら正規分布、 母分散が未知ならt分布を使う。 母分散を推定する問題ではカイ二乗分布を使う。』 という理解でよいでしょうか? この理解ではダメな問題があったので、理解が正しいか教えてください。
181 名前:ふ [2008/01/02(水) 01:23:11 ] 〉177 困りましたね。 本来、統計学は独学の困難な学問ですからね。 文系なら、岩田を2年ぐらいかけてじっくりやりなさいといいたいところです。本当に統計学がやりたければ、統計数理研の学生になりなさい。 面白そうというだけで、のんびり勉強していたのでは、数学と同じで何もえられません。 だれか先生につかないと。
182 名前:132人目の素数さん [2008/01/02(水) 01:43:14 ] >>180 正規分布ならOK. 推定の一般論について読めばそれの理解がよくないことがわかる。
183 名前:132人目の素数さん [2008/01/02(水) 02:58:44 ] >>177 東大の統計学入門は、初心者向けの商品カタログみたいな感じだから 独学には向かないと思うよ。そのレベルなら 蓑谷 千凰彦「統計学入門」東京図書 がいいかも。もっと数学的でも良ければ、 竹村 彰通「現代数理統計学」創文社 とか。
184 名前:132人目の素数さん [2008/01/02(水) 06:43:36 ] 統計学を使って実証分析がしたいのか、純粋に統計学の理論を勉強したいのかで岩田氏の本以降の道が少し変わってくると思います。
185 名前:132人目の素数さん [2008/01/02(水) 07:56:36 ] >>177 統計をやるのなら、確率論をやった方がよい。こちらの方が遥かに応用範囲が広い。 統計は確率論の1つの応用分野である。で、確率論をやるのなら線型代数、微積分 及び集合と位相を最初にやる。お勧めはそれぞれ次の通り。1)線型代数:岩波基礎 数学講座の線型空間、2)微積分:岩波基礎数学講座の解析入門1〜4、3)集合と 位相:岩波の現代数学概説1、2。その中でとりわけ重要なのは微積分、集合と位相 である。高校数学は余りやる必要はない。次に複素解析と測度論をやる。複素解析は、 「岩波基礎数学講座の複素解析」の解析接続あたりまで、測度論は上の「現代数学概 説2」をやればよい。それから確率論をやる。お勧めは「岩波基礎数学講座の確率論」。 これとほぼ並行して、次のことをやる。 1:線型代数の穴埋め。 これは岩波基礎数学講座の「ジョルダン標準形と単因子論」、「2次形式」で十分。 2:少々の抽象代数。現代数学概説1の群、環、体あたりを読んでみよう。 3:複素解析の穴埋め。上に挙げた本を(Riemannの写像定理あたりまで)、暇なとき 或いは必要になったときに読んでいけばよい。 4:関数解析。お勧めは「岩波基礎数学講座の関数解析」。 5:Fourier解析。お勧めは「岩波基礎数学講座のFourier解析、解析入門5」。 6:微分方程式。お勧めは岩波講座の現代数学への入門の 「力学と微分方程式」、「熱・波動と微分方程式」 あたり。 7:岩波講座応用数学。色々読んでみるとよい。役に立つ筈。 ついでに言えば、腕力も鍛えておいた方がよい。
186 名前:132人目の素数さん mailto:sage [2008/01/02(水) 12:17:30 ] >>182 教えてもらってありがとうございます。 とりあえず今の理解でおおまかには大丈夫なら、 まず先に全体を終わらせるよう先に進めます。
187 名前:132人目の素数さん [2008/01/02(水) 13:29:57 ] >>186 大丈夫なのは正規分布の母平均の推定の場合に限ります。 東大出版会の統計学入門を使っているのなら違うのを読んだ方がいいかもです。 漏れも183の言うとおりだと思います。東大出版会でも著者が4人くらいの 統計入門は良いかも。あと183がすすめてる「現代数理統計学」は漏れもオススメ。
188 名前:132人目の素数さん mailto:sage [2008/01/02(水) 14:10:47 ] 東大出版会の「統計学入門」については、初学者として始めた俺も同じ意見。 噛めば分かるのだが、すっと理解できるようには書いてない。 内容が難しいというより、説明に難がある気がする。もうちょっと行間を埋めた本の方が良さそう。
189 名前:132人目の素数さん [2008/01/02(水) 14:50:15 ] 系列範疇法について質問があります。 各カテゴリーの相対頻度と等しい面積を持つように 正規分布を分割したいのですが、 具体的にどうすればどうすればよいのでしょうか。
190 名前:132人目の素数さん mailto:sage [2008/01/02(水) 19:32:13 ] >>180 って他のスレで酷い質問しててワロタんだがw
191 名前:132人目の素数さん [2008/01/03(木) 03:15:42 ] 移動平均の最適パラメータってどうやって求めるんですか?
192 名前:132人目の素数さん mailto:sage [2008/01/03(木) 06:24:38 ] 変数XがA-B群間のt検定では有意差が出ないのに 判別分析(ステップワイズ法)ではA-B群の判別に寄与する変数として投入される ぜんぜん違う分析だからそういうこともあるんだろうとは思いつつ,なんだかしっくりこない
193 名前:132人目の素数さん mailto:sage [2008/01/03(木) 18:32:56 ] コーシー分布の平均値って事実上ゼロでしょ?
194 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:37:43 ] >>193 「事実上」ってなんだ
195 名前:132人目の素数さん mailto:sage [2008/01/03(木) 21:50:06 ] >>192 散布図を描くとするでしょ 右上がり45度の直線を挟んで明らかに二つの群に分かれる、と。 横軸だけでは充分に判別できないし、縦軸だけでも充分に判別できないが、二つ合わさればできる。 こういうのでどうでしょうか
196 名前:132人目の素数さん [2008/01/03(木) 22:52:06 ] >>193 左右対称な分布なら 平均 = 中央値 と定義すればそう。
197 名前:132人目の素数さん [2008/01/03(木) 23:01:51 ] >>193 平均と中央値をごちゃごちゃにしてはだめです。 平均と中央値は中心という概念では同じですが、定義は全く違います。
198 名前:132人目の素数さん mailto:sage [2008/01/04(金) 13:15:44 ] コーシー分布にしたがってランダムに数を生成させて、その数の平均を取ればゼロになるんじゃない?
199 名前:132人目の素数さん mailto:sage [2008/01/04(金) 14:47:30 ] >>195 あー,なるほど,そう言われるとよく分かる.
200 名前:132人目の素数さん mailto:sage [2008/01/04(金) 17:16:13 ] >>198 コーシー分布にしたがってランダムに数を生成させる方法を述べよ 仮にそのような標本が取得できたとして母平均を推定する方法を述べよ
201 名前:132人目の素数さん [2008/01/04(金) 18:42:25 ] >>198 >>200 コーシー乱数は、区間(0, 1)の一様乱数の arctan 変換で作れるよ。 あと位置と尺度を一般化したコーシー分布、例えば ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%82%B7%E3%83%BC%E5%88%86%E5%B8%83 の母数は、「母平均」や「母標準偏差」ではない。 母平均も母分散も存在しないからね。 また標本平均も同じコーシー分布にしたがうから、位置母数の推定には不適。 というか、そもそも推定している対象が存在しない。 コーシーの位置母数は、「母中央値」と考えて、標本中央値で推定するのが吉。 つまり、裾長分布の兆候を持つデータの位置母数推定で、 標本平均を使うのは危険。経験的には、外れ値を除外したり、 両端を一定率で除外した調整平均が使われている。 一方、正規分布など特定の分布では少し効率が悪いが、 「標本中央値なら常に安全」という教訓になるのがコーシー。
202 名前:132人目の素数さん mailto:sage [2008/01/04(金) 18:49:11 ] コーシー分布にしたがってランダムに数を生成させる方法はある。 まず、(-∞, +∞)の一様分布の確率変数p(x)を用意する(ただし、厳密な意味ではこれが一番難しい)。 あとは、コーシー分布y=f(x)の逆関数x=φ(y)を用意して、 q(y)=Σp(φ(y))・dφ(y)/dy で定義されるq(y)で数を生成すればOK。ただし、x=φ(y)は二価関数なので、単調増加の領域と 単調減少の領域に分けてΣを計算すれば良い。
203 名前:132人目の素数さん [2008/01/04(金) 18:55:38 ] >>202 それ合ってんの?
204 名前:202 mailto:sage [2008/01/04(金) 18:57:21 ] >>203 知らんw
205 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:00:33 ] (-∞, +∞)で一様に生成される確率変数なら、ほぼ確実に-∞と+∞の二値しか取らないのではないだろうか?
206 名前:132人目の素数さん [2008/01/04(金) 19:00:37 ] >>204 何だ知ったかか
207 名前:132人目の素数さん [2008/01/04(金) 19:07:15 ] 何で無駄に(-∞, +∞)で考えてんだよ もっと効率よくしろ
208 名前:202 mailto:sage [2008/01/04(金) 19:09:23 ] >>206 小針の確率・統計入門のP49§3確率変数の変換に書いてある
209 名前:132人目の素数さん mailto:sage [2008/01/04(金) 19:12:22 ] 標準正規の比や一様分布のtanで生成するだけだろ
210 名前:201 mailto:sage [2008/01/04(金) 19:20:40 ] 訂正 ×arctan 変換で作れるよ。 ○ tan 変換で作れるよ。 スマソ。逆が2回出てくる関係なので、書く時に確かめずに勘違いした;
211 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:33:57 ] 理論的に生成可能かどうかは問題ではない 問題は生成した数からどうやって>>198 の言う平均を計算するかだ そもそもこの計算自体が既に不可能だろうという話
212 名前:132人目の素数さん mailto:sage [2008/01/04(金) 20:48:33 ] 実測値の算術平均なら何の問題もなく計算できます
213 名前:132人目の素数さん mailto:sage [2008/01/04(金) 21:27:51 ] >>212 >>198 の検証をたのむ
214 名前:132人目の素数さん mailto:sage [2008/01/04(金) 23:59:26 ] だーかーらー コーシー分布乱数の標本平均は、同じコーシー分布乱数なんだよ。 どれだけ大標本でもだ。つまり平均取っても無意味。 >>198 は「標本平均は必ず確率収束する」と思ってる厨房w
215 名前:132人目の素数さん mailto:sage [2008/01/05(土) 07:16:26 ] 「事実上の平均」に面白い定義を与えられるかどうかだな。 乱数を[-d,d]にtruncateした上で平均を取って極限をとり、 最後にd→∞にしてみるとか?
216 名前:132人目の素数さん [2008/01/05(土) 10:53:42 ] クイズ問題のサイトを作ろうと思っているのですが、 1万のクイズを、複数の人に自由に解かせるとして、 (クイズを解く数は個人差ありで、いつどれだけ解いてもいいし、 一度、解くのをやめ、後でまた解いても良い。) どのような公式で、ランキングをつけたら良いのでしょうか。 例えば、単純確率だと10問中5問正解した人と、 100問中50問正解した人は、同じランクになりますが、 果たして、これは、同じランクで良いのでしょうか。 そうすると、1問中1問正解した人は、いつも1位となってしまいます。 何か、良い公式がないでしょうか。 よろしくお願いします。
217 名前:132人目の素数さん mailto:sage [2008/01/05(土) 13:20:23 ] 単純に 正解数−不正解数 じゃダメ?
218 名前:132人目の素数さん mailto:sage [2008/01/05(土) 15:16:41 ] >>216 検定の考え方を使えば多少は重み付けも出来るが 明確に順序をつけるのは無理だろう ゲームとして割りきるなら 正答率*正答率*回答数 くらいで良いんじゃないかと思う。 理論的根拠は無い。
219 名前:132人目の素数さん mailto:sage [2008/01/05(土) 18:26:36 ] >>216 乱暴だけど、 n 問中 x 問正解する確率が、1問正解する確率 p の 事象を n 回独立に繰り返した時の二項分布になるとする。 この二項分布の平均は μ = np、標準偏差は σ = √(np(1-p))。 仮に1問正解する確率を p=1/2 とすると、μ = n / 2、σ= (√n )/ 2。 正解数 x を標準化した値 z = (x - μ)/σ を使って比較すれば、 マハラノビス距離空間上のランキングが得られる。 p の推定値は、参加者全員の 正解数合計 / 解いた問題数合計 が良いけど、それだと毎回ランキングが変化する。 問題作成者が p=1/2 とか 1/4 とか適当に決めても良いかも。。。
220 名前:132人目の素数さん mailto:sage [2008/01/05(土) 20:20:15 ] >>215 コーシーの主値
221 名前:219 [2008/01/06(日) 18:34:11 ] >>216 数値例が無かったので補足。 選択式の回答方式だと思うので、すべて「4択」だとしよう。 そうすると、「でたらめに答えて」当たる確率は p=1/4。 この時 μ = n/4、σ = (√n√3 )/ 4。 z = (x - μ)/σ は、よりわかりやすく「偏差値 D = 10z + 50」に変換。 n x z D(偏差値) 1 1 1.22 62 … 1問中 1問 10 5 0.65 56 … 10問中 5問 100 50 2.04 70 … 100問中 50問 1000 500 6.45 115 … 1000問中 500問 ・正規分布近似を使っていることになるので、精度条件として だいたい np≧5 (p≦1/2) または n(1-p)≧5 (p>1/2) が必要。 よって p=1/4 なら n≧20、つまり20問以上答えた者のみランキングに入れる。 ・偏差値 D が使用する有効精度内で同じ場合には、問題数 n の大きい方を上位とする。 ※1次元で「マハラノビス距離空間」は大袈裟なので、「偏差値」が良い。
222 名前:132人目の素数さん [2008/01/06(日) 19:18:40 ] くだらん。 正解数−不正解数の方がよっぽど役にたつ。
223 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:47:21 ] >>222 Aは、100問全問正解(正解率100%)で 100 − 0 = 100。 Bは、200問中151問正解(正解率75.5%)で 151 − 49 = 102。 B > A でいいのか?
224 名前:132人目の素数さん [2008/01/06(日) 19:53:31 ] いい。 100問正解の時点で、Aは残りの49問を正解する確証がどこにもないから、 ランキングとしては151問正解のBよりも低くランキングされるのが妥当。
225 名前:132人目の素数さん mailto:sage [2008/01/06(日) 19:54:36 ] 上位一割くらいしか表示しないなら>>218 がシンプルでいい >>219 みたいになると仮定の妥当性とかいろいろ面倒だからな
226 名前:132人目の素数さん [2008/01/06(日) 19:55:45 ] ただし、問題文ごとに独立性がないのなら話は別。 過去の正答率が未来の正答率を支配するような問題文の構成になっているのなら 単純な正答率によるランキングが妥当。
227 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:05:22 ] 224=226です。
228 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:07:18 ] 俺が野球チームの監督なら、200打席151安打のバッターと、 100打席全安打のバッターなら後者を使うけどな
229 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:14:35 ] 何が正しい計量と判断できるかは、問題文(群)の構成に強く依存する。 問題文の独立性が保障される様な理想的な構成なら、正解数−不正解数が正しい計量となる。 が、何も考えずに羅列したいい加減な問題文の構成なら、単純な正解数/回答数が妥当な計量になるだろう。
230 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:27:48 ] >>226 , >>229 が言ってるのは、「独立性」ではなく「異質性」だな。 つまり統計的な考え方が全く通用しない異質な問題が、毎回出題されるような場合。 量子力学の問題の次は文学の問題とか、、、 しかし回答者が人工無脳なら、「偶然」という同質性は排除できないぞ
231 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:31:06 ] クイズという問題をどうとらえるかだが、 あらかじめ確定した操作をランダムな順序で対象に実行して その対象の性質を評価する過程と考えれば情報量的な扱いが妥当か。 と思ったが各問題の回答が持つ情報量は回答者依存だしなあ。
232 名前:132人目の素数さん [2008/01/06(日) 20:33:04 ] こういう話題が出てきてwktkしてきた >>180-215 のような低レベルな話より断然興味深い
233 名前:132人目の素数さん mailto:sage [2008/01/06(日) 20:54:08 ] 出題側が、回答者のどういう能力を測定したいかをまず決める必要があろう。 ネイマン・ピアソンの考え方に従うか ベイズの考え方に従うか 両方とも客観的で信頼の置ける考え方なので、出題側の教養とセンスによって どういう統計量で判断するかが決まる。
234 名前:219=221 mailto:sage [2008/01/07(月) 00:52:43 ] >>225 「でたらめ」に答えて正解する確率 p が限りなく小さいスタイルの 回答方式なら、>>218 でも良いよ。なぜなら z = (x - μ)/σ、ただし μ=np, σ=√(np(1-p)) において、分母の回答者に関する共通部 √(p(1-p)) を取り除くと、 y = x/√n - np で回答者同士を比較しているのと同じ。この値は p → 0 の時 y → x/√n = (√n) (x/n) = (√回答数)・正答率 なので、自乗すれば >>218 の指標になる。 ※知能や知識は、完全不確実状態(混沌)からどれだけ確実状態(秩序) に近づいたかで計るのが、情報量的な考え方。 ただし、誤知能や誤知識という方向への脳内秩序もアリなので、 「でたらめ」よりも低い正答率が出やすく作られたクイズの方が面白い。
235 名前:234 mailto:sage [2008/01/07(月) 00:59:44 ] × y = x/√n - np ○ y = x/√n - (√n)p
236 名前:132人目の素数さん mailto:sage [2008/01/07(月) 18:36:12 ] >>234 それが>>225 でいう「上位一割」と「仮定の妥当性」の意味なんだけどな。 そもそもpは不確定なのだからそれに依存して決まる順位も絶対的ではなく、 結局のところ意味があるのはpに依存しない部分だけというわけだ。 お前さんは優秀なようだが教科書の理論だけでは統計の世界は生き残れんよ
237 名前:132人目の素数さん mailto:sage [2008/01/07(月) 21:24:23 ] すみません、お教えください。4群の共分散分析をやっていて、 回帰直線の傾きが有意に違う、という結果を得ています。 で、1つのグループAを除いて3群で検定すると傾きに有意差は見られません。 グループAの傾きが他の3群と異なるかどうか、を知りたいのですが、 ボンフェローニ等の補正をし、グループ毎に対比較をすれば良いのでしょうか?
238 名前:234 [2008/01/07(月) 21:36:34 ] >>236 まあまあ抑えてw、たかがクイズのランキングの話。 で、(初等教科書的な)二項分布モデルが気に入らないようだけど、 こう考えればどうかな? クイズの回答はすべて選択式で、選択肢の数は常にM個とする。 また出題時に、選択肢の順序は乱数でかき混ぜる。 別室に居る見えない回答者にクイズを出題して、その答えのみから 回答者がサイコロのような乱数器(完全無知脳)を使っているか、自分自身 (幾分の知能を保有)でマジに答えているかを判定する。 もちろんすべてLANで繋がったPCを使ってだ。プロトコルはHTTP-TCP-IP、 記述言語は HTML+Javascript で十分だろう。OSは何でも良いw この場合の統計的検定は、p=1/M の二項分布モデルそのものになる。 したがって、「知能」を「無知脳では無い統計的度合い」によって計るなら、 >>219 , >>234-235 の尺度を使うことなる。 つまり、p もモデルもすべて出題時に確定していて、どこも不確定ではない。 不確定なのは、知能の持つどんな側面を見れば良いか、出題する内容の方。
239 名前:238=234 mailto:sage [2008/01/07(月) 21:47:00 ] × 使うことなる。 ○ 使うことになる。
240 名前:132人目の素数さん mailto:sage [2008/01/07(月) 22:11:03 ] >>237 ボンフェローニでAと他の群がすべて棄却され、 他の群同士は棄却されないならそれでいいんじゃない? (ボンフェローニだと補正がきつすぎてAと他の群で 棄却されないものが出てくるのなら問題だが。)
241 名前:237 mailto:sage [2008/01/07(月) 23:39:27 ] >>240 ありがとうございます。方法としては間違ってないと知り、安心しました。 仰る通り、補正がきつくすべてを棄却することができません。もう少し弱そうな補正を探した所、 ttp://www.human.tsukuba.ac.jp/~percept/index.php?ANOVA%B7%AF%2F%C2%BF%BD%C5%C8%E6%B3%D3%A4%CE%CA%FD%CB%A1 を見つけました。群馬大の青木先生の掲示板では、シダックの方法?というのが出ていたのですが、 解説されている本、永田靖・吉田道弘著「統計的多重比較法の基礎」が品薄ですぐに手に入りません。 もちろん後日文献にて確認するつもりではありますが、シダックの不等式を確認させて下さい。 1−(1−α)^(1/k)がシダックの不等式なんでしょうか?
242 名前:132人目の素数さん [2008/01/08(火) 01:41:49 ] 連続型確率関数Xの確率密度関数が f(x)=1 (0≦x≦1) の場合で X=e^-Y/2 とするときのYの確率密度関数の求め方ってどうすればいいですか?
243 名前:132人目の素数さん [2008/01/08(火) 01:45:01 ] 変数変換の公式を調べてそれを使うだけだろ 別に何も変わったところがない
244 名前:132人目の素数さん [2008/01/08(火) 01:49:00 ] >>242 まで辿り着いてここでつまってしまったんです
245 名前:132人目の素数さん mailto:sage [2008/01/08(火) 01:50:00 ] >>243 で書いてある通り、調べればすぐわかることだから自分で解決してみな
246 名前:242 [2008/01/08(火) 02:06:12 ] 何か勘違いしてたみたいで簡単にできました お騒がせしてすいませんでした
247 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:06:18 ] また試験のシーズンか、、、
248 名前:132人目の素数さん mailto:sage [2008/01/08(火) 02:17:51 ] 試験に囚われてはならない。 自分のペースで学習することが大切だ。 試験で良い点を取ったからと言って 本当の実力が付いているとは限らない。
249 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:35:10 ] >>241 シダックは使える条件があるからいいのかな? 大体4群だとボンフェローニで0.0125で シダックで0.012741だからあまり大差ないね。 そのページのHolmの方法なんかいいんじゃない? Shafferの方法は表がいるしね。
250 名前:132人目の素数さん mailto:sage [2008/01/08(火) 23:45:15 ] 2007年11月のウェブサイト利用統計 -------------------------------------------------- 順位 延べ利用時間 利用者数 (万時間) (万人) -------------------------------------------------- 某Yahoo! 1位→1位 12549 某楽天市場 3位→2位 2164 某ミクシィ 2位→3位 1669 某YouTube 4位→4位 1495 動画投稿 某ニコニコ動画 ?→5位 1249 386 動画投稿 某FC2 9位→6位 960 ブログ制作支援 某Google 7位→7位 794 >2000 2ちゃんねる 5位→8位 751 掲示板 某goo 8位→9位 645 1800 某msn 6位→10位 628 ---------------------------------------------------
251 名前:237, 241 mailto:sage [2008/01/09(水) 18:38:41 ] >>249 レスありがとうございます。あのサイトを良く読むと、例題がちょうど4群のうち1群が外れる、 という状態だったので、それを参考にすすめる事にしました。 ただ、シダックの不等式、式そのものを見つけられず・・・不安なのです。 その「シダックを使える条件」というのはページに書いてあった、反復測定データに使えない、 という事でしょうか? (後出しで申し訳ないですが、検定しようとしているデータはそれぞれ独立サンプルです)
252 名前:132人目の素数さん mailto:sage [2008/01/09(水) 22:49:14 ] >>251 シダックの不等式は書かれてないが、それに基づく有意水準の調整は >>241 で合ってるよ。>>249 もそれで計算しただけだしね。 ただデータが完全に独立でも共分散分析での傾きの検定では共通分散を 使うだろうから検定は独立にはならないよ。それでもシダックの不等式は満たしそうだけど 確信はないなあ。 >>249 で差が小さかったし、シダックを使うというのならHolland-Copenhaverの方法まで 進めないと効果はないかもね。
253 名前:132人目の素数さん mailto:sage [2008/01/10(木) 00:24:36 ] 鼻の炎症はビエン、では耳の炎症は?
254 名前:132人目の素数さん mailto:sage [2008/01/10(木) 01:10:26 ] ━━━━━┓ ____ ┃ / \ ┃┏┳┛┃┃┃ ,,..--――--/ \ ━━━━━┛ ┃ ┏┛ | ヾ==___ ヽ \ ┏┻━ ヾ :::::::::::::====\ | ┃┣┓┣┓ ━━┓╋ ┣ `ー--/ ミ(⌒) / ┏┛ ╋ ━┓ ┏┛┃━┏╋ _ ヽ, ) ミノ ~レ-r -‐、/ ━┻━ ┛ ┗━ ━┗┛ / ヽ. <_ ノ__ i i i〉 〉 ━ /ヽ }<´ / ヽ、 /_/_/レ′ ┏━━╋ ,.-、/ ,.>-‐'" { _.......:::::::: ヽ、)ト´ ´ ヽ:;ヽ:;:-:;:-、. ┃ ━ ┃ ┃┃ ,,..‐'ヾ_j ,..< `ー、:::::::: /;: ̄:;i ヽ、;:_;:;:;:;:;;: ┃┏┓╋ ┃ ,.-'"、 ヽ、 |::::/ / /;:;:ヽ ノ;:;:;:;:;:;:i \ ヽ ┛┗┛┗┃┃┃ i./ヽ ヽ |ノ !´ /;:;:;:;:;| (;;/j;:;:;:;:;ヽ_ ノ | ┛┗━┛ ┗━┛ (__/ヽjノ / /;:;:;:;:;:;|、 (;:;ノ;:;:;:;:;:;:/\ | ┳━┳ /ヽ / ┏━━┓ |;:;:;:;:;;/ ヽー'/;:;ノ;:;:;:;:/ |\ | ┏╋━╋┓ ┏┛ | | ┃ );:);/ ||(;:;:;:;/| ヽ、\ | ┗╋━╋┛ ┏┛ ╋ ┃ ┃ ┃ ┃ ;:;::;:ヽ |: ヽ;:;:ヾ ヽ__ノ ┻━┻┃┃┗┓ ┃ ┃ ┃ ┏━┛ ┛┗━┛ ┗┓ ┏╋ ┗ ┃ ┗┛ ┏┓ ┗┛
255 名前:251 mailto:sage [2008/01/10(木) 01:31:44 ] >>252 >共分散分析での傾きの検定では共通分散を使うだろうから検定は独立にはならない なるほど、納得です。Holm か Shaffer の方法でやる事にしました。ありがとうございました。
256 名前:32と35 [2008/01/10(木) 02:04:32 ] コックス比例ハザードモデルについてお教えください。 予後推定因子を解析する際の事ですが 単変量解析をする際に、交互作用のある因子は除こうと思うのですが SPSS でその因子の抽出の仕方を教えてください。 イベントが50例ある場合は、単変量解析の因子は5から10程度に絞り込む 必要があると思います。 もしくは交互作用のある因子を除く以外に絞り込む事は可能ですか?
257 名前:132人目の素数さん [2008/01/11(金) 19:59:43 ] 「絶対計算」という本を図書館で借りて読んだ。 要点は、絶対計算したほうが良い、という感じで なかなかいい本だった。
258 名前:統計 [2008/01/11(金) 21:11:39 ] 文系の大学生なんですが統計学で卒論書こうと思っています。なにかおもしろいテーマあったら教えてください。 アンケートを使ってどんな(容姿・性格)の人が好感をもたれるのかをやりたなぁと考えています。
259 名前:132人目の素数さん [2008/01/11(金) 21:11:59 ] Xが正規分布N(μ、σ二乗)に従う時、標準化するとσ分のX−μはN(0、1二乗)に従う。 N(0、1二乗)についてP(1.5<=σ分のX−μ)=0.07、 P(0.5<=σ分のX−μ)=0.31である。 あるクラスの生徒の成績Xが正規分布N(μ、σ二乗)に従う時、 μ+1.5σ<=Xの生徒は5段階評価の5、 μ+0.5σ<=X<=μ+1.5σの生徒は4、 μ−0.5σ<=X<=μ+0.5σの生徒は3をつけるとする。 この時5をもらうのは全体の()%、 4をもらうのは全体の()%、 3をもらうのは全体の()%である。 分かりにくくてすみません。とりあえず5をもらうのが7%というのまでわかりました。どなたかお願いします。
260 名前:132人目の素数さん mailto:sage [2008/01/11(金) 22:04:40 ] 5が7%だとわかったのに何で4と3がわからないんだ? 5で計算したのと同じようにやればいいだろ。
261 名前:132人目の素数さん [2008/01/11(金) 22:44:57 ] 4が24%で3が38%ですかね? 間違ってたらご指摘ください…。
262 名前:132人目の素数さん mailto:sage [2008/01/12(土) 13:14:22 ] すいません、無相関の検定って何でしょうか? 初心者丸出しの質問ですみません。
263 名前:132人目の素数さん mailto:sage [2008/01/12(土) 14:21:27 ] >>257 山形浩生が訳してるやつ? 結構おもろいよね
264 名前:132人目の素数さん [2008/01/12(土) 15:20:48 ] >>262 単回帰の傾きゼロ検定
265 名前:132人目の素数さん [2008/01/12(土) 15:22:57 ] >>258 統計数理研究所のHPで教員の業績を調べると、適当なテーマが見つかるよ。 副所長が『女子学生の飲み物調査』で論文を書いているとか。
266 名前:132人目の素数さん [2008/01/12(土) 21:26:58 ] すいません、質問させてください。 繰り返しのない二元配置(または乱塊方、反復測定一元配置分散分析) で分析できるデータを、多重比較したいのです。 そもそもそういうやり方がないので、ボンフェローニの補正を行いたいのですが、 この場合、対応のあるt検定を繰り返して有意水準を補正すればよいのですか。 それとも、対応のないt検定を繰り返せばよいのでしょうか。 ご意見くださいますでしょうか。
267 名前:132人目の素数さん [2008/01/15(火) 21:21:41 ] >>262 普通に相関係数の検定でいいのでは。
268 名前:132人目の素数さん [2008/01/15(火) 21:29:11 ] 変数変換について質問します。 0近傍で変化がなく、X軸のマイナス側はマイナスの値、X軸のプラス側はプラスの値の方に増加する(TANを平たくしたような関数) ような変数変換がしたいのですが、 ロジスティック関数を90度回転したような変換を扱うにはどうしたらよいでしょうか?
269 名前:132人目の素数さん mailto:sage [2008/01/15(火) 23:12:43 ] tanを平たくした関数やロジスティック関数を90度回転させた関数で変換すればよい
270 名前:132人目の素数さん [2008/01/17(木) 08:18:16 ] 目的はある値を予測することです。 外れ値の多いデータの場合、回帰分析は回帰直線が外れ値に影響されます。 外れ値の多いデータの場合、回帰分析は不適でしょうか? 1.不適なら分析手法は何を使うべきでしょうか? 2.また回帰分析で可能な場合外れ値分析や除去して回帰分析した予測をすると 予測の時に目的変数が未知の外れ値がきたときに予測精度が悪くなります。 どのように対処したらよいでしょうか?
271 名前:132人目の素数さん mailto:sage [2008/01/17(木) 20:44:18 ] >>270 >外れ値の多いデータの場合、回帰分析は不適でしょうか? 外れ値の多いデータというのは、通常の1次線形回帰分析での寄与率が 何%程度なのかな?80%未満なら、その回帰式を予測式に使うのは避ける べきではないかな。 >1.不適なら分析手法は何を使うべきでしょうか? 偏回帰線図を見て、非線形傾向なら高次回帰分析にかけてみるとよいのでは。 応答曲面法をメニューに有する数万円のソフトもあるからね。
272 名前:132人目の素数さん mailto:sage [2008/01/17(木) 23:09:06 ] 2は考え違い。 外れ値に対する予測精度を高めるということは 誤差に追従させるというのと同じ。
273 名前:132人目の素数さん mailto:sage [2008/01/18(金) 00:02:15 ] >>270 ロバスト回帰を使えば?
274 名前:132人目の素数さん [2008/01/18(金) 13:20:34 ] >>271 40項目あり、単回帰での寄与率は大きい方から45、30、20、18、、10、9、〜です。 偏回帰線図とは散布図のことでしょうか?調べてもわかりませんでした。
275 名前:132人目の素数さん mailto:sage [2008/01/18(金) 19:04:42 ] >>274 >40項目あり、単回帰での寄与率は・・・ 40項目とは収集データの組み数のことでしょうが、重回帰でなく単回帰というと 説明変数が1種類だけなのですか? >偏回帰線図とは・・・ ThinkSTAT等の重回帰分析ソフトで偏回帰プロットと呼ばれている散布図の ことです。Excelの回帰分析だと観測値グラフが似ています。
276 名前:132人目の素数さん [2008/01/18(金) 22:44:10 ] ttp://www.vipper.net/vip437256.zip.html 誰かこの回答の仕方があっているか教えてくれませんか? 教科書とか持ってないんで調べようがないので。。。