統計学なんでもスレッド　13

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 12/23 01:43 / Filesize : 243 KB / Number-of Response : 874
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド　13

1 名前：１３２人目の素数さん [2011/02/11(金) 01:51:36 ]: 2010.9上旬のkamomeサーバ霧散スレッド全損事件から５ヶ月、
運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。
引き続き、質問等どうぞ。

前スレ
統計学なんでもスレッド12
kamome.2ch.net/test/read.cgi/math/1283521346/
321 名前：１３２人目の素数さん [2011/08/02(火) 19:36:58.24 ]: 比率の差の検定で多重比較の検定はありますでしょうか。

成功か失敗かの実験で、n=30で、
条件A　成功率80％、条件B　成功率70％、条件C　成功率50％　で
α＝0.05で多重比較を行いたいのです。
322 名前：１３２人目の素数さん mailto:sage [2011/08/03(水) 01:15:45.18 ]: ＞＞３１７
なるほど利用率てのはPCの稼働率のことなのか
323 名前：１３２人目の素数さん mailto:sage [2011/08/03(水) 09:58:59.92 ]: >>321
特に比率と考える必要もないと思います
324 名前：１３２人目の素数さん [2011/08/03(水) 13:21:37.00 ]: >>318
PCの台数はわからないの？
325 名前：１３２人目の素数さん mailto:sage [2011/08/03(水) 17:15:04.05 ]: PCの台数は書かれてないけど、％出してるわけだから時間帯毎に全何台中
何台稼働ってデータがあるわけでしょ。要するに検定の必要なし。
326 名前：１３２人目の素数さん mailto:sage [2011/08/04(木) 15:56:01.73 ]: >>305
紹介されたmac板　hibari.2ch.net/mac/にJMPスレなんぞ、見あたらないぞ。
そもそもまともな統計家は、Macなんぞ使わないのでは？
327 名前：１３２人目の素数さん mailto:sage [2011/08/04(木) 18:53:05.65 ]: >>326
JMPってわざわざMac向けに開発されたパッケージ。
328 名前：１３２人目の素数さん mailto:sage [2011/08/04(木) 19:10:35.68 ]: どおりで旧バージョンのサポートをあっさり捨てるんだな。
アップルと同じだな。
329 名前：１３２人目の素数さん mailto:sage [2011/08/04(木) 19:17:58.83 ]: >>328
ただし現在のユーザー人口は圧倒的にWindowsってSASの人がセミナーで言ってた。
330 名前：１３２人目の素数さん mailto:sage [2011/08/04(木) 19:36:30.39 ]: Adobeと同じだな。
331 名前：１３２人目の素数さん mailto:sage [2011/08/05(金) 07:12:44.95 ]: >>326
JMPの専用のスレがあるってことじゃなくて、MAC使いが少ない
ここで聞くよりもMAC使いに聞いた方が早いんじゃないかってこと。
332 名前：１３２人目の素数さん mailto:sage [2011/08/05(金) 11:23:12.13 ]: >>327
そうかあ、JMPってマウス機能なんかが他のWindows用ビジネスアプリとは毛色が
違うなと感じていたんだが、元々はExcel同様にMAC用に開発されたアプリだった
のか。出生地がMAC環境だったんだね。
333 名前：１３２人目の素数さん mailto:sage [2011/08/05(金) 21:07:35.70 ]: SPSSもSASもツイッターやってんだな

twitter.com/#!/spssjapan
twitter.com/#!/SASJapan
334 名前：１３２人目の素数さん mailto:sage [2011/08/06(土) 02:43:08.18 ]: わかる人教えてください

Aという細胞郡とBという細胞郡を用意します。

それに対して薬品CとDで処理をしてある値を３回ずつ計測します。

つまり　AC１　AC2　AC3　BC1　BC2　BC3　
　　　　AD1　AD2　AD3　BD1　BD2　BD3　

という実験結果をえます。

それぞれ３回ずつの値の平均　μAC＝（AC1＋AC2＋AC3）/3　として

平均のRatio　RA=μAC/μAD　　　　　RB＝μBC/μBD　と定義します。

この平均の比率　RAとRBについて優位差検定をしたいのですが、そのような検定方法はございますでしょうか？

教えてください。
335 名前：334 mailto:sage [2011/08/06(土) 05:41:55.83 ]: 補足

薬品CとDは濃度が違うだけで同じ薬品です。

なので比を取っています。
336 名前：１３２人目の素数さん [2011/08/06(土) 13:59:09.69 ]: >>334
「フィッシャーの正確確率検定」
でググってみてください。
337 名前：１３２人目の素数さん mailto:sage [2011/08/06(土) 21:04:36.39 ]: >>332
JMPといえば、慶應大の公認データ解析ソフトですね。SPSS>>333より、有能なの？
www.dsci.sfc.keio.ac.jp/
338 名前：１３２人目の素数さん mailto:sage [2011/08/06(土) 23:00:46.81 ]: マウスを多用する解析が好ましいと感じる人がいるようだ。
MAC好きと同じだな。
339 名前：１３２人目の素数さん [2011/08/07(日) 00:56:23.84 ]: MAC好きって馬鹿が多いよね。
なぜだろう？
340 名前：１３２人目の素数さん [2011/08/07(日) 01:15:09.39 ]: 米農家を侮辱した東海テレビにあの方がお怒りのようです

www.youtube.com/watch?v=FSzRjnq9boY&feature=related
341 名前：１３２人目の素数さん mailto:sage [2011/08/09(火) 17:38:47.29 ]: >>339
自分の周囲を見てると分からないでもないが、p=0.1くらいの主張だな。
342 名前：１３２人目の素数さん mailto:sage [2011/08/10(水) 21:57:18.84 ]: >>334
何か難しいこと考えるんだね
自分なら、細胞の種類(ダミー)と薬品の濃度、その交互作用を独立変数にして
「ある値」を従属変数にして回帰分析。
交互作用が有意なら細胞によって薬品に対する反応が異なる、つまり、あなたの言葉で言うRAとRBに差がある。
有意でないのなら差はない。
といくかな。
交互作用が「比」に相当するとしてよいように思うけど。
343 名前：１３２人目の素数さん mailto:sage [2011/08/13(土) 22:15:03.93 ]: カイ２乗検定で

帰無仮説H0：～と～は独立だ
対立仮説H1：～と～は独立でない

としてH0を棄却して独立でないことを示す例が多いけど、

逆はできないんだよね？
つまり独立でないことを帰無仮説として、
カイ２乗統計量が小さいことを根拠に帰無仮説を棄却し、
独立であることを示すってことは無理だよね？
344 名前：１３２人目の素数さん [2011/08/15(月) 10:26:41.77 ]: 独立でない、と仮定したときの貝2錠推計量をどうやって計算するつもりなんだ？？
345 名前：１３２人目の素数さん mailto:sage [2011/08/15(月) 14:28:39.87 ]: こういうことじゃないの。

aoki2.si.gunma-u.ac.jp/lecture/mb-arc/one-two.html
の1.1の最後の方にある
もう一つ付け加えておく。比率の差をχ2 分布を用いて検定するときに，左側の例えば 0.05% は何を意味するであろうか。
それは，「偶然とは思えないほど差がない」ということである。これは比率の差の検定ではあまり取り上げられないが，
適合度の検定（これも比率の差の検定としても解釈できる）の場合には「データがねつ造された可能性」を示唆するものとして
取り上げられることがある。すなわち，χ2 分布の左側は「理論に一致しすぎる」，右側は「理論と乖離しすぎる」ということである。
中庸がもっともあり得るという立場から検定すれば，「χ2 検定の場合にも両側検定はあり得る」。
(適当に改行)
346 名前：１３２人目の素数さん mailto:sage [2011/08/15(月) 15:11:19.49 ]: >>345
>中庸がもっともあり得るという立場から検定すれば，「χ2 検定の場合にも
>両側検定はあり得る」

って一般的な考え方かな？
347 名前：１３２人目の素数さん [2011/08/15(月) 17:34:26.01 ]: >>339,>>341
私の周りでもそうだから、
P=0.9になってしまうね。
反論はないのかな？
348 名前：１３２人目の素数さん mailto:sage [2011/08/15(月) 19:34:02.90 ]: >>347
私の周りでもそうだからp値が小さくなるって言わなきゃいけないんじゃないの
349 名前：１３２人目の素数さん mailto:sage [2011/08/15(月) 20:04:14.93 ]: >>346
一般的じゃない。
対立仮説として「データ捏造」をさらに加えた時の話だよね。
どんな検定基準を作っても、捏造者はそれをクリアーしてくる。
なので「データ捏造」は統計学の枠には入らない
350 名前：１３２人目の素数さん mailto:sage [2011/08/17(水) 19:47:15.88 ]: 基準を知られたら何でも無理なのは確か。
ただ過去の捏造話では簡単に見破れるほどひどいのが多いけどね。
（見破られていない完全犯罪的な捏造があるのかもしれんが）
351 名前：１３２人目の素数さん mailto:sage [2011/08/23(火) 23:23:46.04 ]: ついでにχ^2検定について１つ質問

m*nの分割表の自由度は(m-1)(n-1)で計算になるというのは分かるのだけど、
7*2の表と4*3の表の自由度が6となって
推計量が同じ分布に従うことが納得いかない。
分かりやすい説明ない？
352 名前：１３２人目の素数さん mailto:sage [2011/08/24(水) 00:19:25.41 ]: 計算は理解しているのになぜ納得いかないかが分からない。
353 名前：１３２人目の素数さん [2011/08/24(水) 13:44:37.19 ]: ＞自由度は(m-1)(n-1)で計算になるというのは
＞　　「　分　か　る　」　
＞のだけど

　
　　　↓

＞7*2の表と4*3の表の自由度が6となって同じが　納得いかない。

本当に　分かっているとは　思えない。
つまらん見栄、はるなよ。
354 名前：１３２人目の素数さん mailto:sage [2011/08/24(水) 18:54:14.87 ]: 自由度の「式は知ってる」と言いたかったんだろう。意味じゃなくてね
355 名前：１３２人目の素数さん mailto:sage [2011/08/24(水) 22:58:06.11 ]: SBICが資料によっていろいろ違ってるような気がする
356 名前：１３２人目の素数さん mailto:sage [2011/08/24(水) 23:08:12.92 ]: >>352->>354
そうです。
計算式は知ってるけど意味が分かりません
357 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 00:49:17.27 ]: 分割表は周辺固定。なんで1引くのか考えてみてよ。
358 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 06:43:36.03 ]: ヒント：以下の２×２分割表の(1)(2)(3)欄を x の式で表しなさい。
　　　　　　　　　　　　計
　　　　x　　　 (1)　　 10
　　　 (2)　　　(3)　　 40
計　　20　　　30　　　50
359 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 17:59:49.85 ]: 知っている人がいたら教えて欲しいのですが
シェッフェの一対比較法で
-2から2の5点系や-3から3の7点系は見るんですが
-1から1の3点系ってあるんですか？
360 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 23:22:58.14 ]: >>358
だから、計算は知ってるんだって。
361 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 23:37:28.87 ]: >>360
だから、>>358をみると、２×２の場合には１個情報が与えられてしまえば
他の情報は決定されてしまう。つまり自由に決めれる自由度が１個。

その考え方を、>>351の７×２と４×３にも当てはめて見れば、自由になる数
の個数はどうなる？
362 名前：１３２人目の素数さん mailto:sage [2011/08/25(木) 23:39:56.81 ]: >>361
その自由になる個数の数ってのは分かってるよ。
計算式の途中で7*2は14項、4*3は12項出てくるじゃん。
それが各項が独立ではないから自由度6のカイ２乗分布に従うんだろうってことは分かるけど、
直感的に違和感を感じるから詳しい人に説明してもらいたいんだよ。
363 名前：１３２人目の素数さん [2011/08/26(金) 13:21:18.15 ]: こんなことで、直感的に違和感を感じる人には
　統計学は無理じゃないかな。。。
　
　普通、直感的に理解できることなので…
　

　
364 名前：１３２人目の素数さん mailto:sage [2011/08/26(金) 21:13:14.73 ]: 具体的に数式を変形して
(～)^2 + (～)^2 + (～)^2 + (～)^2 + (～)^2 + (～)^2
の形に変型して見せてよ。

違和感感じてるの項数だけなんだから。

あと、学問として統計学をやっていこうという気はないです。
ただのツールなので。
365 名前：１３２人目の素数さん mailto:sage [2011/08/26(金) 22:52:34.40 ]: >>364
ただのツールなら、それこそ気にしなくていいよ。

それに、ただのツールと言う人のために時間を割いて書き込みしても無駄でしょう。
366 名前：１３２人目の素数さん mailto:sage [2011/08/26(金) 23:01:45.70 ]: 信用して使えるものなのか気になる
367 名前：１３２人目の素数さん mailto:sage [2011/08/27(土) 00:07:00.15 ]: >>366
そういう点が気になるなら、「学問」として自分で勉強しましょうね。
368 名前：１３２人目の素数さん mailto:sage [2011/08/27(土) 00:10:12.47 ]: 2*2の場合、とてもきれいな公式があったので、
それより大きな表の場合を知りたかったのですけどね。
私の計算力では無理でした。
残念です。
369 名前：１３２人目の素数さん [2011/08/27(土) 09:17:42.05 ]: JUMPかRで、三群以上の実験データについて比率の差の検定の
多重測定はできますでしょうか
370 名前：１３２人目の素数さん mailto:sage [2011/08/27(土) 09:19:37.91 ]: できます。
371 名前：１３２人目の素数さん mailto:sage [2011/08/27(土) 11:24:16.89 ]: >>368

>>368は>>351かな？
最初から、
「2*2で自由度についてこういう展開式があってわかりやすいんだけど、
3*4とか7*2みたいな場合はどうなるのかわかるひといるかな。
私の計算力では無理だった」
と書けば答えてくれた人もいると思う。

質問の仕方と受け答えを間違ったね。
372 名前：１３２人目の素数さん mailto:sage [2011/08/27(土) 23:21:53.41 ]: あのう、立教明治スレからやってきた者です。
ぜひ皆さんのお力を借りたく参りました。
どうしても立教明治ダブル合格のデータの持つ意味に納得が行かないので
相談しています。
結果の数値は事実なので問題ではありません。
でもこの調査結果から明治より立教が秀逸とは言えないと思います。
なぜなら、そもそもの調査対象データに偏り、というよりデータの取り方に問題が
あると思うからです。

皆さまには、この立教明治ダブル合格者のデータの信憑性について、あるいは適切な
参照方法についてご教授いただきたけないでしょうか？
373 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 00:08:35.73 ]: 少なくとも2×2分割表で納得できたのなら、もう気は済んだでしょう。

これは結構難しい問題で、最初はトップの専門家が皆間違えてた。
その誤りを指摘して、今日使われている自由度の式を導いたのが、R.A.Fisher。
これでデビュー後、次々と精密理論を作り上げて行った。

R.A.Fisher, "On the Interpretation of X2 from Contingency Tables, and the Calculation of P,"
Journal of the Royal Statistical Society, Vol.85, No 1(1922), pp 87-94.
374 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 00:31:57.95 ]: >>372
立教と明治の両方に合格した人がどっちを選んだかという話？
データ例を挙げて、どんな偏りがありそうなのかを説明してみれば、
統計的な問題がありそうかどうかわかると思うけど
375 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 01:22:45.61 ]: >>372
とりあえず、データ見せてよ。

君が持ってるデータをみんなが持っているわけじゃないし、
そんな聞き方じゃ、わざわざ探す気にもならないよ。
376 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 01:35:59.22 ]: >>374 >>375
ありがとうございます。
コピペしますので、もうしばらくお待ちください。
377 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 01:58:07.02 ]: 週刊誌の受験特集でダブル合格者の進学データがあります。
一例を挙げると以下のようなものです。

1 エリート街道さん 2009/02/18(水) 13:47:33 ID:BtFc0u57
読売ウィークリー08.8.3号「Ｗ合格者対決特集」
～Ｗ合格時の進学先～
[対明治]　　　　　　　　　　　　　　　　[対青学]
○立教法　 42 - 27●明治法　　　　○立教法　 11 - 0●青学法　
○立教法　　7 - 4●明治政経　　　○立教経済　7 - 1●青学経済
○立教経済19 - 4●明治商　　　　 ○立教経済　4 - 0●青学国際政経
○立教経済16 - 0●明治経営　　　○立教経営　5 - 0●青学経営
○立教経営34 - 3●明治経営　　　○立教文　 31 - 5●青学文
○立教経済37 - 14●明治政経　　　○立教理　　8 - 1●青学理工
○立教文 102 -28●明治文
○立教理　48 - 5●明治理工
[対学習院]
○立教法　 10 - 0●学習院法　　　　　※[対中央][対法政]は問題外、掲載すらされず
○立教経済13 - 1●学習院経済
○立教文　 23 - 4●学習院文
○立教心理 4 - 1●学習院文
○立教理　 14 - 2●学習院理

■アエラ09.2.23号併願対決
～○立教全体平均70-明治全体平均30●～
○立教経営85-15明治商●
○立教経営89-11明治経営●
○立教文68-32明治文●
○立教心理55-明治文46●
※立教心理は新座、明治文は御茶ノ水

●立教法10-中央法90○
●明治法4-中央法96○
378 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 01:58:27.91 ]: この表ではマーチ各校の勝敗をダブル合格者の進学数によって決めています。
この調査で明らかなのはダブル合格者の進学者の数であって、その大小を示した
に過ぎません。
多くのスレッドではあたかもWinnerの大学の方が人気があり、優れていることの
裏付けのように扱っています。たしかにダブル合格者にとってはその通りです。

ですが、両校の受験者の合計と比較してダブル受験者数があまりに小さい場合、
ダブル合格者のもたらす結果は補正して見る必要があると考えます。

統計学に精通されている皆さまなら、私の申しあげたことの趣旨を汲み取って
いただけるのではないかと思い、こちらに書き込みさせていただきました。

立教明治スレであまりにも酷い解釈がまかり通っており、皆さまからの助言を
期待するものです。
379 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 02:11:46.99 ]: 少し本音ベースで話すと私は明治の出身です。
このダブル合格者の進学データを見たとき、正直無意味と思いました。
多分高校3年のときだったと思います。
なぜなら両校を受験しているという条件が一般的ではない、その他のケースの
方が圧倒的に多いだろう、と思ったからです。

実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人は
いませんでした。彼女も明治ですが、やはり女友達にもいなかったそうです。
なので明治入学者のほとんどは立教を受験していないと考えます。
ですから、立教と明治のダブル合格者の進学データについては明大生一般の実状と
異なるものと考えます。
明治ではよくこう言われます、「そもそも立教青学は受けない」と。
理由は偏差値の差以上に校風のベクトルが違い過ぎるからです。
明大生は早稲田、公立大落ちがほとんどです。
380 名前：１３２人目の素数さん [2011/08/28(日) 03:08:01.25 ]: 俺、早稲田だけど明治は受けなかったけど立教は受けたよぐらいしか言えない
381 名前：１３２人目の素数さん [2011/08/28(日) 03:59:35.07 ]: ＞　実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人はいませんでした。

それは何人にたずねたのかな？
係属高校出身者を除いて１００人ぐらいにたずねていれば一応評価できるけど。

立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。
だから気にしないでいいと思う。

今の不景気な時代に私立大学に行くことは、裕福な家庭の子息にしか
できないことだからね。

勉強するのは旧帝や早慶にまかせておいて。
まったり遊んで卒業すればいいんじゃないの？
382 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 05:08:22.56 ]: >>379
読売ウィークリーのデータがどれくらい信用できるかって問題はある。
08年くらいだと個人を特定できたんだっけ？
もしも、きちんと個人を特定してダブル合格をフォローできてるなら
立教と明治の両方を受かった学生は立教に行ってるのが多いくらいは
言えそう。

まあ、似たようなLVの大学を複数受けてるってことは、そのLVの大学が
適正LVで、そのために受験料も余分に出せるってことなので、お金がある
って意味では立教向きの属性はあるかも。

でも、どうでもいい数字だなと思う。
学生の雰囲気も違うし、入った大学が気に入ってればいいんじゃないの。
383 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 10:47:27.68 ]: >>380　やはり立教の方がいいということでしょうか、
それとも明治は早稲田コンプという雰囲気だから敬遠されたんでしょうかね。
ご回答ありがとうございます。

>>381　周囲にはせいぜい20～30人くらいです。ですからほとんど主観の領域です。
付生には尋ねていません。

>立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。
>だから気にしないでいいと思う。

>勉強するのは旧帝や早慶にまかせておいて。
>まったり遊んで卒業すればいいんじゃないの？

私が主張したいのも、まさにこれらのことです。立教も明治も同レベル。
ただ両方受けた人にとっては立教が良かった、ただそれだけ。
もしくは明治はいやだった。ほとんど好みの問題で偏差値云々の話でないと
考えています。
私の考えでは、立教を併願するということは少しでも魅力を感じていたという
ことで、選択する可能性があります。一方私の持論である、明大生は立教を
受けていないという考えに立てば、ダブル合格者の進学データは、明治合格者の
スケールに比して極小となります。データとして偏りがあるということになります。
一応立教明治スレでも併願者数のデータを貼り付けてもらいました。
後程コピペします。

>>382　ホントにどうでもいい数字なんです。
ぜひそのことを立教関係者の方に理解してほしいのです。
384 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 11:10:27.57 ]: さきほの件です。古いデータですが各校の併願先がわかります。

887 エリート街道さん sage 2011/08/27(土) 22:30:11.29 ID:wvvB/703
>>877はサンプルに偏りがあるけどね

明治立教を例にすると

①明治、立教にどちらも合格し、明治か立教に入学した
②明治だけ、立教だけに受験した合格した人は対象外
③明治、立教どちらも合格したが他の大学に入学したは対象外

2001年と古いが代ゼミの併願対決ではこうなってる
www.geocities.co.jp/CollegeLife-Lounge/6635/

明治法　　早大法1129　中央法1128　法政法840　立教法549★　日本法533　早大社518
明治商　　早大商*951　明治営*672　法政営654　明治政639　早大社575　立教経513★　中央商508
明治政　　早大社*818　早大商*805　明治商639　中央経562　早大政562　法政経508　明治営502　立教経477
明治文　　早大教*640　中央文*585　法政文583　早大文581　立教文491★　國學文417
明治理　　立教ランク外

立教文　　青学文*730　早大教697　上智文633　早大文623　学習文566　明治文491★　中央文386
立教経　　早大商1208　立教経952　早大社724　明治営621★　上智経568　法政営560　明治商513★　立教社510　早大政488　明治政477★　慶応経441
立教理　　理大理*389　中央理312　理理工247　上智理237　早大理233　青学理203　早大教154　学習理149　明治理130★
立教法　　早大法*714　明治法549★　中央法546　上智法470　法政法397　早大社366　立教経356　学習法319
385 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 11:12:08.44 ]: 877 エリート街道さん 2011/08/27(土) 21:47:18.40 ID:DkVmnfYc
具体的にサンプル数が判明しているソース

■私大併願対決「MARCH関関同立編」（AERA 2010年1月25日号）
iup.2ch-library.com/i/i0047294-1263749439.jpg
【マーチ編】　　　　　　　　　　　【関関同立編】
○立教２６６ - 　１２１明治●　　　○同大６１２- 　　３７立命●
○立教１５７ - 　　４６青学●　　　○同大４９５- 　　３２関学●
○立教１４９ - 　　５４中央●　　　○同大４６４- 　　　５関西●
○立教２６８ - 　　１２法政●　　　○立命１３９- 　１３４関学●
○明治２１０ - 　　８１青学●　　　○立命２４６- 　　５５関西●
○明治３１１ - 　１６９中央●　　　○関学３７３- 　　５５関西●
○明治５１５ - 　　１５法政●
○青学１０５ - 　　６０中央●
○青学２０６ - 　　３１法政●
386 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 11:20:14.21 ]: で、この表を見易くしてくれたのがコレ。
明治立教の併願は387名。明治の単独受験者数は10万人以上。立教も数万はいる。一見サンプル抽出の手法を取っているかのように見えるが、明らかに立教明治の併願というのはレアケースと言える。果たしてそのようなデータに信憑性はあるのか？
そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。私はこの現状をなんとかしないと、と思ってる。

879 エリート街道さん 2011/08/27(土) 21:52:52.60 ID:DkVmnfYc
明治法政５３０人
明治中央４８０人
立教明治３８７人
明治青学２９１人
立教法政２８０人
青学法政２３７人
立教青学２０３人
立教中央２０３人
青学中央１６５人

明治・法政・中央はホーチミンで併願が多いのは当たり前
次に多いのが立教明治。立教法政も多い。
この辺は六大学だからか。
387 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 18:05:36.76 ]: >>386
まず、2001年のデータは古すぎます。
10年前のデータをだしても現在の人気の変数にはなりません。

>そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。
>私はこの現状をなんとかしないと、と思ってる。

って書いてるけど、別に受験生はそんなこと考えていないでしょ。
受かりそうな大学を併願してるだけ。

で、受かった後に、自分の大学を少しでもいいと思いたいから語ってるだけ。
ということで、君が気にしてるほど受験生は気にしてないし、ネットに書き込む
属性の人がそういってるだけなので放っておいていいと思います。
388 名前：１３２人目の素数さん mailto:sage [2011/08/28(日) 18:48:07.54 ]: 2010年のデータはどうですか？
また受験生に関しては私の勝手な想いですから気にしないでください。

これらの立教明治のダブル合格者の進学データは大学受験板、学歴板に大量に貼られ、そのたびに不毛な論争が続いています。どうにかこのダブル合格者の進学データの無意味さ(立教明治の優劣を決める上での指標という意味で)を証明したいと思うので、助言を下さい。
389 名前：369 [2011/08/28(日) 22:12:52.11 ]: >370 ありがとうございます。Rの場合のパッケージと関数を教えて頂けないでしょうか
よろしくお願いします
390 名前：１３２人目の素数さん mailto:sage [2011/08/29(月) 00:38:43.95 ]: >>385
＞○立教２６６ - 　１２１明治●

全学部で　２：１　ぐらいの比だよね。率に直すと 69% ; 31%。
n = 387人だと、約20人以上の差がつくと5%有意なので、
この結果は「統計的に見て有意差あり」。

差が出る要因は
１．人数：一般入試合格者数の違い
２．学部学科構成（一方にあって他方にない学部学科の志望者数）
３．キャンパス・部活・宗教・就職先・・・
とか、もっと細かく見て行かないとわからない。
あと、併願同時合格者にもし女性が多いと、立教に行く率が高くなるかもね。

なので統計学ではなく、専門としてはマーケティングや社会学が近いかも。
けど一般常識としては、「これぐらいの差なら大体同ランクの大学」。
391 名前：390 訂正 mailto:sage [2011/08/29(月) 01:21:17.60 ]: ×　約20人以上の差がつくと5%有意なので、
○　約40人以上の差がつくと5%有意なので、

（仮説 p=1/2 の下で √(np(1-p)) = √387 / 2 ≒ 10）
392 名前：１３２人目の素数さん mailto:sage [2011/08/30(火) 19:17:51.10 ]: 質問です。
tukeyの方法で30群(自由度270)を多重比較したいのですが、ステューデント化した範囲の表には10群までしか載っていません。10群以上は不可能なんでしょうか？
それとも補間する方法があるんでしょうか？
よろしくお願いします。
393 名前：(・゜ω゜・) ☆まじめこて☆ ◆rgujENbs.s mailto:sage [2011/08/30(火) 21:06:06.41 ]: 質問です。
変動係数の存在意義って何ですか？
標準化統計量を比較すればそれで事足りる気がするんですが。
394 名前：１３２人目の素数さん mailto:sage [2011/08/30(火) 22:54:37.40 ]: >>392
可能です。
が、10までしかない表から30の場合を補間することはできません。
395 名前：１３２人目の素数さん mailto:sage [2011/08/30(火) 23:02:27.51 ]: >>393
標準化統計量を比較するとは？
具体的に言うと、どういう数値を、何と何とで比較することを意味しているのでしょうか？
396 名前：(・゜ω゜・) ☆まじめこて☆ ◆rgujENbs.s mailto:sage [2011/08/31(水) 00:12:48.52 ]: >>395
んーと、変動係数ってデータ集団の桁が違えば、
標準偏差の大きさが違ってくるから、
散らばりの程度を集団間で比較できないので必要と言う話ですよね？

それに対して標準化統計量って、ある特定のデータが
集団の中でどの辺りに位置しているかを表すわけですよね？
つまり、２つのデータ集団のデータを全て標準化して、
さらに２つのデータ集団ごとに標準偏差をとれば、
集団間の散らばりの程度を表現できますよね？という話です。

どうでしょう？
397 名前：１３２人目の素数さん mailto:sage [2011/08/31(水) 07:05:09.51 ]: >>396
確かに、変動係数の存在意義は小さいと思いますが、それはさておき。

＞２つのデータ集団のデータを全て標準化して、
＞さらに２つのデータ集団ごとに標準偏差をとれば、

データの標準化というのは、「各々のデータから平均を減じて標準偏差で割る」ことでしょ？
いわゆるz得点というものですが。
そうすると、平均0、標準偏差1になりますから、もう一度標準偏差をとったら、当然1以外になりようがないでしょう。

ではなくて、A集団とB集団のデータを込みで平均と標準偏差を計算して、込みで標準化した後、
それぞれの集団ごとに集計して標準偏差をとるということですか？

たとえば、平均1で標準偏差0.1のA集団(アリ)と平均170で標準偏差10のB集団(ヒト)とを込みで標準化できると思いますか？
（まさに桁違いの場合)
計算はできますが、どういう意味をもつのでしょうか。
398 名前：392 mailto:sage [2011/08/31(水) 11:38:48.13 ]: >>394
ありがとうございます！
自由度と群数から範囲を求められるツールを手に入れたので、それでやってみようと思います。
399 名前：１３２人目の素数さん [2011/08/31(水) 13:02:53.38 ]: lkjs6
400 名前：１３２人目の素数さん [2011/09/02(金) 00:27:21.39 ]: 質問です。
y=a+bx+eにおいて
aとbをＯＬＳで求めたとして、
その推計値はどの様な確率変数に従うか説明しろって言われたら
何て答えれば必要充分なんでしょうか？
サンプル数が多ければ正規分布、少なければｔ分布だと思うのですが
これだけだと説明になってないし・・・
401 名前：１３２人目の素数さん mailto:sage [2011/09/02(金) 09:17:39.66 ]: >>400
ｔ分布は間違い（a, b の推定値とは違う話）。

＞はどの様な確率変数に従うか

問いとしては、誤差項の分布の「平均・分散」（と幾つかの標準的な仮定）を与えた時に、
「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨だと思う。
分布形は仮定せずに答えたあとなら、誤差項が正規分布に従うなら・・・とか付け足してもＯＫ
402 名前：１３２人目の素数さん [2011/09/02(金) 16:09:55.47 ]: >>410

ありがとう御座います。

>「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨
ということは「a,bは不偏推定量であり、分散は～～の式で求めることが出来る」
とか書けばいいのでしょうか？
403 名前：１３２人目の素数さん [2011/09/02(金) 16:32:16.64 ]: ちゃうやろ。

おそらく「ｔ分布に従う」、という答えを求められているぞ。

数学的に正確かどうかは別の話。
404 名前：１３２人目の素数さん [2011/09/04(日) 16:23:52.48 ]: 質問です。
ある計測をして、
1,2,3,3,4,4,4,5,5,5,5,6,6,6,7,7,7,8,9,300
という20個のデータが得られたとします。
このとき、けた外れに大きい300というデータを取り除いたり、この計測データには不適(測定ミス)だと判断できるような方法はあるでしょうか？
わかりにくい内容で申し訳ありませんがよろしくお願いします。
405 名前：１３２人目の素数さん mailto:sage [2011/09/04(日) 17:55:20.85 ]: >>404
実際に測定ミスであったか否かの判定は統計では分からないです。
ただそれが外れ値、異常値であるという示唆は得られるので、それに従って
検証し直すことになります。測定ミス、入力ミスでない外れ値であるとなった
場合にそれを分析から除去するのか、別の処理をするのかは研究の内容にも
よるでしょう。
406 名前：１３２人目の素数さん mailto:sage [2011/09/04(日) 18:58:23.73 ]: >>404
それが、計測ミスか入力ミスか外れ値かはわからないが
極端に外れているかどうかは、統計でわかるよ。
407 名前：404 [2011/09/04(日) 19:13:12.26 ]: >>405-406
ありがとうございます。
では300というデータが他のデータ群から極端に離れていることを客観的に示すためにはどのような方法で示せばよろしいでしょうか。
質問ばかりで申し訳ございません。
408 名前：１３２人目の素数さん mailto:sage [2011/09/05(月) 12:19:43.44 ]: >>407
2chとWikipediaとどちらが信頼できるのか、
五十歩百歩だと思うが、Wikipediaを参照するのもよかろう
ttp://ja.wikipedia.org/wiki/%E5%A4%96%E3%82%8C%E5%80%A4
409 名前：404 [2011/09/05(月) 20:30:08.99 ]: >>408
わざわざありがとうございます!!
参考になります。
410 名前：迷える学生 mailto:sage [2011/09/06(火) 00:46:15.99 ]: こんばんわ正規分布と標準正規分布がいまいちわかりません。
標準正規分布は平均＝０　標準偏差＝１と言うのはわかりますが。
問題で工場の[平均５．２kg][標準偏差が０．１kg][５．０kg]未満の製品は社内で不合格とされるとでているのですが生産された製品の不合格率の割合が何パーかがわかりません。
分かる方おねがいします。
411 名前：１３２人目の素数さん mailto:sage [2011/09/09(金) 17:40:51.71 ]: 質問です。

『ある会社Aが「うちの授業受けた人の90%はTOEFLの点数が20点上がってるよ」って宣伝してました。それに対し、会社Bが「Aは誇張している!」と訴えました。
規制協会が調査に乗り出して、Aの授業を受けた人のうち100人の成績をGET。その内訳は
・50人は35点up
・35人は20点up
・15人は0点up(点数上昇無し)
でした。
この時、有意水準5%でAの主張またはBの主張を検定しなさい。』
という問題なのですが、90%という部分をどう扱えばよいのかわかりません。
その部分さえ無ければ普通の仮説検定でよいと思うのですが…。
412 名前：１３２人目の素数さん mailto:sage [2011/09/09(金) 18:59:54.31 ]: >>411
Aの宣伝が正しければ、ランダムに生徒を調べてみたら、100人のうち90人前後が成績upしているはず。
協会が調べてみたら、50人がupしていて、50人は変わらず、だったとしたら、
90%upした集団からのサンプルとは言い難いと考えるでしょうね。

では、85人がupだった場合はどうなのか。90人には足りないけれど、
この85人は、元々のA社の言う90%が正しいとして、「たまたま」5人少なかっただけ、と言えるかどうか。

「普通の仮説検定」の意味がよくわかりませんが、これもごく普通に行われる仮説検定。
413 名前：１３２人目の素数さん mailto:sage [2011/09/09(金) 19:27:30.88 ]: >>411
＞点数が20点上がってるよ

２０点「以上」では？
414 名前：１３２人目の素数さん mailto:sage [2011/09/10(土) 16:58:00.24 ]: >>411
>90%という部分をどう扱えばよいのかわかりません

期待値の算出に使う
415 名前：１３２人目の素数さん mailto:sage [2011/09/10(土) 23:17:01.06 ]: ランダムに選んだ１００人中に成績が上がらなかった人が
１５人以上になる確率を考えればいいんじゃね？
416 名前：１３２人目の素数さん [2011/09/12(月) 13:59:25.12 ]: 20%上がっているか、上がっていないかの２値判定なので、２項検定に持ち込む。

20%以上上がっている人が何点であるか、また20％以下の人が何点であるかは関係ない。
「３５点ｕｐ」とか「０点ｕｐ」とかの情報は使われない。引っかけ問題。
417 名前：１３２人目の素数さん mailto:sage [2011/09/12(月) 17:45:38.52 ]: >>416
>>413
418 名前：１３２人目の素数さん mailto:sage [2011/09/12(月) 18:15:42.92 ]: 20点以上上がったか、上がらなかったかという二つのカテゴリーに単純化して二項検定
でいいんじゃないの
419 名前：１３２人目の素数さん [2011/09/20(火) 13:57:36.70 ]: 「２つの確率変数XとYの相関係数は０だが、独立ではないような例を示せ」って
たとえば何があるんでしょう？

自分は苦し紛れに需要が完全に硬直的な状態のマネタリーベースと総需要の関係と答えたんですが・・
420 名前：【34.3m】 mailto:sage [2011/09/20(火) 14:35:13.45 ]: >>419
相関係数ってのは、二つの変数の間に直線の関係があるかを示している。
なので、右上がり、右下がりといった傾きの無い関係を考えればいい。

経済学部みたいだけど、そういう時の例は経済に限らなくてもいいのでは。

Y=sin(X)、Xの範囲は（－360°、＋360°）とか。こんなに範囲取らなくてもいいけどね。
Y=X^2、Xの範囲は（-1、1）とか。下がって上がるので相関ゼロ。
Y^2+X^2=r^2、XとYの相関はゼロだけど円という関係にある。
421 名前：１３２人目の素数さん mailto:sage [2011/09/20(火) 18:40:28.72 ]: >>419
独立性の問題だから理論的な確率分布の話。
例として簡単なのは以下のような離散型確率分布
　 x　y　　確率 p(x, y)
　 0　 1　　 1/4
　 1　 0　　 1/4
　 0　-1　　 1/4
　-1　 0　　 1/4

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef