統計学Part１５

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 08/20 22:51 / Filesize : 219 KB / Number-of Response : 972
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学Part１５

1 名前：１３２人目の素数さん [2013/04/05(金) 23:35:41.08 ]: 前スレ

統計学なんでもスレッド14
uni.2ch.net/test/read.cgi/math/1326471964/
2 名前：１３２人目の素数さん mailto:age [2013/04/06(土) 15:57:12.57 ]: おまんこ女学院
3 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
4 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
5 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
6 名前：１３２人目の素数さん [2013/04/11(木) 14:10:30.81 ]: 誰か書き込んでー
7 名前：１３２人目の素数さん [2013/04/11(木) 16:01:15.32 ]: 7匹でもハチ
8 名前：１３２人目の素数さん mailto:sage [2013/04/11(木) 16:09:48.89 ]: 実データ集計にヒストグラムなんぞ使うのは間違ってる
確率は累積分布関数が基本なんだから累積ヒストグラムを使うべきだ
ビン幅に依存しない最大限に正確な分析が出来る
9 名前：１３２人目の素数さん [2013/04/12(金) 14:46:43.79 ]: こちらの方々って、『N=95を統計処理』って言われただけで意味分かりますか？
ライザップってジムのバナー広告で、

めざせ-15kg！ ※2
※2 N=95を統計処理した結果(2013年2月LM研究財団調べ)

ってのがあるのですが、何を言っているのかが分かりません。
その財団のサイトを探しても見つかりません。
10 名前：１３２人目の素数さん mailto:sage [2013/04/12(金) 15:31:00.18 ]: 効果があったと言ってる人が95人いるってことだろ
11 名前：１３２人目の素数さん mailto:sage [2013/04/12(金) 15:57:52.72 ]: 100%が痩せています※
※N=95を統計処理した結果(2013年LM研究財団調べ)　統計的な確立の表現であり、特異な例外はありえます。

統計「的」、あくまでも確立であって確率ではないところがポイントｗ
12 名前：１３２人目の素数さん [2013/04/12(金) 18:25:20.61 ]: >>10
そうしますと、
・母体数：95人
・95人が落とした体重の平均値：15kg
ってことでしょうか？
そんな簡単な計算を財団に依頼したとか言ってるんですか？
13 名前：１３２人目の素数さん [2013/04/12(金) 23:56:37.28 ]: 仕事でクラメールのVを使うことになったのですが、クラメールのVが0以上1以下という証明が掲載されている本はないでしょうか？
検索したり自分で考えたりしてみたのですがわかりませんでした。
14 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
15 名前：１３２人目の素数さん mailto:sage [2013/04/13(土) 11:33:02.13 ]: >>12
言うのは勝手
16 名前：１３２人目の素数さん [2013/04/18(木) 11:34:20.17 ]: ガチでわからなくて困ってるんだけど教えてください
30分に平均1台の車が通る高速道路で、ある車が通過してから、（その車を含めて）5台目の車が通るまでの時間をXとする。
Xの平均と分散を求めよ。
まず何の分布（ポアソン分布だとか幾何分布だとか）なのかもよくわからなくて詰んでる。
17 名前：１３２人目の素数さん mailto:sage [2013/04/18(木) 16:53:59.73 ]: 車と車の時間間隔は指数分布でそれが4つの和の分布は4つ畳込みだ
ポアソン分布は一定時間に通る車の数
18 名前：１３２人目の素数さん [2013/04/19(金) 14:21:41.47 ]: >>17
ってことは
平均で一時間に二台車が通るということだから
四台とおるのにx時間かかるとして、その確率は
f(x)=Γ(4,2)=(8/3)x^3*e^(-2x) (0<x<∞)
よって
E(x)=∮[0:∞]x*f(x) dx
=(1/12)*Γ(5)=(1/12)*4!=2(時間)
また、
V(x)=E(x^2)-(E(x))^2
=∮[0:∞]x^2*f(x) dx-2^2=(1/24)Γ(6)-4=(1/24)*5!-4=5-4=1
ということでよろしいですか？
確率難しすぎワロタ
19 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 21:16:24.01 ]: なんで５台あたり通る分布が４つの畳み込み積分？
車が２台あたり１時間通る分布がλ＝２で
2*exp(-2*t)なのは解るけど、そこからどう導くんでしょうか。
20 名前：１３２人目の素数さん [2013/04/19(金) 21:56:57.16 ]: TEST
21 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 22:09:52.94 ]: >>1
スレ趣旨テンプレを省略するなよ。1000番間近で前スレは、何故にdat落ちしたのだろ？

以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。
22 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 22:13:22.88 ]: >>2
過去スレ
統計学なんでもスレッド14　　
uni.2ch.net/test/read.cgi/math/1326471964/
統計学なんでもスレッド13
uni.2ch.net/test/read.cgi/math/1297356696/
統計学なんでもスレッド12
kamome.2ch.net/test/read.cgi/math/1283521346/
統計学なんでもスレッド11
kamome.2ch.net/test/read.cgi/math/1258355122/
統計学なんでもスレッド10
science6.2ch.net/test/read.cgi/math/1245043541/
統計学なんでもスレッド9
science6.2ch.net/test/read.cgi/math/1226981666/
統計学なんでもスレッド8
science6.2ch.net/test/read.cgi/math/1211786770/
統計学なんでもスレッド7
science6.2ch.net/test/read.cgi/math/1193183539/
統計学なんでもスレッド6
science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
science.2ch.net/test/read.cgi/math/1012782106/
23 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 22:16:10.11 ]: >>3
関連スレ１　ソフトウェア
【R言語】統計解析フリーソフトＲ第４章【GNU R】
kamome.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
kamome.2ch.net/test/read.cgi/math/1284083650/
統計・解析ソフトについて
hibari.2ch.net/test/read.cgi/bsoft/1012298063/
【統計分析】機械学習・データマイニング【集合知】
toro.2ch.net/test/read.cgi/tech/1286200810/

関連スレ２　試験
【会計士】★統計学part2★【選択科目】
kohada.2ch.net/test/read.cgi/exam/1260227046/
【通信】　　統計士・データ解析士　　【高杉】
ikura.2ch.net/test/read.cgi/lic/1288016000/
統計・プログラミング選択あつまれー
kohada.2ch.net/test/read.cgi/kouri/1323147411/
センター数学2Bで統計選択のやつ集まれ～ 2011
kohada.2ch.net/test/read.cgi/kouri/1318831930/

関連スレ３　その他
統計学は低脳のやる学問？
uni.2ch.net/test/read.cgi/math/1310989332/
心理統計学スレ
awabi.2ch.net/test/read.cgi/psycho/1324507670/
偏った標本調査・世論調査・統計を吊し上げるスレ
ikura.2ch.net/test/read.cgi/sim/1322885523/
【泰野くん】（独）統計センター２【藤田】
uni.2ch.net/test/read.cgi/koumu/1284048045/
【さよなら】（独）統計センター３【ラスプーチン】
uni.2ch.net/test/read.cgi/koumu/1285335261/
24 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 22:20:02.26 ]: >>4
関連スレ４　kamome鯖霧散消失前スレ
【統計学】統計的仮説検定！！
science6.2ch.net/test/read.cgi/math/1201535084/
◆統計学について語るスレ
kamome.2ch.net/test/read.cgi/sim/1012828891/
生物学での統計学スレ
kamome.2ch.net/test/read.cgi/life/1127772845/
統計ソフト統合スレッド－SPSS・SAS以外
yasai.2ch.net/test/read.cgi/psycho/1012801769/
SASスレ
yasai.2ch.net/test/read.cgi/psycho/1012738237/
SPSSスレ
yasai.2ch.net/test/read.cgi/psycho/1012388599/
25 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 22:28:40.71 ]: >>5
関連スレ５　数学板現役スレ
統計学の分かりやすい本教えろください
uni.2ch.net/test/read.cgi/math/1337166984/
【R言語】統計解析フリーソフトＲ第４章【GNU R】
uni.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
uni.2ch.net/test/read.cgi/math/1284083650/
26 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 23:08:43.23 ]: >>6
関連スレ４補　kamome鯖霧散消失前スレ
統計学なんて数学じゃないだろ
kamome.2ch.net/test/read.cgi/math/1173876727/
「今後一番セクシーな仕事は統計学者になるはずだ」
science6.2ch.net/test/read.cgi/math/1245375555/
統計学的手法の数々の競馬への転用の実証
science6.2ch.net/test/read.cgi/sim/1052761881/
統計学
kamome.2ch.net/test/read.cgi/sociology/982489314/
経済学で使う統計学スレッド
kamome.2ch.net/test/read.cgi/economics/1094012265/
27 名前：１３２人目の素数さん mailto:sage [2013/04/19(金) 23:16:16.49 ]: >>896
>統計学の本なんて実践的な本しか見たこと無いけど・・・・・・
おいおい、これらの統計学初学者向けの名著を目にしたことはないのかね？
初等統計学（第４版）　Ｐ．Ｇ．ホーエル　培風館　A5判　1981/01　
www.washin.co.jp/honya/outline/4-563-00839-7.htm
はじめての統計学　鳥居泰彦　日本経済新聞社　Ａ5判　1994.11
www.nikkeibook.com/book_detail/13074/#9784532130749
28 名前：１３２人目の素数さん mailto:sage [2013/04/21(日) 13:46:36.11 ]: 前スレ質問を、再録です。
二項分布を正規分布で近似してるから>>>>933は、P(1-P)/n式の答でしょうが、
これがなぜ誤差分になるのかが知りたいのです。
932 ：１３２人目の素数さん[sage] ：投稿日：2013/03/18 21:48:52
>>924
ｎを導く統計学公式の元式
　　　　　μ<Xbar+1.96*SQRT(P(1-P)/n)
の右辺第2項即ち誤差項の成り立ちが、理解できません。
比率Pとその補数の積を標本数で割ったP(1-P)/nの平方根が、どうして誤差分に
なるのですか？
29 名前：１３２人目の素数さん mailto:sage [2013/04/21(日) 15:35:28.01 ]: 調べるのメンドイから調べないけどw
チェビシェフの不等式に何か代入して、崩したら信頼区間の形になった気がする。
あと最初は標準正規分布の信頼区間から考えた方がいいと思われ。
それができたあとに、二項分布に中心極限定理使えばあなたが示す式になるかと。

何言ってるのかわけわかめなら数理統計学の入門書読んだ方が早い気がするお。
あと自分の持ってる数理統計の知識とかも書いてくれた方がレスつきやすいんじゃないかな。
30 名前：１３２人目の素数さん mailto:sage [2013/04/21(日) 20:51:47.52 ]: 勉強もせずに問題やってるんだろ
31 名前：２８ mailto:sage [2013/04/23(火) 23:21:39.86 ]: >>29
32 名前：２８ mailto:sage [2013/04/23(火) 23:52:33.71 ]: >>29
助言有難うございます。当方は、統計学未修工学部卒の統計学習７年生です。
標準正規分布-->二項分布の２段階に分けて考えるわけですね。
　　正規分布変数Xの標準化式 u=(X-μ)/σ ・・・・32-１)
　　は理解できます。
　　95％信頼区間上限値u=1.96を32-１)式に代入して、正規分布時の>>28式右辺が、
　　導出されるのも理解できます。
理解できていないのが、>>28式の以下の２点です。
　　Q1.平方根に変わるのは、何故？
　　Q2.P(1-P)/nに、何故置換できるの？
33 名前：１３２人目の素数さん mailto:sage [2013/04/24(水) 15:54:02.00 ]: 正規分布の標準かはX~ Norm(μ,sigma^2)のとき(X-μ)/σ ~ Norm(0,1)であってるけど

中心極限定理は
X~何らかの分布（BinでもPoissonでもWeibullでも、、）
のときlim n-> ∞で (X_bar - μ)/(sigma/sqrt(n)) ~ Z(0,1)がなりたつというもの。
試しにX_i ~ Bin(1,p)を公式に代入してみて。期待値はp、分散はp*(1-p)なので簡単。
34 名前：１３２人目の素数さん mailto:sage [2013/04/24(水) 15:59:00.49 ]: Z(0,1)じゃなくてNorm(0,1)ね。

それとサンプルの平均と分散を求めてみてください。
X_i ~iid~ BIn(1,p)としたとき
E[X] = p
Var[X] = p(1-p)ですが
E[X_bar]とVar[X_bar]はどうなるでしょうか。
ヒント：X_bar = (X_1 + X_2+ ,,,,+X_n)/n
35 名前：１３２人目の素数さん mailto:sage [2013/04/26(金) 21:50:25.31 ]: 来月5/13に故田口玄一一周忌記念統計学シンポが、筑波大であるようです。
田口玄一博士一周忌シンポジウム-統計科学から見たタグチメソッドの現在・過去・未来-
【日時】２０１３年５月１３日（月）９：３０～１７：１０
【場所】筑波大学東京キャンパス
【主催】統計数理研究所サービス科学研究センター　他
【定員】 150名
noe.ism.ac.jp/service-center/2013/02/24/
36 名前：１３２人目の素数さん [2013/05/02(木) 07:18:22.40 ]: 文系なんだが大学文理移転してで統計学極められるかな？
37 名前：１３２人目の素数さん mailto:sage [2013/05/02(木) 12:24:55.42 ]: 能力次第
38 名前：１３２人目の素数さん mailto:sage [2013/05/02(木) 20:31:33.94 ]: >>36
ていうか、文系でも計量系はどっぷり統計学に漬かっているし、
その分野に固有の統計的問題に取り組んでいる。
文系理系は関係ないから、本人のやる気と能力次第。
39 名前：１３２人目の素数さん mailto:sage [2013/05/03(金) 09:42:25.95 ]: >>37-38
ありがと
希望持てたはW
40 名前：１３２人目の素数さん mailto:sage [2013/05/05(日) 06:40:40.59 ]: ベイズ統計学のおすすめの洋書ありましたら教えてくださいm（＿＿）m
41 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
42 名前：１３２人目の素数さん [2013/05/08(水) 14:56:13.69 ]: 仮説検定には帰無仮説と対立仮説がありますが、一般的にどちらの仮説がより重要なのでしょうか？
43 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
44 名前：１３２人目の素数さん mailto:sage [2013/05/08(水) 21:38:59.46 ]: それ尋ねてる時点で、定義が解ってない。
教科書はいつ読むの？今日でしょ。
45 名前：１３２人目の素数さん mailto:sage [2013/05/09(木) 19:48:24.85 ]: >>42
10円玉には裏と表がありますが、どちらがより10円なのでしょう？
と尋ねられたときと同じくらいインパクトのある質問だなw
46 名前：１３２人目の素数さん mailto:sage [2013/05/09(木) 20:24:39.46 ]: 裏に決まってるだろ
47 名前：１３２人目の素数さん [2013/05/09(木) 22:21:36.31 ]: 統計の分散分析ででてくる、
「対比」は、英語でなんと言いますか？
48 名前：１３２人目の素数さん mailto:sage [2013/05/09(木) 22:34:16.79 ]: contarst
49 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
50 名前：１３２人目の素数さん mailto:sage [2013/05/11(土) 10:46:33.42 ]: 最近やっと簡単な統計学の教科書を一冊終えました。（有名な東京大学出版の赤と灰色が基調の本です）
そしてもう一段上の教科書に手を出してみたのですが。。。
測度論？が難しくて理解できませんでした。そこで測度論のための教科書を当たってみたのですが
これも数学記号が難しい。どなたか数学に詳しい人がいたらどの分野の順序で測度論を勉強すれば良いか教えてもらえると幸いです。

集合論→測度論
で良いんでしょうか。
51 名前：１３２人目の素数さん mailto:sage [2013/05/11(土) 11:03:19.97 ]: 微積分は知ってるのか？
52 名前：１３２人目の素数さん mailto:sage [2013/05/11(土) 11:31:23.51 ]: 微積分、線形代数、ベクトル解析、偏微分常微分はしってますが計算ができるくらいで。
εデルタ論法や写像などの数学科ぽい事は解りません。群環体とか現代数学ぽいのも
勉強した経験はないです。適当にググった所によると

Real and Complex Analysis Rudin
『はじめての確率論測度から確率へ』佐藤担
講座数学の考え方 (20) 確率論　船木直久
が良いみたいですね。
53 名前：１３２人目の素数さん mailto:sage [2013/05/11(土) 21:57:38.78 ]: 測度論はεδ論法を使いまくるぞ
54 名前：１３２人目の素数さん mailto:sage [2013/05/12(日) 01:06:29.12 ]: マジですか。結局勉強す順番としては
集合論→解析学（？）→測度論
でいいのかな。
55 名前：１３２人目の素数さん mailto:sage [2013/05/12(日) 01:20:49.31 ]: 解析学を全部やると測度論を含んでしまうから
わからん言葉が出てきたら辞書みたいに調べる程度で良いが
εδ論法は良く理解する事
56 名前：１３２人目の素数さん mailto:sage [2013/05/13(月) 21:09:16.71 ]: 統計をまなび初めて日が浅いのです。よろしければ教えてください。
平均＝７０、標準偏差＝１０の正規分布に従った。このとき
・競争率が１０倍だったときの、合格最低点

という問題で、回答には正規分布表よりα（ｚ）＝０．４より、ｚ＝１．２９がわかるので～→合格最低点８３点と書いてあるのですが
０．４という数字や１．２９という数字が出てきた理由がわからないです。教えてください。
57 名前：１３２人目の素数さん mailto:sage [2013/05/13(月) 23:00:03.97 ]: 上位1割を合格とするときの最低点を求めよ
58 名前：１３２人目の素数さん mailto:sage [2013/05/14(火) 00:19:34.51 ]: 標準偏差でよくでるσについて質問ですがσ=68%、２σ=95%、3σ=99%をどう扱えばいいか分かりません。
例えば棒の長さのばらつきを調べたい場合、標準偏差を計算したらσが2.2とかになったらどういうことなんでしょうか。
59 名前：１３２人目の素数さん mailto:sage [2013/05/15(水) 03:44:18.20 ]: 仮に棒の長さの平均が5だとすると
棒の長さが5-2.2~5+2.2
つまり棒の長さが2.8~7.2にあるような棒の割合はおおよそ68%であるということ
また長さが5-2.2*2~5+2.2*2
つまり長さが0.6~9.4にあるのうな棒の割合はおおよそ95%であるということ
60 名前：１３２人目の素数さん mailto:sage [2013/05/18(土) 03:20:26.70 ]: >>18
f(x)=Γ(4,2)なのは X~expo(1/2)のとき、X~Γ(1,2)で4X ~ Γ(4,2)だから
という理解であってる？
61 名前：１３２人目の素数さん mailto:sage [2013/05/21(火) 20:00:07.01 ]: このニュース記事なのだが、同一大学・同一学部のデータを比較しないと意味がないと思う。

東大よ、その入試で大丈夫か
sankei.jp.msn.com/life/news/130520/edc13052011570000-n2.htm

ニュース内容は、推薦入試で入学すると所得が下がるという主張だが・・・。

学生数を確保するために推薦入試を多用する大学があり、
そういった所に入学すると所得が低くなるという結論でも良さそう。

同一大学内のデータで、推薦と一般入試で差が出るかは気になる。
62 名前：１３２人目の素数さん mailto:sage [2013/05/21(火) 20:08:05.32 ]: 統計的な手段で得た推論を発表する前に、

「原因と結果が入れ替わっているのではないか？？」

と考える事が重要だと思う。

「ローマ法王になると長生きできる」とかと同じ。
63 名前：１３２人目の素数さん mailto:sage [2013/05/21(火) 20:11:32.06 ]: 「分数のできない大学生」に対抗して、「統計のできない大学教授」のタイトルで誰か本を書いてくれ！！
64 名前：１３２人目の素数さん mailto:sage [2013/05/21(火) 20:46:36.51 ]: こっちにも同じニュースあり。
新聞社は、基本的に学者の出張は吟味せずに鵜呑みなのかね。

東大よ、その入試で大丈夫か？　“骨抜き受験”に見る所得格差…
headlines.yahoo.co.jp/hl?a=20130520-00000519-san-soci
65 名前：１３２人目の素数さん [2013/05/22(水) 17:47:04.74 ]: >>61

持論に都合の良いデータだけ出してそう
66 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
67 名前：１３２人目の素数さん mailto:sage [2013/05/28(火) 00:40:51.59 ]: >>61

>同一大学内のデータ

これを示さないのがダメだな。
68 名前：１３２人目の素数さん [2013/05/28(火) 21:47:25.45 ]: すいません

野球で四球、単打、二塁打、HRとあります（三塁打は無視します）
ここでそれぞれ単独での得点との相関係数を左から、0.3、0.3．0.55、0.63としたとき

①正の相関性が強い指標になるほど、得点が増えやすい・・・という表現は正しいか？
（規則正しく得点が増えやすい＝増える確率が高いという解釈でも可）

②仮に一番左の四球の相関係数がゼロだったとします
この時、四球と得点との関連性が見られないので得点に貢献してるとは言い難い、で合ってますか？
69 名前：１３２人目の素数さん mailto:sage [2013/05/28(火) 22:04:33.98 ]: ホームランと得点の相関が低いような指標でいいのか？
野球で得点に貢献するということの意味を考え直すべき
70 名前：１３２人目の素数さん mailto:sage [2013/05/28(火) 22:15:35.83 ]: >>68
1は合ってると思う
2はサンプル数が十分あれば言えると思う
71 名前：１３２人目の素数さん mailto:sage [2013/05/28(火) 22:18:36.11 ]: 四球の多い投手に対して待球作戦をとって勝った場合、四球は勝利得点に貢献するが
打たないので大量点にはならず他の試合で打ちまくってると統計ではチーム得点と逆相関になる
この場合、得点に貢献してないと言うか？
72 名前：68 [2013/05/28(火) 22:39:08.44 ]: うわぁ、返事が早くて感動ｗ

>>69
全部合わせてOPS（長打率＋出塁率）にすると、相関係数0.940くらいにはなります
（15年間くらいのNPBデータで）

>>70
ありがとうございます

>>71
勝敗は無視して、あくまで得点との相関だけです
膨大な試合数での話なんで、展開とかは無視してもいいような？
73 名前：68 [2013/05/28(火) 22:45:54.99 ]: もう一つ質問です

得点に関係した指標で、四死球、安打・長打・盗塁などさまざまなものがあります
それぞれ単体での相関係数（影響度）が出ますよね？

この場合、各指標の得点への貢献度を比較する時、まず相関係数の高いものと
指標ごとの個数の多少を尊重する・・・こういう考えで合ってますか？

いやね、とある掲示板で

「指標ごとの相関係数と貢献度なんか全く関係ない！
仮に四球と得点の相関がゼロでも平均得点÷平均四死球が大きければ貢献度は高い」
とおっしゃる方がいまして・・・

僕の考えは
「相関係数がゼロならそもそも影響力がないと見て、貢献度を判断する価値がない」
と思ってるんですが、どっちが合ってます？
74 名前：１３２人目の素数さん mailto:sage [2013/05/28(火) 23:17:53.07 ]: 得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

あなたの議論している指標が上の例に当てはまるかと言う
質問ならどちらとも言えない
75 名前：68 [2013/05/28(火) 23:29:54.52 ]: >>74
ありがとうございます

①＞得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

②＞得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

よろしければ、①と②についてそれぞれ理由を教えていただけたら嬉しいです
76 名前：１３２人目の素数さん mailto:sage [2013/05/29(水) 00:55:35.58 ]: 敢えて極端な例を挙げる
現実との折り合いは自分で考えて

打撃力に関係する指標と得点との相関が軒並み0.8くらいだったとする
一方、走力に関係する指標の相関は軒並み0.3くらいだったとする
打撃力に関係する指標をいくら組み合わせても相関は0.8から大して
伸びないだろうが、走力も考慮することで得点能力の説明可能性が
上がると期待できる

日時、試合場、打順等から一意な数字を作る
この数字と得点との相関は限りなく0に近いだろうが、
この数字を指定されれば各打席における得点を誤差0で説明できる
77 名前：１３２人目の素数さん mailto:sage [2013/05/29(水) 02:51:55.94 ]: 勝率への貢献度を無駄な得点への貢献度に摺り替えてるみたいだな
78 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
79 名前：１３２人目の素数さん mailto:sage [2013/05/30(木) 17:48:57.47 ]: 統計始めたばかりのバカからの質問です

「あるデータが◯◯分布に従う」という根拠は何ですか？
80 名前：１３２人目の素数さん mailto:sage [2013/05/30(木) 21:04:53.15 ]: とくにない
81 名前：１３２人目の素数さん mailto:sage [2013/05/30(木) 23:52:26.33 ]: 分布グラフを見て比べるくらいだな
82 名前：１３２人目の素数さん mailto:sage [2013/06/14(金) 18:25:35.31 ]: プロ野球のボールの反発係数は、0．4134～0．4374に収まるように
定められているが製造する際の目標値は下限の0.4134であった。
このときの不良率の推定値は？
83 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 14:55:18.67 ]: 標準偏差について質問です
σとはばらつき具合を数字で現すと聞いたんですが
何を基準にばらつきが大きいとか小さいを決めてるんですか？
84 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 17:31:17.29 ]: 例えば条件を変更した結果の比較とかはＦ検定を使う
85 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 18:07:38.69 ]: 平均±σの範囲に入るデータが68％ってどういう意味ですか？
例えば100個のデータがあるとして平均±σの範囲にデータが50％しか入ってなかったらばらついてる、とかそういう意味ですか？
86 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 22:00:01.74 ]: >>85
ばらつけばばらつくほどσは大きくなるんだが
87 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 22:46:26.30 ]: つまりばらつきが小さかろうが大きかろうが平均±σの範囲には必ず68％のデータがあるということですか？
88 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 23:14:19.00 ]: 正規分布していればな
89 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 23:31:36.05 ]: ありがとうございます。
だとすれば何を基準にばらつきがあるとかないとか言えばいいんですか？
計算してσを出して何をもって、何と比較してこのσは大きいからばらつきがある、とか言えるんでしょうか
90 名前：１３２人目の素数さん mailto:sage [2013/06/16(日) 23:50:11.23 ]: 100は大きいのか？小さいのか？
何を基準にそう判断するのか？
91 名前：１３２人目の素数さん mailto:sage [2013/06/17(月) 00:19:27.38 ]: >>89
ばらつきなんて相対的なもので、
比較するものがなければ、そもそも大きいとも小さいとも言えない。
だから「何を基準に」と言われても、
逆に「貴方の基準は何ですか？」と逆質問するしかない。
92 名前：１３２人目の素数さん mailto:sage [2013/06/17(月) 08:03:01.68 ]: >>82
1σ=0.4373-0.4134のとき約66%
2σ=0.4373-0.4134のとき約52%
3σ=0.4373-0.4134のとき約50%
93 名前：１３２人目の素数さん [2013/06/20(木) 23:52:41.91 ]: 統計学は破綻している学問だと前に聞いたことがあるんだが
本当なの？
94 名前：１３２人目の素数さん mailto:sage [2013/06/21(金) 00:32:10.58 ]: 何をもって破綻しているのか分からないけど
モデル選択をミスって理論と現実がかけ離れてしまうってのはよくあること
95 名前：１３２人目の素数さん mailto:sage [2013/06/21(金) 01:10:05.92 ]: デタラメ言って気を引こうとする奴はどこにでもいるな
常識で判断できる事だ
96 名前：１３２人目の素数さん mailto:sage [2013/06/21(金) 01:33:10.09 ]: ちょっと質問です。
2つの変数の値の分布がどんな感じになってるかを表す指標がほしいなと思って
wikipediaで相関係数のページ見てみたんだけど、ページ右上の画像を見ると分布が全然違うのに
相関係数が同じだったりして、あんまり良くないなと思いました。
分布における形やばらつきのような、分布の特徴を表す指標ってどういうのがいいんでしょう？
1つポンと数値がでなくても複数組み合わせでもいいんですが、何かありますか？
97 名前：１３２人目の素数さん mailto:sage [2013/06/21(金) 02:17:22.30 ]: 2次元分布見れば
98 名前：１３２人目の素数さん [2013/06/21(金) 02:28:26.82 ]: >>95
どういうこと？
99 名前：１３２人目の素数さん mailto:sage [2013/06/21(金) 09:03:10.50 ]: >>96
1変数の関数がどんな感じになってるかを表す指標と同じでいいよ
100 名前：１３２人目の素数さん mailto:sage [2013/06/26(水) 21:42:41.23 ]: >>89
>だとすれば何を基準にばらつきがあるとかないとか・・・・・・・・・・・・
工業製品の場合、ばらつきが大きい・小さいの基準は、その品質規格だ。
規格上下限範囲より大きければばらつき大・小さければばらつき小だよ。
101 名前：１３２人目の素数さん mailto:sage [2013/06/29(土) 11:28:51.92 ]: ジョエル・ベストのこのイカサマ統計警鐘新刊は、一読に価しますか？
前著「統計はこうしてウソをつく」よりも、秀作ですか？
「あやしい統計フィールドガイド―ニュースのウソの見抜き方」　Ｊ・ベスト　白揚社　2011.12
www.hakuyo-sha.co.jp/cgi-bin/search.cgi?mode=detail&id=401
102 名前：１３２人目の素数さん mailto:sage [2013/07/01(月) NY:AN:NY.AN ]: すみません、初学者ですが、例えばt検定の解説でt分布の山形のグラフが描かれて、有意水準5%ならこっからここまでの面積を足すと5%だからここに入ったら棄却ですねと説明されますが、
5%の線を引いたとき、ちょうどその線上にt値がきたときは、どうするのでしょうか？
稀だし、そんなきわどい値になるなら実験とかやり直した方がいいとは思うのですが、棄却域を求める計算の際に、t>=●●としてもt>●●としても、
tの確率密度は連続関数だから意味は同じであるといった解説もあり、はて線上の扱いはどうなるんだろうと気になったものですm(_ _)m
103 名前：１３２人目の素数さん mailto:sage [2013/07/02(火) NY:AN:NY.AN ]: 有意水準5%はどう決めたのか？
104 名前：１３２人目の素数さん [2013/07/03(水) NY:AN:NY.AN ]: スピアマンの順位相関を使って分析したのですが、事後分析として検定力を算出したいと思っています。
ピアソンrの場合と同様に計算してはいけない気がするのですが、どなたかご存知でしたら教えてください。
105 名前：１３２人目の素数さん mailto:sage [2013/07/03(水) NY:AN:NY.AN ]: >>104
ちょうとあなたと同じ質問をした人がいるよ。
ttp://www.stata.com/statalist/archive/2008-06/msg00652.html

で、参考になるかも知れない論文
ttp://biostat.georgiahealth.edu/Journal%20Club/bonett_wright_2000.pdf
106 名前：１３２人目の素数さん [2013/07/03(水) NY:AN:NY.AN ]: しっぽ確率ってそんなに便利かな
しっぽ確率使わないでゴリ押し計算で十分な気がしてきた
それともしっぽ確率使わないとヤバイような計算があるのかな
107 名前：１３２人目の素数さん [2013/07/03(水) NY:AN:NY.AN ]: >>105 ありがとうございます。
ただ、これはSTATAというソフトを使った解答かと思うのですが・・・
いったん読んでみます。
108 名前：１３２人目の素数さん mailto:sage [2013/07/03(水) NY:AN:NY.AN ]: きょうコレあやたんｷﾀ━━━━(ﾟ∀ﾟ)━━━━!!
109 名前：１３２人目の素数さん mailto:sage [2013/07/03(水) NY:AN:NY.AN ]: >>107
統計ソフトの種類とかが本質的な訳ではなく、
「事後に検出力の計算なんかしてんじゃねーよ、
だいたいSpearmanで分析する前にサンプルサイズはどうやって計算したんだ」
って質問者が怒られているのが問題の核心。
110 名前：１３２人目の素数さん [2013/07/04(木) NY:AN:NY.AN ]: >>109　
仰るとおりです。
ただ、もともとはピアソンrでやるつもりだったので。
パラメトリックの前提が確認できなかったためやむなくスピアマンにしたのです。
問題の核心よりも、できれば事後にスピアマンで検定力を出す方法を教えていただきたいです。
111 名前：１３２人目の素数さん mailto:sage [2013/07/08(月) NY:AN:NY.AN ]: 以下のようなことをしたいのですが、何か手法がないか分かる方はいないでしょうか。

いくつかの変数からなる100レコードや1000レコードのローデータを
複数のグループに可能な限り均等に分けたいです。

例えば男性70人、女性30人のデータがあったとして、これを5グループに分けたい場合、
各グループとも男性14人、女性6人の20人×5グループ。

さらにある変数の値がAの人が50、Bの人が50ならば男性女性の均等配分をなるべく維持したまま
各グループとも男性14人、女性6人、A10人、B10人の20人×5グループ。

ただし、当然ながらクロスを取れば男女とABの偏りがあるはずなので、
この例のようにぴったりな配分にはなりません。

均等配分したい変数は5つの時もあれば7つの時もあり、
分けたいグループ数も3の時もあれば6の時もあります。

全ての変数を完全に均等になるようにグループ分けすることは不可能でも、
各グループの総人数はきれいに分けて、その内訳の変数の値は
可能な限り均等に近い最適化された分類にしたいです。

色々調べたら層別ランダム化とか最小化法動的割付とか、そんな言葉が出てきて
それが近い結果を出せるのかという気がしたんですが。
SPSSで可能でしょうか？
112 名前：１３２人目の素数さん mailto:sage [2013/07/08(月) NY:AN:NY.AN ]: >>111
層別化無作為抽出で正解。
Rなら出来るけどSPSSはしらん
113 名前：１３２人目の素数さん mailto:sage [2013/07/11(木) NY:AN:NY.AN ]: >>112
Rですか、使ったことがないです。
コマンドラインで動くからちょっとこれだけやりたい、というには難しそうですね。
とりあえずRスレに行ってみます。
114 名前：１３２人目の素数さん [2013/07/12(金) NY:AN:NY.AN ]: 線形変換って何の為にあるの？
115 名前：１３２人目の素数さん [2013/07/13(土) NY:AN:NY.AN ]: 例えば平均μ,分散σ^2の正規分布から平均０、分散１の標準正規分布に変換するのだって
線型変換だし他にもいろいろ使い道あるんじゃない？多変数になってくると特に
嘘だったらごめんね☆
116 名前：１３２人目の素数さん mailto:sage [2013/07/16(火) NY:AN:NY.AN ]: 味噌汁の味見のように一事をもって万事を量るのが統計学の任務ですが、
世論調査などではちゃんとかき混ぜているのでしょうか？
117 名前：１３２人目の素数さん mailto:sage [2013/07/16(火) NY:AN:NY.AN ]: >>116
そんなものは調査デザインによる。
固有の調査名とその調査デザインが提示されない限り、
意味のない質問。
118 名前：１３２人目の素数さん mailto:sage [2013/07/17(水) NY:AN:NY.AN ]: 測度論を使ってないから分りやすい統計学の本っていうけど
測度論を使った統計学の本なんてみたことないんだけど
本当にあるの？
119 名前：１３２人目の素数さん [2013/07/17(水) NY:AN:NY.AN ]: 測度論そのものかは知らないけどLebesgue&#8211;Stieltjes integrationとかなら普通にあるんじゃね？
ただ理論そのものは俺も見たことはないなあ(^q^)ｵﾜｯ
120 名前：１３２人目の素数さん mailto:sage [2013/07/18(木) NY:AN:NY.AN ]: コルモゴロフ本は確率を測度で定義してたと思うが不満か？
121 名前：１３２人目の素数さん mailto:sage [2013/07/18(木) NY:AN:NY.AN ]: 確率論と統計学は違うだろ。
122 名前：１３２人目の素数さん mailto:sage [2013/07/18(木) NY:AN:NY.AN ]: >>119
マジかよ。その本教えろよ。
ルベーグステルチェス積分ってリーマンステルチェス積分とは違って
ルベーグ積分のステルチェス測度を使った積分だぞ？
123 名前：１３２人目の素数さん mailto:sage [2013/07/18(木) NY:AN:NY.AN ]: 7/4宵、NHK「クローズアップ現代」曰く、目下統計学ブームだとか。番組冒頭には、狩野裕
阪大教授の講義光景が出てきた。統計家に企業求人が引く手数多というのは本当なのか？
”統計学を使いこなす「データサイエンティスト」が、多くの企業から引く手あまたの状況・・・・・・・・・・”
クローズアップ現代　「数字のカラクリ・データの真実～統計学ブームのヒミツ～」
ゲスト：サイエンス作家…竹内薫，成蹊大学教授・統計学者…岩崎学　　キャスタ：国谷裕子
www.nhk.or.jp/gendai/yotei/#3375
124 名前：１３２人目の素数さん [2013/07/19(金) NY:AN:NY.AN ]: 最近ビッグデータビッグデータって喧しいけど
データ分析で使う統計学に何か本質的な違いあるんですか？
125 名前：１３２人目の素数さん mailto:sage [2013/07/19(金) NY:AN:NY.AN ]: IT屋のビジネスだよ。
おまけでログのテキスト分析が付いていてそっちは原則統計だね。
ただ学術的に怪しい式が結構混じってる。
126 名前：１３２人目の素数さん mailto:sage [2013/07/19(金) NY:AN:NY.AN ]: >>125
ビッグデータビッグデータと喧伝し始めたのは、IT企業でなく
マーケティング業界でなかったか？
SNS上やInternet上に溢れるカテゴリデータを、商売にどう使おうかと。
学術的に怪しい式というのは、何を求める式のことなの？
127 名前：１３２人目の素数さん mailto:sage [2013/07/21(日) NY:AN:NY.AN ]: 7/21NHK7時のニュースで臙脂色ワンピミニスカ江崎史恵アナが、国内宿泊旅行
統計棒グラフを指し示して、ここ10年で国民の国内宿泊旅行回数が年平均
1.5回から1.2回に漸減し続けており、その原因が斯く斯く然々と微笑みながら
説明していた。その棒グラフには、年代別折れ線グラフが重ね描きされた。
こういう統計って、誰がどのように採っておるのだろ？
Web検索すると、観光庁の「宿泊旅行統計調査」がhitしたんだが、調査対象が
旅館・ホテル事業者とあってニュースのとは違っていた。　　
128 名前：１３２人目の素数さん [2013/07/21(日) NY:AN:NY.AN ]: 旅行・観光消費動向調査
129 名前：１３２人目の素数さん [2013/07/23(火) NY:AN:NY.AN ]: 朝倉書店の「ロジスティック回帰分析―SASを利用した統計解析の実際」を読むと、プロファイル（変数の組み合わせパターン別の発生件数とか）を作ってから係数を最尤推定するとあります。
一方Rのglm関数ではプロファイルは作らず観測値からIRLSで係数を推定するとありますが、この２つの方法での推定値って一致するんでしょうか？
130 名前：１３２人目の素数さん mailto:sage [2013/07/23(火) NY:AN:NY.AN ]: 自分でやればわかるやろ
131 名前：１３２人目の素数さん [2013/07/23(火) NY:AN:NY.AN ]: ２、区間推定（分散）：地域経済
我が国の都道府県別納税者1人当たりの課税対象所得額（万円/人）は正規母集団N(μ、σ２)を呈することが予想されている。いま任意の10都道府県についてこの値を調査したところ下記の数値を得た
　199.4, 177.9, 190.8, 241.9, 246.8, 213.9, 224.4, 226.1, 184.0, 200.5
１）このとき、全国平均μが未知であるとして母分散σ２を信頼係数95%で推定せよ
２）また、全国平均μが207.2万円であるとして母分散σ２を信頼係数95%で推定せよ

お前らの力を見せてみろ
132 名前：１３２人目の素数さん mailto:sage [2013/07/23(火) NY:AN:NY.AN ]: ふと思ったんだけど、中央値の逐次更新（オンライン処理）ってどうやるんだろう？
平均値とか分散ならちょっと計算したら漸化式にできるけど
133 名前：１３２人目の素数さん mailto:sage [2013/07/23(火) NY:AN:NY.AN ]: 過去データ全部抱えていないと無理でね？
134 名前：１３２人目の素数さん mailto:sage [2013/07/23(火) NY:AN:NY.AN ]: 収束する前提なら適当に分散推定しながら
中央付近のビンだけ更新しとけばできそうだな
135 名前：１３２人目の素数さん [2013/07/23(火) NY:AN:NY.AN ]: ある企業の発売以降の月次売上数(金額ではない)が、基本、対数近似を描くようだが、そんなこと、一般的に証明する方法はありますか？
136 名前：あぼーん mailto:あぼーん [あぼーん]: あぼーん
137 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: >>131
なんだこのカス問は
>>136
ヤりたいですぅ！！
138 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: 対数近似を描くってなんぞ
139 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: １月から４月までの売上数があれば、一年先の売上数が、対数近似を使うことである程度予測で来る
140 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: >>135
>>139を過去のデータ使って確かめたらええやん
141 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: 過去データはエクセルで調べた
だいたい(９割程度)が対数近似のグラプに準ずる(一部累乗近似、線形も)

これって『統計学的に対数近似のグラフを描く』と言ってもいいのだろうか？
142 名前：１３２人目の素数さん mailto:sage [2013/07/24(水) NY:AN:NY.AN ]: 対数近似って対数とると線形になるってことかな
143 名前：１３２人目の素数さん [2013/07/24(水) NY:AN:NY.AN ]: y = a × ln(x) ＋ b
かな
144 名前：１３２人目の素数さん [2013/07/27(土) NY:AN:NY.AN ]: 誰かいますか？
145 名前：１３２人目の素数さん [2013/07/27(土) NY:AN:NY.AN ]: >>141
予測区間の決定係数がその位なら問題ないだろ
146 名前：１３２人目の素数さん [2013/07/28(日) NY:AN:NY.AN ]: >>145
ありがとう！
147 名前：１３２人目の素数さん [2013/07/29(月) NY:AN:NY.AN ]: 2つの母平均の差の検定で分散未知ですがｎ＞30以上ならば、σの代わりに普遍分散で代用してZ検定するのと、等分散でなかった場合に用いるウェルチの検定の式は同じでしょうか？

Ｚ＝XbarA-XbarB/√SA2/ｎA+SB2/ｎB　　→SA2はＡの不偏分散です

そうすると、大標本であった場合は、先に等分散の検定をしなくてもこの公式に当てはめて計算してもかまわないのでしょうか？
148 名前：１３２人目の素数さん [2013/07/31(水) NY:AN:NY.AN ]: χ二乗検定の際に各セルの値が小さいとき連続修正を行う
とありますが、セルの期待度数が小さいとモデルへの当てはまりが悪いためであり
この修正によってモデルへの当てまりがよくなると言うことでした。
なぜ当てはまりがよくなるんですか？
統計素人なんでもしかすると超絶基本を聞いているかもと恐れながらも質問してしまいます。
どなたかよろしくお願いします
149 名前：１３２人目の素数さん mailto:sage [2013/08/01(木) NY:AN:NY.AN ]: 一般論としてサンプル数が小さいとばらつきが大きい
つまり、たまたま外れる確率が高くなるということ

さらにサンプル数が小さいと分解能が悪いから精度が下がり易い
期待度数が0.5回なら観測頻度が0回でも1回でも誤差50%
150 名前：１３２人目の素数さん mailto:sage [2013/08/22(木) NY:AN:NY.AN ]: 些細な名称とかに拘らず独自の統計学をとれば良いと思うんだよね
習った知識ばかりじゃカチンコチン過ぎて統計学止まりだね
統計で思考停止したいなら良いけど
151 名前：１３２人目の素数さん mailto:sage [2013/08/23(金) NY:AN:NY.AN ]: >>149
>さらにサンプル数が小さいと分解能が悪いから精度が下がり易い・・・・・・・・・・・・
サンプル数ってサンプルサイズ？分解能が悪いって、使用計測器の
性能問題？何が言いたいの？いったい何番の質疑へのレスなの？
152 名前：１３２人目の素数さん mailto:sage [2013/08/24(土) NY:AN:NY.AN ]: 8/24NHK朝7時のニュースで鮭肉色膝上丈ワンピスカ江崎史恵アナが、国民の
スポーツ習慣統計調査の年代別頻度結果を円グラフ・帯グラフを使って
紹介していた。国が、国民3000人に訊ねて1800余人から有効回答の結果とも。
この手のアンケート調査の抜取標本数は、どういう計算式で決めているのだろ？
153 名前：１３２人目の素数さん mailto:sage [2013/08/26(月) NY:AN:NY.AN ]: ある無限集団のサンプルとしてなら3000で十分だと思うが、その調査で3000は意味が無いな。

おそらくは、老若男女、収入や労働環境、地域性や病気の有無、季節性その他で、
スポーツ習慣は違ったものになってしまうだろうからな。

そしたものを全部一緒にして年代だけ分けてドヤ顔するのは偏向報道のチョンNHKらしいな。
154 名前：カナリア [2013/08/26(月) NY:AN:NY.AN ]: 質問させてください！
正規分布していないデータ（単純反応時間など）と正規分布しているデータ（IQなど）の相関を出そうとした場合、ピアソン積率相関係数ではだめですよね？？？
でも結構それで論文でてたりするんですが、いかがなものですか？
厳密にいうとだめってレベルなのでしょうか？
教えてくださーい
155 名前：１３２人目の素数さん mailto:sage [2013/08/27(火) NY:AN:NY.AN ]: >>153
無限集団というのは、幾つ以上をいうのですか？スポーツ習慣統計
調査>>152の場合、母集団は10代以上の日本国民ですから１億人以上
ですが、１億人では有限集団ということですね？
なお調査機関は、NHKでなく国と江崎史恵アナは云っておりました。
156 名前：１３２人目の素数さん mailto:sage [2013/08/28(水) NY:AN:NY.AN ]: 統計学って全てのサンプルを調べられて
パソコンで計算可能なら確率論でしかないですよね？
157 名前：１３２人目の素数さん mailto:sage [2013/08/28(水) NY:AN:NY.AN ]: >>156
それのどこに確率的な要素があるの？
158 名前：１３２人目の素数さん mailto:sage [2013/08/28(水) NY:AN:NY.AN ]: 平均値、標準偏差ね。
つまりヒストグラム＝確率分布となるわけだよね。
159 名前：pH7.74 mailto:sage [2013/08/29(木) NY:AN:NY.AN ]: SPSSによるロジスティック回帰の出力について質問失礼します(SPSS&元データ非所持)
(例) 応答変数：発病するか否か、説明変数：体重(量的変数)、場所(質的変数)
　　　　　　　B 　　標準誤差　　Wald　　自由度　…
体重　　　.087　　　　0.44　　　3.858　　　　1
場所　　　　　　　　　　　　　　　14.294　　　2
場所(1)　1.435　　　.461　　　　9.687　　　1
…
場所のWaldの欄にある統計量は一体何でどのように算出されたものなのか、教えていただけますと幸いです
160 名前：１３２人目の素数さん mailto:sage [2013/08/29(木) NY:AN:NY.AN ]: >>159
「Wald検定量　ロジスティック回帰」で検索してはいかがでしょうか。
算出方法など詳しい解説がすぐに見つかると思います。
161 名前：１３２人目の素数さん mailto:sage [2013/09/01(日) 23:20:52.89 ]: あんまり数学がわかっていない人間ですが、質問させてください。
ある、時系列データがあり、過去の変動が次の変動にどのような影響を与えるか推測する方法はどんなものが基本でしょうか？
よろしくお願いいたします。
162 名前：１３２人目の素数さん [2013/09/01(日) 23:40:01.31 ]: ノバルティスの問題も、つまるところ当該の医学者に統計学の素養がないことが発端だろ？
迷惑だから、統計学勉強しないで税金使って論文書くの本当にやめて欲しい。
学問として論文を書くのであれば、測度論とまでは言わないが、統計学の前提となる確率論、確率論の前提となる積分ぐらい勉強すべき。これ、語学とおなじくらい重要と思うのだが。
163 名前：１３２人目の素数さん mailto:sage [2013/09/01(日) 23:40:16.75 ]: 自己回帰モデル
164 名前：１３２人目の素数さん mailto:sage [2013/09/02(月) 01:12:02.14 ]: >>161
自己相関
165 名前：159 mailto:sage [2013/09/02(月) 11:41:26.81 ]: >>160
返信遅れまして申し訳ございません、少し説明不足でした

体重や場所(1)のWaldに関しては、傾きや切片の推定値がゼロと
異なっているかを推定するためのWald統計量ということで理解できるのですが、
場所のWald欄にある統計量が一体何なのかが解らず困っております
私自身は解析にRを用いているのですが、その場合カテゴリカル変数一つに対して一つの
Wald統計量が算出されるため、上記のような統計量と遭遇したことがなく、どなたか教えていただけますと助かります
166 名前：159 mailto:sage [2013/09/02(月) 15:10:19.98 ]: >>159下から2行目訂正失礼します
カテゴリカル変数一つに対して一つの　＞　カテゴリカル変数の各水準に対して各一つずつの
167 名前：１３２人目の素数さん mailto:sage [2013/09/03(火) 15:24:35.67 ]: >>165-166
自己解決しました
Wald統計量は自由度2以上でも普通に算出できるのですね、失礼しました
168 名前：１３２人目の素数さん [2013/09/06(金) 18:54:39.01 ]: ときお
まどりっど
イスタンプール
169 名前：カナリア [2013/09/08(日) 17:23:02.99 ]: グラフにエラーバー（SD）をつけました。
縦軸に正答率をとると、80~90程度の平均値ですので、エラーバーが100を超えます。
個人的には100でとめたいのですが、だめっていう意見もあります。
皆さんの意見をお聞かせください。
170 名前：１３２人目の素数さん [2013/09/22(日) 16:02:21.69 ]: DCC-GARCHについて勉強したいのですが、日本語で詳しく説明されている論文、テキストなど教えてください。
171 名前：１３２人目の素数さん mailto:sage [2013/09/22(日) 16:32:33.61 ]: 日本語あてにしてたらアカンやろ
172 名前：１３２人目の素数さん mailto:sage [2013/09/23(月) 00:46:34.67 ]: すいません初学者なのですが、２つの水準の平均値差を検定する場合に、t検定を行った場合と、分散分析を行った場合では、意味合いは違うと理解してよろしいのでしょうか？（教科書では分散分析は３群以上比較する場合に使うと書いてありますがあえて2群でやった場合です）
t検定のtと、分散分析のFは、計算式も違いますし分布の形状も違いますが、いくつかのサンプルデータで統計ソフトをつかって計算したところ、t検定でも分散分析でも有意確率が同じ値になりました。これはたまたまでしょうか？
173 名前：１３２人目の素数さん mailto:sage [2013/09/23(月) 10:25:13.75 ]: 現実的な最低点は、max(0,70-3.5*10)
174 名前：１３２人目の素数さん mailto:sage [2013/09/26(木) 00:59:32.90 ]: おまえら
シグマっていったら。

やっぱり
σ　の方か？
175 名前：１３２人目の素数さん mailto:sage [2013/09/27(金) 22:32:18.33 ]: 大文字小文字両方
176 名前：１３２人目の素数さん mailto:sage [2013/09/27(金) 22:37:19.24 ]: ttp://www.bun-eido.co.jp/publish/high/series/sigma_bq.html
177 名前：１３２人目の素数さん mailto:sage [2013/09/28(土) 00:26:45.06 ]: 統計学に必要な数学の知識ってなに？

微積分と線形代数学分かってればいいの？
178 名前：１３２人目の素数さん mailto:sage [2013/09/28(土) 03:13:21.26 ]: 大学1年レベルの微積と線形代数わかってるとかなり便利
もちろんもっと高度な知識も必要な場合もあるけど目的次第かな
179 名前：１３２人目の素数さん [2013/09/28(土) 03:36:38.64 ]: >>178
ありがとう
こちとら文系で数2Bしかやってないもんだから
今から小島寛之の微積分と線形代数やろうかなぁと思いまして
本当はチャートとか高校生が使うようなもので勉強した方がいいのかな？
180 名前：１３２人目の素数さん mailto:sage [2013/09/28(土) 03:48:33.82 ]: >>179
高校数学はIIICまではある程度理解しておいたほうがいいのは確か
でもチャートとかは量が多すぎるからなぁ…
IIBやってたなら小島寛之の本にもついていけるかも
181 名前：１３２人目の素数さん mailto:sage [2013/09/28(土) 10:15:04.78 ]: >>177
そんなあなたにマセマ
182 名前：１３２人目の素数さん [2013/09/28(土) 17:39:01.41 ]: 　
統計学って数学じゃないだろコレ
183 名前：１３２人目の素数さん [2013/09/28(土) 18:54:23.30 ]: 「プログラミングのための確率統計」（オーム社）これ、近年まれにみる良書。
タイトルからのイメージとは全く異なり、プログラム技法は何も記されていない。
しかし、初学者に確率統計のかんどころを理解させようとする著者の工夫と執念を感じる。
184 名前：１３２人目の素数さん mailto:sage [2013/09/28(土) 20:52:19.06 ]: >>182
統計学は数学じゃなく算数だね　経験則
185 名前：１３２人目の素数さん mailto:sage [2013/09/29(日) 05:19:32.19 ]: 吉田朋広の数理統計学ぐらいだと普通に数学と思うけどなぁ
186 名前：１３２人目の素数さん mailto:sage [2013/09/29(日) 19:23:38.93 ]: 統計学は数学を使う
187 名前：１３２人目の素数さん mailto:sage [2013/09/29(日) 20:14:45.15 ]: 応用算数でしょ普通の統計学は
188 名前：１３２人目の素数さん mailto:sage [2013/10/01(火) 01:25:11.85 ]: 算数レベルで公式が出せるか
189 名前：１３２人目の素数さん mailto:sage [2013/10/01(火) 01:57:19.89 ]: 算数レベルの統計しか知らないってことか
190 名前：１３２人目の素数さん mailto:sage [2013/10/01(火) 04:21:56.72 ]: 標本数の少ない2項分布の母集団の差の検定ってどうやればいい？
標本数少ないから正規近似が出来ないのだけど。
191 名前：１３２人目の素数さん mailto:sage [2013/10/01(火) 07:55:34.87 ]: >>190
マクネマー検定でいいんじゃない。
192 名前：１３２人目の素数さん [2013/10/02(水) 00:24:59.73 ]: 　
古典統計学⊂ベイズ統計学　だよね？
193 名前：１３２人目の素数さん [2013/10/02(水) 13:16:11.78 ]: 東京大学教養学部統計学教室編『基礎統計学』(全3巻)はどうですか？
194 名前：１３２人目の素数さん mailto:sage [2013/10/02(水) 23:23:36.53 ]: >>193
全部買って読んだけど、独学するには解説が足りない気がするが、ネットで調べながらならOKだと思う
個人的には第２巻いらんかった。
195 名前：１３２人目の素数さん mailto:sage [2013/10/03(木) 10:43:02.09 ]: 全三巻じゃないし・・・・
バラバラに買うやつだろ。
196 名前：１３２人目の素数さん mailto:sage [2013/10/11(金) 13:15:08.34 ]: ポアソン分布とかガンマ分布とか出てくるけど、あれも算数？
197 名前：１３２人目の素数さん [2013/10/11(金) 15:32:38.62 ]: 学校の課題で会計士への連絡内容書くやつあるんだけどどうな風に書けばいいの？
ぐぐっても分からないので教えてください

例題
会計士にアイスの平均販売個数の値を連絡する
198 名前：１３２人目の素数さん mailto:sage [2013/10/11(金) 17:01:30.33 ]: >>197
１０月１１日　今日は暑かったのでアイス100個売れました。
199 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 19:52:25.56 ]: kohada.2ch.net/test/read.cgi/part/1355033626/574

偏差値の部分、勢いで書いちまったんだけど、間違ってないよな？
200 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 20:45:28.23 ]: 偏差値50=平均値ってこと？あってるよ
201 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 21:39:14.58 ]: だよな？
偏差値50は平均だから、偏差値50レベルの大学には半分が受かるってことでいいんだよな？
202 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 22:07:16.12 ]: 分布に偏りがある場合は偏差値50でも半分受からないことはあるぞ
203 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 22:17:47.12 ]: 平均と中央値は違うからね
204 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 22:19:59.01 ]: >>199
そのスレの581の方が正しいな
対称正規分布とかいう言い方は意味わからんけど
205 名前：１３２人目の素数さん mailto:sage [2013/10/12(土) 22:43:27.86 ]: 対称でさえあれば正規分布である必要はないけどな
206 名前：１３２人目の素数さん mailto:sage [2013/10/13(日) 16:00:01.08 ]: 偏差値は母集団が正規分布に近いときに有効だからかな
変な分布なら偏差値を使う意味が薄れる
207 名前：１３２人目の素数さん mailto:sage [2013/10/13(日) 18:16:36.27 ]: 最近の学力の分布は二極化が激しいからなあ
偏差値50で等分できるかは怪しいぞ
208 名前：１３２人目の素数さん mailto:sage [2013/10/13(日) 18:27:16.35 ]: ？？？
209 名前：１３２人目の素数さん mailto:sage [2013/10/16(水) 09:23:56.28 ]: ebsa.ism.ac.jp/
統計学の絶版の本が無料で沢山読める
ホームページ見つけたよ。
お礼はいいからね。
210 名前：１３２人目の素数さん mailto:sage [2013/10/16(水) 09:34:53.46 ]: danke
211 名前：１３２人目の素数さん [2013/10/16(水) 12:52:45.86 ]: なにこれめっちゃいいじゃん
212 名前：１３２人目の素数さん mailto:sag [2013/10/18(金) 00:04:58.09 ]: 「古典統計学⊂ベイズ統計学」ということでいいの？
213 名前：１３２人目の素数さん mailto:sage [2013/10/18(金) 02:20:44.56 ]: いいわけないだろ、あほか
214 名前：１３２人目の素数さん mailto:sage [2013/10/18(金) 23:18:06.31 ]: それじゃイコールってこと？
215 名前：１３２人目の素数さん mailto:sage [2013/10/18(金) 23:26:31.82 ]: ナイーブな質問なのか、はたまた・・・
216 名前：１３２人目の素数さん mailto:sage [2013/10/18(金) 23:32:32.52 ]: 統計学初心者です。両者の本質的な関係が知りたいです。
217 名前：１３２人目の素数さん mailto:sage [2013/10/18(金) 23:38:38.30 ]: 古典統計学、ベイズ統計学も勉強したことがない初心者が本質を知りたいとな
218 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 00:55:07.95 ]: 初心者でも本質は知りたいだろ
219 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 00:56:03.04 ]: いや、多少はかじっていますよ　統計物理とかも
220 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 06:17:54.31 ]: 統計力学てなんですかてとうしろうに聞かれたら答えられる？
221 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 06:36:59.48 ]: >>218
おまえが答えろよ
222 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 08:57:18.17 ]: ソーバーの「科学と証拠」とか読めばいいんじゃね
223 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 10:09:59.34 ]: いい本紹介してもらった　ありがとう
224 名前：１３２人目の素数さん mailto:sage [2013/10/19(土) 21:58:29.62 ]: >>221
あほ？
225 名前：１３２人目の素数さん mailto:sage [2013/10/20(日) 07:06:19.89 ]: >>224
おはよう、アホ
226 名前：１３２人目の素数さん mailto:sage [2013/10/20(日) 11:15:00.69 ]: >>224 >>225
邪魔だ
227 名前：１３２人目の素数さん [2013/10/22(火) 09:47:13.46 ]: 教えてください。

ある仮説H0を検定する統計量としてT1とT2があり、T1は通常のカイ２乗分布、
T2はカイ２乗変数の加重和で表される非標準的な分布に従っているとします。
このとき、T1とT2の検出力を理論的に比較することは可能でしょうか？
シミュレーションだと簡単なのですが。。。
228 名前：１３２人目の素数さん mailto:sage [2013/10/23(水) 19:09:29.26 ]: 宅建試験の統計データなんだけど、
こういう過去のデータとの相関関係とか信頼性？推定？とかって統計学でちゃんと出るのかな？
数学にぜんぜん疎いんだけど、よかったら教えてください

平成19年：LECサンプル数1499名、平均34.4点。合格点35点。
平成20年：LECサンプル数2023名、平均33.2点。合格点33点。
平成21年：LECサンプル数1719名、平均33.8点。合格点33点。
平成22年：LECサンプル数2038名、平均36.3点。合格点36点。
平成23年：LECサンプル数2162名、平均35.7点。合格点36点。
平成24年：LECサンプル数2362名、平均33.2点。合格点33点。

平成20年：U-CAN平均29.8点　合格点33点
平成21年：U-CAN平均30.4点　合格点33点
平成22年：U-CAN平均32.1点　合格点36点
平成23年：U-CAN平均33.05点合格点36点
平成24年：U-CAN平均29.77点合格点33点
229 名前：２２８ mailto:sage [2013/10/23(水) 19:10:23.31 ]: えっと、つまり、こういう予備校のサンプル数から、
今年の合格点の推定をどの程度の信頼度で出せるのかってことですが
230 名前：１３２人目の素数さん mailto:sage [2013/10/23(水) 23:27:46.50 ]: このデータ数だとサンプル数で重みつけて回帰するくらいかな
予備校の中の人なら分散も分かるだろうからもう少しましだろうけど
231 名前：１３２人目の素数さん mailto:sage [2013/10/24(木) 22:52:52.13 ]: マンガでわかる統計学、結構面白かったでござる
オオカミと羊の方じゃなくて、女子高生の奴ね。
232 名前：１３２人目の素数さん mailto:sage [2013/10/25(金) 10:18:43.92 ]: 新世社の「入門統計解析」って本があったからやってみるわ。
233 名前：１３２人目の素数さん [2013/10/28(月) 07:47:46.58 ]: 　
結局「古典統計学⊂ベイズ統計学」ということでいいんだよね？
234 名前：１３２人目の素数さん [2013/10/28(月) 10:39:17.11 ]: excelで散布図に２本の回帰直線を描く方法教えてくれ
235 名前：１３２人目の素数さん mailto:sage [2013/10/28(月) 12:37:04.85 ]: ２本の回帰直線て何？
主軸の事か？
236 名前：１３２人目の素数さん [2013/10/28(月) 19:46:13.53 ]: 統計学なのかも良く分からないのですが分かったら教えて下さい。
サッカーのパスが成功する確率の平均が3/4のチームと4/5のチームが
対戦したとするとボールのポゼッション割合は数学的にはどうなりますか？
料チームの他の体力とかの条件は同じで無視すると考えて下さい。
237 名前：１３２人目の素数さん mailto:sage [2013/10/28(月) 22:56:06.28 ]: パスの平均連続成功回数は1/(1-p)になるので
お互い10秒に一回パスするというような状況を考えれば
支配率は4:5に収束するような気がする
238 名前：１３２人目の素数さん mailto:sage [2013/10/28(月) 23:09:09.42 ]: P[n+1]=0.75P[n]+0.2Q[n]、Q[n+1]=0.25P[n]+0.8Q[n]
(P[n],Q[n])→(4/9,5/9)　（n→∞)
239 名前：１３２人目の素数さん [2013/10/29(火) 04:56:27.03 ]: 236です。
ありがとうございました。
意外に差が出ないんですね。自分としては差が拡がるものと推測してました。
これなら少し確率は落ちてもより効果的であろうパスを出す方が得点には
結び付き易いように思えますね。
240 名前：１３２人目の素数さん mailto:sage [2013/10/30(水) 03:19:28.64 ]: 統計学を独学でやろうと思ってるんですが文系でまったく数学が出来ません
そこで中高の数学からやり直そうと思ってるんですがその場合どの単元をやり直す
必要がありますか？
241 名前：１３２人目の素数さん mailto:sage [2013/10/30(水) 10:08:56.85 ]: 数と式・場合の数・確率・微積分
このへんかな
242 名前：１３２人目の素数さん mailto:sage [2013/10/30(水) 13:50:35.04 ]: 詳しくありがとうございました。
また中学数学から再勉強します。
243 名前：１３２人目の素数さん [2013/10/30(水) 23:32:04.36 ]: 12種類のビールについて、下表にある、
消費者の知覚による評価値を得た。
「高価格/低価格」は数値が正符号が大きいほど、
高価格であると知覚され、負で大きい値ほど、
低価格であると知覚された事を示している。
「のどごし/コク,キレ」では、正値がコクであることを意味し、
負値がキレを意味する。得点は-10点から10点の間で評価され、0点はどちらでもない事を意味する。
ここから、プロダクトマップを作成して、解釈せよ。

製品高価格/低価格のどごし(コク/キレ)
A -6.5 5
B 8 8.6
C 2.3 8.5
D 9 8
E -5.7 -6.1
F -3.1 -2.6
G -9 -9
H 8 -9
I -7.2 9
J 6.7 -9.1
K -8.2 1.2
L -8.6 0.5
何とかやっと表はできたんですが、誰かこれ、解釈してくれませんか??

高価格なビールにはコクがある。
だと短すぎますし。
imepic.jp/20131029/837490
244 名前：１３２人目の素数さん mailto:sage [2013/10/31(木) 02:07:01.33 ]: せんせえおながいしまつ。

ワイブルプロットによる寿命予測で、実測データから不信頼度 F(t) を求める際メジアンランク法 F(t)=(i-0.3)/(N+0.4) を使いますが、式の根拠が良くわかりません。
総数N個のサンプルでi番目の不良の発生確率と不信頼度の関係がベータ分布に従う事から、発生確率50%(中央値)とした際の不信頼度(=不良率)を求める近似式、というところまでは分かった？のですが、、、

実測データとして得られる統計量は、例えば「たまたま最初の不良が起きた時刻」であるのに対して、モデルは「発生確率50%、つまり時刻はばらつきの中央値」という前提で計算するのは問題無いんでしょうか？
何か勘違いしている？
245 名前：１３２人目の素数さん mailto:sage [2013/10/31(木) 02:56:09.05 ]: 100本のクジがあり当りが1本あります。　1本引いては戻す形で100回引きます。
100回引いてるさいに当たりが出たら、再度100回引けます。　100回引いて当りが出なかったら終了

というときに、クジを引ける平均回数はどのように求めればよいのでしょうか。

板違いだったら、申し訳ないですが、どなたかご存知の方いましたらよろしくお願いします。
246 名前：１３２人目の素数さん mailto:sage [2013/10/31(木) 08:02:09.05 ]: 仮説検定ってあるじゃないですか。
あれって凄く仮説が違っているとき以外、
仮説が違ってても仮設が正しいになりますよね。
どういう風に役立つんですか？
247 名前：１３２人目の素数さん [2013/10/31(木) 16:12:04.31 ]: 　
で、「古典統計学⊂ベイズ統計学」ということでいいんだよね？
248 名前：１３２人目の素数さん [2013/10/31(木) 18:49:48.11 ]: >>243を誰か
249 名前：１３２人目の素数さん [2013/11/01(金) 20:55:26.43 ]: >>147
大標本・小標本と書いて、続けてその境界数を付記した教科書を見たことが
ないんだが、３０が境界数なのですか？
それとも場合場合で、具体数が変動するから付記しないのですか？
250 名前：１３２人目の素数さん [2013/11/02(土) 05:16:05.67 ]: >>248
どうせ学校の課題かなんかだろうけど、とりあえず、オーム社の漫画でも買って読んでみたら？
プロット見ても、相関係数が0.07589016を見ても、
「高価格なビールにはコクがある」なんて言えないことくらい分かるだろ。
あと、データは解析しやすいように書いてくれないと、Rを回すにも面倒だから。
251 名前：１３２人目の素数さん [2013/11/02(土) 17:16:46.76 ]: 検定統計量って簡単に求められますか？

無相関検定とか等平均仮説の検定(母分散既知・未知とかで5種類くらいある？)の統計量とか覚えられそうにありません...

ちなみに理系大学生で高校数学、大学教養レベルの数学は分かります
252 名前：１３２人目の素数さん [2013/11/02(土) 17:21:47.37 ]: 種牡馬データはサンプルが少ない方が、傾向を掴む上では役に立つことが多い」と発言したことを
取り上げて叩いている人が少なからずいて、統計学を知らないのか、などという声もあるようだ。

そりゃ私は無知ですから統計学なんて知らないですよ。でも競馬予想に統計学まで持ちだす必要はない。
それこそ、サンプルが溜まれば同じような傾向に収束してしまって、面白いデータにはなりえないし、
そもそもみんなが気付いていることには金脈がない。　

私があんなことを言ったのは、サンプルが少なくて、ハッキリした傾向が出ているということは、
極めて短いスパンで「乗れる」ケースが多いからだ。例えばスニッツェルのそれだったり、
ローエングリンのそれだったり、アドマイヤドンのそれだったりするわけで、
少ないサンプルから近未来に振れていく方向を想定する面白みがあるのだ。
統計がどうとかいうのとは、全く違う見地から言っているので、そこを理解する気がないなら無視していただきたい。
253 名前：１３２人目の素数さん mailto:sage [2013/11/02(土) 17:23:11.15 ]: >>249
ggrks
254 名前：１３２人目の素数さん [2013/11/02(土) 18:28:30.02 ]: どうでもいいけど、ベイズ統計の話題にみんなダンマリなのはどうして？
255 名前：１３２人目の素数さん mailto:sage [2013/11/03(日) 00:20:13.49 ]: じゃあおまえが語れよ
256 名前：１３２人目の素数さん [2013/11/03(日) 23:07:07.64 ]: ベイズ統計への偏見持ってるヤシ多過ぎｗ
257 名前：１３２人目の素数さん [2013/11/03(日) 23:33:40.25 ]: 金融工学についてのブログ記事を書いたところ、謎理論を唱える変な奴に粘着されました。
お手数ですが、もしよければこのブログのコメント欄で、どちらの言い分が統計学的に正しいかジャッジをお願いします。
s.ameblo.jp/anti-index/comment-11625847545/
258 名前：１３２人目の素数さん [2013/11/10(日) 11:05:08.12 ]: 初歩的な質問ですが…
同じ被験者の中で色々条件を変えたときにはどういう検定をすればいいんでしょうか

例えば、立ってるとき、座っているとき、寝ているとき、うつ伏せているときの声の大きさや声を出していられる時間の長さなどを30人くらいで測定して検定したいときです
259 名前：１３２人目の素数さん mailto:sage [2013/11/11(月) 00:51:33.96 ]: >>258
分散分析、対応あり、被験者内で検索
260 名前：１３２人目の素数さん [2013/11/11(月) 01:13:25.09 ]: >>259
ありがとう
むちゃくちゃ初歩的なとこでしたね…
261 名前：１３２人目の素数さん [2013/11/11(月) 12:37:22.25 ]: とても単純なことなのですが、
自分で考えてもどうしても分からないので
質問させていただきます。

質問票にいくつか質問があり、
答えが「はい」と「いいえ」の選択肢しかない場合、
質問の数から答えの組み合わせの数を導き出すには
どのような方法がありますか。

よろしくお願いします。
262 名前：１３２人目の素数さん mailto:sage [2013/11/11(月) 12:58:31.75 ]: 2^質問数かな。
263 名前：１３２人目の素数さん [2013/11/11(月) 13:12:02.31 ]: >262さん

「^」の正体は分かりませんが、
Excelに計算式を入れたらそれっぽい答えが出ました。
それほどとてつもない答えの組み合わせ数にはならないようで
ホッとしています。

これで仕事を軌道に乗せて進められそうです。
ありがとうございました。
264 名前：１３２人目の素数さん [2013/11/11(月) 13:20:09.11 ]: と思ったら、
質問数7までは「2^7=49」でまだ現実味のある数字でしたが、
質問が8つに増えると一気に「2^8=256」で
実務としては無茶な数字になるんですね。

質問数は何としても7までに抑えたいと思います。
265 名前：１３２人目の素数さん mailto:sage [2013/11/11(月) 13:55:57.71 ]: ^はべき乗です。2^3 = 2 x 2 x 2 = 8です。
質問数が1増えたら２倍ずつ増えていくということです。
266 名前：１３２人目の素数さん [2013/11/11(月) 14:13:08.46 ]: >>265　さん

ご親切な回答ありがとうございます。

それで気づいたのですが、
先ほどの「2^7=49」は間違いでしたね。
と言うのもExcelに入力するのに2と7が入れ替わっても
答えは変わらないだろうと思い、
「=7^2」と入力していたからです。
「=2^7」で入力し直したら答えは128になり、
これで進めると私は正気を失うところでした。

質問数は何とか6つに抑え、
2^6=64の回答数で企画を進めたいと思います。
危ないところでした。
267 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 00:53:16.38 ]: 何か根本的な思い違いをしている気がしてならない。
回答の組み合わせ総数を何に使うんだろう？
268 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 08:51:47.27 ]: Yes・Noの質問を６つ作るのではなく、質問は一つで選択肢を64個設けるに決まってんだろ言わせんな

え？
269 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 17:55:03.78 ]: データベース上からある人と似たデータを持つ人を選び出す方法があって
・一人あたり10種類のデータ(長さや角度)がある
・データベースには、50人分のデータがある
この時以下の式で求めた値がデータベース上で一番小さな人を選び出されます．

10
Σ{(Di-di)^2/σi^2}
i=1

Di(i=1~10)はデータベースの人の値，di(i=1~10)が調べたい人の値です．

この時分散で割っているのはどういう意味なんでしょうか？
10種類のデータそれぞれの重みを合わせているってことですか？
270 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 19:34:44.00 ]: そうだと思いますよ。
偏差値求めるときって標準偏差で割るので
偏差値に統一してるんじゃないでしょうか。
271 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 19:50:40.58 ]: 269です

>>270
ありがとうございます
ちなみに、この方法なのですが、二乗平均平方根でやることもできますでしょうか？
こちらだと、重みが変わってきたりしますか？
272 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 20:25:58.35 ]: >>271
>二乗平均平方根でやる
とは？詳しく
273 名前：269 mailto:sage [2013/11/12(火) 21:01:46.29 ]: >>272
調べていてこちらでも良いのかなと思ったのですが、自信はありません。

上の条件を当てはめるとこんな感じでしょうか

______________
/ N
√ (1/N) Σ(Di-di)^2
i=1

N=10
これは一人辺りの10種類のデータということです。
データベースと調べたい人の差を相加平均して平方根をつけました。
274 名前：１３２人目の素数さん mailto:sage [2013/11/12(火) 21:13:57.63 ]: >>273
それは Σ(Di-di)^2 と同じ、Σ{(Di-di)^2/σi^2} とは違う
275 名前：269 mailto:sage [2013/11/13(水) 09:35:09.48 ]: >>274
回答ありがとうございます

文献で見かけて気になっていたところですので、スッキリしました。
ありがとうございました。
276 名前：１３２人目の素数さん mailto:sage [2013/11/15(金) 12:50:25.09 ]: 確率分布から平均や標準偏差を求める場合に
モーメントという用語を使う場合があります

確率分布関数がF(x)である場合

０次モーメントが m0 = ΣF(x)
１次モーメントが m1 = Σ(x*F(x))/ΣF(x)
２次モーメント以上のn次モーメントが
mn = Σ((x-m1)^2*F(x))/ΣF(x)

で、０次と１次と２次以上で定義が変わって気持ち悪いです
０次と１次を含めたn次モーメントは本来どうやって定義するのでしょうか？
277 名前：１３２人目の素数さん mailto:sage [2013/11/15(金) 19:05:55.21 ]: 確率分布関数を用いた定義は知らないけど、
n次モーメントはE[X^n]で定義されているのでは
n次の中心化モーメントはE[(X-E[X})^n]で定義されている
平均値はE[X]で1次のモーメントに相当し、分散Var[X]は1次のモーメントと2次のモーメントを用いて
Var[X]=E[X^2]-(E[X])^2で定義されています。
見当違いのこと言ってたらごめんなさい
278 名前：１３２人目の素数さん mailto:sage [2013/11/16(土) 03:12:16.20 ]: その前に >>276 のｎ次モーメントは
mn = Σ((x-m1)^n*F(x))/ΣF(x)
の打ち間違いでした。

>>277
分散が
＞Var[X]=E[X^2]-(E[X])^2で定義されています。
という定義でもあるというは見たことはあります。
上の書き方だと
　Var = Σ(x^2*F(x))/ΣF(x) - (Σ(x*F(x))/ΣF(x))^2
一方で、重心周りの2次モーメントは
　m2 = Σ((x-m1)^2*F(x))/ΣF(x)
MatlabクローンのOctaveで正規分布のその分散とm2を計算してみると

mu=50;
> sg=10;
> xx=[0:0.1:100];
> yy=exp(-1.*(xx-mu).^2./(2*sg^2));
> m0=sum(yy);
> m1=sum(xx.*yy)/m0
m1 = 50.0000
> var=sum(xx.^2.*yy)/m0-(m1)^2
var = 99.9985
> m2=sum((xx-m1).^2.*yy)/m0
m2 = 99.9985

同じになります。でもたまたま合っただけのようにしか思えません。
重心周りの0次と1次モーメントの定義が知りたいのです。
279 名前：１３２人目の素数さん mailto:sage [2013/11/16(土) 19:13:00.90 ]: >>278
そのF(x)は確率分布関数ではなく普通は確率関数と呼ぶ
原点回りのn次モーメントはE[X^n]
平均周りのn次モーメントはE[(X-E(X))^n]
分散の定義は平均周りの2次モーメントV(X)=E[(X-E(X))^2]
公式としてV(X)=E[X^2]-E[X]^2が成り立つ
0次モーメントは原点回りでも平均周りでも1になる
280 名前：１３２人目の素数さん mailto:sage [2013/11/17(日) 04:24:18.03 ]: 確率の問題なんやが
ttp://www.logsoku.com/r/livejupiter/1384626276/
281 名前：１３２人目の素数さん mailto:sage [2013/11/18(月) 07:10:09.08 ]: 重回帰分析したいのですがcsvファイルが見当たりません
喫煙率と肺がん、年齢などのデータはどう入手すればよいでしょうか
282 名前：１３２人目の素数さん mailto:sage [2013/11/18(月) 21:28:48.79 ]: 先生が、全部、墓へ持って行ってしまいました。
そっち方面は、最初からやり直してください。
283 名前：１３２人目の素数さん [2013/11/19(火) 09:13:37.79 ]: こないだの日曜日、統計検定3級受けた人いる？過去問より難しくなかった？
284 名前：１３２人目の素数さん mailto:sage [2013/11/19(火) 13:40:19.56 ]: すみません。卒論で気温や降水量の分析をしているのですが、気温どうしの分散、なら比べられるのですが、気温と降水量の分散は比べるには大体どうすればいいのでしょうか
285 名前：１３２人目の素数さん mailto:sage [2013/11/19(火) 13:55:50.12 ]: 相関とか
286 名前：１３２人目の素数さん mailto:sage [2013/11/19(火) 16:38:09.43 ]: 統計学の授業で困っています
助けてください
学内で食生活のアンケートを取りました
その結果と全国データを比べるのですが、解析の方法がわかりません

アンケート項目は
１．食生活に関心があるか
[関心がある][どちらかといえば関心がある][どちらかといえば関心がない][関心がない]
２．料理をするか
[毎日する][週に2，3日する][週に1日する][全くしない]

全国データでは「食生活に関心があるほど料理をする」というものでした
これと同じことが私の学校でも同じと言えるのか、言えないのか調べるためには、どうすればいいですか？
287 名前：１３２人目の素数さん mailto:sage [2013/11/19(火) 18:00:39.65 ]: >>286
>全国データでは「食生活に関心があるほど料理をする」というもの
この結論を得た解析と同じことをやるしかないんでは。
288 名前：１３２人目の素数さん mailto:sage [2013/11/19(火) 18:31:40.67 ]: 関心度、料理頻度を適当に数値して相関係数を求めるとか
289 名前：１３２人目の素数さん [2013/11/19(火) 23:55:17.27 ]: 杏「どうしてわかったんだ？」
ほむら「統計よ」
290 名前：１３２人目の素数さん mailto:sage [2013/11/20(水) 03:39:34.04 ]: >>283を受けたことは無いけど、試しに1級の過去問を見てみたけど、先日の1級の試験は照明問題が減ってる印象ね。
291 名前：１３２人目の素数さん mailto:sage [2013/11/20(水) 20:22:11.29 ]: >>283
2級受けてきたけど、2級も過去問より難化してたと思う。
解答速報も出たから採点してみたけど、7割ぐらいだった。合格ラインは何割ぐらいなんだろうか。
292 名前：１３２人目の素数さん mailto:sage [2013/11/20(水) 23:38:43.74 ]: Twitter見ると1級難化してるとか言ってたな
293 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 04:57:07.95 ]: >>292
検定Twitterって、資格スレには紹介されていないが？
品質管理検定（QC検定）1～4級 part11
ikura.2ch.net/test/read.cgi/lic/1384000601/
294 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 05:04:43.21 ]: >>293
統計検定
https://twitter.com/toukei_kentei
https://twitter.com/search?q=%E7%B5%B1%E8%A8%88%E6%A4%9C%E5%AE%9A&src=typd&f=realtime
295 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 05:26:39.29 ]: ＴＶ番組で、日本人の1日当たりの塩分摂取量全国平均が男性11.8g、
女性10.1g、全国１位を男女とも山梨県が獲得と紹介していた。
厚労省統計値らしいんだが、聴取されても答えられぬ塩分摂取量統計
なんて、どのように採取集計するの？
「なぜ多い？　山梨県の塩分摂取量」　　2013.11.05
textview.jp/post/health/10526
296 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 05:44:01.12 ]: >>295
記述式で1日3食×1週間の食事アンケート

外食の各メニューやスーパーで買った食材(魚の切身)とかの塩分量は厚労省もデータを取得済だから、概算値は十分に計算できるかと。
297 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 06:08:06.00 ]: >>296
即答有難うございます。アンケート記述式として県民平均摂取量はどの
ように集計するの？ラーメンスープを飲まない・飲干すとか醤油ふり
かけ量等の個人差や老若世代差や温暖・寒冷県差をどう加減するの？
到底科学的統計値になりえないと想像されるのですが？
298 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 08:32:17.88 ]: 厚労省なら健康診断でも見てるんじゃないの
299 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 10:57:41.92 ]: 集計は国民栄養調査とかじゃないかね。
あれは全国を単位区として無作為抽出してるから、
その都道府県あたりの平均や個人属性とかは出せるかと。
塩分の計算自体がアンケートからの概算という限界は変わらないけど。
300 名前：１３２人目の素数さん mailto:sage [2013/11/23(土) 12:05:49.61 ]: >>299
この厚労省統計だね。概要で例示されている血圧値なら測定値の県別大小
比較も首肯されるが、アンケートからの概算>>299塩分摂取量に対して、”全国
平均男性は11.8g、女性は10.1g・・・・山梨県は・・・男性は1.5g 、女性は1.1gも
多い”>>295などと同列に数値比較論議に不見識ではないのか？
平成22年国民健康・栄養調査結果の概要　　厚生労働省　　2012年1月
www.mhlw.go.jp/stf/houdou/2r98520000020qbb.html
301 名前：１３２人目の素数さん mailto:sage [2013/11/24(日) 00:00:47.21 ]: >>295
リンクを見ずに答えるが、>>299の言うように国民栄養調査のデータだろう。
厳密に計測するときは、24時間畜尿をやって尿中塩分濃度から摂取塩分を推定する。
でもそんなの何万人もの大規模調査で実施したら途方ない予算が必要。
国民栄養調査の調査方法については、厚労省のWebサイトで解説されているから、
参照して下さい。
302 名前：１３２人目の素数さん mailto:sage [2013/11/24(日) 00:10:47.81 ]: >>300
まぁ、それが栄養学の限界。ずっと議論されてているらしい。
それから血圧だって、日中変動や再現性に大きな問題があって、
「本当の値」は何かという問題がある。
綺麗な看護師とおばちゃんでは値が変わってしまうからね。
303 名前：１３２人目の素数さん mailto:sage [2013/11/24(日) 12:17:45.92 ]: 精度が荒くてもないよりはいいじゃないか。
304 名前：１３２人目の素数さん mailto:sage [2013/11/24(日) 13:16:54.26 ]: 誤差は付き物
305 名前：１３２人目の素数さん [2013/11/25(月) 17:00:54.36 ]: エクセルでグレンジャーの因果テストってできるのかな・・・
出来るのなら、やり方を教えてください！
306 名前：１３２人目の素数さん mailto:sage [2013/11/27(水) 16:30:37.68 ]: 統計学の勉強はじめたいんだけど、
Amazonのレビュー見たら「数式が少なくてわかりやすい！」とか甘ったれた理由で星つけてるのばっかで
どれが良書なのかよくわからん
おすすめの入門書教えてくれ
307 名前：１３２人目の素数さん mailto:sage [2013/11/27(水) 16:40:39.09 ]: Amazonのレビューは嘘だらけだよ。
小島寛之の本には完全に騙された。詐欺レベル。
308 名前：１３２人目の素数さん [2013/11/28(木) 01:12:42.91 ]: 統計検定3級平成25年11月問3

AチームとBチームのサッカーの試合において、じゃんけんで勝った方を先攻とし、あいこの場合はAチームを先攻と決めた。このとき、3回の試合の先攻を決める場合にあいこが1度も起きず、Bチームが少なくとも一度は先攻になる確率を、次の(1)～(5)のうちから一つ選べ。

(1) 1-1/3
(2) 1-(1/3)~3
(3) 3*(1/3)~3
(4) 7*(1/3)~3
(5) 8*(1/3)~3

【解答】(4)

解説お願いします。
309 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 01:44:02.62 ]: 8-1=7
310 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 06:57:34.01 ]: >>309
レスありがとうございます。
8はどういう意味合いで出てくるものでしょうか。
理解がとろくてすみません… m(__)m
311 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 08:42:31.41 ]: 3+3+1=7
312 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 09:56:58.88 ]: >>308

Ｂが○ならＡは×
Ｂが×ならＡは○
Ｂが△ならＡは△

1回目：3通り
2回目：3通り
3回目：3通り

全部で　3*3*3通り
-----------------------
Ｂが３回とも先攻　○○○
Ｂが２回のみ先攻　○○×　　○×○　×○○
Ｂが１回のみ先攻　○××　　×○×　××○

条件を満たすのが７通り
------------------------------------

あってる？
313 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 10:20:39.99 ]: >>312 さん

おお！分かりやすく説明いただき、ありがとうございました！！
納得できました！！ ^ ^
314 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 13:15:20.87 ]: サッカーはコイントスなのに。
315 名前：１３２人目の素数さん mailto:sage [2013/11/28(木) 15:01:06.00 ]: >>306
誰かこれを頼む…ペーパーバックとかでも頑張って読むから
316 名前：１３２人目の素数さん mailto:sage [2013/11/29(金) 05:27:19.81 ]: >>315
数理統計学の入門書レベルでなく、『初等統計学』なんて銘打たれた教科書なら、
独学のための取っ掛かりとしてはよろしいんじゃないかな？

経験則では初等～の類には、まず積率母関数は触れていないカンジ。
だから、定理や法則の解説や例示されている証明に微分や級数展開が使われずに展開されている印象。
初等レベルを勉強し終えてから、今度は数理統計を謳った教科書で、同じ単元でもより深く勉強するなんてのは？
317 名前：１３２人目の素数さん mailto:sage [2013/11/29(金) 09:20:31.21 ]: >>316
ありがとう
amazonとか見ながら１冊買ったんだけど、式の解説が薄くて式の意味の理解が浅いままだった
だから統計学の概略は分かったんだけど、いろいろ腑に落ちないところが多かった
数理統計学っていうのが数学的にしっかりとしてるのなら、次はそっちのジャンルの本を買ってみる
318 名前：１３２人目の素数さん [2013/11/29(金) 09:34:39.71 ]: 高校数学でわかる統計学」
319 名前：１３２人目の素数さん mailto:sage [2013/12/01(日) 16:48:27.41 ]: >>318
お奨め？
320 名前：１３２人目の素数さん mailto:sage [2013/12/01(日) 17:16:15.93 ]: ヤフー知恵袋でなく、2ちゃんのこんな板を見付けて書き込みに来るくらいの人間には満足できない超初心者向けの一冊なんじゃない？
本の題名的にも。
321 名前：１３２人目の素数さん mailto:sage [2013/12/01(日) 18:11:44.77 ]: >>307
ほんんとに？
322 名前：１３２人目の素数さん [2013/12/03(火) 02:46:12.21 ]: ブルーバックスの高校数学でわかるシリーズは結構いいよ
名前で判断してはいかん
Amazonのレビューみてみればわかるが
323 名前：１３２人目の素数さん mailto:sage [2013/12/03(火) 13:24:29.03 ]: へえ、今読んでる本終わったら読んでみようかな
文庫本サイズは手出しやすいし
324 名前：１３２人目の素数さん mailto:sage [2013/12/03(火) 16:29:38.74 ]: >>322
表紙のデザインがとっつきにくいなぁ
325 名前：１３２人目の素数さん [2013/12/04(水) 12:37:55.44 ]: 「相関係数を求める」ことと「無相関検定」の役割的な違い
ってどうなのでしょうか。
二つの変数の相関を調べるだけなら、相関係数だけでいいかと
思うのですが、、。
326 名前：１３２人目の素数さん mailto:sage [2013/12/05(木) 15:59:28.02 ]: 少し質問させてください
異なる計算方法の二種類の為替レートがあって、
その差が有意であるかを調べたい場合は
どのようにすれば良いのでしょうか？

たとえば計算方法1では、ユーロ=120 ドル=100 ポンド=150 と計算され、
計算方法2では、ユーロ=115 ドル=105 ポンド=152
などと計算される場合に、
両計算方法からでる結果に有意差があるかを知りたいです。
各通貨の平均をとってt検定しても意味がないように感じますが、
(各通貨ごとに平均値が大きく異なるので)
どうにか計算方法の違いを有意検定できる方法はありませんでしょうか？

よろしくお願いします。
327 名前：１３２人目の素数さん mailto:sage [2013/12/05(木) 16:18:27.07 ]: >>326
計算式が異なれば有意な差がでて当たり前じゃないの？
ユーロ vs ドルをn=100で計算してみた。

> f1 <- function(x) x * 100/120
> f2 <- function(x) x * 105/115
> x <- sample(10:100000, 100)
> t.test(f1(x), f2(x), paired = TRUE)

Paired t-test

data: f1(x) and f2(x)
t = -17.1435, df = 99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4471.794 -3544.030
sample estimates:
mean of the differences
-4007.912
328 名前：１３２人目の素数さん mailto:sage [2013/12/05(木) 17:40:20.87 ]: ありがとうございました、t検定でいけるのでしょうか？
>>326は数字は全くの適当ですが、
為替レートを計算するための複雑だけど正確な式と、
簡単だけど大雑把な式がありまして、
簡単なほうで計算をしても問題無いかどうかを知りたいと思っています。
言い換えれば、統計的に有意差が無い、ほうが好ましい結果となります。
本来の検定の考えかたとは異なると思いますが、
どのようにアプローチしていけばよいかわからず
困っております。
329 名前：１３２人目の素数さん mailto:sage [2013/12/05(木) 21:13:33.15 ]: 検定の問題集みたいなので勉強になる本無い？
330 名前：１３２人目の素数さん mailto:sage [2013/12/05(木) 22:03:05.53 ]: >>328
非劣性検定で検索
331 名前：１３２人目の素数さん mailto:sage [2013/12/06(金) 08:17:18.34 ]: >>330
ありがとうございました！まさにこれでした。
そして、帰無仮説が棄却されなかったからといって、
帰無仮説を採択できるわけではない、
という初歩的なところを誤ってました。
ありがとうございました
332 名前：１３２人目の素数さん mailto:sage [2013/12/06(金) 13:44:45.69 ]: 正規分布する確率変数の和の分布
とかでさ、
積分したら1のものと積分したら1の物を足したら、積分したら2になるじゃん。
そしたら積分したら1でなきゃいけない確率変数ではなくなるじゃん。
つまりどういうこと？
333 名前：１３２人目の素数さん mailto:sage [2013/12/06(金) 13:55:31.57 ]: は？？
334 名前：１３２人目の素数さん mailto:sage [2013/12/06(金) 14:01:03.37 ]: もうちょっとわかりやすく疑問を投げかけてくれ
具体例出すとか
335 名前：332 mailto:sage [2013/12/06(金) 18:31:43.95 ]: よくわかってないので、変なこときいたのかもしれないのだが。

正規分布の再生性あたりの疑問で、たとえば、
ttp://bio-info.biz/statistics/element_reproductive_property.html
このページの一番下の図のようなことを考えていて、
赤と緑の面積は1だから、それの合わせた緑の面積は2になるじゃん。
だから、確率変数の和の分布はどうして2じゃ無いんだ？とか考えたわけだ。
まあ、正規分布の再生性というのが、図にある’重ね合わせ’のようになんでならないかが
さっぱり根本的にわかっていないから、そう考えたんだろうけど。

結局のところ、確率変数を足すと、なんで重ね合わせのようにならんのだ？
336 名前：１３２人目の素数さん mailto:sage [2013/12/06(金) 19:10:04.60 ]: 正規分布は確率密度関数のグラフであって、確率変数のグラフじゃないから

upload.wikimedia.org/math/1/f/b/1fbab0f6399a52a3cfec041b458e62a1.png
確率変数を足すと、この確率密度関数f(x)の中のσとμが足しあわされるだけで、
確率密度関数そのものが足しあわされてるわけじゃない
337 名前：１３２人目の素数さん [2013/12/07(土) 17:05:59.42 ]: 十年前に数学科を出たものですが、統計学勉強したくなりました。
何から勉強すればいいですか？
教えろください。
338 名前：１３２人目の素数さん mailto:sage [2013/12/07(土) 17:29:48.44 ]: 数学科出たのなら，「数式がない．．」とかのうたい文句があるのはヤメた方がいい。
バッチリした教科書、確率まで踏み込んであるのが読めるならそれがいい。
あなたが数学科で代数とか幾何とか選考して、解析や確率を敬遠していたのなら、
昔の高校教科書「確率と統計」とか見てみると多分すんなり入れると思う。
たとえばちくま文庫から出てるような。それから、専門的な教科書に入るのはワリ
と易しいと思うよ。

以上似たような経歴のモンから。
ゼミで確率論なんかやってたのなら全く無用の助言でした。
339 名前：１３２人目の素数さん [2013/12/07(土) 17:48:53.29 ]: >>338
ありがとうございます。
ゼミでは、グラフ理論やってましたｗ
高校からやるのいいかもしれませんね。
専門的な教科書のおすすめってありますか～？
340 名前：１３２人目の素数さん mailto:sage [2013/12/07(土) 18:41:38.97 ]: そもそも統計学なんて数学科以前に教養課程で習うだろ
統計専攻の人でも学部レベルくらいまでなら、あれに毛が生えたようなレベルしか
勉強しないぞ
しいて言うなら、確率論に測度が入ってくるくらいか
341 名前：１３２人目の素数さん mailto:sage [2013/12/07(土) 19:48:10.87 ]: >>337
これでもガーとやれば
ttp://www.amazon.co.jp/dp/4130420658
342 名前：１３２人目の素数さん mailto:sage [2013/12/07(土) 20:10:49.89 ]: 大学院出るレベルで基礎からやりたいっていうなら
www.amazon.co.jp/dp/0486637603/
これが結構おすすめ
343 名前：１３２人目の素数さん [2013/12/08(日) 04:53:21.60 ]: みなさま教えてちょんまげ。
統計検定１級対策は何を勉強すればいいですか？
公式テキストだけじゃ足りないよな？？
344 名前：１３２人目の素数さん mailto:sage [2013/12/08(日) 17:30:55.13 ]: >>337は実社会でも適応できないのだろうね
345 名前：１３２人目の素数さん [2013/12/11(水) 22:15:25.47 ]: 344が進行とめたねｗ
346 名前：１３２人目の素数さん mailto:sage [2013/12/11(水) 23:01:17.50 ]: >>344
337は数学科卒にしては適応してる人だと思うよ
いまごろ統計やってみようとか感心感心
昔グラフやった人ならちょっとモチベがあれば
その辺の有象無象よりはあっというまにテイクオフだよ
がんばれ
347 名前：１３２人目の素数さん mailto:sage [2013/12/11(水) 23:03:16.33 ]: 本人登場
348 名前：１３２人目の素数さん mailto:sage [2013/12/11(水) 23:03:56.85 ]: >>347
運営乙()
349 名前：１３２人目の素数さん mailto:sage [2013/12/12(木) 13:35:49.23 ]: momentとmoment generating functionがあるのは分かったけど、
なんでこれを導入すると有用なのかがイマイチ分からない…
350 名前：１３２人目の素数さん mailto:sage [2013/12/13(金) 02:49:30.06 ]: 微分が簡単な指数関数で1回2回と微分すれば平均や分散が求まるってところから、
もっともっと深く意味を求めたいのなら、和訳の積率母関数でググればいっぱい説明してるサイトがみつかすよ。

勉強してる人が歪度や尖度をに対してどれくらい重要さをイメージしているか、次第かなと。
351 名前：１３２人目の素数さん mailto:sage [2013/12/13(金) 22:36:24.02 ]: >>349
関数の一致や関数列の収束などを示すために
ラプラス変換したもので考えたほうが計算が楽になることがある
例としては、中心極限定理の証明、分布の再生性の証明などなど
352 名前：１３２人目の素数さん [2013/12/17(火) 00:26:59.91 ]: ｎでわるのか
n-1でわるのか
分からなくなってきた。
353 名前：１３２人目の素数さん mailto:sage [2013/12/17(火) 08:28:04.20 ]: 解答がマークシートの類でなく、設問ごとにある程度の余白が用意されている答案用紙だったら、
その問の解答途中で、
偏差平方和をn-1で割った値を標本分散とするならば～
みたいな一筆をあらかじめ入れておいて、計算を進めていけば、
仕上がった答案に対して採点者も原点ってカタチで文句を付けることは無いんじゃないかな？
354 名前：１３２人目の素数さん mailto:sage [2013/12/17(火) 18:38:47.76 ]: そんなこと書いても違いが分からないのならバツです。
355 名前：１３２人目の素数さん mailto:sage [2013/12/17(火) 20:19:03.86 ]: 不偏分散という用語はあるが、
n で割ることを陽に示す言葉が無い
のは、不便ちゃ不便だな。
統計よりな人は、「分散」とだけ聞いて
不偏分散のことだと思ったりするからな。
356 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 14:54:08.43 ]: 高校で習う標準偏差とか分散って、そりゃ、データがたまたま、
ああいう綺麗な真ん中で盛り上がってる綺麗な形なら使えるけどさ、

実際のデータは、もっとひん曲がった、右と左が非対称だったり、ぐにゃぐにゃな形だったりするんだから
実務的なリアルなシミュレーションするときは、あんまり使えなくないですか

それなら、数式もクソもない、ただ確率に応じて代表的な数字を返すだけの、素朴なプログラムのほうがよほどリアルな出力になる。
・・・と思うんですが、ぼくの認識はおかしいですかね。
357 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 15:23:21.37 ]: 高校生かな？

もちろん全てのデータが正規分布に従うなんてことはなくて、
ひん曲がったぐにゃぐにゃな形があることなんて100年以上も昔から分かっているし、
もっと上級の統計学になるとそういう形に対応できる様々な分布を取り扱うようになる
ただ正規分布が、様々な分布の中でも一番基礎的で重要な分布なのは間違いないから、
高校では正規分布に絞って統計学のさわりを教えているんだと思う

実務的なリアルなシミュレーションでは、データに沿った分布を選択することになる
358 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 19:04:39.93 ]: >>357
そうですよねえ。正規分布は、そこそこ使える分布ながら、手計算しやすい＝エデュケーション用途にもピッタリ
てなことだと思ってましたが、やはりそういうことでしたか。

ただ、私は、この手の分析の仕事は、コンピューター使ったほうが、複雑な関数を使わなくて済むぶん、
よほどシンプルになると思いました。　ご返答ありがとうございました。
359 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 19:25:16.03 ]: 全然違うと思いますがそういう理解でいいんじゃないでしょうか。
360 名前：１３２人目の素数さん [2013/12/18(水) 19:39:32.30 ]: w
361 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 20:17:23.98 ]: >>358
> >>357

大数の法則といって、
もとがどんな分布であろうとも、標本をたくさんとればとるほど、正規分布に近づく
っていう数学の法則があるのです。

教育的な分かりやすさからいうと、二項分布とか分かりやすいし、身近な例への応用もやりやすい。
362 名前：１３２人目の素数さん mailto:sage [2013/12/18(水) 20:56:01.36 ]: そのコンピュータが結局ヒトにとって複雑な関数の計算を代行してくれているんじゃ荷ですかねえ
363 名前：１３２人目の素数さん [2013/12/19(木) 01:14:21.85 ]: >>361

標本平均の分布が正規分布に近づくのは中心極限定理では？
364 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 01:40:02.50 ]: その中心極限定理を保証するのが、要するに大数の法則かと
365 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 05:15:57.17 ]: 大数の法則は、弱と強があって、確率収束と概収束に関連しています。
成立条件から言っても、中心極限定理とは別物です。
366 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 10:16:06.89 ]: どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、
逆算すれば母集団の平均が推定できるってことだな。
367 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 10:23:55.30 ]: >>366
> どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、

もっと統計用語は正確に書いた方がいい。正規分布するなんて、どの教科書にも
出てこないよ。

標本平均が正規分布に従うなんてことはない。
指数分布に従う母集団からの標本平均も正規分布に従うの？
368 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 10:27:38.83 ]: わざと一般人の理解向けに不明瞭に書いたんだよ。
369 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 10:30:37.63 ]: ここはひどいインターネッツですね。
370 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 11:23:02.87 ]: 質問者の程度に合わせた回答を施してあげるのも、知性ある人間としての能力の一つだ。
同好の士同士の問答でもあるまいし、何でもかんでも難しく答えりゃイイってモンじゃない。
371 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 11:45:32.69 ]: 正規分布は使えないという結論に至った初学者に
指数分布では～とか言ったらやはりおれの結論は正しかったになるよ。
372 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 11:52:54.99 ]: >>357
これが大体いい解答だと思う
373 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 11:56:05.97 ]: 統計学って最初の壁が絶壁なんだよな。
374 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 12:08:56.60 ]: 『唯一、社会に出てからも役に立つ数学』をウリにしておいて、とっつきにくさという実質的な足切り関門が存在しているというのも、改善すべき要素だと思うなあ
375 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 12:32:38.23 ]: この程度で「つきはなされた」と感じて混乱するような人は統計なんて使わない方がいいよ
他の人に任せなって
376 名前：１３２人目の素数さん [2013/12/19(木) 13:22:43.16 ]: >>366
正解
>>367
>指数分布に従う母集団からの標本平均も正規分布に従うの？
従う。
中心極限定理は母集団分布は何だっていいことを保証している。
377 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 14:35:05.48 ]: サンプルサイズが十分大きい時、中心極限定理が成立する。
です。
378 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 14:37:32.31 ]: 信頼区間95%を素人に理解させるのは不可能。
379 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 14:41:33.10 ]: >>377
分散有限とかの条件があるよ
380 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 14:46:51.47 ]: >>378
視聴率のウィキペで説明したらわかってくれそうじゃない？
ttp://ja.wikipedia.org/wiki/%E8%A6%96%E8%81%B4%E7%8E%87#.E7.B5.B1.E8.A8.88.E5.AD.A6.E7.9A.84.E3.81.AA.E3.83.87.E3.83.BC.E3.82.BF.E3.81.AE.E8.B3.AA.E3.81.AB.E3.81.A4.E3.81.84.E3.81.A6.E3.81.AE.E5.95.8F.E9.A1.8C
381 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 15:12:18.77 ]: 2chではありがちなことだけど、
自分の中での結論ありきで議論を展開する奴に物事を理解させるのは不可能だから
その辺に見極めが重要
382 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 16:57:19.21 ]: 何冊か読んだけどカイ二乗分布の説明がどれもこれも概念的すぎてよくわからん…
383 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 17:40:17.13 ]: カイ二乗分布は確率変数の二乗和が従う分布。
ただし、母集団の分布が正規分布で確率変数は独立である必要がある。

カイ二乗分布の存在意義は検定に使えるから。
384 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 18:18:55.72 ]: なんで正規分布じゃダメなの？って疑問。
385 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 18:37:36.94 ]: 平均の検定なら正規分布やt分布でいいが、
標本分散は正規分布には従わない。

分散の場合は、カイ二乗分布に従うから、これを使う。
386 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 18:48:33.23 ]: 本当に基本的なところで申し訳ないんだけど、分散を比較しなきゃいけないシチュエーションって
どういうシチュエーション？
387 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 18:51:25.21 ]: そういうことか。普通は平均だけで満足しちゃうから出番が少ないのか。
ありがとう。
388 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 19:02:43.25 ]: 例えば、税理士の平均年収が600万円で弁護士の平均年収が650万円だったとする。
普通の人なら、税理士も弁護士もほとんど年収変わらないなら、税理士の方が得じゃない？と考えるだろう。

しかし、もしかすると、弁護士は新卒が多くて、給料あまりもらってない人が多く、高所得者も多いのでは？とか、仮説を立てる。すると、年収の分散も比較したくなるわけ。

じゃあ、税理士の分散と弁護士の分散を検定してみると、この仮説が検証できる。
このとき、分散比の検定でF分布（カイ二乗分布の親戚）を使う。
389 名前：１３２人目の素数さん mailto:sage [2013/12/19(木) 20:10:36.51 ]: なるほど。わかりやすい
390 名前：１３２人目の素数さん mailto:sage [2013/12/20(金) 09:32:35.08 ]: >>388
素晴らしい
391 名前：１３２人目の素数さん mailto:sage [2013/12/20(金) 09:35:37.68 ]: >>388
公認会計士、弁理士、医者は？
392 名前：１３２人目の素数さん [2013/12/20(金) 13:33:11.96 ]: アスぺ乙
393 名前：１３２人目の素数さん [2013/12/20(金) 15:20:21.80 ]: 検定統計量っていろいろあるけど、どうやって算出するんだ？
394 名前：１３２人目の素数さん mailto:sage [2013/12/20(金) 15:56:31.23 ]: たいていはただの標準化だよ
教科書に導出とか載ってない？
395 名前：１３２人目の素数さん mailto:sage [2013/12/20(金) 19:06:48.79 ]: >>392
アスペクト比が問題なわけだな、分散の偏りだな、勉強になります
396 名前：１３２人目の素数さん [2013/12/20(金) 19:55:16.86 ]: >>391
3変数以上の検定には多重比較などを利用出来る。
397 名前：１３２人目の素数さん [2013/12/21(土) 11:14:19.36 ]: ピペット操作を複数回行い、得られた数値の平均値、標準偏差から変動係数は3%以内になった
変動係数が3%以内であれば測定値は正確な値だと言われている
なぜ3%以内なのか統計学の観点から考察せよ
という課題が出されたんですが、全くわからず、結局レポートを提出できませんでした
その後も答えをくれませんでしたし、参考書を見ても3%以内なら正確な値とは書かれてませんでした
どのような回答が正しかったのでしょうか
398 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 11:58:29.21 ]: >>397
「考察せよ」という課題に解答なんて存在するの？
399 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 12:04:19.67 ]: >>393
パラメトリックなときは、Neyman-Pearson fundamental lenma
ノンパラのときは、対立仮説と帰無仮説の差を表現できるものから検定統計量
作ります。
400 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 13:13:44.85 ]: 「考察せよ」てのは問題自体も問題なんだよな
401 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 13:34:30.09 ]: 正解がないなんて良問だろう。暗記問題じゃないということ。
402 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 16:35:21.13 ]: >>399
なるほど！
403 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 17:25:22.60 ]: >>397
読んでないけど、参考になるかも(wikipediaのreferenceより)
"Statistical quality control and routine data processing for radioimmunoassays and immunoradiometric assays."以下リンク
www.clinchem.org/content/20/10/1255.full.pdf
404 名前：１３２人目の素数さん mailto:sage [2013/12/21(土) 22:56:36.44 ]: 考察せよ

考察しました

ご苦労さん
405 名前：すみません数学得意な人この問題解いて下さいm(_ _)m [2013/12/22(日) 22:18:14.10 ]: A.B.C.D.E.F.G.Hの8チームがトーナメント形式で戦う
一回戦の対戦相手はくじ引きで決めPからWまでのどこかに振り分けられる
Aが2回戦でBを倒し、3回戦でCを倒す確率は？
答えは336分の１なのですが納得出来ません
優勝
| |
ーー
| | | |
ーーーー
| | | | | | | |
P Q R S T U V W
406 名前：１３２人目の素数さん mailto:sage [2013/12/23(月) 01:29:56.36 ]: Aが2回戦でB、3回戦でCと当たるような配置になる確率:2/7*4/6
AとBが共に2回戦に進む確率:1/2*1/2
AがBに勝つ確率:1/2
Cが3回戦に進む確率:1/2*1/2
AがCに勝つ確率:1/2

これを全部掛け合わせる
407 名前：１３２人目の素数さん [2013/12/23(月) 09:06:16.84 ]: >>406
解決しましたありがとうございますm(_ _)m
408 名前：１３２人目の素数さん [2013/12/24(火) 17:24:15.09 ]: 質問です
時系列データの標準偏差というのは定性的にいうとどういう意味があるのですか？
動きが激しいほど大きいとかですかね？？？
409 名前：１３２人目の素数さん mailto:sage [2013/12/24(火) 21:42:08.14 ]: 逆だ。
「動きが激しい」という詩的表現が、
定性的には、時系列の分散が大きい
という意味を持つのだ。
410 名前：１３２人目の素数さん mailto:sage [2013/12/24(火) 23:18:36.00 ]: もちろん動きが激しいほどボラティリティは大きくなる。
例えば、株だとリスクの大きさを表す。
411 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 13:48:23.42 ]: 最近勉強し始めて統計の入門の本いくつか読んでみたけど、
実践を説明しつつもその理論的背景に触れてる本ってほとんど無いんだね。

例えば、t分布の話では、t分布は母分散が未知で小さな標本に対して使うもので、
どうやって信頼区間を計算していくのかが説明されていくけど、
なぜそれがt分布に従うのかの説明が薄いことが多い気がする。

多分それは、実際的な仕事として統計学を必要としている人が数学に対するリテラシーを
あまり持ちあわせていないことが多いからなんだろうけど、
やっぱりちょっと理論の支柱を端折られるとなんとなく気持ち悪い。

こういうところを端折らないでしっかり説明してくれてる良い参考書ってある？
412 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 16:23:07.25 ]: おれもそう思う。
数学出身の人だと、確率論やったもんでなくとも、
大数の法則、中心極限定理など通過しているうちは納得出来るが、
いざ応用の段になって、これこれの標本には、ほにゃらら分布がよく合います、
というところでは、「ふ～ん」というしかない。
実際の現場では、そうなってんだからつべこべ言わずにやれ！
ということなんだろうか？
統計学は最強の武器である、というならわかるが
最強の「学問」だそうだから。
413 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 16:43:38.14 ]: 数式を使用しないことを売りにしてる統計学入門書を手に取って
数式がない、証明がないというのは筋違いではなかろうか。

数理統計学ときちんと題名がついてるなら証明まで書いてる可能性が高いんじゃないかな。
414 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 17:02:22.18 ]: >>412
統計学は数学と違って解釈が含まれるからな。
例えば、有意水準５％にする理由にしても経験的なものだし。

やっぱその辺が数学者からしたら、しっくりこないんだと思う。
415 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 17:05:54.65 ]: 自閉症の人でしょ、それ
数学者一般に話を拡げないでよ
416 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 17:13:10.90 ]: 問題から入る統計学があってもいいかもね
ありそうだけど
417 名前：１３２人目の素数さん [2013/12/26(木) 17:41:06.94 ]: >>413
いや、数式満載、すべての定理に証明付き、という数理統計学の
で入門して１冊目はスムーズだったんですよ。
だから甲斐事情分布辺りまではスイスイだったんだが、
次の統計本になって、以上のような始末。
特に、馬に蹴られて死んだ兵士の数とかワラってしまう。
いや死者を侮辱してるのではないよ、ナポレオン時代の話しでしょ。
数学はなれるとこういう話は好きなんだが
418 名前：１３２人目の素数さん mailto:sage [2013/12/26(木) 17:54:24.94 ]: >>413
俺はあえて数式が少ない入門書を選ぶつもりはなかったんだ。
「統計学」自体が数学の一種に分類される学問を表す言葉だと思うし、
「統計学」が文系でも踏み込めるライトなジャンルで、
「数理統計学」がしっかりと数学しているヘビーなジャンルだなんていう住み分けは
初学者にはわからんよ。おかげでいきなり躓いてしまった。

それはともかく、数理統計学の本を探せばいいんだな。
教えてくれてありがとう。
419 名前：１３２人目の素数さん mailto:sage [2013/12/27(金) 12:55:01.47 ]: >>414
普通、統計学使った論文だと有意水準は複数出してる
５％、１％、０．１％など
あんまり入門書だけで語るな
420 名前：１３２人目の素数さん mailto:sage [2013/12/27(金) 12:59:09.49 ]: >>411
使い方よりも分布の構成の仕方とかを数学的に説明するというタイプの
本ならそこそこある。有名どころなら
Hogg, McKean and Craigの本とか。
421 名前：１３２人目の素数さん mailto:sage [2013/12/27(金) 13:03:27.18 ]: 統計の入門書しか読んでない研究者が有意水準を複数論文に入れるんだろ？

普通なら検出力を書いとけば良いと思うが。
422 名前：１３２人目の素数さん mailto:sage [2013/12/27(金) 18:46:18.37 ]: 検出力でなく、p値でしょ。
423 名前：１３２人目の素数さん mailto:sage [2013/12/27(金) 23:32:46.74 ]: >>411
> なぜそれがt分布に従うのか
t分布が編み出された『実験的背景』としては、
少数の標本抽出×気が遠くなるような試行回数の結果、構築することのできた分布なんでしょ？

今日までBSで神の数式完全版が放送されてたけど、出演者たち理論物理学者は
キチンと数式的に証明してくれなくっちゃ、こんな説明では全く納得できないんだろうけど。
424 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 00:23:03.44 ]: >>411
ガンマ関数やゼータ関数を用いて説明しなくちゃならないってことになったら、
大半の読み手のことを考えたら、理論的背景を敬遠するんじゃないかな。
425 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 01:46:30.47 ]: >>422
いや、p値じゃなく検出力

確かに、有意水準を複数記載されるより、p値を書いてもらったほうがありがたい。
けど、検定で最も大事なのは第一種の過誤と第二種の過誤がどのくらいの確率で起こるかを知ることだから、検出力の記載は必要かと。
426 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 02:29:41.82 ]: >>424さま
411ではありませんが，ガンマやゼータ使って議論出来るんですね
それは面白い，いずれ暇ができたら勉強します．
やっぱり本だけではなく，論文読んだり，その筋の人達と
しゃべらないと分かんないですよね．
427 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 10:03:35.38 ]: >>423
t分布が完全に経験則ってこと？そんなわけないだろ
そう勘違いする人が居るってこと自体、巷に出回ってる統計の参考書は不十分ってことだよ
428 名前：１３２人目の素数さん [2013/12/28(土) 15:04:30.55 ]: 統計数理研究所の広大出身の河村敏彦助教ってのは、
書いている本が全く意味不明だし、
馬鹿のくせに自分の業績自慢ばかりしてる。

気に入らないとずっと怒鳴ってるし、
まったくキチガイとしかいいようがない。
なぜ河村敏彦のようなキチガイが
助教になれたんだ？

コネしか考えられないんだが、将来的には
河村敏彦のキチガイ野郎がコネで大学教授とかに
なるのか？
信じられん！
429 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 15:09:02.09 ]: なんとかして誰かを傷つけてやりたい、ってアンチの書き込みは、それが強すぎて
逆効果になってることってあるよね。
430 名前：１３２人目の素数さん [2013/12/28(土) 15:35:29.34 ]: なんとかって助教が馬鹿かはわからんが、>>428は間違いなく馬鹿
431 名前：１３２人目の素数さん mailto:sage [2013/12/28(土) 19:25:48.80 ]: 人を攻撃するくせに自分は『スレ上では』完全匿名というのも卑怯だよね
432 名前：１３２人目の素数さん mailto:sage [2013/12/29(日) 00:03:38.23 ]: あまり強い言葉を遣うなよ弱く見えるぞ
433 名前：１３２人目の素数さん [2013/12/29(日) 04:33:00.12 ]: >>428
河村君の能力では助教以上のアカポスに就くのは不可能だろう
だから放っとけばいい
434 名前：１３２人目の素数さん mailto:sage [2013/12/29(日) 04:41:57.52 ]: ID非表示の板なら、日付変わらなくても工作活動が自由自在ね
435 名前：１３２人目の素数さん mailto:sage [2013/12/29(日) 12:05:32.05 ]: ここのサークルの統計本ってどうなの？
www.pixiv.net/member_illust.php?mode=medium&illust_id=40092092
436 名前：１３２人目の素数さん [2013/12/29(日) 13:34:54.83 ]: 河村君が２ｃｈばかりやっているといううわさが
本当だということは確かめられた
そんなヒマがあったらほんの少しでも勉強したほうがいい
それでなくても駅弁で頭も悪く、性格はすごく悪いと評判なのだから
437 名前：１３２人目の素数さん [2013/12/29(日) 14:06:24.15 ]: キチガイにストーキングされると大変だね
438 名前：１３２人目の素数さん [2013/12/29(日) 15:31:27.03 ]: 河村敏彦助教がストーキングしてるのかね？
あいつならやりそうだ（笑
439 名前：１３２人目の素数さん [2013/12/30(月) 11:35:01.74 ]: あ、本当に河村が書かれてる
440 名前：１３２人目の素数さん [2014/01/02(木) 05:54:57.73 ]: 　
441 名前：１３２人目の素数さん [2014/01/02(木) 06:04:34.68 ]: 質問させてもらいます。

試行回数をｎ、的中率をｐ、回収率をｋ％とすると、
真の回収率＝ｋ × (p ± ２×平方根((１－ｐ)×ｐ／ｎ) )／ｐ

※１と２の真の回収率はいくつになるのでしょうか？お願いいたします。

※１　試行回数４８５　　　的中率５．８％　　　　　回収率１８１．３％

※２　　　　　４８５　　　　　　１１．５％　　　　　　　１２３．９％
442 名前：１３２人目の素数さん mailto:sage [2014/01/02(木) 11:41:26.75 ]: 起こりにくい事象を毎日計測して曜日毎に平均回数を出してλ_sun, λ_mon, ･･･, λ_sat を作り、全て足し合わせたものをパラメータにポアソン分布を作ります

これは曜日なんて考えないで単純に毎日計測して平均回数を7倍したパラメータで作ったポアソン分布に一致しますか？
443 名前：１３２人目の素数さん mailto:sage [2014/01/03(金) 07:52:01.90 ]: 質問があります。私は経済学部１年です。

1. 普通、回帰曲線は残差平方和を最小にする曲線だと思いますが、経済かその他の現象で、残差平方の加重平均か指数移動平均を最小にする曲線に意味があることはありますか？

2. よく個人投資家の株やfxで、現在価格とは違う、真の価値として単純移動平均や指数移動平均が出てきますが、これは有効ですか？
真の価値より低いときに買い、高いときに売るそうです。二項格子モデルでは無意味で、ブラック=ショールズモデルでは逆効果だと思うのですが。

時系列分析とか勉強してません。これからするつもりです。
444 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 15:14:19.70 ]: 1.最小二乗法のことだと思うけど、その曲線に意味はない。
2.有効ではない。

とだけ、言っておこう。

証券の真の価値とかそんなもんデタラメだから、信じない方が良いと思います。
445 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 17:37:59.71 ]: >>444
はい
446 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 17:42:29.51 ]: fxのブログ見たら頭悪そうなのばっかり
447 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 23:24:06.89 ]: 「改訂増補版紅魔館の統計学なティータイム」買った。
まあいい本だと思うが、もうこうなると別に東方のキャラ使う意味なくね？
448 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 23:27:40.40 ]: 有名キャラを使えば、話のタネにしたい人やコレクターが買うんだろう
449 名前：１３２人目の素数さん mailto:sage [2014/01/04(土) 23:49:20.66 ]: 興味ない人間からすると、逆にそういうの絡ませちゃうといい本でも手を出しづらくなるけどな
450 名前：１３２人目の素数さん [2014/01/05(日) 17:54:45.18 ]: クズがクソ本の宣伝
451 名前：１３２人目の素数さん [2014/01/05(日) 21:40:00.32 ]: クズ代表の俺から言わせてもらうと、他人をあからさまに
クズ形容する人に本物はいない。ソツのない秀才タイプが多い。
ソツがないということは、自分の手を汚そうとしない。けれど
真実を掴み取ろうと思ったら、自分で泥をかぶりその中にしか
ダイヤの原石のような本物は無い事に気付くことだ。クズの俺は
そんなことすらまだ出来ないw
452 名前：１３２人目の素数さん mailto:sage [2014/01/05(日) 21:41:12.53 ]: n数が1では正しさを評価しようがないな
453 名前：１３２人目の素数さん [2014/01/05(日) 23:06:42.01 ]: クズを無作為抽出→あなたは本物ですか？と質問→母比率の検定
454 名前：１３２人目の素数さん mailto:sage [2014/01/05(日) 23:30:53.27 ]: 母集団は２ｃｈ
455 名前：１３２人目の素数さん [2014/01/06(月) 01:26:03.23 ]: キチガイがクズ本の宣伝しても
２ｃｈらしくていいんじゃないか？
456 名前：１３２人目の素数さん mailto:sage [2014/01/06(月) 03:07:11.84 ]: 母集団の母数は何ですか(初心者)

集団のサイズwwwwwww
457 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 19:53:54.79 ]: 『朝まで生テレビ』アンケートで7割が靖国参拝支持　社会学者「統計的に意味のない数字」
blog.livedoor.jp/dqnplus/archives/1784020.html

コレって意味ないの？
458 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 21:18:34.63 ]: 無作為抽出とは程遠いから意味無いね
459 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 21:23:22.46 ]: ただ解ってるならアンケートやる前に言えよって話
460 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 21:32:09.70 ]: 小学校3年生から英語を習わせるように、統計ってヤツも算数の段階からリテラシーを育成する意味でも教育に重きを置くべきなんじゃねーの？
461 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 21:37:00.90 ]: 小学校で「割合」の概念を扱うのが、確か５年か６年の頃ですわ
462 名前：１３２人目の素数さん mailto:sage [2014/01/07(火) 23:57:19.00 ]: 世論を推定するには価値のないアンケートだが、
朝生見てる奴はこういう奴らという統計量としては意味がある。
463 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 00:04:50.78 ]: むしろこの偏ったデータを修正するためにどの程度の規模でどのような調査を実施すべきなのか
464 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 00:11:52.84 ]: 普通の新聞の世論調査で十分だよ。
465 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 02:12:40.94 ]: >>464
無作為で発生させた数字列を電話番号に見立てて、それで電話をかけて実際に出た人に対して、世論調査に協力。
いきなりの電話でイタズラ電話だと思う人も多いから、回答率は60%程度ではあるけれど、そんな無作為標本から得られた調査結果ならば、世論調査として安心できるわな。

政治問題に無関心な層に関しても、1-0.6≒0.4という数字デからも判断できるから、回答率100%のいびつな電話FAXアンケートよりも信頼に値する調査結果だし。
466 名前：１３２人目の素数さん [2014/01/08(水) 14:21:36.72 ]: 「イタズラ電話にわざわざ回答する」というフィルターが恣意的ではないとは思えない
467 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 17:15:41.53 ]: www.nhk.or.jp/bunken/yoron/nhk/process/sampling.html
NHKではこんな風に抽出してるらしい
468 名前：１３２人目の素数さん [2014/01/08(水) 23:42:50.70 ]: >>466
実際こういう世論調査における回答拒否ってどう扱えばいいんだろう？
テレビなんかだと回答内容の内訳のグラフとか出したりするけど、あれに回答拒否を加えたら意味あるのかね
469 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 23:52:25.23 ]: そもそも日中に家の電話に出られるヒマ人って段階で到底無作為とはいえないんじゃないか？
470 名前：１３２人目の素数さん mailto:sage [2014/01/08(水) 23:54:20.63 ]: まともな世論調査では有効回答とか回答率とか数値も出してる。

マスゴミの信用度と取るか世論の民度と取るか調査した会社の態度の悪さと取るかは
また別のアンケートが必要だな。
471 名前：１３２人目の素数さん mailto:sage [2014/01/12(日) 18:13:49.95 ]: 例挙げて質問します

車のアクセルペダルの踏み込み量によって車の走り方がどう変わるかという実験をしたとします
踏み込み量を因子として、20%40%60%80%100%の５条件とします
測定データを加速度、最高速度、燃費、回転数とします
踏み込み量と車の走り方の関係性を検討するにはどういった検定を行えばよいでしょうか？
472 名前：１３２人目の素数さん mailto:sage [2014/01/16(木) 23:07:55.05 ]: 仮説検定の対立仮説（H_1）と帰無仮説（H_0）について質問です
H_1:μ>m　と　H_0:μ=mについての検定ってよく書かれているんですが、
帰無仮説って必ずしもμ=mでなければならないんでしょうか？
μ＜mとかでもよいのでしょうか
473 名前：１３２人目の素数さん mailto:sage [2014/01/17(金) 04:45:41.68 ]: >>472
帰無仮説は否定されてこそナンボ
イコールであるコトを否定する方が検定作業は簡単。
474 名前：１３２人目の素数さん mailto:sage [2014/01/18(土) 00:09:42.96 ]: キム仮説ってなんか韓国人の仮説みたいだ
475 名前：１３２人目の素数さん mailto:sage [2014/01/18(土) 08:53:02.44 ]: ある事象が韓国発祥であるという仮説

確かに否定されてナンボだ
476 名前：１３２人目の素数さん mailto:sage [2014/01/18(土) 12:55:31.99 ]: もともと金さんが発見したから金仮説だろ
統計学の発祥は韓国
477 名前：１３２人目の素数さん mailto:sage [2014/01/18(土) 17:47:40.88 ]: 大学で統計学やってるんだが質問いい？

問、(有意水準5%として)「有意水準」とは確率である。確率であるということはある試行を無限回繰り返した時に何が起こる確率が5%なのか？

また上でなされた判断(ある試験の母平均が50点であるかどうかの仮説検定)は、現実に観測された結果をどのように考えた結果なされたものかについて述べよ

説明が上手くできないから教えてくだされ
m(_ _)m
478 名前：１３２人目の素数さん mailto:sage [2014/01/20(月) 12:44:19.29 ]: >>477
有意水準＝危険率って教えてる先生も多い。
やさしい解説書にもそういう記述が多いんじゃないかな？

否定されてナンボのキム仮説が「実はまさかの真実であった！という確率→"有意水準0.05"

ato,
天気予報の降水確率と関連付けると、何となくわかり易いって教わった。
479 名前：１３２人目の素数さん mailto:sage [2014/01/20(月) 20:16:20.57 ]: imgur.com/akb6Mxv.jpg
このZは何をさしてるのか教えて下さい(´・ω・｀)
独立2群の差の検定で求めたものです
480 名前：１３２人目の素数さん mailto:sage [2014/01/21(火) 18:35:55.91 ]: ももクロっぽさ
481 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 00:25:18.24 ]: 独立でない正規分布の和、例えばX+Yみたいなのって正規分布に従う？
各平均、分散に加えて共分散さえわかれば、平均も分散は出せるけど分布も正規分布なのか？
適当に調べたんだが独立な場合に畳み込みやら再生性って話はあるけど、従属な時がわかりゃせん
482 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 00:29:33.47 ]: 従属の仕方による
483 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 00:45:50.69 ]: >>482
なんかヒントください
共分散0.5みたいな感じだと正規分布になります？
484 名前：１３２人目の素数さん [2014/01/23(木) 08:03:12.82 ]: 日本の学歴の相対評価

５（07%）　院卒・一流大卒
４（24%）　四大卒
３（38%）　短大卒・専門卒
２（24%）　高卒
１（07%）　中卒

これって大体あってますか？
485 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 09:07:31.80 ]: それで大体合うように大学を格付けすればいいんじゃないですかね
486 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 09:10:02.78 ]: 大学院こそ学歴と実力との相関が大きい気がする
487 名前：１３２人目の素数さん [2014/01/23(木) 10:43:20.60 ]: >>481

従属なときは正規分布しないでしょ。

多次元正規分布は変数同士は独立が仮定にある。
独立じゃないと確率密度関数はめちゃ複雑な形になり、正規分布ではなくなる。
488 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 11:17:21.98 ]: X が正規分布するとき、
X と X は？
489 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 11:30:53.09 ]: ネトウヨがよく言う「韓国語は英語より平均点がめちゃくちゃ高いので
在日特権！（キリリッ」を検証するためには
１．大学入試センターが得点分布を公表し
２．その得点分布が正規分布に従うと言えるか検定
３．韓国語と英語の得点差に有意性があるかさらに検定
する必要があるんdが

あ　の　隠　蔽　体　質　を　考　え　る　と　ム　リ　ポ
490 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 13:08:29.14 ]: あえて英語じゃなくて第二外国語を選ぶっていうことは、
その言語に対してリテラシーがあるってことだから、平均点が高くなるのは当たり前
だから難易度に格差があるかどうかは第二外国語間の比較で論ずるのが妥当だと思う
491 名前：１３２人目の素数さん [2014/01/23(木) 13:15:15.24 ]: >>488
2Xの正規分布
492 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 14:19:11.40 ]: >>491
Xを確率変数としたとき
X＋Xと２Xは違うんだぜ
493 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 14:53:02.62 ]: マジで！？
494 名前：売国新聞排除 mailto:sage [2014/01/23(木) 15:01:24.55 ]: 新聞購読を止めて、月3000～4000円、年間36000～48000円の節約

特に日本と日本人を貶める売国新聞を購読することは売国行為に加担するに等しい

新聞を購読することは止めて自分の頭で考えるようになろう
495 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 15:22:44.12 ]: あ、iidじゃないのか。なら2X。
496 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 21:35:35.27 ]: 分散=E(x^2)-E(x)^2
になるのどうしてですか？

分散は期待値u周りの二次元のモーメントなので、
分散=∫(x-u)^2･f(x)dx
=∫x^2･f(x)dx-2u∫x･f(x)dx+u^2∫f(x)dx
=∫x^2･f(x)dx-2u･u+u^2
=∫x^2･f(x)dx-u^2

ここで∫x^2･f(x)dxをどうすればE(x^2)に変形できるのですか？
497 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 21:39:56.88 ]: Eという記号の定義より
498 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 21:46:03.28 ]: E(x^2)って∫x^2・f(x^2)dx
じゃないの？
499 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 21:48:04.55 ]: f(x)はf(x)

例えばサイコロの出る目の二乗の期待値E(x^2)は
∑x^2・p(x^2)じゃなくて∑x^2・p(x)だろ？
500 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 21:56:05.89 ]: あm分かりました。ありがとうございます
501 名前：１３２人目の素数さん mailto:sage [2014/01/23(木) 22:27:33.27 ]: xの期待値は連続分布のとき∫x･f(x)dxで与えられるが、
このときxについての任意の関数g(x)の期待値は∫g(x)･f(x)dxになる
502 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 00:02:07.06 ]: これは良い正規分布
twicsy.com/i/gKwsMe
503 名前：１３２人目の素数さん [2014/01/24(金) 17:02:58.68 ]: 綺麗な正規分布を描く試験はダメな試験

良い試験は出来る層と出来ない層で山が２つ出来る。

今年のセンター国語はアホが作ったんだな。
504 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 17:50:50.25 ]: 2つ山ができたら良いテストなの？何故？
505 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:00:14.28 ]: 出来る層（十分な国語の学力を持つ層）と出来ない層（十分な国語の学力を持たない層）の基準が大学によって異なる
ということに考えが至らないようでは…
506 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:16:50.65 ]: センターの場合、受験者が多いのと、学力にバラツキがあるから、
良いセンター試験は台形型の分布になるだろうな。
507 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:28:06.87 ]: >>504
テストの目的って、賢いやつと賢くないやつを分類することだろ？

今年のセンター国語は賢いやつと賢くないやつを分けれてないな。
こんな正規分布だと国語出来ない奴も出来る奴も中央値に向かいやすくなる。

つまり、国語出来ない奴にはお得な試験で、出来る奴には辛い試験だったという
ことが分布から分かるんだな～
508 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:29:42.93 ]: 「十分に賢い」の基準が大学によって異なる
509 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:33:03.99 ]: 教育界は横並び志向だから、
そっちのほうが「よい試験」。
偏差値を偏重するのも、
正規分布が念頭にあるから。
510 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 18:33:08.99 ]: ＞テストの目的って、賢いやつと賢くないやつを分類することだろ？
この時点で疑問符がつく
上のような意図の試験も一つの形ではあるだろうが、細かくランク分けすることが好ましい場合もある
ましてやそれが、レベルが様々な全国の大学の共通試験ともなれば、一層疑問の色が濃くなる
511 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 19:17:22.37 ]: >>510
その場合、分散がでかくなるから、裾の広い分布になるだろ。
尖度の大きい分布にはならないはず。
512 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 19:21:48.05 ]: 正規分布になるのが良い試験だとは言ってないよ
山が２つ出来るのが良い試験なのか？と疑義を投げかけている
513 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 19:26:38.04 ]: ちなみに、センターは基礎学力を見る試験だから、細かい能力の差を見る試験ではない。
より精密な順位をつけるために２次試験があるんだろ。
514 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 19:30:09.08 ]: 合格、不合格の２値で判定される試験では、山２つが良い試験。
515 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 20:41:14.14 ]: >>507
テストの目的は能力を測ることだと思う
516 名前：515 mailto:sage [2014/01/24(金) 20:47:04.47 ]: その上で能力を推定することを考えると
問題単位で考えると能力に対して正答率が50%くらいの問題を与えるのが情報量が多くて一番良いと聞いたことはあるんだけど、その問題の集合をテストとしたときに得点分布はどんなふうになるんだろう
517 名前：515 mailto:sage [2014/01/24(金) 21:56:24.41 ]: >>516
これ得点分布考えても意味なさそうですね
考えるなら能力の分布ですかね
518 名前：１３２人目の素数さん mailto:sage [2014/01/24(金) 23:47:48.78 ]: え、二つ山より、正規分布になる方がいい試験だと思ってたけど違うの？
519 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 07:48:16.70 ]: >>516
テスト理論は統計学を使った方法がある。TOEICやTOEFLみたいな試験で採用されている。

この方法では、まず正答率が高い人を抽出する。
正答率が高い人だけが正解する問題は、出来る人を検出する問題ということで良い問題。
こいういう問題は配点が高くなる設定になる。
逆に正答率が高い人でも解けない問題というのは、誰も解けないじゃん。ということで悪問扱いで配点は低い。
あと、みんなが解ける問題というのも能力を測れていないので、配点は低い。
520 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 07:51:19.54 ]: >>515
能力を測る場合でも、分散がでかくなるような分布が理想。
521 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 07:59:49.69 ]: >>518
TOEICやセンターなど点数に意味のある試験では分散のでかい分布が良い試験。
間違っても、今年のセンター国語のような正規分布良い試験ではない。
２択まで絞って、そこからは運って試験が平均100点の正規分布となるが、センター国語はまさにそんな試験。

２次試験では合格、不合格に分類したいわけだから、山２つを目指して、試験を作る。
522 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 09:44:15.55 ]: それ合格者と不合格者が明確に異なる平均・分散からなる母集団に区分けされるってこと？
あり得ないだろそんなのｗ
ましてやセンター試験みたいな母集団が大きくて受ける大学もバラバラな試験じゃあね
523 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 10:13:30.64 ]: 合否の分かれ目の点数に大量の受験者がいたら
運が合否の分かれ目の試験になってしまうな。よくない試験と言える。
524 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 10:53:18.76 ]: まず
良い試験
悪い試験
の定義から始めなよ
525 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 11:37:34.71 ]: >>522
統計学が分かってるやつらが作った試験（数学、物理）とそうでない奴らが作った試験（国語、歴史など）の分布を
見比べてみなよ。

国語や歴史は正規分布型に近いはず。
これは、科目の性質を表しているんじゃなくて、出題者の意図の違いだよ。
数学や物理は難しい問題を出そうと思ったらいくらでも出せるけど、
それでは出来る奴を判別する試験にはならないから、あえてそうしないだけ。
526 名前：１３２人目の素数さん [2014/01/25(土) 12:24:45.43 ]: 適当に画像検索してみたが２つ山になんてなってねーじゃねーかｗ
デタラメばっか言うなよ
527 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 13:14:44.81 ]: 物理や数学のセンター試験は山が２つあるとでも思ったのか？

だから、山２つ出来るのは２次試験だって何度も言ってるだろ。
528 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 13:17:33.88 ]: monoist.atmarkit.co.jp/mn/articles/1304/12/news009_2.html
529 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 13:28:45.63 ]: センター試験に端を発してるのにその論理はもうグチャグチャだろ
だったら初めから口はさむなと言いたい
530 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 13:55:21.72 ]: 統計の話じゃねーだろ
531 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 14:25:24.82 ]: >>529
センター試験の話がしたいなら受験サロンでもお逝きなさい
532 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 15:10:00.86 ]: 得点が正規分布しない方が受験用としては良い試験というのは勉強になった。
533 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 15:26:38.40 ]: お口直しに
ttp://www.msi.co.jp/splus/usersCase/edu/pdf/hayashij.pdf
534 名前：１３２人目の素数さん mailto:sage [2014/01/25(土) 20:04:09.97 ]: 統計リテラシーが身につくといろんな知識が蓄えられるな
535 名前：１３２人目の素数さん mailto:sage [2014/01/26(日) 03:34:41.01 ]: 数学がちょっと好きな文系１年です。（統計２級うかったけど１級落ちました(T_T)）
質問があります。

標本比率から母比率を検定する方法についてです。
n: 標本サイズ p: 母比率 r: 標本比率
大標本のとき、比率の分布がN(np, np(1-p))に近似できると本や学校で習いました。
そこまではいいんですが、検定するときにpをrで代用してp～N(nr, nr(1-r))に近似するという方法をやりました。
p≒rの話だと思うのですが、母比率の分布は厳密には少し0.5の方に歪んでますよね？（最尤値はrかな？）なんていう分布か教えてください。

それとレヴィ分布についても教えて下さい。
立ち読みした本に、正規分布を酔っ払いがホテルで自分の部屋から行き着く部屋とすると、
レヴィ分布は酔っぱらいが横に長い壁に向かって銃を撃ったときに銃弾があたる場所の分布だと書いてありました。
これってθ～Nのときの1/tanθの分布って意味ですか？
536 名前：１３２人目の素数さん [2014/01/26(日) 05:52:34.57 ]: 勉強した人は高い平均の分布、してない人は低い平均の分布で、結果は２つ山。
これを２人でなく１０００人で考えると、多峰性の分布や一様分布になるが、さすがに０点や
１００点は少ないので両端とれて台形の分布になるのでは。上のレスであるように。
537 名前：５３５ mailto:sage [2014/01/26(日) 06:01:44.34 ]: N(np, np(1-p))は数の分布だった
N(p, p(1-p)/n)です
538 名前：１３２人目の素数さん [2014/01/26(日) 06:13:18.36 ]: なんかわかりにくいので式にすると単に
X|μ ~ normal(mean =μ,sd =5)ぐらいで
μ~uniform(10,80)
の分布を考えると台形になるんじゃ。μ～normal(mean=50,sd=10)はどうなんかな。
Xがセンター試験の得点分布で、μが受験者の実力分布としたばあいね
539 名前：１３２人目の素数さん mailto:sage [2014/01/26(日) 17:36:42.97 ]: >>535
歪んでんの？へぇー

なぜ1/tanθだと思うの？
540 名前：１３２人目の素数さん mailto:sage [2014/01/26(日) 20:18:38.68 ]: r=0のとき明らかにpの平均値・中央値は0より大。r=1のときも1より小。
ただしpの最頻値がrであると思ったから。
それ以外は想像。

まずレヴィ分布について知らないから、よっぱらいの銃が壁にあたったところってあるから
i.imgur.com/WPXzcFS.jpg
だとおもった。
θがランダムで、y=tanθとy=1の交点の分布を考えた。
541 名前：１３２人目の素数さん mailto:sage [2014/01/27(月) 19:05:08.02 ]: F分布のことかな？

それ、正規分布になると思うよ？
レヴィ分布は右に裾を引く分布だね。金融工学とかで使ってるよ。
542 名前：535 mailto:sage [2014/01/27(月) 21:21:13.51 ]: F分布ですか。母比率についてF分布にしたがう統計量あってびっくりです。
正規分布の比の分布はコーシー分布、正規分布の二乗和の分布はカイ二乗分布みたいな、狭義レヴィ分布の説明ってありますか？
543 名前：１３２人目の素数さん mailto:sage [2014/01/27(月) 21:42:55.63 ]: パラメタ不明のn個の正規分布{N(μ_i, σ_i^2) | i ∈ [1,n]}から
それぞれm個ずつ独立に値をサンプリングして、
そのmn個の値をもとに平均の和(Σμ_i)の信頼区間を作りたいのですが、良い方法はありますか？

n個の分布に従う変数の和の分布を考えれば、標本数=mのt検定ができることは分かるのですが、
そこまで情報を捨てないで済むものを探しています

n=2の場合は片方を符号反転してWelchのt検定でよさそうなんですが、
一般の場合にも似たような手法が使えるのでしょうか

また、分散が一部共通の2n個の正規分布{N(μ_i_j, σ_i^2) | i ∈ [1,n], j ∈ [1,2]}の標本から
(Σ(μ_i_1 - μ_i_2))の信頼区間を作りたい場合に良い方法はありますか
544 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 05:01:20.79 ]: 標本数？
545 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 05:48:14.24 ]: すいませんsample sizeのつもりでした
546 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 09:09:10.97 ]: sample size mのt検定はないでしょ。
547 名前：１３２人目の素数さん [2014/01/28(火) 11:13:27.30 ]: >>543
正規分布の再生性　じゃダメ？
それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
パラメータの信頼区間を求めたいなら別だけど。
548 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 12:39:05.56 ]: >>542
レヴィ分布は確率過程や確率解析の本を見たら乗ってると思う。
統計より確率論の話。
549 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 15:41:50.93 ]: こんなとこで聞かないで図書館行って調べろよ
何でもかんでも人に聞く癖を直せ
大学生なら最終的には教授に聞け
550 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 21:27:49.76 ]: >>547
再生性を使うより良い方法があるかと思って質問したのですが、無理そうでしたか
ありがとうございます

>それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
>パラメータの信頼区間を求めたいなら別だけど。
パラメータの推定が目的なので、パラメータの信頼区間を求めたいです
551 名前：535 mailto:sage [2014/01/28(火) 23:20:40.64 ]: >>548 PRMLとかですか？
どうりで入門書でも数理統計の本で見なかったと思いました。
552 名前：１３２人目の素数さん mailto:sage [2014/01/28(火) 23:22:14.09 ]: prmlは確率過程じゃなかった
553 名前：１３２人目の素数さん [2014/01/29(水) 04:16:50.94 ]: 統計学をやろうとおもうのですが、高校数学の平面図形の知識は必要ですか。

重点的にやっおいたほうがいいという分野がアレばお願いします
554 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 06:28:53.08 ]: 統計学をやればいいと思います
555 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 07:51:02.21 ]: 必要になる度に復習せえ
とんでもない量になって結局、高校数学全て見直す娘とになるがな
556 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 08:17:42.21 ]: 確率は見直しとくとスムーズ
557 名前：１３２人目の素数さん [2014/01/29(水) 09:57:22.23 ]: 機械学習と統計学の違いは何？
どっちが難しい？
どっちが実用的？
統計学が最強の～では機械学習はあまり触れられていませんでしたが。
558 名前：１３２人目の素数さん [2014/01/29(水) 10:04:44.07 ]: ＞５５３
一変数の微積と高校程度の確率の話が分かってれば大体なんとかなる
559 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 10:12:04.76 ]: >>557
かぶる部分も多いけど、統計の方が難しい。
統計家は機械学習できるけど、情報屋は数理統計学で詰む。

実用的なのは機械学習。
ビッグデータでも使えるし。
従来の頻度論統計学はデータ量が多いと使えない。
560 名前：１３２人目の素数さん [2014/01/29(水) 11:43:49.36 ]: >>559
どうもです。機械学習のほうが難しいのだと思っていました。
統計学よりも数学的知識を前提にしているようですし。
データ量が多いと統計学が使えないのは初めて知りました。
統計学はデータ量が多いほど分析が簡単になるのでは？
561 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 13:56:10.22 ]: 統計学の本来の目的って、標本から母集団を推定したり・検定することにある。
標本が1000とか1万とかのデータ数だと、それはもう母集団といえる規模。
推定は一致し、検定は有意な差しか出なくなる。

ビッグデータに古典的な推定や検定を使ってたら、分析者を殴っていい。
562 名前：１３２人目の素数さん [2014/01/29(水) 17:51:50.00 ]: >>561
どこまでを統計学というの？
また、ビッグ・データとは何？
563 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 18:06:18.39 ]: >>543
解決しました
検定統計量を
√(Σ(s_i^2/m))
(ただしs_iは標本標準偏差)とし、実効自由度を
(Σ(s_i^2/m))^2/(Σ((s_i^2/m)^2/(m-1)))
としたt検定でいけるようです
564 名前：１３２人目の素数さん mailto:sage [2014/01/29(水) 20:31:10.73 ]: >>562
明確な定義はない。
565 名前：１３２人目の素数さん [2014/01/30(木) 14:57:27.25 ]: >>561
有意な差がでるのは良くないことなんですね。つまり
有意な差がでやすい大きな標本を統計学では使うべきではない、
ということですね。わかりました。
566 名前：１３２人目の素数さん mailto:sage [2014/01/30(木) 21:55:20.32 ]: 釣られてあげようか？
567 名前：１３２人目の素数さん mailto:sage [2014/01/30(木) 22:10:41.80 ]: >>565
そうだよ。
推測統計ではデータが少なすぎるのも問題だけど、多すぎるものに使うのも問題。
568 名前：１３２人目の素数さん mailto:sage [2014/01/30(木) 22:12:01.89 ]: 多すぎると何が問題なんですか？
569 名前：１３２人目の素数さん [2014/01/30(木) 22:17:32.41 ]: ベイズ統計スレを新たに建てたら？
570 名前：１３２人目の素数さん mailto:sage [2014/01/30(木) 22:32:32.04 ]: >>567
例えば、データ数が1000の相関係数が0.06だった場合、普通は相関無しと思うが、
相関係数の検定をすると有意差が生まれる。

これは、検定がもともとデータ数が少ない場合に使うことを前提にして作られたから起きる問題。

www.urano-ken.com/research/seminar/2007/seminar_urano_2.pdf
571 名前：１３２人目の素数さん [2014/01/31(金) 03:31:41.68 ]: そのｐｄｆ，「きわめて小さな差でも“（統計的には）有意である”という結果になる可能性が
高まります。」と書いてるけど、それで何が問題なのかわからないです。。

むしろ極めて小さな差でもデータ数が多ければ、その差が偶然出ないことがハッキリして
よかったね、というふう好意的に解釈してしまいました。
572 名前：１３２人目の素数さん [2014/01/31(金) 06:47:42.46 ]: 適切な標本数って母集団の大きさと目標とする誤差で変わってくるんでは
政府統計だと標本数10万人規模だったりするし
573 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 08:30:10.36 ]: 標本数
574 名前：１３２人目の素数さん [2014/01/31(金) 08:45:25.91 ]: 標本の大きさというべきでありました・・・
575 名前：１３２人目の素数さん [2014/01/31(金) 12:11:15.00 ]: で
結局データ数が多い場合には極めて小さな差でも有意にできるのは問題なん？
問題ないん？どっち？
576 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 12:55:36.73 ]: 問題無い
577 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 18:45:32.96 ]: >>570
問題の意味が分らない。誰か説明して。
578 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 19:09:28.32 ]: >>575
問題ありだろ。

例えば、イケメン度合い(y)を2chに書き込んだ回数(x)で回帰分析する場合を考える。
普通この２変数に相関はないだろう。
しかし、「2chに書き込めばイケメンになれるんだということを世間に知らしめたいとする」
その場合、標本数を1000以上とってくる。
そして、回帰モデルの検定を行う。
すると、p値に有意差が生まれて、このモデルは統計的に意味のあるモデルと言うことが出来る。

ただ、正の相関か負の相関かは標本次第w
579 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 19:13:06.08 ]: 基本的に思考停止な検定を始める奴は統計学に向いていない
580 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 20:41:22.58 ]: 質問です。
ここにいる皆さんは仕事をするときに統計学をがっつり使っていますか？
現在就活中で大学で統計学を専攻しているのでそれを活かせる職業を探しています。
因みに私立文系でプログラミングは出来ません。
よろしくお願いします。
581 名前：１３２人目の素数さん [2014/01/31(金) 20:43:07.34 ]: >>580
大学はどこ?
582 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 20:50:17.70 ]: >>581
早慶です
583 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 21:10:32.93 ]: 基本的にプログラミングの知識を使わないで統計の知識だけ使うってことはほとんど無いよ
新卒なら入社してから覚えさせられることになるし、
現時点でバリバリプログラミングが出来る必要はないけど、
そういう仕事やりたいんならちょっとかじるくらいではプログラミングに触れておいたほうがいいかも
584 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 21:11:29.97 ]: ↑自己アピールができる、という意味でね

ただ入社以降もプログラミングには触れたくない！って言うのならおすすめはしない
585 名前：１３２人目の素数さん [2014/01/31(金) 21:25:45.95 ]: >>582
早稲田は文系でも統計の研究室いくつかあるけど、そこ出身かな？！

マーケティングの統計職ならあまりプログラミングはないと思うけど。
586 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 21:29:12.16 ]: なんで学生課に行かずにここで聞くのかな
587 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 22:33:48.65 ]: Ｒぐらいでも十分じゃないかなあ。
自分でコーティングは、しないでしょ。
588 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 23:20:36.36 ]: 手段として統計を使う仕事はいくらでもあるが
目的として統計を使う仕事はほとんどない

手段に秀でているだけの人材は下請けで間に合う
589 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 23:22:38.72 ]: 大学の教授に聞けよ
なんでもかんでも他人に丸投げしないで自分から動け
590 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 23:27:55.18 ]: 私大の文系だと数Ⅲもできないだろうし理屈から始めるにはもう遅いかもな
591 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 23:34:11.44 ]: 統計学専攻なら文系でも線型代数とか簡単な解析学ぐらいはやるだろう
592 名前：１３２人目の素数さん [2014/01/31(金) 23:43:19.97 ]: 統計専攻って言うくらいだから、数理統計学はやってるだろう
593 名前：１３２人目の素数さん mailto:sage [2014/01/31(金) 23:45:03.51 ]: 文系なら技術屋になるより、そいつらを使う側に回った方が良い気がするけどな。
594 名前：535 mailto:sage [2014/02/01(土) 00:29:28.40 ]: 私大文系だけど、今日の統計のテスト、カイ二乗検定とt検定しかなかったわ
595 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 00:30:19.31 ]: 名前まちがえた
596 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 00:46:55.27 ]: 皆さんありがとうございます。
>>580です。

ここにいる人達が普段のお仕事の中で統計学をいかに使っているのかを知りたかったので、質問しました。
とりあえず、明日就職課に聞いてみます。
597 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 01:35:49.77 ]: >>596
統計を人を騙す道具として使ってる企業多いから気をつけてね。

例えば、製薬とか被験者の取り方でいくらでも効く薬や副作用の少ない薬作ることが可能だから。
まともな人は病むかも。
マーケティングや調査会社も如何わしい。お客さんが喜べば何しても良いと思ってる。

そういう意味では、事業会社の統計職が良いかもね。いろんな部署と協力して出来るし。

本当に統計が好きなら、統計の大学教授になることだよ。一番まともに統計使って、さらに作ってる人たち。
598 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 01:43:00.44 ]: 伸びてるから面白い話題かと思ったのに
599 名前：１３２人目の素数さん [2014/02/01(土) 06:30:20.07 ]: やっぱり有意という言葉が良くないと思う。代わりに標準偏差と推定量だけ、
ｔ統計量もｐ値も各自で計算して、有意という言葉は廃止にした方がいい気がス。つかってていいこと一つもないし。
600 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 12:07:08.15 ]: 質問させてください。完備統計量はどういう意味があるんでしょうか？
E[h(T)]=0ならばh(t)=0が定義なのですが、なぜこんな量を求めるのかが
よくわかりません。

それに妙に線形代数の線形結合の定義と似ている気もするのですが関連があるのでしょうか。
601 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 13:14:56.94 ]: 良く使った最小自乗法は、統計的推定と称するけど統計を使ってる意識はないなー
602 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 13:21:22.05 ]: >>600
その成分だけで全部決まるという意味だからベクトル空間の基底と同じ性質だわな
603 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 13:46:06.42 ]: >>597
日本の企業で統計使うって品質管理分野ばかりなんだけどね。
604 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 14:47:18.07 ]: >>603
そんなことはありえない。

だって、統計関連学会で知り合う人はメーカーから製薬、金融まで幅広いぞ。
605 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 15:25:06.33 ]: >>603-604
は？
606 名前：１３２人目の素数さん mailto:sage [2014/02/01(土) 15:34:29.86 ]: >>602
どうもです。ということはコレは線形結合の場合に係数c1,c2,,,cnが一意的に決まる
のと同じと考えていいんですね。
例えばE[h(T)]=12のような値になる場合必ずh(T)=1/4Tに一意的にきまる、というふうに。
607 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 13:49:50.04 ]: ちょっと統計学から離れちゃうかもしれないけど、
積率って元々どんな学問分野で、どんな目的で産まれた概念なの？
608 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 17:48:53.04 ]: 梃子じゃない？
609 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 17:54:37.65 ]: 疑問に思っちゃんだ、どうしてかな？
610 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 18:39:57.94 ]: 数理統計学の本読んでいたら
「離散確率変数Xの分布の積率は次のように用意に定義できる」
っていう記述が出てきたんだけど、なんか突飛に感じたから。

結果的には積率っていう道具を導入することで、
分布の記述に利があるということはわかるんだけど、
そもそも積率そのものの意味がよくわからないから、なんとなくもやもやした。

それで、積率というものが元々どんな分野のどんな要件を満たすために産まれた概念なのかがわかれば、
なんでここで積率を導入するのか、しようと思ったのかが理解しやすいかな、って思ったから聞いてみた。
スレ違いだったらごめん。
611 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 23:12:14.41 ]: 「利」があることが分かってんなら十分だろ
612 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 23:30:40.14 ]: お前は学問向いてないな
613 名前：１３２人目の素数さん mailto:sage [2014/02/04(火) 23:51:44.35 ]: 統計学の課題を出されたのですが、まったく解らず困っています。
誰か考え方だけでも教えてもらえないでしょうか。
よろしくお願いいたします。
614 名前：１３２人目の素数さん mailto:sage [2014/02/05(水) 04:57:32.20 ]: 確か積率母関数の積率がモーメントのことで実際テイラー展開すると
モーメントの線形結合がわんさか出てくるから母関数だとマセマに
書いてあったよ。
615 名前：１３２人目の素数さん mailto:sage [2014/02/05(水) 23:55:03.57 ]: キュムラント展開か、統計で役にたつのかな、物理なら分かるが
616 名前：１３２人目の素数さん mailto:sage [2014/02/06(木) 21:53:36.67 ]: 誤差付きのデータの扱いに関して質問があります。
誤差付きのデータの平均をとるときにエラーの大きさに応じて重みを付けるのはわかるのですが、
データの標本分散を求めるときには重みってつけなくていいのでしょうか？？
Xってパラメータの標本があったとして(それぞれ誤差σがついてる)、X_iのデータの重みをw_i = 1/σ_i^2とすると分散は
V=sum(w_i*(<X>-X_i)^2)/sum(w_i)
にした方がいいのかなと考えたのですが見当違いですか？sum()が()内の総和で、<X>はXの加重平均です。
調べても加重平均の標準偏差しか出てこなくて誤差のついた標本の分布全体の標準偏差ってのが出てこなくて困った挙句物理板で聞いたらここを紹介されました。
どなたか教えていただけないでしょうか
617 名前：１３２人目の素数さん mailto:sage [2014/02/06(木) 22:31:27.90 ]: 標準偏差を求めるために標準偏差で規格化したら意味が無かろう
618 名前：１３２人目の素数さん mailto:sage [2014/02/06(木) 23:51:35.27 ]: >>617
ごめんなさい、なんか自分がわけのわからないことをしようとしていたことに気付いたかもです。
なんか異なるいくつかの母集団それぞれの平均と標準偏差からそれら全体を母集団とする集団の平均と標準偏差を求めようとしてたんですけど、もともとそれぞれ違うものなんだから重み付けるのがそもそも間違ってるような気がしてきました。
例えると、蟻、犬、芋虫、猫、人、象って種の体長とその標準偏差をそれぞれ求めて、じゃあそれらの動物全体の平均体長とそのばらつきをそこからそれぞれの標準偏差で重み付けて求めようとしてました。
この場合、重みをつけるべきではないですよね？
619 名前：１３２人目の素数さん mailto:sage [2014/02/07(金) 08:49:08.24 ]: 正規化すればいいんじゃない？
620 名前：１３２人目の素数さん [2014/02/10(月) 11:29:37.40 ]: 1分に1回事件が起こるってポワソン分布に従って、乱数で件数を返す関数Aがあったとして
それを60回足し合わせたら
60分に60回ってポワソン分布に従って件数を返す関数Bと同じようなものになるの？
初学者なのでヘンテコな質問になってるかもしれないが
621 名前：１３２人目の素数さん mailto:sage [2014/02/10(月) 16:41:47.30 ]: せめて確率変数と言ってはどうか
1分に平均で1回の～確率変数を60個足し合わせると60分に平均で60回の～になる
622 名前：１３２人目の素数さん mailto:sage [2014/02/10(月) 18:08:40.15 ]: すまんなﾄﾝｸｽ
うまいことできてんなぁ
623 名前：１３２人目の素数さん [2014/02/12(水) 03:12:16.12 ]: 1個のサイコロを600回投げたら1の目が118回出た。
このサイコロは正常ではないか、有意水準5%で推定せよ
↑この問題から、z=1.84<1.96　よって、正常でないとは言えない
この答の出し方がわからないんだが、どういう考え方でやってるんだ？
624 名前：１３２人目の素数さん [2014/02/12(水) 03:18:55.59 ]: 2行目、推定じゃなくて検定か
平均E=100,偏差σ=9.13を出して、
E-1.96*9.13 , E+1.96*9.13で有効な範囲出すだけじゃダメなんかな
625 名前：１３２人目の素数さん mailto:sage [2014/02/12(水) 04:10:27.21 ]: 標準化するんでしょ？
しかし問題合ってるか？これ
626 名前：１３２人目の素数さん mailto:sage [2014/02/12(水) 05:15:13.90 ]: やっぱり問題（答え？）が間違ってるのかな？
(118-100)/9.13 >1.96
よって、正常ではない

やりかたはこれであってるのかな？
627 名前：１３２人目の素数さん [2014/02/12(水) 23:13:56.67 ]: >>597
＞　統計を人を騙す道具として使ってる企業多いから気をつけてね。

お前が人を騙しているんだろうがクズが。
詐欺師のくせに数学板にくるんじゃない馬鹿が！
628 名前：１３２人目の素数さん mailto:sage [2014/02/17(月) 00:40:42.15 ]: execel2007の分散検定で「繰り返しのある分散検定」というのがありますが、
「対応のある分散検定」と同意でしょうか？
629 名前：１３２人目の素数さん mailto:sage [2014/02/19(水) 02:42:00.85 ]: 洋書の教科書を買いたいのですがオススメはなんでしょう？
unbiased, efficient, precise estimatorについて述べてあるもので
630 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 00:46:19.69 ]: 私立文系のアホですが統計やる事になり困ってます
中高の数学だと何の単元が統計学には必要でしょうか？
631 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 01:24:40.92 ]: 記述統計なら、数学よりむしろエクセル勉強。

推測統計なら、場合の数（数学A）、確率（数学A）、数列（数学B）、積分（数学Ⅱ）かな。
あと多分ならってないだろうけど、統計とコンピュータ（数学B）、確率分布（数学C）、統計処理（数学C）
は、目を通しとけば。
632 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 02:24:09.41 ]: 四則演算を覚えたら後は大学の統計を勉強すればよい
633 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 11:37:51.64 ]: >>631
詳しくありがとうございます
634 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 13:25:11.13 ]: 大学で習う統計学を、高校数学の教養無しで学ぶのは無理じゃね。
635 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 14:17:35.69 ]: 自分の場合中学数学からやる必要があるorz
636 名前：１３２人目の素数さん mailto:sage [2014/02/23(日) 21:07:40.18 ]: 文型の統計学なら、理論より実践的なものを学ぶんじゃね。
経済統計とか社会統計とかさ。
調査票のとり方とか、そういうのかもよ。
確率分布とか、そういったものじゃない気がする。
経験者俺。
637 名前：１３２人目の素数さん mailto:sage [2014/02/25(火) 13:35:48.53 ]: 中学数学だとどこら辺の単元をやる必要がありますか？
638 名前：１３２人目の素数さん [2014/02/25(火) 19:41:34.40 ]: ちょいと教えていただきたい
選挙みたいなやつの出口調査と実際の結果がどの程度一致するものなのか調べてみたいんだが
そういう場合は全候補者にそれぞれの得票数でχ二乗検定をすればいいのか
それとも単に順位相関を求めればいいのか
どうも何をどう適用すればいいか十分には理解してなくて
639 名前：１３２人目の素数さん [2014/02/25(火) 22:58:28.19 ]: 明日の16時39分頃に気をつけて下さい。
日本にも世界にも巨大地震が起きませんように。
皆さんも一緒に祈って下さい。

太陽フレアのＸが発生しました。
太陽黒点数の100越えが24日間継続しているようです。
640 名前：１３２人目の素数さん mailto:sage [2014/02/26(水) 23:33:48.35 ]: 中学レベルの数学からやり直すのは、良いことかも知れんが。
正直その勉強が直接統計学に役立つようには思えないんだが。

とりあえず、「エクセルで学ぶ統計学」みたいな本でパソコンに打ち込んでいけば？
641 名前：１３２人目の素数さん mailto:sage [2014/02/27(木) 21:06:41.09 ]: >>640
偏微分が理解できる様にしておけと言われていますが
正直偏微分が何が何だか状態です
642 名前：１３２人目の素数さん mailto:sage [2014/02/27(木) 22:02:08.39 ]: あきらめろ。
中学の3年間で数学の初歩を学び、高校で2年目でやっと基本の微積を学ぶ。
5年もの時間をかけて身につけるものを、数日で理解できるわけがない。
643 名前：１３２人目の素数さん mailto:sage [2014/02/27(木) 22:34:48.01 ]: 確率変数をlogXと変換するのと、Xの確率密度関数にlog xを代入するのって何が違うの？前者は確率密度関数に1/xがつくのは知ってはいるけど
644 名前：１３２人目の素数さん mailto:sage [2014/02/28(金) 02:02:37.78 ]: >>629におねがいします
645 名前：１３２人目の素数さん mailto:sage [2014/02/28(金) 05:34:14.71 ]: 偏微分は最小二乗法で使うからかな？
あれぐらいならすぐにわかる
646 名前：１３２人目の素数さん mailto:sage [2014/02/28(金) 20:35:57.10 ]: >>642
猶予としては1年間くらいあります
647 名前：１３２人目の素数さん [2014/03/01(土) 04:30:58.21 ]: 来年から統計学を学ぶんだけど、標準偏差って二乗するよね？
たとえば、
１、２、３、４、５は平均３で、標準偏差は√１０になると思うんだけど、
０、３、３、３、６は平均３で、標準偏差は√１８になるよね？
平均とのズレの合計は同じ６なのに下の例の方が標準偏差が大きいけど、つまり同じ平均とのズレでも、差が大きいものを抱えている方が標準偏差が大きくなるってこと？
だから二乗するの？
648 名前：１３２人目の素数さん mailto:sage [2014/03/01(土) 04:47:30.82 ]: 分散「」
649 名前：１３２人目の素数さん [2014/03/01(土) 19:44:10.76 ]: >>647
>差が大きいものを抱えている方が標準偏差が大きくなるってこと？
そだよ～
>だから二乗するの？
そりゃ関係ないよ～
数学では、絶対値を付けた差をとって計算するより
二乗して計算すれば計算が楽だから。楽というのは、そういう計算の
やり方が昔からしっかりと証明され、そろっているという意味。
ということで、二乗する事情はそういう事情。
二つの隔たりとかそういうのを数学的に計算しやすい。

平均だって、ふつうの平均（算術平均）もあれば、幾何平均なんてのも
あるでしょ。距離を計算するときにだって単なる差だけじゃ～ないのよ。

なにしろ、犬がお父さんやる時代だからね。
650 名前：１３２人目の素数さん [2014/03/01(土) 23:05:09.21 ]: でも二乗しないと大きい差を持つほど大きくならないよね？
絶対値だけでやったら、差が大きいものがあるほど大きくならないと思うんだけど！
651 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 00:42:06.62 ]: 絶対値より二乗の方がいいのは、計算が簡単だからというのと、
二乗にルートをとった標準偏差σの1σがちょうど標準正規分布の転換点にあたるから、
って訊いたことがある。
652 名前：１３２人目の素数さん [2014/03/02(日) 03:46:30.05 ]: 二乗するのは、平均より離れた数値を持っているとより標準偏差が大きくなるからですよ
絶対値だと、平均との差の和が同じなら、例を挙げれば
２、２、３、４、４（平均３、平均との差の和は４）
１、３、３、３、５（平均３、平均との差の和は４）も同じになってしまいますが、
二乗したものを足せば、上が４、下が８になります。
つまり下の方が、ばらつきが大きいということなのです。
653 名前：１３２人目の素数さん [2014/03/02(日) 06:03:58.55 ]: >>651
標準正規分布は、その前にすでに偏差平方和の考えがあるから
出てきてるんじゃないのかな？
だから、転換点に当たるからというのは、後からの話という
ことになる気がするぞ。ちがうかな？

計算が簡単とよく言われるけど、その簡単というのは何を言っているんだろう
といつも思う。単純に考えると絶対値をとってしまえばあとはなにも難しくないと思う。
したがって、簡単という意味は、もっと別な意味を持っていると思うんだけど
それってなんだろう？

大昔の数学者たちがいろいろやって、その中で >>642 の形が最もうまく
差を表せるということになって、偏差平方和ととる方向になっていった
という形なのかな？
654 名前：１３２人目の素数さん [2014/03/02(日) 06:06:52.65 ]: >>653で訂正

その中で >>642 の形が最もうまく
⇒ その中で >>652 の形が最もうまく
655 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 09:52:39.40 ]: >>653
絶対値の計算って難しいだろ。
656 名前：１３２人目の素数さん [2014/03/02(日) 10:01:35.48 ]: 絶対値にしてしまったら、
そのあとの難しさってなに？
657 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 10:09:07.91 ]: 計算済みの絶対値にしてしまえないからみんな面倒、難しいっていってんだよ。
どこでもドアがあったら簡単にハワイに行けますねと言ってるようなもの。
658 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 10:24:50.87 ]: MAEが既知の分布の和のMAEとか計算したら発狂する
659 名前：１３２人目の素数さん [2014/03/02(日) 10:35:02.82 ]: >>657
>計算済みの絶対値にしてしまえないからみんな
絶対値をとること自体、難しい部分ってある？

なんども質問で申し訳ない。いやみで聞いてないから、お願い。
660 名前：１３２人目の素数さん [2014/03/02(日) 10:45:45.49 ]: なぜ聞いているかというと、知っている人間に聞いても
「絶対値の計算は大変だから」
という言葉で終わって、そのあとどうして大変なのか
ということを聞いても、答えが出てこないもので。
私も、聞かれたときにどうこたえていいかがわからない。
という経緯があります。
661 名前：１３２人目の素数さん [2014/03/02(日) 10:53:29.91 ]: 私なりには、単に差分をとったり分散や標準偏差にかかわらず、
その後の処理で、最小二乗など数学的枠組みが現在の
統計解析以前に確立していたので、その枠組みをつかう
ことが可能なため、というのが背景にあったためなのかな。
と思うんですが。間違いでしょうかね？
そもそも、>>652 のように、単なる差分だとうまく表せない
という問題がありますけど。
662 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 10:55:18.05 ]: 統計勉強すれば分かるよ
その程度の知識では無理
663 名前：１３２人目の素数さん [2014/03/02(日) 11:09:24.42 ]: そうかなー
そもそも差分の枠組みでやることなく
既存の枠組みで覚えてゆくので、じゃあどこか問題かという
こと自体を考えることもないと思うんだけど。
664 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 11:12:39.03 ]: 問題を感じてないなら無理に知る必要もないだろう
微積を知らなくたってたいていの人は生きていける
>>658みたいな例も出てるけど意味が分からんのだろ?
665 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 11:19:32.02 ]: >>660
自分で計算しても楽だったのなら
キミは数学の天才だからそれていいんじゃないだろうか。
666 名前：１３２人目の素数さん [2014/03/02(日) 11:24:01.05 ]: >>664

>>658の例は、それで大変に良いと思う。
要は説明時に、どこでも「絶対値の扱いは面倒なので」という言葉
だけで飛ばしてしまっている。
分かっている人には良いが、入り口の人たちからすると、
コンピューターの発達した今では、絶対値をとって計算なんか
簡単じゃないか。どうしてなんだ。という考えが出てくる。
そこで、絶対値をとった場合、次に出てくる問題は何か、だから
二乗して使っている。
というような流で説明ができないものかと。

>>647　のような質問は、そういうことが前段階にあるために
出てくる問題じゃないかと思っている。
667 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 11:31:51.78 ]: 絶対値のついた関数の微分とか微分不可能な点ばかりでコンピューターどうのこうのという問題ではないんじゃ
よく知らんけど
668 名前：１３２人目の素数さん [2014/03/02(日) 11:56:49.57 ]: 前人が分布関数という考えに至った時
その段階で数学の枠組みを利用するためには
絶対値ではできないから
というのが背景にありそうですね。

統計解析の発展の歴史のような書物をみても
どういう経緯でそこに至ったかがうまく書かれた
ものが見つからなかったので。
669 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 11:59:58.64 ]: y=|x|のグラフを書いて、
この関数が式のあっちこっちに埋め込まれて簡単だと言えるのならやはり天才だ。
670 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 12:23:09.31 ]: コンピュータ時の昨今ではモンテカルロ法がもてはやされたりもするしな
やりたいことをやれるようにやった結果が現状だと言ってしまえばそれまでだ
671 名前：１３２人目の素数さん [2014/03/02(日) 12:34:00.71 ]: >>669
X自体を正として扱えば
そういうグラフにすること自体ないだろ
672 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 12:39:59.52 ]: その論法では足し算は簡単ですと言っているだけなのだが
673 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 12:46:25.79 ]: 絶対値を理解していないっぽいな
絶対値の否定か？
674 名前：１３２人目の素数さん [2014/03/02(日) 12:47:53.40 ]: だって二乗しているのも正にするためが
理由の一つでしょう。
だからそれが本質じゃないだろう
675 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 12:57:19.21 ]: >X自体を正として扱えば
これどういう意味なんだろうか
676 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 13:09:27.36 ]: サンプルと母集団の違いとか統計量に対する演算とか
そういったことを気にしない世界ならいいんじゃないの

値を計算するだけならマンハッタン距離でもレーベンシュタイン距離でも
小学生レベルの簡単な計算だからね
677 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 13:59:23.83 ]: 共分散とかどうすんのかね
分散共分散行列とかもあるし
678 名前：１３２人目の素数さん [2014/03/02(日) 18:10:20.83 ]: >>676
ありがとうございます。
分布を考える世界への導入を想定したときに
出てくるということですね。
なんかすっきりです。

>>677
それは既存の数学的枠具があることが前提なので
単純な差分からの場合は、そもそもそういうものに
発展し得るのか（別な考え方がでてくるかもしれないけど）
どうかさえ分からないですから、まあ心配無用でね。

あくまで、統計始めた人から、そういう質問が出てきたとき
どう答えたらスッキリしてもらえるか？という悩みでしたので。
679 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 18:41:57.97 ]: 分散や標準偏差の概念が見つかるずっと前に解析学や線型代数は発達してたから
その利用をしようと思うのは当然だと思うがなんか変なこと言ってるかな？
680 名前：１３２人目の素数さん [2014/03/02(日) 18:46:01.77 ]: うん
681 名前：１３２人目の素数さん [2014/03/02(日) 19:02:23.29 ]: >>679
それはその通りでおかしくない。

それを前提に考えたからこそ二乗するという手段を使用した。
そういう風にはっきりと説明することで理解してもらえる
ことにつながります。
682 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 20:03:36.55 ]: どれが>>652かさっぱり分からん
683 名前：681 [2014/03/02(日) 20:08:12.09 ]: >>682

最初の質問者のことなら
>>652じゃなく>>647でしょ

>>647は出てないと思うけど。
おれは、>>647をみて、そういえば初めに統計を学ぶ人に似た
ようなことを聞かれる場面有るな～とおもって、
さあ、どう答えたらいいのかと思い、いろいろみんなに聞いた。
684 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 20:15:59.02 ]: 答えは簡単
偏差E(|x-m|^α)のメリット、デメリットを議論すればいいだけ
>>647にそれをいっても無駄、わからんだろう
685 名前：１３２人目の素数さん [2014/03/02(日) 20:41:02.08 ]: 二乗するのは差が大きいほど大きくするためだって先生に聞いたけど
まさにその通りでしょ
絶対値だと１、２、３、４、５も０、３、３、３、６も同じになるという前に言ってる人がいるのと同じ
686 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 20:44:07.24 ]: 1.馬鹿は引っ込んでろ
2.半年ロムれ
3.過去ログ読めよ
好きなの選べ
687 名前：１３２人目の素数さん [2014/03/02(日) 20:45:17.11 ]: >>684
私は理解させられませんという告白になっちゃうよ
688 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 20:46:51.94 ]: >>687
馬鹿には無理 FAQ
689 名前：１３２人目の素数さん [2014/03/02(日) 20:51:08.74 ]: >>688
じゃあなく、あなたの告白ということ
690 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 20:52:23.67 ]: とりあえずのりで突っ込みました、たいがいこれでだいじょうななはず、てかー
691 名前：681 [2014/03/02(日) 21:03:18.90 ]: お、その後も変な風に続いてるな。

>>685　それで、そっかーと思ってくれる相手であれば、なんも問題ない。

ともかくどうしようもなく素人が統計入門の際にわかりやすく。
そーだよねーと、思って通り過ぎてもらえばいい部分なんで
その説明方法であればよかったので、とりあえず俺は終了。
692 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 21:04:30.06 ]: 意味負は去った
693 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 21:12:30.48 ]: そして忘れ去られる質問たち
694 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 21:16:08.03 ]: [訂正]
意味負は逃走
695 名前：１３２人目の素数さん [2014/03/02(日) 22:11:20.47 ]: >>685
こいつの言うとおりじゃね
大体あってると思う
696 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 22:13:52.97 ]: >>685
こいつの言うとおりじゃね
大体あってると思う
697 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 22:23:42.86 ]: 大きくしたいならガンマ関数がお勧め
698 名前：１３２人目の素数さん mailto:sage [2014/03/02(日) 23:37:25.87 ]: 統計の最初は、分散や標準偏差を習うもんな。
そのとき、絶対値じゃだめなの？って当然思うわな。
699 名前：１３２人目の素数さん [2014/03/03(月) 00:13:05.67 ]: うん
700 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 03:20:51.62 ]: >分かっている人には良いが、入り口の人たちからすると、
>コンピューターの発達した今では、絶対値をとって計算なんか
>簡単じゃないか。どうしてなんだ。という考えが出てくる。
こんな考えなかなか出てこないと思うわｗ
高校1年以上なら絶対値=面倒くさいというのが普通だろう

>X自体を正として扱えば
>そういうグラフにすること自体ないだろ
ここはもうめちゃくちゃ
701 名前：１３２人目の素数さん [2014/03/03(月) 05:32:22.09 ]: 自分も似たような感想を持った
そもそも二乗したら２→９、３→９と実際の差よりも大きくなってしまって何も論理的に語れなくなるんじゃないかと思ったんだけど
どうなの？
702 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 05:49:22.15 ]: 最近話題の緑本だけど何故対数変換がダメなのか、それと
なぜ割り算値を説明変数にするのがダメなのかがよくわからなかった。
詳しい人解説おねがいします。
703 名前：１３２人目の素数さん [2014/03/03(月) 07:58:56.37 ]: >高校1年以上なら絶対値=面倒くさいというのが普通だろう
そういうやつは、２乗も面倒じゃないか？
704 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 08:35:38.28 ]: 少なくとも面倒かどうか知らないということは
中高のときに数学をほとんど勉強していないのではないか。
計算経験がほとんどない。
705 名前：１３２人目の素数さん [2014/03/03(月) 08:53:32.01 ]: この場合、単に距離としての扱いだから
別に面倒でもない気がするな
706 名前：１３２人目の素数さん [2014/03/03(月) 09:13:21.27 ]: やはり統計学をきちんと理解するには数学を勉強してないと難しいよ。
距離とか次元とかノルムとか空間とか概念を理解していないと、意味不明な議論になる。
距離といっても、ピタゴラスの定理しか思い浮かばないようだとやはり厳しい。
「微分可能性」だけ考えても、絶対値は不利だということはすぐわかる。
もっとも、記述統計学内の議論ならば、絶対値もありかなとは思う。
推測統計学まがいの議論をするくらいだったらね。
707 名前：１３２人目の素数さん [2014/03/03(月) 09:23:02.40 ]: あ～
前の議論の延長としての話なんで
すれ違ってたね
708 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 10:08:57.08 ]: 住人のレベルが分かる議論
709 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 11:29:52.62 ]: おまえもなー
710 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 11:32:54.38 ]: おれのレベルがわかる発言はしていない、ふふふ
711 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 14:41:44.39 ]: L^1空間よりもL^2空間の方が何かと都合がいい
712 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:02:59.40 ]: >>711
既に書いた
>>684
713 名前：１３２人目の素数さん [2014/03/03(月) 15:04:15.21 ]: そういえば俺も二乗する理由を教わってなかったな。
つまるところどういうことなの？
714 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:09:30.19 ]: >>713
既に書いた
>>662
715 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:21:07.42 ]: 流石にその答えじゃ納得せんやろうなあ
716 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:28:26.60 ]: >>715
おまえがどうぞ
717 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:31:46.48 ]: その答えしかないってことね
なら仕方ないか
718 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:34:05.70 ]: >>717
遠慮すんなよ
719 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 15:37:30.79 ]: あなたに出来ないのなら誰にもできないよ
仕方ないことだ
720 名前：１３２人目の素数さん mailto:sage [2014/03/03(月) 22:32:59.41 ]: 支那竹みたいだな
721 名前：１３２人目の素数さん [2014/03/04(火) 03:26:27.60 ]: 統計学二乗は確かに難しいな。
誰かここには分かってるやつはいないのか？
722 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 04:29:48.75 ]: L1って理論値求めるとき大変そう
723 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 09:42:21.68 ]: じゃ、「計算しやすいから」がここの総意ってことでFA？
724 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 09:47:56.42 ]: いつまで粘着してんだよ
725 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 16:49:04.85 ]: 計算しやすいだけじゃ何の意味もないのは自明だろ
ユークリッド距離と同型なら同様に自然で蓄積された知識が流用できて都合が良いだけさ
726 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 17:09:07.98 ]: 違うよ。
簡単に言うなら >>685
手法にはフォーカスしてない。
727 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 17:24:32.46 ]: 絶対値>ニ乗>四乗>六乗>八乗てか
728 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 17:25:47.21 ]: 逆だな
絶対値<ニ乗<四乗<六乗<八乗てか
729 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 20:29:50.26 ]: >>647, 685
>絶対値だと１、２、３、４、５も０、３、３、３、６も同じになる
??
分子のみだけど、
> sum(abs((1:5)-mean(1:5)))
[1] 6
> sum(abs(c(0,3,3,3,6)-mean(0,3,3,3,6)))
[1] 15
そもそも全然違うのだけど。
730 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 20:39:33.89 ]: おいｗ
731 名前：１３２人目の素数さん [2014/03/04(火) 20:40:12.36 ]: >>729
なにそれ。
732 名前：729 mailto:sage [2014/03/04(火) 20:55:18.23 ]: ごめん、やっぱり合ってたわ。タイポした。
> sum(abs(c(0,3,3,3,6)-mean(c(0,3,3,3,6))))
[1] 6
733 名前：１３２人目の素数さん [2014/03/04(火) 21:14:50.53 ]: 数学会の世界を揺るがす小保方さん出現か！とおもった。
734 名前：１３２人目の素数さん mailto:sage [2014/03/04(火) 21:19:30.65 ]: このスレのレベルをよく表しているじゃないか
735 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 08:08:36.75 ]: 誰か>>702の解答おねがいしまう
736 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 08:28:22.52 ]: 緑本は知らんが特異点を持つ変換は嫌われる
737 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 14:33:28.95 ]: いろんな問題集があるんだね
738 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 16:47:51.75 ]: 記述統計の側から眺めていても、
なぜ絶対偏差でなく２乗なのか
なぜ３乗や４乗でないのかの
スッキリした説明は出てこない。

標準偏差の生まれは正規分布のパラメータであって、
標本標準偏差はデータを正規分布からの標本と
見た場合の正規分布の推定量と考えれば、
２乗でなければいけない理由づけができる。

正規分布が登場する理由は、中心極限定理。
739 名前：１３２人目の素数さん [2014/03/05(水) 17:31:04.61 ]: だとすると、
大学で統計入門時によく使われる説明、
「絶対値は扱いづらから」という旧来の説明は
必ずしも正しくないということになるのかな？
740 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 17:37:10.17 ]: えっ、何がどうして「だとすると」になるの
741 名前：１３２人目の素数さん [2014/03/05(水) 17:54:16.48 ]: 上の方で、「絶対値は扱いづらい」からと言っている
流れから。おかしいかな？
742 名前：１３２人目の素数さん [2014/03/05(水) 17:58:31.69 ]: すごくおかしい
743 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 18:03:32.98 ]: 不偏標準偏差でなく標本標準偏差を使う理由とか
計算が楽だからとしか言いようがない部分もあるが、
なぜ２乗か？に必然性を持たせようとするならば、
正規分布を経由したほうが物語性があるだろう。
「歴史的経緯で」じゃ、あまりにもツマラナイし。
744 名前：１３２人目の素数さん [2014/03/05(水) 18:07:35.69 ]: なんで、言葉に、引っかかってるのがわからない。
あなたの言っている通りでしょ。

だから、絶対値は扱いづらい。という言葉で済ますのは良くないし
歴史的経緯で済ますのは良くないでしょ。

どこに引っかかったの？
745 名前：１３２人目の素数さん [2014/03/05(水) 18:13:11.35 ]: >>743
言っていることは正しいと思うんだけど
困ったことに、正規分布は歴史的に後から出てきてるよね。
正規分布にこだわらずなんじゃないだろうか。
746 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 19:53:37.14 ]: 標準偏差だの正規分布だのが
アリガタがられる理由は、
中心極限定理以外に
思いつかないんだがなあ。
747 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 19:56:29.40 ]: もう諦めて答えを見てはどうか。
748 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 20:10:58.60 ]: 歴史的には標準偏差の方が、正規分布や中心極限定理より後に出てきたらしいが。
正規分布や中心極限定理は、ド・モアブル、ラプラス、ガウスあたり。
標準偏差はピアソン。
749 名前：１３２人目の素数さん [2014/03/05(水) 21:43:27.00 ]: 二乗にも、いろいろ事情があるもんだ
750 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 22:58:24.62 ]: ざぶとん
751 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 22:59:49.30 ]: いくつぐらいになったらオヤジギャグに笑えるようになるかという統計データがほしいです。
752 名前：１３２人目の素数さん mailto:sage [2014/03/05(水) 23:55:00.73 ]: ここは
この板のレベルが分かる書き込みだな
だろう
753 名前：１３２人目の素数さん [2014/03/06(木) 00:12:31.79 ]: >>749
数学において難解な二乗は
「愛の事情」
弱ったことにマイナスしか出てこない
754 名前：１３２人目の素数さん [2014/03/06(木) 23:29:11.45 ]: 平均値と、中央値、（もしくは最大値、最小値も加えて）から
最頻値mode を推定することができますか？
755 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 00:42:33.41 ]: 無理
756 名前：１３２人目の素数さん [2014/03/07(金) 01:00:44.42 ]: >>754
分布がわかってれば
できることもあるけど
757 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 01:19:19.24 ]: 正規分布でも仮定するんだろ
母集団平均の推定と同じだが
758 名前：１３２人目の素数さん [2014/03/07(金) 01:55:46.82 ]: まさか平均０で標準偏差１の場合だったりして
759 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 03:18:38.62 ]: >>757
エスパーさんか
760 名前：754 [2014/03/07(金) 13:02:30.53 ]: ありがとうございます。やはり無理そうですかねえ。
分布は正規分布ではないですが、偏りのある一峰の山のある分布を前提としています。

何故、このようの事を考えているのかといいますと。
Rで計算をしていますが、modeが標準の関数にないということ。（パッケージがあるのは承知しています）
正しくmodeを計算するには、ヒストグラム（度数分布）を求めないといけなくて、サンプルセット数（サンプル数でなく）
が多くて計算量が多くなりすぎること。ビン幅も個別に設定しなければならないこと。

以上のことから、もっと簡易にmodeが求められたらいいのにと思った次第です。
すくなくとも、（最大値-中央値）=Aか、(中央値-最小値)=Bとすると、AかBかの
小さい方の範囲にmodeがあるはずです。
また、平均値と中央値の差が大きければ、modeも中央値より離れていると想定できます。

そのあたり何かアイデアがないでしょうか。
761 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 14:07:00.02 ]: ヒストグラムなんぞ使うな、累積分布にしとけ
累積分布ならビン幅などいらんぞ
ヒストグラムより本質的な累積分布を軽視するのは教育の欠陥だ
762 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 18:31:15.29 ]: すきにすればいいだろ
763 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 19:22:54.06 ]: 当然だ、自業自得にすぎん
764 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 20:09:37.43 ]: >>761質問の意味解っているなら、答えてやれよ。
765 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 20:32:45.80 ]: これ結構難しいんじゃないの
766 名前：１３２人目の素数さん [2014/03/07(金) 23:01:01.56 ]: 様々な一峰の分布を調べて、
(最頻値-中央値)　と　(中央値 - 平均値) の相関を求めて、相関があるといえるなら、
(最頻値-平均値)　÷　(中央値 - 平均値)　を計算しそれをAとする。
求める最頻値　は、A　×　(中央値 - 平均値)

でどう？
767 名前：１３２人目の素数さん mailto:sage [2014/03/07(金) 23:35:21.81 ]: >>760
平均値と中央値と最頻値は独立に指定できる
768 名前：１３２人目の素数さん mailto:sage [2014/03/08(土) 00:49:52.87 ]: モードのオンライン更新ってできまいのかな
769 名前：１３２人目の素数さん mailto:sage [2014/03/08(土) 09:38:56.41 ]: 例えば1,2,2,1,1,2,2,...みたいにモードが収束しないサンプル列に対して
何らかの意味で効率的なオンライン更新則が作れるか考えてみたらいい
770 名前：１３２人目の素数さん [2014/03/15(土) 07:25:39.51 ]: 大学の数学の教科書、あまりの誤植の多さはポアソン分布に従っているとはとてもじゃないけど思えない。
刊行後も出版社のサイトで気軽に正誤表をアップできちゃえるからって、著者も出版社側も書籍作りに対して甘え過ぎだ。
771 名前：１３２人目の素数さん mailto:sage [2014/03/15(土) 13:26:29.01 ]: 身内の個人出版感覚なのかもシレン
教授が執筆した小部数書籍に校閲のプロを雇うのは予算的に無理だろうし
772 名前：１３２人目の素数さん mailto:sage [2014/03/15(土) 13:51:50.89 ]: 大学数学レベルだと正誤を判断できる人が少ないしなぁ
出版前にミス減らすのは難しいだろう
773 名前：１３２人目の素数さん mailto:sage [2014/03/15(土) 14:57:44.21 ]: >>770
tex使って書いて、校正も自分でやってるんじゃないの？
774 名前：１３２人目の素数さん mailto:sage [2014/03/15(土) 16:10:52.76 ]: 大学の数学関係なく、日本の出版は誤植だらけ。
大半がマカーだから仕方がない。
775 名前：１３２人目の素数さん mailto:sage [2014/03/15(土) 22:24:51.54 ]: つめが甘いのは、糖尿病だからだ。
研究職の人は、運動しないから。
776 名前：１３２人目の素数さん mailto:sage [2014/03/16(日) 03:08:27.56 ]: アル中かニコチン中だから集中力が続かないんだよ。
777 名前：１３２人目の素数さん mailto:sage [2014/03/16(日) 22:46:25.66 ]: アルコール中毒と
アルコール依存症は
別のもの。
778 名前：１３２人目の素数さん mailto:sage [2014/03/17(月) 10:34:44.88 ]: 比較的易しめな教科書を使って統計学を自習してるんだが、天下り的に書いてあることが、「定理」なのか「法則」なのか「経験的にうまくいく手法」なのか書いて無くてもやもやする。
例えば、「母分散が未知な商標本の推定/検定にはｔ分布を用いる」と書いてあって、それはｔ分布はそのような推定を正しく行えるという定理なのか？それともｔ分布を使うとうまくいくと経験的に知られているということなのか？

数学的に厳密な本を読めばちゃんと書いてあるのかな？
779 名前：１３２人目の素数さん mailto:sage [2014/03/17(月) 10:35:43.41 ]: あ、改行してなかったごめん
780 名前：１３２人目の素数さん mailto:sage [2014/03/17(月) 13:47:43.56 ]: 書いてあるわけねー
定理は書いてるだろうが、定理と法則の違いは何だ？
781 名前：１３２人目の素数さん mailto:sage [2014/03/17(月) 18:34:18.60 ]: 定理じゃないか
782 名前：１３２人目の素数さん mailto:sage [2014/03/18(火) 00:13:43.73 ]: ちゃんと書いてあるよ

○○が正規分布に従うとき××はt分布に従う
自由度nのt分布はn→∞で正規分布に弱収束する

とかね
予備知識として測度論を仮定するけど
783 名前：１３２人目の素数さん mailto:sage [2014/03/18(火) 00:51:57.22 ]: すっきりしたいならルベーグ積分まで勉強してから吉田朋広の数理統計学を読むといいぞ
784 名前：１３２人目の素数さん [2014/03/19(水) 14:56:35.88 ]: 例えば、0～100の範囲の実数を考えます。

Aは、1,5,10,12,40,42,43,70,75,76 （10個）
Bは、2,4,6,10,12,41,43,74（8個）
Cは、5,6,22,23,50,51,52,55,62,63,70（11個）

以上のようなデータがあります。
これらABCのデータの相関関係を調べたいのですが
それぞれのデータ総数はことなっています。

ですのでエクセルでいうところのcorrel関数は
使えません。
だからといって、それぞれ相関がないとも言えません。
AとBの方が、AとCの相関より高い気がします。

こういったデータの数の異なる場合の相関の求め方を教えてください。
または、Rでの関数がありましたらお教えください。
785 名前：１３２人目の素数さん mailto:sage [2014/03/19(水) 15:31:28.09 ]: 個数が違うのに相関がある…？
別の分析方法を模索すべきでは
786 名前：１３２人目の素数さん mailto:sage [2014/03/19(水) 15:41:10.68 ]: なるほど、相関とは言えないのですね。
各ABCがそれぞれ似ている度合を調べたいのです。
どういう方法がありますでしょうか？
787 名前：１３２人目の素数さん mailto:sage [2014/03/22(土) 01:24:58.62 ]: 似ているとは何か
788 名前：１３２人目の素数さん mailto:sage [2014/03/22(土) 23:51:23.93 ]: >>787
質問に質問返しとな？あほですか。

>>784
とりあえず、ABCの集合について、0から100を10で区切り、
ヒストグラムを求める。
10で区切った分布の数を、ABCで相関係数で求める。
以上。
789 名前：１３２人目の素数さん [2014/03/23(日) 13:07:48.14 ]: >>784
A,B,Cのそれぞれの近さを見るとしたら
分布の類似度を見るということにして
カルバックライブラーあるいはエントロピーあたりの
情報量を利用したほうがいいんじゃないだろうか。
790 名前：１３２人目の素数さん [2014/03/24(月) 15:46:49.50 ]: 質問です。
ロジスティック回帰と二項ロジットモデルの違いについて教えてください。
同じ、としているものや微妙に違う、としているものがあって困ってます。
791 名前：１３２人目の素数さん mailto:sage [2014/03/25(火) 00:19:26.68 ]: 同じでいいと思う派
あえて言うならロジスティクス回帰の一つに二項ロジットがあるって感じかな
792 名前：１３２人目の素数さん mailto:sage [2014/03/27(木) 21:52:46.28 ]: 質問です。

AグループとBグループの２つのグループがあるとします。
それぞれのグループの2種類の要素を抜き出し、
その要素間を比較した際に、ABグループに
有意差があるかどうかを見たいのですが、
正規分布するかどうかは予想できない物として、
どのような検定が見合っているのでしょうか？

設問が抽象的なのでもうちょっと具体的な例示をすると、

和食（Aグループ）と洋食（Bグループ）で、
それぞれ「食事量」「怪我の治る日数」という要素を抜き出し、

「食事量が多いほど、怪我の治りが早い。
　特に洋食グループほうが、やや治りが早い」

というように、ABグループのもつ要因（食事量）が、
最終的に「怪我の治り」に影響するかどうか、
みたいなことを調べたいのです。
793 名前：１３２人目の素数さん mailto:sage [2014/03/28(金) 14:34:03.30 ]: 学部1年からやり直しなさい
794 名前：１３２人目の素数さん mailto:sage [2014/03/28(金) 14:48:15.29 ]: >>792
>具体的な例示をすると、
めちゃくちゃ
795 名前：１３２人目の素数さん mailto:sage [2014/03/28(金) 15:27:23.57 ]: めちゃくちゃ、とか書かれても何のヒントにもならないんだけど、
例が悪いってことかな？

じゃあ、別の例を設定すると、

ある遺伝病を持つグループ（Aグループ）と持たないグループ（Bグループ）があり、
ある程度相関認められている第一要因と第二要因について、
特定の治療後に第一要因と第二要因を測定した場合、
Aグループの第二要因の平均改善率のみ高いとする。

この場合に、その上昇を誤差であるのか、有意差であるのかを検定する場合に
どんな検定法が考えられるのか、が知りたいのです。

遺伝病の有無をダミー変数化して、3要因に対してフリードマン検定をかけ、有意差が拾えた場合に多重比較する、という手順であってますか？

上司の論文用のデータを揃えるために統計学を今年から独習し始めたのですが、
完全独習なので周りに先生といえる人が存在せず（上司自体も統計が得意ではない）、
自分のロジックがあっているのかどうかが判断できなくて困ってるんです。
796 名前：１３２人目の素数さん mailto:sage [2014/03/28(金) 17:13:15.83 ]: めちゃくちゃなのは君の上司ｗ
797 名前：１３２人目の素数さん mailto:sage [2014/03/28(金) 19:03:29.63 ]: exactly
798 名前：１３２人目の素数さん [2014/03/29(土) 10:38:04.02 ]: >>792
件数がどれくらいかわからないけど、
クロスとってカイ二乗の値みて、違いの有無を
判断したらどう？
データ件数が、すご～く多いと、なんでも有意になっちゃうけど。
799 名前：１３２人目の素数さん mailto:sage [2014/03/29(土) 10:42:50.93 ]: 上司に相談してセミナーに参加するなり、大学の先生を紹介してもらえ
そうしないと今流行の捏造になります、といえば
800 名前：１３２人目の素数さん mailto:sage [2014/03/29(土) 21:16:16.26 ]: >>798
結局、第一要因と第二要因の比率をとり、
A群、B群間の比率を比較することにしました。

ありがとうございました。
801 名前：１３２人目の素数さん [2014/03/29(土) 21:49:47.78 ]: >>800
まあ、同じことですね
802 名前：１３２人目の素数さん mailto:sage [2014/03/31(月) 00:49:09.14 ]: overall standard deviationとwithin standard deviationとの違いを教えてください
803 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 00:39:27.60 ]: >>802
名詞句と副詞句
804 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 07:15:16.63 ]: e+πが無理数であることを証明できた！！！苦節５年ううう
805 名前：１３２人目の素数さん [2014/04/01(火) 07:28:53.06 ]: >>802
まさに言葉のとおり

まとめて見るか
グループごとに見るか
806 名前：１３２人目の素数さん [2014/04/01(火) 08:53:52.96 ]: >>804
俺には、むりっすう
807 名前：１３２人目の素数さん [2014/04/01(火) 13:10:38.57 ]: >>804ええ？e+πが無理数であることを証明？eが有理数であろうが無理数であろうが、πが無理数なら足せば無理数なのは自明ではないか？
808 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 13:21:06.67 ]: 無理数+無理数は有理数にもなる
809 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 13:57:59.68 ]: >>807
e+π：無理数は未だに証明されてないんだ.
たしか証明されているのは，e+π，ｅπの少なくとも一つは超越数であるということだけ．
810 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:05:17.36 ]: 今日はエイプリル・フールということもあり、真に受けない方がいいぞ。
統計のスレで数論の話がいきなり出ることは何か不自然だろ。
811 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:15:02.77 ]: 群論から統計に来た先生知ってる
812 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:17:13.06 ]: エイプリル・フールって本当はエイプリルフールという表記でいいのか。
「・」が必要なのかと思ってた。
813 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:22:50.91 ]: >>811
多分、グラフ理論とか組合せ論の間違いだろ。
組合せ論関係なら、有限群関係で大多数の人が組合せ論に移ったという事実がある。
814 名前：１３２人目の素数さん [2014/04/01(火) 14:30:25.95 ]: >>813 中学生の時に通ってた有名高校受験塾でやらされた青チャート数学Ⅰ(現在の赤チャート)で順列組み合わせをやって、面白いパズルみたいだと思ったことがある。
815 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:32:03.82 ]: 有名高校受験塾に通ってたんですか
それはようございましたね
816 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 14:37:03.95 ]: >>814
本格的な組合せ論になると、有限群の表現論とか解析とか用いるようになる。
受験数学とは感覚が全く異なる。
色々なモノを用いる数学というか何というか。
817 名前：１３２人目の素数さん mailto:sage [2014/04/01(火) 17:54:37.06 ]: >>804
エイプリルフールの誤爆でした
818 名前：１３２人目の素数さん mailto:sage [2014/04/02(水) 09:37:15.52 ]: >>811
>>804
エイプリルフールの誤爆でした
819 名前：１３２人目の素数さん mailto:sage [2014/04/02(水) 21:10:24.91 ]: >>412
>最強の「学問」だ・・・・・・・・・・・・・
と、2013年に吹聴した東大医学部卒だが医学科でなく生物統計学専攻とか
のたまう胡散な御仁が、今度は『全国民のための統計解析』を宣教し
始めたようだが、傾聴に値するのかな？
1億人のための統計解析　仮説は最初に立てるな！　　2014年3月25日
business.nikkeibp.co.jp/article/opinion/20140324/261652/
820 名前：１３２人目の素数さん mailto:sage [2014/04/02(水) 23:22:43.98 ]: 医学科にいたら統計なんて下々の学問に手を染めたりしないだろうから
経歴としてはむしろ妥当なんじゃないかと思うが、読むに値するかは知らん。
ビジネス啓蒙書なら整理術とか記憶術とかと同じ枠で考えて判断すれば？
821 名前：１３２人目の素数さん [2014/04/02(水) 23:28:29.86 ]: >>819
医学部だった？学部の時は計数工学あたりかと思ってた。
822 名前：１３２人目の素数さん [2014/04/03(木) 09:35:01.29 ]: >>819
医学部「保健学科」
823 名前：１３２人目の素数さん mailto:sage [2014/04/03(木) 15:32:48.45 ]: >>822
医学部看護学科だよ。
824 名前：１３２人目の素数さん mailto:sage [2014/04/03(木) 19:17:35.95 ]: 衛看か、俺の頃は唯一女子学生しか居ないところだったが
825 名前：１３２人目の素数さん mailto:sage [2014/04/03(木) 19:30:48.01 ]: 八田ちゃんか
826 名前：１３２人目の素数さん mailto:sage [2014/04/03(木) 22:03:16.05 ]: >>823
東大看護学科卒ということは、八田亜矢子、小正裕佳子同様に理Ⅱ
入学組ということか？
827 名前：１３２人目の素数さん mailto:sage [2014/04/04(金) 09:30:25.66 ]: >>824は多分大昔の話、理？、文？とか別枠で衛生看護学科（４年生）
入学資格女子のみ、ただし最初の２年は駒場で一般教養をやってたから
女性の少ないあの頃の東大生は初恋の相手が彼女達というのが多かった。
詳しくはwikiへ
828 名前：１３２人目の素数さん mailto:sage [2014/04/04(金) 20:37:32.94 ]: そう、大きく変わってるからね。
統計に関しても、国内の一つの柱になってる。
829 名前：１３２人目の素数さん mailto:sage [2014/04/05(土) 07:41:06.63 ]: >>821
あづまぶる東大じゃ応用統計学を、計数工学と称するのか？関西じゃ
耳にせぬ名称だな。すると計量工学もあるのか？京大じゃ数理工学科、
阪大じゃ基礎工応用数学科だったか。
830 名前：１３２人目の素数さん [2014/04/05(土) 09:46:22.65 ]: >>829
「計測+数理」からの造語なんで「計量」の対義語じゃないみたいね。
関西に限らず、たしかに計数工学という科は東大以外あまり聞かないね。
まあ、実務の世界で活躍している人を多数輩出してるので
看板の一つだろうな。　
そういえば工学部自体が世界最古だった
831 名前：１３２人目の素数さん mailto:sage [2014/04/05(土) 18:30:56.35 ]: 昔は（５０年くらい前、今も？）数学が好きで理学部数学科に行きたいが
数学者になれるかどうか不安、とか親が工学部に行けと言うから、
という安全志向に押されてここに行った学生がかなり居た
実際理数卒より生涯収入は平均多いだろう
それぞれの教授になった連中は収入は同じようなもんだが、居心地はどっちがよかったか
まあ、性格は大分違ったね（後天的かもしれんが）
832 名前：１３２人目の素数さん [2014/04/05(土) 20:39:10.45 ]: 工学系は、他人がやっていない新しいことを探し出しやすいので
そういうのが好きな人は楽しいんじゃないかな。
院の生物統計も（医薬・看護系）で西欧は盛んでも日本には専門が
無いということで、計数工学出身の教授が新たに作りたいという
事から始まったから、新しいもの好きに向きなのかも。、
833 名前：１３２人目の素数さん mailto:sage [2014/04/07(月) 22:41:29.72 ]: >>832
生物統計を始めた計数工学出身の医学部教授というのは、
大橋教授のことですね？
東大　医学部健康総合科学科　大橋靖雄　教授
www.hn.m.u-tokyo.ac.jp/teachers/ohashiy.html
834 名前：１３２人目の素数さん [2014/04/09(水) 12:12:37.52 ]: すみません、誰か教えてください。

適合度の検定で有意差が出て、どこに差があったのか多重比較を行う場合、
ライアン法を使っても構わないですか?

某オンライン統計サイトでは、自動的にライアン法で多重比較までやってくれますが、
ライアン法は「k×2分割表の比率」のみに使用できる、と書かれている場合もあります。
835 名前：１３２人目の素数さん mailto:sage [2014/04/13(日) 20:51:10.51 ]: 独学で統計を学びたいのですが、一冊目におすすめの本を教えて下さい。
スレチだったらすみません。
836 名前：１３２人目の素数さん mailto:sage [2014/04/14(月) 01:16:37.80 ]: 完全独習統計学
837 名前：１３２人目の素数さん mailto:sage [2014/04/15(火) 07:52:08.12 ]: 統計学入門 (東大出版会)
838 名前：１３２人目の素数さん [2014/04/15(火) 08:49:25.19 ]: 誘導されてやってきますた
ai.2ch.net/test/read.cgi/math/1395970106/295
839 名前：１３２人目の素数さん mailto:sage [2014/04/15(火) 09:01:31.73 ]: 日本の大学で教えている確率・統計学じゃ使いものにならない気がするわ
物理の統計力学とかランダム行列とかまでやらないと

計数工学科は数理科学の工学版みたいなもんだろ
工学向けの数学に関する専門学科って感じだな
840 名前：１３２人目の素数さん mailto:sage [2014/04/15(火) 09:29:35.41 ]: なぜ統計力学が出てくるのか
841 名前：１３２人目の素数さん mailto:sage [2014/04/15(火) 15:54:29.26 ]: 言葉が似てるからだろ
842 名前：１３２人目の素数さん [2014/04/16(水) 00:06:46.19 ]: >>835
入門は放送大学つかえば？
ちょうど新学期の放送始まったばかりだから
843 名前：１３２人目の素数さん mailto:sage [2014/04/16(水) 00:21:04.83 ]: >>842
放送大学良さそうですね。
此方まだ高校生なので理解に足りるかわかりませんが、一度みてみます。
844 名前：１３２人目の素数さん mailto:sage [2014/04/16(水) 00:29:59.69 ]: 確率・統計 (理工系の数学入門コース 7)　薩摩順吉

これを超える統計学入門書は存在しない。
845 名前：１３２人目の素数さん mailto:sage [2014/04/16(水) 01:27:21.12 ]: 放送大学の統計はプロ野球の公式戦でのダルビッシュや松坂の投球内容がやたらとデータ化されて教材として使用されてる
846 名前：１３２人目の素数さん [2014/04/16(水) 23:39:30.73 ]: それは基礎科目の「身近な統計」の方か
専門科目の統計学はラジオなんだな。知らなかった
847 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 07:34:56.89 ]: 区間推定に関して質問です。

正規分布する観測量の平均値を推定するとき、標準化して標準正規分布の数値表から信頼区間を求めますよね。
この時、元になる分布とそれを標準化した標準正規分布の信頼区間が対応するとする根拠はなんでしょうか？
848 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 12:52:37.51 ]: 元側の確率変数に対し、同一の母平均の値を引いて、さらに同一の標準偏差で割ったのが、新しく生成された標準化された確率変数なのだから、
信頼区間内に含まれている標本群の特性は何ら変わらずに、標準化前→標準化後にそのまんま引き継がれていて当然なのでは？
849 名前：１３２人目の素数さん [2014/04/17(木) 18:39:03.63 ]: 平均値が最大値と最小値の間にあること。
中央値が平均値の２倍以下であること。（ただしデータは非負とする）
という２題を証明せよ、という問題なのですが、どういう方針で証明すればいいんでしょうか？
850 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 18:47:21.04 ]: 確率変数Xが平均μ分散σ2の正規分布に従うとき、
aX+bは平均μ+b分散a2σ2の正規分布に従う。
これの証明は、簡単で、多くの教科書に載っている。
思弁的な説明は、数学の範囲外にある。哲認定。
851 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 18:52:51.59 ]: >>849
一行目：最大値と最小値を別々に証明すれば良い
二行目：データの半分は中央値より大きい
852 名前：847 mailto:sage [2014/04/17(木) 19:07:33.94 ]: >>848
感覚的にはわかるのですが、数学的に厳密な証明を知りたいです。自分で定積分計算しようともしましたができませんでした。

>>850
aX+bは平均μ+b分散a2σ2の正規分布に従うということと、対応する区間内での積分値が一致することが繋がりません
853 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 19:22:46.16 ]: 少しは自分で式を書いてみろ
854 名前：１３２人目の素数さん [2014/04/17(木) 19:23:40.64 ]: >>849
なるほど、わけて考えるんですね。
ありがとうございました。頑張って解いてみます。
855 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 22:21:55.63 ]: 文系の大学生で基礎統計をやるんですけど
文系数学の知識ではできないところってありますか？
856 名前：１３２人目の素数さん [2014/04/17(木) 22:28:23.31 ]: 何やるのか知らんが、まともな内容なら、exp(x)ってなあに？だと正規分布すら分からないから無理
たのしいえくせる♪みたいな内容だったら文系だろうが問題ないでしょ
857 名前：１３２人目の素数さん mailto:sage [2014/04/17(木) 22:31:58.40 ]: 理系も混じってるからがちだと思う
新世社の入門統計解析ってのが教科書

微分積分の勉強すればいい？
858 名前：847 mailto:sage [2014/04/17(木) 23:32:36.87 ]: >>853
ん～自分でも式書いて証明こころみてるんですが、単純に積分してイコールになるっていう方法以外思いつかないんですよね。
で、積分するにしても∫[0,a]e^(x^2)dxは手計算では不可能らしいということが分かりましたし。。どうにも厳密な証明にたどりつかないんです
859 名前：１３２人目の素数さん [2014/04/18(金) 00:06:36.61 ]: 本当に書いただけだな
860 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 00:09:47.66 ]: というか母平均を推定するときって標準化するっけ
861 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 01:51:24.32 ]: >>860
そら正規分布表を読んで得られた数値って、標準正規分布という前提で色々計算された結果なんだし
862 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 02:10:51.53 ]: 意味も考えず計算するという奴か
863 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 10:28:13.67 ]: うちの教授は統計は理論を理解するより
何度も計算して手続きを覚えろと教えてたな。
864 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 16:02:24.45 ]: それで済む人はここに来る必要はない
865 名前：１３２人目の素数さん mailto:sage [2014/04/18(金) 20:12:05.19 ]: そんな高度な議論をしていたとは今まで全く気づかなかった。それは失礼した。
866 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 00:33:31.53 ]: 高度だなんて誰が言った？
867 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 00:47:58.52 ]: いやみ、皮肉でしょ
868 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 01:05:05.32 ]: いや、おそらく864が863の意味を反対に捉えてしまったんだろう
869 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 12:54:59.50 ]: どっちの意味でも同じじゃない？
870 名前：１３２人目の素数さん [2014/04/19(土) 13:20:42.61 ]: 正規分布って誰が発見したんですか？
871 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 13:23:12.23 ]: ガウス
872 名前：１３２人目の素数さん [2014/04/19(土) 13:40:05.59 ]: >>871
先生がガウスじゃないって言ってました。
名前は忘れたんですが思い出せなくて。

何人かの数学者が同じ頃に発見していたというように
いってたと思います。
873 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 13:45:08.74 ]: あっ、そう
874 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 14:25:54.78 ]: 正規分布の意義を研究したからガウス分布と言うのさ
875 名前：１３２人目の素数さん mailto:sage [2014/04/19(土) 14:56:27.60 ]: 数学や物理はいつも同時発見が多いのは、発見されることが必然だからさ。
876 名前：１３２人目の素数さん [2014/04/22(火) 11:48:02.43 ]: 問題ではないのですが表を作る上でわからないことがあるため質問させて下さい。

点数と順位の表を作り、その内容から何点取れば何位程度になれるかという表を作りたいです。

サンプル数は非常に少ないのですが、例えば
40点 120位
65点 50位
というサンプルがある場合、80点取れば何位程度が想定できるかという表を作りたいです。

これはどのように表にすることが出来るでしょうか。
877 名前：１３２人目の素数さん [2014/04/22(火) 11:49:37.18 ]: 引っ越すならここじゃなくてポエムスレだろ
878 名前：１３２人目の素数さん mailto:sage [2014/04/22(火) 15:17:09.10 ]: 表とグラフは一応別物だと思っているんだが・・・回帰直線のグラフじゃだめなのかい？
879 名前：１３２人目の素数さん mailto:sage [2014/04/22(火) 18:22:23.30 ]: >>876
ai.2ch.net/test/read.cgi/math/1395970106/351
880 名前：847 mailto:sage [2014/04/24(木) 05:59:52.08 ]: >>847には答えてもらえなそうですかね～証明が載ってる本を紹介してもらうだけでもいいんですが
881 名前：１３２人目の素数さん mailto:sage [2014/04/24(木) 06:38:39.95 ]: 単なる変数変換だから
微積分の教科書読むといいよ
882 名前：１３２人目の素数さん mailto:sage [2014/04/24(木) 13:14:10.39 ]: 「読者を馬鹿にしてる」と言われそうな本があるんかな
ここで書いても馬鹿にされそうだが
883 名前：１３２人目の素数さん mailto:sage [2014/04/24(木) 16:46:02.27 ]: >>880
まさかaを引いてbで割ったものを、bを掛けてaを足したら同じになる根拠はという質問？
標準化した信頼区間を元になる分布に対して見る場合は当然、bを掛けてaを足して元に戻すんだぞ。
884 名前：847 mailto:sage [2014/04/24(木) 23:03:33.44 ]: >>883
いえ、aを引いてbで割ったものが違う値になることはわかっています。

ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね？
たとえば、
f(x)を正規分布する確率変数として、それを標準化したものをg(z)として、
変数xの区間[a, b]に対応する標準化変数zの区間が[z1, z2]だとすると、
∫[a, b]f(x)dx=∫[z1, z2]g(z)dz
が成り立っていなければいけないと思うんです。でもコレの証明を見たことがないということです。
自分で計算しようとしても、どうしても定積分の計算でつまずいてイコールにできません。
885 名前：１３２人目の素数さん mailto:sage [2014/04/24(木) 23:20:39.05 ]: 確率変数と確率密度関数の定義もわからないでそんなこと考えてるのか
886 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 00:20:57.87 ]: 積分のとこ変数変換したら成り立たなくないか
887 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 00:30:57.49 ]: ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね？

ここなぜそう考えたのかわからないので教えてください
888 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 01:14:35.74 ]: >>884
そのつまずいたという計算を書いてみ
889 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 03:45:10.98 ]: >>887
標準化する前も後も結局は同じ式、正規分布関数なのだから、
きっと、∫[(z1-μ)/σ, (z2-μ)/σ]　、∫[z1, z2]を正規分布関数で解けばいいんだよ。同じになるはず。
890 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 21:24:23.58 ]: これが分からん奴に何を説明しても無駄じゃない？
891 名前：１３２人目の素数さん mailto:sage [2014/04/25(金) 21:37:59.38 ]: 数学の基本なしで統計やるとこうなる見本だな
892 名前：１３２人目の素数さん mailto:sage [2014/04/26(土) 18:49:29.43 ]: 最低でも数IIICはしないとダメだなという典型例か
今はCないらしいが
893 名前：１３２人目の素数さん mailto:sage [2014/04/26(土) 21:42:21.27 ]: >>889
前半は元に戻すんだから∫[(z1σ+μ, z2σ+μ]　だな。
正規累積分布関数なら代入するだけ。(x-μ)/√(2σ^2)の部分に代入するだけで、
簡単に同じ式になることが分る。
894 名前：１３２人目の素数さん mailto:sage [2014/04/29(火) 20:49:01.01 ]: 条件付き確率分布でf(x|y;θ)とf(x|y,θ)という書き方を両方見る気がする
違いはあるのだろうか
895 名前：１３２人目の素数さん mailto:sage [2014/04/29(火) 22:13:14.22 ]: a, b, c という具合に変数やパラメータを並べる際、cだけがaやbとは別種のもののとき、その違いを強調するために a, b; c と書くことがある
云わば「強い区切り」としてセミコロンを使う
896 名前：１３２人目の素数さん mailto:sage [2014/04/29(火) 22:15:42.00 ]: 数式にそんな曖昧なルールが本当にあるのか？
単純に処理系の違いじゃないのか。
897 名前：１３２人目の素数さん mailto:sage [2014/04/29(火) 22:18:55.68 ]: コンピュータに入力するわけじゃないんだから、数式の書き方なんて慣習頼みである程度の表記揺れはあるよ
見ればすぐに分かる程度の揺れだが

曖昧というのとは少し違う
898 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 01:17:19.04 ]: 定義は厳密だが表記は人次第
899 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 10:44:14.86 ]: ニュートンの時代の話？
900 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 11:13:14.34 ]: >>899
？？？
901 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 11:16:19.66 ]: >強調するために a, b; c
ねーよ。
902 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 13:17:34.48 ]: いや、あるよ
別に数学だけの慣習ではなく、英語一般に通じる話なんだけど＞強い区切り
903 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 16:14:10.89 ]: 高校の英語でも習う話だな
904 名前：１３２人目の素数さん [2014/04/30(水) 22:33:27.57 ]: 音楽の記号使うか
905 名前：１３２人目の素数さん mailto:sage [2014/04/30(水) 22:51:56.80 ]: >>894
そのケースでは、意味に差の無い
単なる「強い区切り」でしょ、たぶん。
楕円関数なんかだと、区切りの書き方によって
パラメータの表示方法が違ったりするから、
一応、文脈に沿った確認は必要だが、
おそらく >>895 の言うとおり。
906 名前：１３２人目の素数さん mailto:sage [2014/05/01(木) 19:22:50.13 ]: 曖昧に強調するためとかいうから勘違いする奴が出てくる。
ならボールド体や斜体表記でもいいだろということになる。

論理的に明確にコンマと区別したいから使うものだろう。
複数の数列とか行列とかコンマだけなら意味が不明確になる場合に。
907 名前：１３２人目の素数さん mailto:sage [2014/05/01(木) 20:33:02.37 ]: アホ現る
908 名前：１３２人目の素数さん [2014/05/09(金) 23:26:45.58 ]: 統計についてほとんどわからないのですが、
あるゲームの中のイベントが発生する確率を調べたいと思っています。
例えば１０００回試して１０回起きたとしたら普通に計算すると発生確率１％になりますが
この結果が偏りではなく、実際の発生確率とほぼ同じかどうかを検証する方法ってありますか？
909 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 12:44:30.37 ]: 無限回試してみればいい
910 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 13:02:04.24 ]: 直感的に無理だと思うが
911 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 13:07:44.85 ]: じゃあ直感で判断すればいい
912 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 15:01:28.79 ]: ランダムは偏る場合もあるし、偏らない場合もある。
それは諦めて普通に推定すればいい。ほぼ同じかどうか知りたいんだから、
信頼度99%とかで発生確率を推定すればいいだろう。
913 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 16:34:37.71 ]: >>912
>信頼度99%とかで・・・・・・・・・・・・・・・・
モンテカルロ法で発生確率>>908をシミュレーションするとして、推定に
適用する信頼水準は、常用する99%でも95%でもなく、常用しない80%とか
60%にすると推定理論上何か問題があるのでしたっけ？
914 名前：１３２人目の素数さん mailto:sage [2014/05/10(土) 19:01:25.62 ]: 何の問題もないよ。信頼度を落とせば、信頼区間は狭くなるだけ。
試行回数1000回を1万回にすれば精度もあがる。お好みでどうぞ。
915 名前：１３２人目の素数さん mailto:sage [2014/05/11(日) 06:24:42.58 ]: >>914
お好みでと言われるが、信頼区間幅を狭くして推定精度を上げても
その信頼度が60%なり50%なりだと、2回に1回はその推定値範囲内に
入らないわけで、算出はできるが実用にならないのではないか？
916 名前：１３２人目の素数さん mailto:sage [2014/05/11(日) 12:35:09.39 ]: それこそお好み
917 名前：１３２人目の素数さん mailto:sage [2014/05/11(日) 18:09:00.07 ]: このようなものは、χ^2検定が一般的
発生確率をp、試行回数をNとすると、
期待される成功回数はNpで、これをAと表すことにします。
失敗回数はN(1-p)で、これをBと表すことにします。
そして、実際試してみての成功回数がaで、失敗回数がb(=N-a)の時、χ^2と呼ばれる次の量
χ^2=(A-a)^2/A　+　(B-b)^2/B
を計算します。期待される量と、実際の回数が等しい場合は0になり、それからずれるほど
大きな値になるものです。これが、ある一定量を超えると、pがおかしいんじゃ無いかといえ、
今回の場合は自由度が１なので、3.84より大きいと危険度5%でおかしいといえるし、
6.63より大きくなると、危険度1%でおかしいといえる。

実際の計測が、1000回中10回ということなので、
発生確率を1%とすると、当然、χ^2=0で、おかしくない。
発生確率を1.5%とすると、χ^2=1.69で、おかしくない。
発生確率を2%とすると、χ^2=5.1で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
発生確率を0.5%とすると、χ^2=5.025で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
...
と、こんな感じで、危険度をある一定の値で決めれば、それに対応する発生確率の範囲を狭めることができる。
918 名前：１３２人目の素数さん mailto:sage [2014/05/12(月) 17:19:53.25 ]: これはカイ自乗分布に従わないですね。
919 名前：１３２人目の素数さん mailto:sage [2014/05/12(月) 20:35:09.37 ]: >>915
信頼度には、常用される99%か95%を採用すべきだろ。類似ケース例と
比較し易いから。
しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ？
根拠を書いた統計本を、未だ見たことがない。
920 名前：１３２人目の素数さん mailto:sage [2014/05/12(月) 20:53:25.98 ]: キリがいいし、人間の心的傾向による区分だよ。
1%で起こる確率は人はめったにない、めずらしいこととか感じる。
5%ぐらいになると、たまにある、時々あると感じる。
σ=1の中ならだいたいそんな感じ、ふつうにあるみたいな。
921 名前：１３２人目の素数さん mailto:sage [2014/05/12(月) 21:58:23.85 ]: 根拠はないだろう
1・5・10はちょうどいいってだけで気にしなくてもいい
目的に応じて調節すれば問題ない
922 名前：１３２人目の素数さん mailto:sage [2014/05/12(月) 22:38:00.70 ]: 根拠は明白。きりがいいから。

94.133%とか99.273%とか使う馬鹿はいない。誰が見てもきりが悪い。
923 名前：１３２人目の素数さん mailto:sage [2014/05/13(火) 06:44:07.04 ]: >>921
1・5・10はちょうどいいと、最初に用いたのはピアソンだったっけ？
924 名前：１３２人目の素数さん mailto:sage [2014/05/13(火) 23:09:59.99 ]: その年一番よかった曲を投票で決める際、一人が好きな曲を１位～５位として投票することができる
投票した５曲は１位として選ばれたら10pt、５位なら6pt。と重み付けされて集計されて、
投票が終わったときに全員分のポイントが合計され、合計ポイントが高い順にランキングになる

こういう投票システムで、自分の選んだ曲を上位にするために多重投稿している奴がいてランキングが狂ってしまう場合
これを統計的に見破るにはどうしたらいいだろうか

1.多重投票者は特定の同一曲に複数回投票し、残りの曲をどうでもいい曲で埋める
2.多重投票者は同じ日、あるいはかなり近接した日に連続して投票する
3.多重投票する必要のない曲(多くの人が投票する曲)は多重投票する意味がないので投票されない

等、経験的な分析は考えられるもののいい処理の方法がわからん
何かうまい方法はないだろうか
925 名前：１３２人目の素数さん mailto:sage [2014/05/13(火) 23:13:28.64 ]: 系列毎に決めればいいじゃないか。もちろん貢献度を考慮して。
926 名前：１３２人目の素数さん mailto:sage [2014/05/20(火) 06:47:53.93 ]: 確率とか統計とか知りたいんですけどwikipediaの正規分布の項を見ても理解できないので
初歩の初歩だけでも教えてほしいのですが

エクセルで(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)の式を
x=110～220で計算してこのグラフを作りました
i.imgur.com/2N8bCXo.jpg
意味としてはサイコロを1000回振った時の1の出る回数の確率分布って感じなんですが
きれいな正規分布のように見えるのですがμとσがここからどう求まるのかが分かりません

このグラフ又は式からμ及びσの求め方を教えてください
927 名前：１３２人目の素数さん mailto:sage [2014/05/20(火) 08:17:46.77 ]: muは1000*1/6
sigmaはsqrt(1000*1/6*5/6)で近似できるだろうね
最尤推定で正規分布なら推定量は
muは標本平均
sigmaは標本標準偏差になるかな
928 名前：１３２人目の素数さん mailto:sage [2014/05/20(火) 08:41:47.56 ]: 即レスありがとうございます
計算するとμ=166.7 σ=11.785くらいですね
なんとなくそれくらいなのはわかります
二項分布の公式のようなものが有るみたいですね
少し調べてます
929 名前：１３２人目の素数さん mailto:sage [2014/05/24(土) 01:10:21.31 ]: 二項分布の検定で標本数が少なくnp> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
930 名前：１３２人目の素数さん mailto:sage [2014/05/24(土) 08:17:11.20 ]: >>928
>二項分布の公式・・・・・・・・・・・・・・・・・
どういう公式のこと？そもそも正規分布>>926質疑に、何故
二項分布式なのか？
931 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 00:32:57.06 ]: >>930
すいません、よく理解してないんで変なこと書いちゃいましたかね？
Wikipediaで二項分布の項目に

期待値・分散[編集]
B(n, p)にしたがう確率変数X に対し、X の期待値E[X]は
E[X]=np
であり、分散Var[X]は
Var[X]=np(1-p)
となる。

とあるのが公式なのかなと思いました
nが十分に大きい二項分布は正規分布で近似できるともあるし
(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)
はそもそも二項分布式です
>>927でグラフを云々でなく提示式の数字だけ出して答えてくださっていたので
二項分布の公式なんだろうなと>>928に書いたのでした
932 名前：１３２人目の素数さん [2014/05/25(日) 12:11:10.78 ]: 平均と分散だけでいいだろ
何が公式なんだよww
頭おかしいんじゃないの？
933 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 13:32:16.04 ]: 頭おかしい扱いされたのですが
公式という語句を使ったのがまずかったのですか？
934 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 14:06:06.19 ]: どうでもいいよ
935 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 14:13:57.41 ]: >>934＝>>932＝>>930？
なんかカチンと来る人ですね
そもそも最初の文章が読めてなかっただけなんじゃないですか？
数学できても日本語できない感じですか？
936 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 14:36:34.30 ]: すみません、熱くなって見苦しい言葉を書いてしまいました
こちらとしては中途半端な知識で来ているので
間違っている点があればきちんと正していただきたかったのですが残念です
これ以上ここにいるのは誰にとっても不利益だと思うので去ります
スレ汚し失礼いたしました
937 名前：１３２人目の素数さん [2014/05/25(日) 14:57:32.79 ]: 漸近分布使うかどうかだろ？
そんなに熱くなることかよ
二度と来ないみたいだからいいけどw
938 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 17:47:49.47 ]: >>930
二項分布で簡単に解けるからだろ。
939 名前：１３２人目の素数さん mailto:sage [2014/05/25(日) 19:36:35.00 ]: >>926
> このグラフ又は式からμ及びσの求め方を教えてください
定義にあてはめて計算するだけです。
計算そのものは高校の数学Iとか数学IIのレベルです。
以上。
940 名前：１３２人目の素数さん mailto:sage [2014/05/26(月) 17:00:52.04 ]: 0点。
941 名前：１３２人目の素数さん mailto:sage [2014/05/26(月) 17:02:09.19 ]: つまりあんたは数学Iすら分かってないわけだ。
あんまり背伸びせずに着実に足場を固める方がいいと思うぞ。
942 名前：１３２人目の素数さん mailto:sage [2014/05/26(月) 17:08:51.75 ]: 平常点 -100点。
943 名前：１３２人目の素数さん mailto:sage [2014/05/28(水) 04:48:48.32 ]: >>930 はなぜ知ったかしたのか。
944 名前：１３２人目の素数さん mailto:sage [2014/06/02(月) 03:47:28.41 ]: 二項分布の検定で標本数が少なく、np> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
945 名前：１３２人目の素数さん mailto:sage [2014/06/02(月) 13:18:07.01 ]: >>945
ttp://www.press.tokai.ac.jp/bookpub.jsp?isbn_code=ISBN978-4-486-01389-1
統計数学序論 - 東海大学出版会
7.4　百分率の検定
　　　　7.4.2　小標本のとき
946 名前：１３２人目の素数さん mailto:sage [2014/06/02(月) 13:20:32.88 ]: ttp://www.amazon.co.jp/gp/offer-listing/4486013891/ref=la_B004L0PFAA_1_2_olp?s=books&ie=UTF8&qid=1401682782&sr=1-2&condition=used
947 名前：１３２人目の素数さん [2014/06/02(月) 21:50:14.20 ]: そもそも何の検定なのかね
948 名前：１３２人目の素数さん mailto:sage [2014/06/03(火) 00:59:49.14 ]: 実用数学検定じゃねえの？
949 名前：１３２人目の素数さん mailto:sage [2014/06/04(水) 21:03:43.63 ]: >>919
>しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ？

フィッシャーさんが仕事をしていた所が農業試験場だったから。
950 名前：１３２人目の素数さん mailto:sage [2014/06/04(水) 21:11:11.10 ]: 漁師だと思ってたよ。確率的に。
951 名前：１３２人目の素数さん mailto:sage [2014/06/05(木) 07:52:57.07 ]: 「フィッシャーの統計理論」に書いてある。
フィッシャーは肥料や田んぼの作り方の効果を研究するだけでなく、
良い方法が見つかったら近所の百姓を説得してそれを実際に使って
もらうことも仕事だった。フィッシャーの得意な説得方法は次の二つ。

方法１：「今までお前らが経験したことのないほど麦がとれるぞ」
　麦は１年に１回、百姓は２０歳から４０歳までの２０年間働く。
だから２０分の１以下（５％以下）。

方法２：「百年に１回あるかないかの豊作を経験させてやるぞ」
　百年に１回あるかないかとは１００分の１以下（１％以下）。
952 名前：１３２人目の素数さん mailto:sage [2014/06/05(木) 11:47:08.81 ]: 田んぼで麦を作ってたのか？
953 名前：１３２人目の素数さん mailto:sage [2014/06/05(木) 20:17:24.22 ]: フィッシャーは人を釣ってたのか
954 名前：１３２人目の素数さん mailto:sage [2014/06/06(金) 02:27:26.96 ]: フィッシャー、確かに釣り師っぽい名前だな
955 名前：１３２人目の素数さん mailto:sage [2014/06/25(水) 22:35:58.88 ]: 「特異度」って言葉なんか変じゃね?　意味が逆のような気がすんだけど．．

特異度（とくいど）とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。
概要
特異度が高い、とは、「陰性のものを正しく陰性と判定する可能性が高い」、あるいは「陰性のものを間違って陽性と判定する可能性が低い」という意味である。

ja.wikipedia.org/wiki/%E7%89%B9%E7%95%B0%E5%BA%A6
956 名前：１３２人目の素数さん [2014/06/26(木) 21:35:08.87 ]: だから何？
957 名前：１３２人目の素数さん mailto:sage [2014/06/26(木) 21:48:33.26 ]: 逆というか・・わからんよな
958 名前：１３２人目の素数さん [2014/06/26(木) 22:52:04.61 ]: 1-4群のカテゴリーに分けた説明変数が二値アウトカムに与える影響を知りたいので、
SPSSを用いてロジスティック回帰分析を行いました。
1群を対照にして2群から4群に数字が大きくなるにつれてオッズ比が大きくなるという結果なのですが、
これを傾向があると言うにはどうすればいいか悩んでいます

カテゴリーから多項式対比を利用してみましたがこれでいいのか、そしてよいならば結果の解釈はどうすればいいのか
さっぱりわかりません。統計素人なので罵倒されてもいいですから、私の悩みを解決してください
教えてくれたら脱ぎます。いや、嘘ですけど。
959 名前：１３２人目の素数さん mailto:sage [2014/06/27(金) 19:41:19.97 ]: 虎ハンター・小林邦昭スレ
960 名前：１３２人目の素数さん [2014/07/07(月) 22:38:31.18 ]: 統計学ってつまらなくね？行列計算をひたすらやるだけじゃん
961 名前：１３２人目の素数さん mailto:sage [2014/07/07(月) 22:44:38.34 ]: つまる／つまらないで学ぶ類のものではない
そうでしょう？
962 名前：１３２人目の素数さん mailto:sage [2014/07/09(水) 09:35:26.53 ]: そう。
学ぶ必要は大きいが、
全くつまらない。
963 名前：１３２人目の素数さん mailto:sage [2014/07/09(水) 10:01:16.08 ]: つまらないかそうでないか統計をとってみないとわかりません
964 名前：１３２人目の素数さん mailto:sage [2014/07/11(金) 13:06:04.05 ]: つまらん統計をやってるんだな
965 名前：１３２人目の素数さん mailto:sage [2014/08/10(日) 23:47:54.27 ]: すみません中卒です
n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の標準偏差はどう求めればいいのでしょうか？
966 名前：１３２人目の素数さん mailto:sage [2014/08/13(水) 12:17:41.21 ]: 事象が独立ならば、「(A+B)の分散」は「Aの分散+Bの分散」

よって、n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の分散は
サイコロを1回降った時の分散の合計なので、これのルートが求める標準偏差
967 名前：１３２人目の素数さん mailto:sage [2014/08/15(金) 07:56:04.05 ]: ありがとう
968 名前：１３２人目の素数さん [2014/08/16(土) 14:55:08.77 ]: ペプシコーラとコカコーラの「どちらがオイシイ？」という味比べの広告、カイ2乗検定とかF検定まで行ってみないことには、全くもって意味がないと思う
969 名前：１３２人目の素数さん mailto:sage [2014/08/18(月) 17:23:24.91 ]: >>968
発想がアホすぎる
「統計的に意味がない」ところに「広告として意味がある」
あえて反論の余地を残すことで、広告倫理やコカコーラ社の反撃といった問題を回避できている
970 名前：１３２人目の素数さん mailto:sage [2014/08/19(火) 06:48:05.68 ]: コカコーラのほうが上手いのは当然だから、検定するまでもなくあれは間違いだよ
971 名前：１３２人目の素数さん mailto:sage [2014/08/19(火) 20:18:00.63 ]: 平均の差が有意か調べたいのですが、

{1,2,3,4,5}と｛2,3,4,5,6}でP値は0.3466
観測値を1000倍して{1000,2000,3000,4000,5000}と{2000,3000,4000,5000,6000}としてもP値は同じになりませんか。

F1のピット作業時間みたいのは、全部差がないと出るような気がするんですが、どうしたらいいのでしょう？

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef