1 名前:132人目の素数さん [2011/02/11(金) 01:51:36 ] 2010.9上旬のkamomeサーバ霧散スレッド全損事件から5ヶ月、 運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。 引き続き、質問等どうぞ。 前スレ 統計学なんでもスレッド12 kamome.2ch.net/test/read.cgi/math/1283521346/
81 名前:132人目の素数さん [2011/04/17(日) 02:11:01.55 ] >>80 パラメータaとbについては非線形だと思います。 パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。 もちろん「変数」に関しては線形ですが。
82 名前:132人目の素数さん [2011/04/17(日) 03:41:54.70 ] >>81 両辺をaで割れば、 y/a = x1 + b * x2 + u/a となるんじゃないの?
83 名前:132人目の素数さん [2011/04/17(日) 03:59:01.87 ] >>82 でもa自体が未知なので変換は不可能じゃない?
84 名前:132人目の素数さん [2011/04/17(日) 15:07:32.72 ] y = a*x1 + a*b*x2 + u のa*b = cとおいて、 y = a*x1 + c*x2 + u とすれば普通の回帰分析と同じ。 そして、aとcを求めてから、 cをaで割るとbが求まります。 よって線型と同じです。
85 名前:79 [2011/04/17(日) 15:51:49.81 ] すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。 実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような 簡単な方法では扱えないモデルです。 問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。
86 名前:132人目の素数さん mailto:sage [2011/04/17(日) 16:44:18.49 ] >>84 そのように置いたらaとcは独立ではないよね。
87 名前:132人目の素数さん [2011/04/17(日) 18:51:01.98 ] >>86 ええ。そうしなくても独立ではないですよね? >>85 こういうのをやりたいということですか? www.cs.osakafu-u.ac.jp/hi/honda/mathematics2.htm
88 名前: 忍法帖【Lv=19,xxxPT】 mailto:sage [2011/04/17(日) 19:46:06.04 ] 通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。 ベイズ統計学はどういうところで使われているんですか? 普通の統計学にたいして利点と欠点とかってあるんでしょうか?
89 名前:79 [2011/04/17(日) 20:12:17.21 ] 具体的に言うと y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u という回帰モデルでa,b_1,...b_kの推定を考えています。
90 名前:132人目の素数さん [2011/04/17(日) 23:02:45.42 ] >>88 ベイズの公式を利用するものをベイズ統計学という。 どんな問題でも、常にベイズの公式を使う人のことを ベイジアンといいます。 ベイズの公式は単純ですけど、奥が深いらしいです。 利点はベイズの公式を利用できることですかね? 欠点はないです。 だってベイジアンでないかぎり、ベイズの公式を使っても 使わなくてもいいんですから。
91 名前:132人目の素数さん mailto:sage [2011/04/17(日) 23:17:48.07 ] >>90 >欠点はないです。 ベイズは概して計算量が増えます。
92 名前:132人目の素数さん [2011/04/17(日) 23:37:54.83 ] >>89 y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u これを書き換えると y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、 もとまった係数から、順番にb_1からb_kまでを決めていけばいい。
93 名前:132人目の素数さん [2011/04/17(日) 23:40:48.41 ] あ、ごめん、見間違ってた。
94 名前:132人目の素数さん [2011/04/18(月) 02:18:12.99 ] 計量経済で言うコクランオーカット法の推定と同じような問題かな?
95 名前:132人目の素数さん mailto:sage [2011/04/18(月) 18:11:22.42 ] CRFってわざわざ名前つけるほど特別な方法でもないじゃん なんで騒がれてんのか不明だわ
96 名前:132人目の素数さん mailto:sage [2011/04/18(月) 23:31:50.66 ] >>87 aとa*bはそりゃあ独立じゃないですよ。 aとbを別に求めたいから非線形ということですよね。
97 名前:132人目の素数さん [2011/04/22(金) 09:25:33.58 ] データが「正規分布に従う」と言うためには何をすれば(何を示せば)いいですか?
98 名前:132人目の素数さん mailto:sage [2011/04/22(金) 16:27:42.03 ] >>97 宿題?それとも試験中?
99 名前:97 [2011/04/22(金) 19:36:59.20 ] >>98 工学系の論文です。
100 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:51:27.25 ] 論文なのにこんなところで聞くのかw 参考文献に2chと書くのか?w
101 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:54:52.25 ] 胸が熱くなるな…
102 名前:97 [2011/04/22(金) 20:37:35.46 ] >>100 ここで概要を聞いた後に文献を引いて詳細を調べようと思います。
103 名前:132人目の素数さん mailto:sage [2011/04/22(金) 21:34:04.74 ] >>102 データの分布について、正規分布かどうかの検定をする。 あたりまえすぎて、答えになるかな…
104 名前:97 [2011/04/22(金) 23:16:49.37 ] >>103 正規性検定の方法を調べてみたらいろいろ出てきましたが、 よく使われるものや使わない方がよいものはございますか? - Anderson–Darling test - Kolmogorov–Smirnov test - Shapiro–Wilk test - Smirnov–Cramér–von-Mises test
105 名前:132人目の素数さん mailto:sage [2011/04/22(金) 23:18:35.61 ] >>104 概要を聞いたら、詳細に調べるんじゃなかったっけ。
106 名前:97 [2011/04/23(土) 01:20:54.07 ] >>105 はい、それぞれの手法の詳細は現在調べているところです。 最初に質問したときは「正規性の検定と言えばこれ」という 手法があると思っていましたが、いくつもの手法が出てきた ため、定石があれば教えていただきたいと思い質問しました。
107 名前:132人目の素数さん mailto:sage [2011/04/23(土) 08:13:17.77 ] >>106 統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。 それは、各手法を調べればわかること。
108 名前:97 [2011/04/23(土) 10:11:01.86 ] >>107 ありがとうございます。 各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。 >>98 , 103 お礼が遅くなりましたが、ありがとうございます。>>107 と同じ方かも しれませんが、違う方でしたらいろいろな方々にお世話になりました。
109 名前:132人目の素数さん [2011/04/24(日) 21:20:58.83 ] ベキ分布でリスク管理のすすめ f.blogos.livedoor.com/opinion/article/5513200/
110 名前:132人目の素数さん [2011/04/24(日) 22:09:22.10 ] >>108 データ数が多いほど、正規性の検定で棄却されるから、 泣かないようにね。 もし、正規性の検定が研究の中心テーマでないなら、 検定なんかしなくて、ヒストグラムのみ示しておいて、 「正規分布と仮定して、、、」と進めればよいと思います。 棄却されないために、わざと検定しない奴多いんですよ。(爆 また、実験などでデータ数を調整できるような研究なら、 データは少なめにしたほうがいいかも?
111 名前:132人目の素数さん [2011/04/27(水) 13:01:13.59 ] 小説に歴史上の数学者を登場させたくて、 確率論、特に正規分布などの歴史について調べています。 Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。
112 名前:132人目の素数さん mailto:sage [2011/04/28(木) 13:24:03.84 ] 物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた
113 名前:132人目の素数さん mailto:sage [2011/04/28(木) 14:49:13.68 ] >>112 ニートなので出費はちょっと……。 最寄りの図書館にも数学史無かったし……まあ諦めます。
114 名前:132人目の素数さん mailto:sage [2011/04/28(木) 21:49:10.37 ] >>113 ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。 正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。
115 名前:132人目の素数さん mailto:sage [2011/04/28(木) 22:38:47.02 ] >>114 おおっ。良くまとまっていますね!thanks!
116 名前:132人目の素数さん mailto:sage [2011/05/04(水) 20:17:27.97 ] この問題はカイ二乗分布の表を使って解くのでしょうか? どなたか詳しい解き方を教えて頂けたら嬉しいです。 なんかいまいち参考書を読んでも解き方がわからない... 正規分布に従う母集団から次の標本が存在する 66.303、15.102、84.942、53.234、93.443、63.132、45.295 この時、母集団の平均と分散を信頼係数95%で区間推定せよ。 (解答は小数点以下第4位まで求めよ)
117 名前:132人目の素数さん mailto:sage [2011/05/05(木) 01:07:45.13 ] >>116 サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。
118 名前:132人目の素数さん [2011/05/05(木) 06:36:06.04 ] 平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。 統計表のどこを見ればわかるものなのでしょうか? ttp://www.mext.go.jp/b_menu/houdou/21/11/__icsFiles/afieldfile/2009/11/30/1287227_1_1.pdf
119 名前:132人目の素数さん mailto:sage [2011/05/05(木) 07:21:36.82 ] >>118 pdfは見ないで書くけど、ないなら他から探して持ってくる。
120 名前:132人目の素数さん mailto:sage [2011/05/05(木) 11:45:02.47 ] >>116 平均の推定はt分布 分散の推定はχ二乗分布
121 名前:132人目の素数さん mailto:sage [2011/05/05(木) 15:44:47.42 ] >>118 表の中に38698校とあるやつではないわけ?
122 名前:132人目の素数さん [2011/05/05(木) 16:58:23.57 ] >>121 でも、(2ー1)では総数40285校なんですよね。 こういう調査って総数は一致しないものなのですね.
123 名前:132人目の素数さん [2011/05/06(金) 19:58:32.59 ] >>122 >>119 だけど、なんか適当なこと書いてるのでpdfを読んでみた。 とりあえず、統計資料使う時は「注」を読もうね。 私の学生が「こういう調査って総数は一致しないものなのですね」って 言ったら叱ってるw まず、「(1−1)暴力行為の発生状況」と「(2−1)いじめの認知 学校数・認知件数」をみると(1−1)には特別支援学校が含まれていない のでその分(2−1)が多い。 (2−1)の注を見ると「注3)学校総数のうち、高等学校の全定併置校は 全日制、定時制をそれぞれ1校(計2校)として計上しているため、学校基 本調査の数値と一致しない。」と一致しない理由が書いてある。 (1−1)では国立170、公立36242、私立2286で、(2−1)の数字から 特別支援学校を除くと、国立が170(=215-45)、公立36775(=37741-966)、 私立2314(=2329-15)となっていて、国立以外は(2−1)の数字が大きい ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と してデータを処理してるのがわかる。 また、(2−1)の注を見ると「(注4)休校等の学校があるため、認知した 学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、 学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082 と小さくなっているので、(1−1)を見るときも休校などが考慮されていない と予想できる。
124 名前:れが [2011/05/06(金) 21:56:57.84 ] 問題: 三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y:Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、 1) P(Y>=1)=□、P(X^2+Y^2>=1)=□、 2) Xの確率密度関数f(X)はf(X)=□、E[X]=□、 Yの確率密度関数g(y)はg(y)=□、E[Y]=□、 □を求める問題です。 図がなくて申し訳ありません。X座標が1、Y座標が2の三角形Ωです。 分かるかた教えてください。 よろしくお願いします。
125 名前:132人目の素数さん mailto:sage [2011/05/06(金) 22:09:34.67 ] >>124 すぐに答える気はないんだけど とりあえず、三角形の頂点の座標が (0,0)、(1,0)、(0,2) ってことかな?
126 名前:れが [2011/05/06(金) 22:10:37.07 ] >>125 そうです。
127 名前:132人目の素数さん mailto:sage [2011/05/07(土) 14:24:10.69 ] >>124 携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。 1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。 2→三角形の斜辺をxの式で書く。その式が答え。 でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。 正確には「0>x,x>1のとき」はf(x)=0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。 小さい解答欄にそれかくと空気読めてないと思われるかも。 同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。
128 名前:132人目の素数さん mailto:sage [2011/05/07(土) 14:57:56.77 ] >>127 >>125 だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。
129 名前:132人目の素数さん mailto:sage [2011/05/07(土) 20:42:58.13 ] >>117 >>120 ありがとうございます。 この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、 という認識で正しいでしょうか?
130 名前:132人目の素数さん mailto:sage [2011/05/08(日) 23:35:11.89 ] どうしてそんな認識になるのか僕にはわけがわからないよ。
131 名前:132人目の素数さん mailto:sage [2011/05/09(月) 01:48:21.68 ] >>130 多分、信頼区間ってものが全然わかってないんだと思う。
132 名前:132人目の素数さん mailto:sage [2011/05/09(月) 11:37:29.77 ] こりゃ毎回生徒をいびりにくる先生から説教してもらわなな
133 名前:132人目の素数さん mailto:age [2011/05/09(月) 12:10:04.32 ] >>130 >>131 >>132 カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。 これはやはり誤りでしょうか? 教科書を読んでもこの程度しか理解できませんでした・・・ どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。
134 名前:132人目の素数さん mailto:sage [2011/05/09(月) 12:39:27.96 ] >>133 ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を2乗すれば分散になる。 でも君のデータはχ二乗分布なの? 平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。 分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。 その時に、信頼区間の設定(90%とか95%とか)に対応したχ二乗分布の値を使う。
135 名前:132人目の素数さん mailto:sage [2011/05/09(月) 12:45:08.00 ] ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。 とりあえず、分散の信頼区間の式をよく見るんだ!
136 名前:132人目の素数さん mailto:sage [2011/05/09(月) 13:25:32.52 ] >>133 ストーリーがわかってないような気がした 分かっていたらすまん 数学的な話を抜きにして、発想の話 例えば、池の中の魚の身長の平均や分散を知りたい →全部調べるのむり →とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった →ひょっとして、池の魚の平均身長は10センチ?(点推定) →でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな →でかいのが10匹とれたり、小さいのが10匹とれたりするかも →サンプル平均は大小さまざまな値をとるな →池全体の平均を10センチとドンピシャでよそうするのは怖い →平均は8センチ〜12センチにあるとか幅もたせて予想するか →これが区間推定 サンプル平均やサンプル分散はどのような大小さまざまな値をとる しかし、実はそれぞれ工夫をすれば特徴的な分布に従う そして、その分布を見ながら95%の確率まであたるように予想範囲を広げる
137 名前:132人目の素数さん mailto:sage [2011/05/10(火) 18:04:02.52 ] 大数の法則のおかげでこんだけサンプルとれば 信頼に足る母集団の情報が得られますよって判るのか!
138 名前:132人目の素数さん mailto:sage [2011/05/10(火) 18:26:25.60 ] >>137 んだ
139 名前:132人目の素数さん mailto:sage [2011/05/11(水) 19:03:04.39 ] 区間推定の信頼率って、本来は極限とった先での値だよね 有限の場合で考えても、極限にどれだけ近いか(オーダーじゃなくて、正確に数値で)わからないと、 95%なんて具体的な値を引き合いに出しても意味なくね?
140 名前:132人目の素数さん mailto:sage [2011/05/11(水) 19:04:45.90 ] 訂正 "(オーダーじゃなくて、正確に数値で)"は削除
141 名前:132人目の素数さん mailto:sage [2011/05/11(水) 22:29:30.52 ] >>139 小標本特性についてはわかっていない場合が多いが、例えはt分布については特性が数学的にわかってる。 その代わり、母集団の分布に制限がある。 中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く) で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。 ということで、全く意味がないわけではない。
142 名前:132人目の素数さん [2011/05/11(水) 22:50:42.61 ] >>139 まず、>>141 に追加 >中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く) その代り、サンプル数が大きくないといけない。 ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル があれば実用上はそれほど問題がないこともわかっている。 t分布表と標準分布の表を比べてみるとわかるよ。 次にちょっと補足しておくと、小標本の場合は数学的(解析的)にサンプル の分布の状態が求まらない。これは式で表せないということであって、少ない サンプル数での分布は存在する。 なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から 10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、 10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。
143 名前:132人目の素数さん [2011/05/12(木) 13:22:18.88 ] (平均,分散)=(0,1)から10個取り出した10個の平均値は、 0±10なら、確率100% 、 0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。 ところで、その逆(のようなこと)である、 10個の平均値が、zeroの場合の 元の分布(これが正規分布で分散1であると仮定し) 元の分布の平均(つまり母平均)の確率分布を求めたい。 どうもなんだか、すっきりしないから。
144 名前:132人目の素数さん [2011/05/14(土) 09:55:16.63 ] ttp://up3.viploader.net/ippan/src/vlippan207769.jpg
145 名前:132人目の素数さん mailto:sage [2011/05/14(土) 21:05:24.91 ] >>144 距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた 時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。
146 名前:132人目の素数さん [2011/05/15(日) 10:52:52.19 ] 【統計】女子大生の性体験率は62% 女子高生は30%でともに肉食化 toki.2ch.net/test/read.cgi/dqnplus/1304856492/
147 名前:132人目の素数さん [2011/05/16(月) 23:18:20.94 ] すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか(実験誤差は正規分布に従うと仮定) (1)条件A B Cで各条件10サンプルを並行して行いデータを取った。 (2)上記の実験を三回繰り返した(各条件10*3のデータ数) 二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。
148 名前:132人目の素数さん [2011/05/17(火) 10:31:45.76 ] >>147 ABCで10サンプルx3なら それぞれ30サンプルということでいいじゃん? 30サンプルのが3つある、ということで ABCを比較すればいい。 条件は同じなんでしょ?
149 名前:132人目の素数さん mailto:sage [2011/05/18(水) 23:43:29.31 ] >148 レスありがとうございます。はい。条件は同じです。
150 名前:132人目の素数さん mailto:sage [2011/05/19(木) 20:23:43.52 ] 質問があるのですが、どなたかご回答をお願いします。 平均点が58、分散16のとき、得点が65の人の偏差値はいくであるか? 自分の考えでは、10・(65-58)/16+50=54.357になりました。 分散と標準偏差値を同じように扱ってしまっています。 どなたかご教授お願いします。
151 名前:132人目の素数さん mailto:sage [2011/05/19(木) 20:29:18.28 ] >>150 分散は標準偏差の二乗。 標準偏差は分散をルートしたもの。
152 名前:132人目の素数さん mailto:sage [2011/05/20(金) 01:36:12.31 ] >>150 分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。 バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。 で平均から離れてた点数を合計して人数(もしくは人数−1)で割ったら大体のバラツキが分かりそうやろ。 でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。 2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。 前者のほうが、実力バラついてるやろ。 だから平均から離れてた点数を2乗して合計してから人数(もしくは人数−1)で割るんや。それが分散。 でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。 2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。 さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。 当たり前やけど、引かれた点数をもとに平均点を出すと0点になるやろ。 さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。 (100点満点のテストを10点満点にした感じ) この発想が (点数−平均)/標準偏差 みんなの点数をこの式にいれて、これを点数にしたら平均0で大体±1に収まるのではないかと発想したくなる。 その発想をもとに、偏差値はどういう指標なのかを考えてみては。 平均点とれば偏差値50とかの意味もわかると思う。
153 名前:132人目の素数さん mailto:sage [2011/05/20(金) 02:06:38.32 ] その関西弁イラつくからやめて下さい
154 名前:132人目の素数さん [2011/05/20(金) 08:33:36.99 ] というか、10・(65-58)/16+50=54.357 の式を書いてる段階でそれなりに 勉強はしてる。 >>152 の説明だとかえってわからない、混乱させるよ。w
155 名前:132人目の素数さん mailto:sage [2011/05/20(金) 10:21:36.72 ] >>152 自分は納得できました。 たまにくる教員の方?より分かりやすいです。
156 名前:132人目の素数さん mailto:sage [2011/05/20(金) 11:07:32.00 ] >>155 みたいに教科書を読んでも理解できないのが、 「マンガでわかる統計学」の購買層なんだろうなw
157 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:04:01.23 ] >>154 あなたも理解が足りてませんね。 基準化するのに分散で割ってる人を学習が進んでると判断するあたり。 似てる式ですが意味が全く違いますよ。単位が違いますから。 標準正規分布を利用した検定推定。特に区間推定と基準化の関係。 さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。 式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。
158 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:13:35.42 ] 156は教員で悔しかったのかなw ひさびさにワロタ
159 名前:132人目の素数さん mailto:sage [2011/05/20(金) 12:46:50.63 ] いや、たまにくる教員は俺(>>154 )だ。w >>157 当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。 宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。
160 名前:132人目の素数さん mailto:sage [2011/05/20(金) 14:08:02.72 ] 先生! 宿題ききにきて挙げ句ケンカする大学生をなんとかしてください! ここはもはや動物園です でも好きです
161 名前:132人目の素数さん mailto:sage [2011/05/20(金) 15:14:25.55 ] 私も好きなので、止める気はありません。 授業評価もないので、静かにさせなくても問題ないし。w
162 名前:132人目の素数さん mailto:sage [2011/05/21(土) 00:45:12.43 ] すんません。 X〜x^2(n)のとき a*X〜a*x^2(n) になりますか?
163 名前:132人目の素数さん mailto:sage [2011/05/21(土) 09:57:37.52 ] x^2(n) って何?
164 名前:132人目の素数さん mailto:sage [2011/05/21(土) 10:56:55.70 ] カイ二乗じゃないかな
165 名前:132人目の素数さん mailto:sage [2011/05/21(土) 20:57:19.16 ] >>162 です そうですカイ二乗分布です 説明不足ですいません
166 名前:132人目の素数さん mailto:sage [2011/05/22(日) 01:40:50.58 ] >>165 ならない。 χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。 綺麗な形にならないと思う。
167 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:12:13.11 ] a*x^2(n)って何?カイ二乗分布のa倍?
168 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:41:15.19 ] 分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。
169 名前:132人目の素数さん mailto:sage [2011/05/22(日) 02:46:47.72 ] xがn(μ,σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0,1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。
170 名前:132人目の素数さん mailto:sage [2011/05/22(日) 07:42:10.64 ] >>169 y=(x-μ)/σ^2 じゃなくて、y=(x-μ)/σ に修正。
171 名前:132人目の素数さん mailto:sage [2011/05/22(日) 13:43:58.12 ] >>168 それってa倍したものが再生性があるとか考えなくてよいなら どんな分布でもそうなんじゃない? >>169 は再生性の話だよね。
172 名前:132人目の素数さん mailto:sage [2011/05/22(日) 15:10:49.05 ] >>168 a倍した変数が従う分布「〜a*x^2(n)」と書いてるので、 a倍した新しい変数の確率を考えるとこれはおかしい。 全ての確率が1になってない。 全ての確率が1になるような分布関数の形状の話ではなく、 対応関係だけを考えているなら、>>171 のコメントもありかな。 Y=aX ってのは、新しい変数Yの分布を考えた時に、その値が aXと等しければ、元の分布のXの時の確率が与えられる。 例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで 新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。 (ここまでならあり) ただ、普通は変数変換して、y=φ(x)という変換をした場合、 元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y) として、g(y)=f(ξ(y))|dξ(y)/dy| となる。 χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても X^(m/2-1)*e^(-X/2) という項があって、ここのXをY/aに置き換え た物が出てくるので、積分して分布を考えても元のa倍にはならない。
173 名前:132人目の素数さん mailto:sage [2011/05/22(日) 15:13:45.92 ] >>171 あ、肝心なことを答えてなかった。 >>168 、169で書いたのは、再生性というよりも、変数変換した後の 分布の形状の話で、それは元の分布にaを掛けたものにはならない ってことです。
174 名前:132人目の素数さん mailto:sage [2011/05/22(日) 19:07:53.74 ] 回答的には 確率変数 X が自由度 n のカイ自乗分布にしたがう時、 確率変数 Y = aX ( a > 0 ) の確率密度関数のグラフは 自由度 n のカイ自乗分布のグラフの横軸を a 倍、縦軸を 1/a 倍 したものになる。 でOK?
175 名前:132人目の素数さん mailto:sage [2011/05/22(日) 20:18:53.89 ] >>174 正規分布ならそれでいいけど、χ二乗分布だとそうは言えない。>>172 に書いたΓ分布以外の項があるので綺麗にならない。 例えは、自由度2のχ二乗分布の累積密度関数で、0の値(高さ)を計算すると、0.5になる。 これは、y=axで変換しても、y=0で高さが0.5になるってこと。 まあ、χ二乗分布は自由度が高くなれば、漸近的に正規分布に近づくので、そういう意味では、だいたい1/aの高さになると考えてもいいけどね。
176 名前:132人目の素数さん mailto:sage [2011/05/22(日) 22:04:16.43 ] あ、例えで、嘘書いたかも。w
177 名前:132人目の素数さん mailto:sage [2011/05/23(月) 00:09:54.43 ] 例えだけでなく一般論的にも嘘というか勘違いだけど
178 名前:132人目の素数さん mailto:sage [2011/05/23(月) 00:11:01.74 ] 0の値の高さは半分になるよね。 また、変数変換ではy=axならx=y/aでg(y)=f(y/a)/aだよね。 だから変換後の分布はカイ二乗分布にはならないけど 密度関数でいえば>>174 で正解だね。
179 名前:132人目の素数さん mailto:sage [2011/05/23(月) 01:04:12.14 ] >>178 g(y)=f(y/a)/a の処理で、悩んでたんだけど、χ二乗分布か どうかって話を別にすれば、分布の形は高さが1/a になった ものだね。 χ二乗分布にこだわりすぎて、単純なところで勘違いしました。 ありがとうございます。
180 名前:132人目の素数さん mailto:sage [2011/06/01(水) 00:30:09.00 ] 多頻度飽和アイテム集合と多頻度アイテム集合との違いがいまいち 分からないのですがご教授下さい。 聞く場所が分からないのでスレチかもですが。。
181 名前:132人目の素数さん mailto:sage [2011/06/01(水) 10:35:54.89 ] データマイニングの用語のようだね。 ここで反応あるかな?