1 名前:132人目の素数さん mailto:sage [2012/01/14(土) 01:26:04.68 ] スレのお約束を守った上で統計学について何でもどうぞ。 ●学校の宿題の丸投げはやめましょう。 ●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。 ●荒らしは基本的にスルーでお願いします。 前スレ 統計学なんでもスレッド13 uni.2ch.net/test/read.cgi/math/1297356696/
152 名前:132人目の素数さん mailto:sage [2012/02/18(土) 01:39:49.71 ] あ、でも147の言うことも凄い分かります あんまり小児的なんて言葉で切り捨てて欲しくないなぁ しかしこういう些細な?ことを何の疑問もなくつまづきもせず理解できる人って凄いね 頭の作りが違うと言われればそれまでだけど、算数から躓いていた自分からすると 統計の勉強の一歩一歩が本当につらいよ
153 名前:132人目の素数さん mailto:sage [2012/02/18(土) 07:25:33.33 ] >>151 >>146 だけど、以下の説明でわかる? 例えば、サンプルを取ってみたら値が3だったとすると、これは分布ではなくて値だよね。 でも、その3という値が、ある確率分布に従って発生したものであれば、背景というか データを作成している分布を利用して、統計的な処理ができるよね。 (まあ、1個じゃ厳しいけどw) 何かを作る機械(分布)があって、そこに設定(正規分布とか)があって 製品(確率変数)ができるけど、機械や機械の設定と製品は違うでしょ。 (かえって分かりづらいかな)
154 名前:132人目の素数さん mailto:sage [2012/02/18(土) 07:50:36.36 ] >>150 「田中先生の担当科目は英語である」を 「田中先生は英語である」と縮めて表現するようなものだ 文脈次第では正しい表現ではあるが、フォーマルな日本語ではない どこか子供っぽい気がするだろう? アンタの疑問は完全に国語の問題であって、統計学は関係ない
155 名前:132人目の素数さん mailto:sage [2012/02/18(土) 07:53:47.69 ] アンカー先を間違えた >>154 は>>152 に向けて
156 名前:132人目の素数さん mailto:sage [2012/02/18(土) 13:37:19.54 ] those values obeying a multivariate normal distribution ・これらの値は多変量正規分布に従う or ・これらの値は多変量正規分布となっている どっちでもいいだろw
157 名前:132人目の素数さん mailto:sage [2012/02/18(土) 13:50:33.66 ] >>156 obeyってなってるのに…
158 名前:132人目の素数さん mailto:sage [2012/02/18(土) 14:13:38.24 ] >>156 People obeying a law 法律に従っている(守っている、順守している)人々 or 人々は法律である(法律そのものだ!) どっちでも一緒だと思うの?w
159 名前:132人目の素数さん mailto:sage [2012/02/18(土) 14:21:03.60 ] those values obeying a multivariate normal distribution ↓ those values distributing a multivariate normal distribution ということもできるが同じ語が重なるので普通は言わない なにも英語のマネして”従う”という必要はないが 数学では慣習上英語の表現を翻訳して使うことが多い
160 名前:132人目の素数さん mailto:sage [2012/02/18(土) 14:29:29.86 ] >>154 多分国語の問題だし言いたいことは何となく分かるんだけど、 根本的に確率変数や分布などの概念や考え方がピンとこなくて理解できてないから 国語がおかしくなるんだと思う >>153 ありがとう 正規分布に従う=確率変数Xを並べて(?)みたら正規分布の形に分布している という感じで合ってる?
161 名前:132人目の素数さん mailto:sage [2012/02/18(土) 17:13:00.16 ] >>160 >>>153 >ありがとう >正規分布に従う=確率変数Xを並べて(?)みたら正規分布の形に分布している >という感じで合ってる? 元の分布は理想的には物で、出てきた確率蛇は実現した値。 なので、ある確率変数がある分布に従うならば、その分布の性質を当てはめて分析してしまえってこと。 実際に観測された確率変数を並べても、それが従う分析に近い形をしてくれないこともある。だって確率だから。 あくまでも可能性の話なので、「従う」なのよ。
162 名前:132人目の素数さん mailto:sage [2012/02/18(土) 17:14:11.25 ] >>161 訂正… 元の分布は理想的には物で、出てきた確率蛇は実現した値。 元の分布は理想的な物で、出てきた確率変数は実現した値。
163 名前:132人目の素数さん [2012/02/19(日) 03:55:00.68 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ 私は只の数ヲタなんかとは付き合わないわ。 . | \ ∠イ ,イイ| ,`-' | 頭が良くて数学が出来てかっこいい人。それが必要条件よ。 | l^,人| ` `-' ゝ | さらに Ann.of Math に論文書けば十分条件にもなるわよ。 | ` -'\ ー' 人 一番嫌いなのは論文数を増やすためにくだらない論文を書いて | /(l __/ ヽ、 良い論文の出版を遅らせるお馬鹿な人。 | (:::::`‐-、__ |::::`、 ヒニニヽ、 あなたの論文が Ann of Math に accept される確率は? | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ それとも最近は Inv. Math. の方が上かしら? | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
164 名前:132人目の素数さん mailto:sage [2012/02/20(月) 19:32:27.08 ] 初学者にすすめられる本を教えてください ・数学を使わず入学した私立文系大学生 ・まわりに詳しい人はいない ・時間は確保できる よろしくお願いします
165 名前:132人目の素数さん [2012/02/20(月) 21:25:32.56 ] >>164 統計学を学ぶ目的は何でしょう? それによって、数学がどの程度必要となるのか 判断できますので。
166 名前:132人目の素数さん mailto:sage [2012/02/20(月) 23:33:31.59 ] >>164 165さんと同様で、統計を学ぶ目的や利用したい理由などを 教えていただかないと示しようがありません。
167 名前:132人目の素数さん mailto:sage [2012/02/21(火) 08:59:54.74 ] >>165-166 ありがとうございます 生きていく上で散見される数字、データの意味を正しく理解したいと思いまして学習したいと思っています
168 名前:132人目の素数さん mailto:sage [2012/02/21(火) 10:51:08.65 ] マンガでわかる統計学 文系学生のための数学・統計学・資料解釈のテクニック ゼロからわかる確率・統計―100%文系の人のための数学読本 このあたりはどうでしょうか? 書店で見てみてください。
169 名前:132人目の素数さん mailto:sage [2012/02/22(水) 22:22:19.79 ] ありがとうございます 明日みてきたいと思います
170 名前:132人目の素数さん mailto:sage [2012/02/23(木) 00:43:26.06 ] マンガ云々は読んだことが無いので申し訳ないのだが 分かり易い例をひいて説明している本は入門向けに 最適なのでパラパラ中を見て面白そうなのを選ぶと良いよ 時間が有り余っているならブルーバックスとか数学読み物的な 本で統計の歴史みたいなものを探して読むのも一興 なぜそのような概念が必要になったのか背景が分かって面白いよ 逆に教科書的な定義を並べているやつは読まない方が良い 大学のテキストや参考書として有名なシリーズはほとんどが罠 余談だが、某統計教室に遊びに行ったら マンガで分かる統計学が置いてあった 最近は基礎的な統計概念から話の通じない 学生も多いとかで割と重宝していると聞いた ちなみにその研究室ではマンガで分かるシリーズが 全巻揃っていそうな勢いで並べてあって時代を感じた もう5年くらい昔の話ですけどね
171 名前:132人目の素数さん [2012/02/23(木) 02:23:44.70 ] >>167 > 正しく理解したい マンガ、、、などよりずっと上級ですけど、 「統計学100のキーワード 」松原 望 (編集) をお薦めします。 amazonでは在庫切れのようですけど(廃刊か?) 古本で14円から売ってますから、 これをまず読んでみてください。 これは、>>167 さんのような方にはぴったりの本です。 日本統計学会の会報でも紹介されました。 名著だと思いますよ。
172 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:20:22.34 ] 今日話題になってた「平均」がわからない大学生がどうとかの問題の1つです。 1-1 ある中学校の三年生の生徒100 人の身長を測り、その平均を計算すると163.5 cm になりました。この結果から確実に正しいと言えることには○を、そうで ないものには×を、左側の空欄に記入してください。 (3) 身長を10 cm ごとに「130 cm 以上で140 cm 未満の生徒」「140 cm 以 上で150 cm 未満の生徒」・・・というように区分けすると、「160 cm 以上で 170 cm 未満の生徒」が最も多い。 正解:× これって「正規分布に従っているとは言えない」からが理由ですかね?
173 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:24:31.39 ] それだと正確ではない 例えば左右均等でない分布では平均周りが最も多いわけではない
174 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:25:25.69 ] 馬鹿って本当にいるんですね。 おお怖…
175 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:27:05.37 ] 「正確でない」どころか大間違い 身長の分布は離散分布 正規分布は連続分布 近似で使うのならまだしも、当て嵌めは不可能
176 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:32:37.40 ] >>173 中学校3年生に限定すると間違いなく正規分布ではないですよね? 全世代を対象にしていたら正規分布に近くなるかと思いますが。 確かに分布によって最大の数を取る範囲は変わりますからそれが理由ですね。
177 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:38:29.95 ] だから正規分布云々は的外れだって
178 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:40:35.04 ] shiriuskun.srv7.biz/toukei_kiso/seikibunpu.htm 「身近な例をあげれば身長のデータなどは正規分布に従うとされています」 ここで説明されてることはどうなりますの? 馬鹿ですいません
179 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:42:36.00 ] 本当に馬鹿なんですね。 お可哀そうに。 では、そのサイトと心中して下さい
180 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:45:51.00 ] >>175 素人さん?初学者さん? ま、頑張ってね
181 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:47:34.94 ] >>172 正規分布は関係ない M字型の分布をイメージしてみるとよい(真ん中のくぼみが平均値にあたるとする) この場合、一番人数が多いのは左右の尖った部分になる
182 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:52:07.42 ] >180 間違えを指摘されたのがそんなにくやしいのかwww
183 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:59:49.35 ] え?身長を離散分布なんてかなりのアフォだろ
184 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:02:41.19 ] 身長は連続分布するので、どんな身長の値に対してもその身長の人間が存在する確率は0、したがって身長を持つ人間は存在しない。
185 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:04:27.78 ] 正規分布:身長、体重などの自然現象を示すもので、 確率理論の中では最も重要な連続分布。
186 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:08:24.58 ] >>184 おまえかなり頭悪いだろw 一から勉強し直せ
187 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:09:50.39 ] >186 本当に馬鹿なんですね お可哀そうに
188 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:10:41.64 ] >186 分布そのものと近似の区別ができないアフォ
189 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:18:04.35 ] >>186 定理:確率変数Xが連続分布に従うとき、任意の実数aに対して P(X=a)=0 となる。 証明:Xの密度関数を(連続関数)fとすると、P(X∈A)=∫_A f(x)dx。P(X=a)=∫_[1点集合a] f(x)dx=0。
190 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:20:59.18 ] 今回のはどんな分布なのかよくわからないからどこが最も多いか判断できないということですよね
191 名前:132人目の素数さん mailto:sage [2012/02/25(土) 01:42:11.16 ] これってどんな答えを求めてるのかな? 最も多くなる場合は実際的には多いと思うけど (身長が正確に正規分布でなくても) 標準偏差は5cmぐらいだと思うので160cm台には 50人ぐらい入るだろう。それより多い高さがあるとすると 150cm台だと思うけど、元が正規分布なら 偶然で逆転する可能性はどのぐらいなんだろう? それらを踏まえて「最も多くなる可能性は高いが そうならない場合もある」とかいった答えを求めてるのかな? 100人を恣意的に集めたのならM字型とか変な分布は 簡単に作れるけどね。
192 名前:132人目の素数さん mailto:sage [2012/02/25(土) 02:01:06.43 ] mathsoc.jp/comm/kyoiku/chousa2011/surveyslip0955.pdf 今回の調査票です
193 名前:132人目の素数さん mailto:sage [2012/02/25(土) 15:05:56.25 ] 平均の概念を直感的に間違えて回答した大学生よりも 論理的に問題を解釈できないお前らの方が心配だぞ
194 名前:132人目の素数さん mailto:sage [2012/02/25(土) 15:09:17.93 ] では模範解答をどうぞ
195 名前:132人目の素数さん mailto:sage [2012/02/25(土) 16:16:13.71 ] 論理的に解釈するなら、確実に言えるかどうかを問題にするときに勝手に連続分布で近似してはいけないし、 ましてや俗説に従ってそれが正規分布であると決めつけてはいけない。
196 名前:132人目の素数さん mailto:sage [2012/02/25(土) 18:52:47.32 ] >>195 =>>189 だろうけど 中途半端な理解だとこんなレベルになっちゃうから気を付けよう
197 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:11:20.97 ] 「間違ってる」と言うだけなら子供でもできるよ 自分を賢く見せたいのはわかるが、それなら、正しくはどうあるべきかまで自分で考えて書かないと(理解してないから無理だろうけど)
198 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:28:17.77 ] >>197 >>193 のことだよね?
199 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:32:05.18 ] >>198 >>197 は、統計のできない大学生の記事を読んで嘲笑ってたらここの住人に「アホはお前だ」と指摘されて、 以来ずっと粘着してる人に向けた言葉です。
200 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:48:14.30 ] 連続分布するときある値が出現する”確率”は確かにゼロだけど 確率密度があるからその値が出現しないわけではない これが分かっていないで連続分布じゃないとイミフな論を語るのが一人おるな
201 名前:132人目の素数さん mailto:sage [2012/02/25(土) 20:05:11.61 ] >>200 誤解があるようだ。 元々、身長の分布が(近似ではなく正真正銘の分布として)連続分布となると主張する人がいたので、 もしそれが正しいのならどの身長も確率ゼロであり、一方で確率測度は個数測度(÷全体の人数)を採用しているはずだから、 結局人間は存在しないことになってしまうね、という皮肉だったのさ。
202 名前:132人目の素数さん mailto:sage [2012/02/26(日) 00:33:43.55 ] >>192 なるほど確実に言えることとなっているのか。そりゃあ確率的に見れば無理だな。 一番多いことがほとんどだとしてもそうでない確率は0ではないからな。 数学の調査らしいな。w ただ現実的にはこういった身長測定でどのぐらいの確率で最大にならないことが 起こるんだろう?
203 名前:132人目の素数さん mailto:sage [2012/02/26(日) 02:26:29.27 ] 所詮この世はサンプルに過ぎないと言う立場からは 人間は無限に存在するという解釈もありえるが どうでもいいか
204 名前:132人目の素数さん mailto:sage [2012/02/26(日) 10:17:58.24 ] 本当に聞きたかったのは平均値と最頻値は異なる概念だということだと思うけど わかり易い例でということで対称性の強い身長を使ってしまい、さらに区切りを 大きく10cmにしたことが問題だな。なんで163cm以上164cm未満のように1cm 刻みにしなかったんだろう?
205 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:26:39.68 ] ちょっとシミュレーションで調べてみた。 身長の分布をN(163.5,7^2)として標本サイズを100とし、 得られた標本が平均163より大きくなる回数のうち 150cm台が160cm台より多くなる確率。 10000回繰り返すと平均が163より大きくなったのは7674回で そのうち150cm台のほうが160cm台より人数が多かったのは7回だった。 確率は7/7674=0.0009となった。思ったよりかは確率が高いかな。
206 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:33:37.83 ] 自己レス。 標準偏差が重要なようだ。 σ=6なら0.0001まで下がるがσ=8なら0.006まで上がる。
207 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:57:19.68 ] >>206 やっぱ分散が大きいと違ってくるんだね
208 名前:132人目の素数さん mailto:sage [2012/02/27(月) 00:15:12.82 ] >>205 なにでシミュレーションしたの?
209 名前:132人目の素数さん mailto:sage [2012/02/28(火) 00:26:07.86 ] Rだよ。
210 名前:川上 [2012/02/29(水) 00:21:01.48 ] 全くの素人が本を見ながら、統計処理してますので、お助けをお願いします ある処置により、容積Yが変動しました。この容積Vの変動とある検査結果Xが単相関 している所見が得られました。ここで、これらの関連をより明らかにするために 10%以上の増加が意味あるとして、10%以上の増加した群としなかった群と 検査Xの変動の有無で2×2の分割表検定をして、オッズ比をだして、意味があるかどうか 調べるという方法でよいでしょうか?また、これを単変量解析というんですか? N=20程度です
211 名前:132人目の素数さん [2012/02/29(水) 02:20:38.72 ] >>210 以下のところを見てくださいな。 ttp://www.kogures.com/hitoshi/webtext/stat-2x2/index.html
212 名前:132人目の素数さん [2012/02/29(水) 10:51:22.16 ] 統計学について質問があります Zが標準正規分布N(0,1)に従うとき、次の値を求めなさい P(0≦Z≦1.23) P(-2.31≦Z≦0) P(1.38≦Z) クラスの皆がわからず困ってます どなたかお教えお願いしますm(__)m
213 名前:132人目の素数さん mailto:sage [2012/02/29(水) 11:15:40.45 ] >>212 正規分布表見て値を拾えばおk excel等計算機を使う問題じゃないんだよね?
214 名前:132人目の素数さん mailto:sage [2012/02/29(水) 11:41:58.99 ] >>212 標準正規分布に従ってるから一番簡単な問題。 標準正規分布表使えばすぐに求まるよ。 しかもZが0以下か以上の範囲のしかないから更に簡単。 www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
215 名前:もり [2012/02/29(水) 13:10:51.92 ] 多重比較の検定について、どなたか、教えていただけませんでしょうか。 A群:コントロール→介入→非介入、B群:コントロール→非介入→介入、というクロスオーバーデザインです。 1)反復測定分散分析は必須なのでしょうか。 2)ダネットの検定で、A群について、コントロールと介入・非介入を比べる、またB群についてコントロールと非介入・介入を比べる、という作業を別々に行って良いのでしょうか。 3)対応のあるt検定をし、ボンフェローニの方法で補正するのは、検出率が下がる点を無視すれば、手法としては誤りではないでしょうか。 この場合、A群について、2回t検定を行った、B群について2回t検定を行った、という解釈でよいのか、系全体で4回のt検定を行ったと考えるのでしょうか。 用語などあやふやですが、ご容赦ください。宜しくおねがいします。
216 名前:132人目の素数さん [2012/02/29(水) 19:01:29.17 ] 統計学上、ほとんど無視していい事象って100万分の1くらいだっけ?
217 名前:132人目の素数さん mailto:sage [2012/02/29(水) 19:04:06.57 ] そんなこと一概に言えるの?
218 名前:132人目の素数さん mailto:sage [2012/03/01(木) 13:52:00.60 ] 検定のことを言ってるのかな?
219 名前:132人目の素数さん mailto:sage [2012/03/01(木) 15:21:08.83 ] シックス・シグマのことを言いたいのかもよ。
220 名前:132人目の素数さん mailto:sage [2012/03/03(土) 07:35:22.21 ] >>215 何と何を比較したいのかよくわかりません。 AとBに対して、介入するタイミングの違いが差をもたらすということ?
221 名前:もり [2012/03/04(日) 07:04:29.93 ] >>220 ご指摘ありがとうございます。示したいのは介入の有効性なのですが、そもそも自分が、クロスオーバーデザインというものを十分理解していないことに気付きました。 「クロスオーバー」というからには、A群:処置1→処置2だけでなく、B群:処置2→処置1も自動的に必要なのだと思い込んでいました。 処置1と2を比べるとき、時期効果を排除するためA・B両群必要なのは理解できるのですが、片方が「非介入」や「プラセボ」のとき、「B群」はそもそも必要ないのでしょうか? ただ、そうすると、群内比較のデザインよりはパラレルデザインの方がよくて、Nがたくさん必要になるのかなと思いました。 改めて教えてください。よろしくお願いします。
222 名前:132人目の素数さん [2012/03/04(日) 08:00:11.03 ] 分散を求める時、偏差を2乗してから加算しますよね。 その理由として、偏差をそのまま加算すると結果はゼロに なるからと説明してあります。 偏差の絶対値を加算する方が、計算が楽だと思うのですが 何か深遠な理由が有るのでしょうか?
223 名前:132人目の素数さん mailto:sage [2012/03/04(日) 09:03:30.69 ] 自乗して足す方が計算が楽だから
224 名前:132人目の素数さん mailto:sage [2012/03/04(日) 11:26:40.23 ] 数学理論で微分などを行うとき絶対値は扱いが困るから。
225 名前:132人目の素数さん mailto:sage [2012/03/04(日) 11:38:05.47 ] 劣度、尖度とかモーメントとか考えると二乗は合理的にできてるね
226 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:27:30.46 ] というより、 そうやって(2乗して和をとる)計算された分散というものが 多用されるのは、どういう理由ですか。 といったことが尋ねたいのではなかろうか。
227 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:34:04.77 ] >偏差の絶対値を加算する方が、計算が楽だと思うのですが 絶対値より2乗の方が楽だから、で結論が出てる 後は、L^1ノルムよりもL^2ノルムの方がイメージしやすいとか?
228 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:57:13.97 ] >>215 1)必須でないと思います。 2)2群別々でなく、まとめるべきだと思います。 3)これもまとめた上で、対象−介入、対象−非介入の2回だと思います。 ただし、ダネットの方がよいのではないかと思います。 >>221 ほぼおっしゃるとおり。 ただし、クロスオーバーなら2群置く方が普通なので、「普通」に従うべきではないかと思います。 また、パラレルはNを大きくしないといけない、というより、 クロスオーバーはNが小さくてもすむというべきかもしれません。
229 名前:132人目の素数さん mailto:sage [2012/03/04(日) 19:15:35.15 ] >>226 いや、違うと思うよ
230 名前:もり [2012/03/05(月) 06:30:20.92 ] >>228 どうもありがとうございました。
231 名前:132人目の素数さん [2012/03/05(月) 11:50:41.38 ] >> 226 言葉足らずの質問に補足頂きありがとう。 各位の回答を読むと、確かに何も考えず2乗しちゃった方が 簡単ですね。 ばらつきの平均の2乗である分散と、分散のルートを取った 標準偏差を発明するぐらいなら、偏差の絶対値から計算した ばらつきの平均の方が、(私には)しっくりきます。 2乗してあるデータ(分散)と、ルートを取って元に戻した データ(標準偏差)と、2種あるのは、単なる計算方法の違い だけに起因するものなのでしょうか? 統計の本とかを見ても、絶対値から計算する、ばらつき具合は スルーされてて何の説明もなく、疑問に思った次第です。
232 名前:132人目の素数さん mailto:sage [2012/03/05(月) 13:16:11.46 ] 積分とかする際に絶対値だと正負の場合分けを考えたり非常に面倒。 なので普通は二乗で計算しちゃう。 分散のまま計算に使う分散分析などもあるので、標準偏差だけに統一すると二度手間だったりもする。
233 名前:132人目の素数さん mailto:sage [2012/03/05(月) 19:08:45.33 ] 平面上の2点(x1, y1), (x2, y2)の距離は√( (x1 - x2)^2 + (y1 - y2)^2 ) しかし、2乗したものの和でなくても、「距離」を表す指標はつくれる 例えば絶対値の和│x1 - x2│+│y1 - y2│でもよい 分散の定義も同じこと 各数値の「平均値からの距離」の平均が、分散であった
234 名前:132人目の素数さん mailto:sage [2012/03/06(火) 01:50:39.93 ] 結局のところ正規分布のように自然と母分散が密度関数のパラメータとして 出てくるものがあり、その最尤推定量を求めると標本分散が出てくるところが ポイントなのかな。
235 名前:132人目の素数さん [2012/03/07(水) 20:33:53.20 ] 平均値と相性がいいのが標準偏差、中央値と相性がいいのが絶対偏差。
236 名前:132人目の素数さん [2012/03/07(水) 22:37:23.00 ] STATAを今使用して重回帰分析を行なっているんですが、非標準化回帰係数の95%信頼区間は表示されるのですが、"標準化回帰係数"の95%信頼区間はどうやったら表示されるのでしょうか? ご存知の方、よろしくお願いします。
237 名前:132人目の素数さん mailto:sage [2012/03/08(木) 14:47:34.30 ] >>236 デフォルトや、オプションでは表示されないでしょう。 各変数の標準偏差や回帰係数から算出はできますが、面倒くさいし、 adoコマンドにもあるかもしれませんが、 最も簡単なのは、分析に使う変数をすべて標準化してからregに投入すればOKです。 しかし、なぜデフォルトやオプションという簡単な方法で出力されないのかを考えてみては?
238 名前:132人目の素数さん [2012/03/14(水) 23:49:22.71 ] 丹後先生、、、_| ̄|○
239 名前:132人目の素数さん mailto:sage [2012/03/15(木) 06:41:37.32 ] __ノ)-'´ ̄ ̄`ー- 、_ , '´ _. -‐'''"二ニニ=-`ヽ、 / /:::::; -‐''" `ーノ / /:::::/ \ / /::::::/ | | | | | |:::::/ / | | | | | | | |::/ / / | | || | | ,ハ .| ,ハ| | |/ / / /| ,ハノ| /|ノレ,ニ|ル' | | | / / レ',二、レ′ ,ィイ|゙/ 私は只の数ヲタなんかとは付き合わないわ。 . | \ ∠イ ,イイ| ,`-' | 頭が良くて数学が出来てかっこいい人。それが必要条件よ。 | l^,人| ` `-' ゝ | さらに Ann.of Math に論文書けば十分条件にもなるわよ。 | ` -'\ ー' 人 一番嫌いなのは論文数を増やすためにくだらない論文を書いて | /(l __/ ヽ、 良い論文の出版を遅らせるお馬鹿な人。 | (:::::`‐-、__ |::::`、 ヒニニヽ、 あなたの論文が Ann of Math に accept される確率は? | / `‐-、::::::::::`‐-、::::\ /,ニニ、\ それとも最近は Inv. Math. の方が上かしら? | |::::::::::::::::::|` -、:::::::,ヘ ̄|'、 ヒニ二、 \ . | /::::::::::::::::::|::::::::\/:::O`、::\ | '、 \ | /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ ヽ、 | | |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、 /:\__/‐、 | |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄| | /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_| | |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/ | /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/
240 名前:132人目の素数さん mailto:sage [2012/03/20(火) 13:42:29.00 ] ボルトキーヴィッチは著書"Das Gesetz der kleinen Zahlen "(The Law of Small Numbers)において、 プロイセン陸軍の14の騎兵連隊の中で、 1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数 について調査しており、1年間当たりに換算した当該事案の発生件数の分布が パラメータ0.61のポアソン分布によく従うことを示している。 とWikipediaに書いてあったんですが これは、平均598日に1人の兵士が馬に蹴られて死んだと調査で判ったという事ですか?
241 名前:132人目の素数さん mailto:sage [2012/03/21(水) 00:27:46.40 ] 延べ280部隊について1年間に馬に蹴られて死亡した兵士の人数の分布を調べたところ 以下のようになり、ポアソン分布がよく当てはまるということ。 人数 0 1 2 3 4 部隊数 144 91 32 11 2 すなわち、単に平均を求めたのではなく適合度検定したということ。
242 名前:132人目の素数さん mailto:sage [2012/03/21(水) 01:26:51.01 ] そうですか(´・ω・`) 有難うございました
243 名前:132人目の素数さん mailto:sage [2012/03/21(水) 01:27:57.62 ] パラメータの0.61ってどういう手順で出したものですか?
244 名前:132人目の素数さん [2012/03/21(水) 21:12:56.14 ] どなたか「安全なロリコン」を数式にできる方はいませんか? ロリコンってさ… 本当に悪なのか? 16 s.s2ch.net/test/-3---./kohada.2ch.net/kankon/1331729744/n
245 名前:132人目の素数さん mailto:sage [2012/03/22(木) 02:27:58.85 ] >>243 Wikipediaの記述が間違っているみたいだね。0.61は構成の違う軍を除いて 10軍に延べ200軍に絞ったときの平均値だ。例に挙げた14軍のときは 平均値0.7だ。どちらであっても適合度自体はよいようだけど。
246 名前:132人目の素数さん mailto:sage [2012/03/23(金) 12:38:37.31 ] ありがとうございました(´・ω・`)
247 名前:132人目の素数さん mailto:sage [2012/03/23(金) 23:06:47.19 ] >>231 >スルーされてて何の説明もなく・・・・・・ 絶対値は数式計算の際に扱い難いからという>>224 氏や>>232 氏の云う数文字を 載せていない初学者に不親切な統計初歩教科書を採用している貴方の出身大学は、 何処なの?
248 名前:132人目の素数さん mailto:sage [2012/04/04(水) 00:50:23.65 ] 質問です。もしよろしければ教えてください。 店のレジからお金を盗んでいる店員がいるのではないかと疑念があり、統計的に当たりをつけようと 考えています。勿論統計分析が正しくない結果を導くことは承知してますので、結果は慎重に扱うつもりです。 質問1.以下の方法でよいですか? 日々の売上げ、天候、曜日・休日、周辺のイベントの有無を重回帰分析により売上げの計算式をもとめる。 その数式で求めた統計上の売上げと、実際の売上げを信頼区間95%で検定する。 質問2.検定のときに使う分散は、エクセルの回帰分析で出力される分散分析表のどの値を使えばいいのでしょうか? 質問3.年間の季節変動や連休などの影響はどのように反映させればいいのでしょうか? 数年間のデータ平均から手で補正したデータを用いて回帰分析すればいいのでしょうか?
249 名前:248 mailto:sage [2012/04/04(水) 01:05:39.40 ] 補足です。 レジを担当するものは20名ほどおり、一日に2人が交代で担当します。 売上げの異常な日を統計的に検出し、長期的に様子を見ていくつもりです。
250 名前:132人目の素数さん mailto:sage [2012/04/04(水) 08:28:01.10 ] レポートの課題なら適当にやっておけと言うところだが 現実に適用するつもりなら考え直した方がいい。 露骨に特定の人物がいる日だけ売り上げが下がるならば 難しい統計はいらないし、微妙な結果になるならば あなたの考えた恣意的な補正で犯人が決まるだけだから。 質問の内容からして統計だけでなく自分の商材の売れ方すら 碌に分かっていないようだからなお更危うい。 POSいれるなり在庫管理を厳密化するなりして 直接的に盗みを検出できる仕組みを作るべき。
251 名前:132人目の素数さん mailto:sage [2012/04/04(水) 09:22:47.59 ] 万札、5千円札、千円札、500円硬貨、とお金の種類ごとの数を日々表にしていけばよろし。2000円札は不要でしょw それを各人ごとに集計して比率の差の検定。 うまくいくかどうかは保証の限りではなし。 レジから金を盗んでてもすぐには気づかないほどの売上高があって、 レジする人が20人も従業員がいるような規模なら、>>250 が言うように、もうちょいしっかり在庫管理とかできてないものなの? 95%信頼区間なんて難しい言葉を知っているのに、検定で分散分析表のどの値を使えばいいのか、ってのも ちぐはぐな感じを受けます。余計なお世話かもしれませんが。
252 名前:132人目の素数さん [2012/04/04(水) 20:11:22.88 ] この一昨夜4/2のNHK教育を見逃したんだが、統計学のどういう分野の 話題が出てきたの? [stats:3110] NHK スーパープレゼンテーション Date: Mon, 02 Apr 2012 mid.ism.ac.jp/stats/msg01597.html