[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 2chのread.cgiへ]
Update time : 05/05 16:45 / Filesize : 282 KB / Number-of Response : 682
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド14



1 名前:132人目の素数さん mailto:sage [2012/01/14(土) 01:26:04.68 ]
スレのお約束を守った上で統計学について何でもどうぞ。

●学校の宿題の丸投げはやめましょう。
●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
●荒らしは基本的にスルーでお願いします。

前スレ
統計学なんでもスレッド13
uni.2ch.net/test/read.cgi/math/1297356696/

175 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:27:05.37 ]
「正確でない」どころか大間違い

身長の分布は離散分布
正規分布は連続分布

近似で使うのならまだしも、当て嵌めは不可能

176 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:32:37.40 ]
>>173
中学校3年生に限定すると間違いなく正規分布ではないですよね?
全世代を対象にしていたら正規分布に近くなるかと思いますが。

確かに分布によって最大の数を取る範囲は変わりますからそれが理由ですね。

177 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:38:29.95 ]
だから正規分布云々は的外れだって

178 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:40:35.04 ]
shiriuskun.srv7.biz/toukei_kiso/seikibunpu.htm

「身近な例をあげれば身長のデータなどは正規分布に従うとされています」

ここで説明されてることはどうなりますの?
馬鹿ですいません

179 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:42:36.00 ]
本当に馬鹿なんですね。
お可哀そうに。

では、そのサイトと心中して下さい

180 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:45:51.00 ]
>>175
素人さん?初学者さん?
ま、頑張ってね

181 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:47:34.94 ]
>>172
正規分布は関係ない
M字型の分布をイメージしてみるとよい(真ん中のくぼみが平均値にあたるとする)
この場合、一番人数が多いのは左右の尖った部分になる

182 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:52:07.42 ]
>180
間違えを指摘されたのがそんなにくやしいのかwww

183 名前:132人目の素数さん mailto:sage [2012/02/24(金) 23:59:49.35 ]
え?身長を離散分布なんてかなりのアフォだろ



184 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:02:41.19 ]
身長は連続分布するので、どんな身長の値に対してもその身長の人間が存在する確率は0、したがって身長を持つ人間は存在しない。

185 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:04:27.78 ]
正規分布:身長、体重などの自然現象を示すもので、
確率理論の中では最も重要な連続分布。


186 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:08:24.58 ]
>>184
おまえかなり頭悪いだろw
一から勉強し直せ

187 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:09:50.39 ]
>186
本当に馬鹿なんですね
お可哀そうに

188 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:10:41.64 ]
>186
分布そのものと近似の区別ができないアフォ

189 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:18:04.35 ]
>>186
定理:確率変数Xが連続分布に従うとき、任意の実数aに対して P(X=a)=0 となる。
証明:Xの密度関数を(連続関数)fとすると、P(X∈A)=∫_A f(x)dx。P(X=a)=∫_[1点集合a] f(x)dx=0。

190 名前:132人目の素数さん mailto:sage [2012/02/25(土) 00:20:59.18 ]
今回のはどんな分布なのかよくわからないからどこが最も多いか判断できないということですよね


191 名前:132人目の素数さん mailto:sage [2012/02/25(土) 01:42:11.16 ]
これってどんな答えを求めてるのかな?
最も多くなる場合は実際的には多いと思うけど
(身長が正確に正規分布でなくても)
標準偏差は5cmぐらいだと思うので160cm台には
50人ぐらい入るだろう。それより多い高さがあるとすると
150cm台だと思うけど、元が正規分布なら
偶然で逆転する可能性はどのぐらいなんだろう?
それらを踏まえて「最も多くなる可能性は高いが
そうならない場合もある」とかいった答えを求めてるのかな?
100人を恣意的に集めたのならM字型とか変な分布は
簡単に作れるけどね。

192 名前:132人目の素数さん mailto:sage [2012/02/25(土) 02:01:06.43 ]
mathsoc.jp/comm/kyoiku/chousa2011/surveyslip0955.pdf

今回の調査票です

193 名前:132人目の素数さん mailto:sage [2012/02/25(土) 15:05:56.25 ]
平均の概念を直感的に間違えて回答した大学生よりも
論理的に問題を解釈できないお前らの方が心配だぞ



194 名前:132人目の素数さん mailto:sage [2012/02/25(土) 15:09:17.93 ]
では模範解答をどうぞ

195 名前:132人目の素数さん mailto:sage [2012/02/25(土) 16:16:13.71 ]
論理的に解釈するなら、確実に言えるかどうかを問題にするときに勝手に連続分布で近似してはいけないし、
ましてや俗説に従ってそれが正規分布であると決めつけてはいけない。

196 名前:132人目の素数さん mailto:sage [2012/02/25(土) 18:52:47.32 ]
>>195=>>189だろうけど
中途半端な理解だとこんなレベルになっちゃうから気を付けよう

197 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:11:20.97 ]
「間違ってる」と言うだけなら子供でもできるよ
自分を賢く見せたいのはわかるが、それなら、正しくはどうあるべきかまで自分で考えて書かないと(理解してないから無理だろうけど)

198 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:28:17.77 ]
>>197
>>193のことだよね?

199 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:32:05.18 ]
>>198

>>197は、統計のできない大学生の記事を読んで嘲笑ってたらここの住人に「アホはお前だ」と指摘されて、
以来ずっと粘着してる人に向けた言葉です。

200 名前:132人目の素数さん mailto:sage [2012/02/25(土) 19:48:14.30 ]
連続分布するときある値が出現する”確率”は確かにゼロだけど
確率密度があるからその値が出現しないわけではない

これが分かっていないで連続分布じゃないとイミフな論を語るのが一人おるな

201 名前:132人目の素数さん mailto:sage [2012/02/25(土) 20:05:11.61 ]
>>200
誤解があるようだ。
元々、身長の分布が(近似ではなく正真正銘の分布として)連続分布となると主張する人がいたので、
もしそれが正しいのならどの身長も確率ゼロであり、一方で確率測度は個数測度(÷全体の人数)を採用しているはずだから、
結局人間は存在しないことになってしまうね、という皮肉だったのさ。

202 名前:132人目の素数さん mailto:sage [2012/02/26(日) 00:33:43.55 ]
>>192
なるほど確実に言えることとなっているのか。そりゃあ確率的に見れば無理だな。
一番多いことがほとんどだとしてもそうでない確率は0ではないからな。
数学の調査らしいな。w
ただ現実的にはこういった身長測定でどのぐらいの確率で最大にならないことが
起こるんだろう?

203 名前:132人目の素数さん mailto:sage [2012/02/26(日) 02:26:29.27 ]
所詮この世はサンプルに過ぎないと言う立場からは
人間は無限に存在するという解釈もありえるが

どうでもいいか



204 名前:132人目の素数さん mailto:sage [2012/02/26(日) 10:17:58.24 ]
本当に聞きたかったのは平均値と最頻値は異なる概念だということだと思うけど
わかり易い例でということで対称性の強い身長を使ってしまい、さらに区切りを
大きく10cmにしたことが問題だな。なんで163cm以上164cm未満のように1cm
刻みにしなかったんだろう?

205 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:26:39.68 ]
ちょっとシミュレーションで調べてみた。
身長の分布をN(163.5,7^2)として標本サイズを100とし、
得られた標本が平均163より大きくなる回数のうち
150cm台が160cm台より多くなる確率。
10000回繰り返すと平均が163より大きくなったのは7674回で
そのうち150cm台のほうが160cm台より人数が多かったのは7回だった。
確率は7/7674=0.0009となった。思ったよりかは確率が高いかな。

206 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:33:37.83 ]
自己レス。
標準偏差が重要なようだ。
σ=6なら0.0001まで下がるがσ=8なら0.006まで上がる。

207 名前:132人目の素数さん mailto:sage [2012/02/26(日) 23:57:19.68 ]
>>206
やっぱ分散が大きいと違ってくるんだね

208 名前:132人目の素数さん mailto:sage [2012/02/27(月) 00:15:12.82 ]
>>205
なにでシミュレーションしたの?

209 名前:132人目の素数さん mailto:sage [2012/02/28(火) 00:26:07.86 ]
Rだよ。

210 名前:川上 [2012/02/29(水) 00:21:01.48 ]
全くの素人が本を見ながら、統計処理してますので、お助けをお願いします
ある処置により、容積Yが変動しました。この容積Vの変動とある検査結果Xが単相関
している所見が得られました。ここで、これらの関連をより明らかにするために
10%以上の増加が意味あるとして、10%以上の増加した群としなかった群と
検査Xの変動の有無で2×2の分割表検定をして、オッズ比をだして、意味があるかどうか
調べるという方法でよいでしょうか?また、これを単変量解析というんですか?
N=20程度です

211 名前:132人目の素数さん [2012/02/29(水) 02:20:38.72 ]
>>210

以下のところを見てくださいな。

ttp://www.kogures.com/hitoshi/webtext/stat-2x2/index.html


212 名前:132人目の素数さん [2012/02/29(水) 10:51:22.16 ]
統計学について質問があります
Zが標準正規分布N(0,1)に従うとき、次の値を求めなさい
P(0≦Z≦1.23) P(-2.31≦Z≦0)
P(1.38≦Z)
クラスの皆がわからず困ってます
どなたかお教えお願いしますm(__)m


213 名前:132人目の素数さん mailto:sage [2012/02/29(水) 11:15:40.45 ]
>>212
正規分布表見て値を拾えばおk
excel等計算機を使う問題じゃないんだよね?



214 名前:132人目の素数さん mailto:sage [2012/02/29(水) 11:41:58.99 ]
>>212
標準正規分布に従ってるから一番簡単な問題。
標準正規分布表使えばすぐに求まるよ。
しかもZが0以下か以上の範囲のしかないから更に簡単。

www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

215 名前:もり [2012/02/29(水) 13:10:51.92 ]
多重比較の検定について、どなたか、教えていただけませんでしょうか。

A群:コントロール→介入→非介入、B群:コントロール→非介入→介入、というクロスオーバーデザインです。
1)反復測定分散分析は必須なのでしょうか。

2)ダネットの検定で、A群について、コントロールと介入・非介入を比べる、またB群についてコントロールと非介入・介入を比べる、という作業を別々に行って良いのでしょうか。

3)対応のあるt検定をし、ボンフェローニの方法で補正するのは、検出率が下がる点を無視すれば、手法としては誤りではないでしょうか。
この場合、A群について、2回t検定を行った、B群について2回t検定を行った、という解釈でよいのか、系全体で4回のt検定を行ったと考えるのでしょうか。

用語などあやふやですが、ご容赦ください。宜しくおねがいします。

216 名前:132人目の素数さん [2012/02/29(水) 19:01:29.17 ]

統計学上、ほとんど無視していい事象って100万分の1くらいだっけ?

217 名前:132人目の素数さん mailto:sage [2012/02/29(水) 19:04:06.57 ]
そんなこと一概に言えるの?

218 名前:132人目の素数さん mailto:sage [2012/03/01(木) 13:52:00.60 ]
検定のことを言ってるのかな?


219 名前:132人目の素数さん mailto:sage [2012/03/01(木) 15:21:08.83 ]
シックス・シグマのことを言いたいのかもよ。

220 名前:132人目の素数さん mailto:sage [2012/03/03(土) 07:35:22.21 ]
>>215
何と何を比較したいのかよくわかりません。
AとBに対して、介入するタイミングの違いが差をもたらすということ?

221 名前:もり [2012/03/04(日) 07:04:29.93 ]
>>220
ご指摘ありがとうございます。示したいのは介入の有効性なのですが、そもそも自分が、クロスオーバーデザインというものを十分理解していないことに気付きました。
「クロスオーバー」というからには、A群:処置1→処置2だけでなく、B群:処置2→処置1も自動的に必要なのだと思い込んでいました。
処置1と2を比べるとき、時期効果を排除するためA・B両群必要なのは理解できるのですが、片方が「非介入」や「プラセボ」のとき、「B群」はそもそも必要ないのでしょうか?
ただ、そうすると、群内比較のデザインよりはパラレルデザインの方がよくて、Nがたくさん必要になるのかなと思いました。
改めて教えてください。よろしくお願いします。

222 名前:132人目の素数さん [2012/03/04(日) 08:00:11.03 ]
分散を求める時、偏差を2乗してから加算しますよね。
その理由として、偏差をそのまま加算すると結果はゼロに
なるからと説明してあります。
偏差の絶対値を加算する方が、計算が楽だと思うのですが
何か深遠な理由が有るのでしょうか?


223 名前:132人目の素数さん mailto:sage [2012/03/04(日) 09:03:30.69 ]
自乗して足す方が計算が楽だから



224 名前:132人目の素数さん mailto:sage [2012/03/04(日) 11:26:40.23 ]
数学理論で微分などを行うとき絶対値は扱いが困るから。

225 名前:132人目の素数さん mailto:sage [2012/03/04(日) 11:38:05.47 ]
劣度、尖度とかモーメントとか考えると二乗は合理的にできてるね

226 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:27:30.46 ]
というより、
そうやって(2乗して和をとる)計算された分散というものが
多用されるのは、どういう理由ですか。
といったことが尋ねたいのではなかろうか。

227 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:34:04.77 ]
>偏差の絶対値を加算する方が、計算が楽だと思うのですが
絶対値より2乗の方が楽だから、で結論が出てる
後は、L^1ノルムよりもL^2ノルムの方がイメージしやすいとか?

228 名前:132人目の素数さん mailto:sage [2012/03/04(日) 16:57:13.97 ]
>>215
1)必須でないと思います。
2)2群別々でなく、まとめるべきだと思います。
3)これもまとめた上で、対象−介入、対象−非介入の2回だと思います。
ただし、ダネットの方がよいのではないかと思います。
>>221
ほぼおっしゃるとおり。
ただし、クロスオーバーなら2群置く方が普通なので、「普通」に従うべきではないかと思います。
また、パラレルはNを大きくしないといけない、というより、
クロスオーバーはNが小さくてもすむというべきかもしれません。

229 名前:132人目の素数さん mailto:sage [2012/03/04(日) 19:15:35.15 ]
>>226
いや、違うと思うよ

230 名前:もり [2012/03/05(月) 06:30:20.92 ]
>>228
どうもありがとうございました。

231 名前:132人目の素数さん [2012/03/05(月) 11:50:41.38 ]
>> 226
言葉足らずの質問に補足頂きありがとう。
各位の回答を読むと、確かに何も考えず2乗しちゃった方が
簡単ですね。

ばらつきの平均の2乗である分散と、分散のルートを取った
標準偏差を発明するぐらいなら、偏差の絶対値から計算した
ばらつきの平均の方が、(私には)しっくりきます。

2乗してあるデータ(分散)と、ルートを取って元に戻した
データ(標準偏差)と、2種あるのは、単なる計算方法の違い
だけに起因するものなのでしょうか?

統計の本とかを見ても、絶対値から計算する、ばらつき具合は
スルーされてて何の説明もなく、疑問に思った次第です。


232 名前:132人目の素数さん mailto:sage [2012/03/05(月) 13:16:11.46 ]
積分とかする際に絶対値だと正負の場合分けを考えたり非常に面倒。
なので普通は二乗で計算しちゃう。

分散のまま計算に使う分散分析などもあるので、標準偏差だけに統一すると二度手間だったりもする。

233 名前:132人目の素数さん mailto:sage [2012/03/05(月) 19:08:45.33 ]
平面上の2点(x1, y1), (x2, y2)の距離は√( (x1 - x2)^2 + (y1 - y2)^2 )
しかし、2乗したものの和でなくても、「距離」を表す指標はつくれる
例えば絶対値の和│x1 - x2│+│y1 - y2│でもよい

分散の定義も同じこと
各数値の「平均値からの距離」の平均が、分散であった



234 名前:132人目の素数さん mailto:sage [2012/03/06(火) 01:50:39.93 ]
結局のところ正規分布のように自然と母分散が密度関数のパラメータとして
出てくるものがあり、その最尤推定量を求めると標本分散が出てくるところが
ポイントなのかな。

235 名前:132人目の素数さん [2012/03/07(水) 20:33:53.20 ]
平均値と相性がいいのが標準偏差、中央値と相性がいいのが絶対偏差。

236 名前:132人目の素数さん [2012/03/07(水) 22:37:23.00 ]
STATAを今使用して重回帰分析を行なっているんですが、非標準化回帰係数の95%信頼区間は表示されるのですが、"標準化回帰係数"の95%信頼区間はどうやったら表示されるのでしょうか?
ご存知の方、よろしくお願いします。

237 名前:132人目の素数さん mailto:sage [2012/03/08(木) 14:47:34.30 ]
>>236
デフォルトや、オプションでは表示されないでしょう。
各変数の標準偏差や回帰係数から算出はできますが、面倒くさいし、
adoコマンドにもあるかもしれませんが、
最も簡単なのは、分析に使う変数をすべて標準化してからregに投入すればOKです。

しかし、なぜデフォルトやオプションという簡単な方法で出力されないのかを考えてみては?

238 名前:132人目の素数さん [2012/03/14(水) 23:49:22.71 ]
丹後先生、、、_| ̄|○


239 名前:132人目の素数さん mailto:sage [2012/03/15(木) 06:41:37.32 ]
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   私は只の数ヲタなんかとは付き合わないわ。
.     |   \ ∠イ  ,イイ|    ,`-' |      頭が良くて数学が出来てかっこいい人。それが必要条件よ。
     |     l^,人|  ` `-'     ゝ  |        さらに Ann.of Math に論文書けば十分条件にもなるわよ。
      |      ` -'\       ー'  人          一番嫌いなのは論文数を増やすためにくだらない論文を書いて
    |        /(l     __/  ヽ、           良い論文の出版を遅らせるお馬鹿な人。
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、         あなたの論文が Ann of Math に accept される確率は?
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            それとも最近は Inv. Math. の方が上かしら?
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄|
   |     /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_|
   |    |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/
    |   /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/

240 名前:132人目の素数さん mailto:sage [2012/03/20(火) 13:42:29.00 ]
ボルトキーヴィッチは著書"Das Gesetz der kleinen Zahlen "(The Law of Small Numbers)において、
プロイセン陸軍の14の騎兵連隊の中で、
1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数
について調査しており、1年間当たりに換算した当該事案の発生件数の分布が
パラメータ0.61のポアソン分布によく従うことを示している。


とWikipediaに書いてあったんですが
これは、平均598日に1人の兵士が馬に蹴られて死んだと調査で判ったという事ですか?

241 名前:132人目の素数さん mailto:sage [2012/03/21(水) 00:27:46.40 ]
延べ280部隊について1年間に馬に蹴られて死亡した兵士の人数の分布を調べたところ
以下のようになり、ポアソン分布がよく当てはまるということ。

人数    0  1  2  3 4
部隊数 144 91 32 11 2

すなわち、単に平均を求めたのではなく適合度検定したということ。

242 名前:132人目の素数さん mailto:sage [2012/03/21(水) 01:26:51.01 ]
そうですか(´・ω・`)
有難うございました

243 名前:132人目の素数さん mailto:sage [2012/03/21(水) 01:27:57.62 ]
パラメータの0.61ってどういう手順で出したものですか?



244 名前:132人目の素数さん [2012/03/21(水) 21:12:56.14 ]
どなたか「安全なロリコン」を数式にできる方はいませんか?

ロリコンってさ… 本当に悪なのか? 16
s.s2ch.net/test/-3---./kohada.2ch.net/kankon/1331729744/n

245 名前:132人目の素数さん mailto:sage [2012/03/22(木) 02:27:58.85 ]
>>243
Wikipediaの記述が間違っているみたいだね。0.61は構成の違う軍を除いて
10軍に延べ200軍に絞ったときの平均値だ。例に挙げた14軍のときは
平均値0.7だ。どちらであっても適合度自体はよいようだけど。

246 名前:132人目の素数さん mailto:sage [2012/03/23(金) 12:38:37.31 ]
ありがとうございました(´・ω・`)

247 名前:132人目の素数さん mailto:sage [2012/03/23(金) 23:06:47.19 ]
>>231
>スルーされてて何の説明もなく・・・・・・
絶対値は数式計算の際に扱い難いからという>>224氏や>>232氏の云う数文字を
載せていない初学者に不親切な統計初歩教科書を採用している貴方の出身大学は、
何処なの?

248 名前:132人目の素数さん mailto:sage [2012/04/04(水) 00:50:23.65 ]
質問です。もしよろしければ教えてください。

店のレジからお金を盗んでいる店員がいるのではないかと疑念があり、統計的に当たりをつけようと
考えています。勿論統計分析が正しくない結果を導くことは承知してますので、結果は慎重に扱うつもりです。

質問1.以下の方法でよいですか?
日々の売上げ、天候、曜日・休日、周辺のイベントの有無を重回帰分析により売上げの計算式をもとめる。
その数式で求めた統計上の売上げと、実際の売上げを信頼区間95%で検定する。

質問2.検定のときに使う分散は、エクセルの回帰分析で出力される分散分析表のどの値を使えばいいのでしょうか?

質問3.年間の季節変動や連休などの影響はどのように反映させればいいのでしょうか?
数年間のデータ平均から手で補正したデータを用いて回帰分析すればいいのでしょうか?

249 名前:248 mailto:sage [2012/04/04(水) 01:05:39.40 ]
補足です。
レジを担当するものは20名ほどおり、一日に2人が交代で担当します。
売上げの異常な日を統計的に検出し、長期的に様子を見ていくつもりです。

250 名前:132人目の素数さん mailto:sage [2012/04/04(水) 08:28:01.10 ]
レポートの課題なら適当にやっておけと言うところだが
現実に適用するつもりなら考え直した方がいい。

露骨に特定の人物がいる日だけ売り上げが下がるならば
難しい統計はいらないし、微妙な結果になるならば
あなたの考えた恣意的な補正で犯人が決まるだけだから。
質問の内容からして統計だけでなく自分の商材の売れ方すら
碌に分かっていないようだからなお更危うい。

POSいれるなり在庫管理を厳密化するなりして
直接的に盗みを検出できる仕組みを作るべき。

251 名前:132人目の素数さん mailto:sage [2012/04/04(水) 09:22:47.59 ]
万札、5千円札、千円札、500円硬貨、とお金の種類ごとの数を日々表にしていけばよろし。2000円札は不要でしょw
それを各人ごとに集計して比率の差の検定。
うまくいくかどうかは保証の限りではなし。

レジから金を盗んでてもすぐには気づかないほどの売上高があって、
レジする人が20人も従業員がいるような規模なら、>>250が言うように、もうちょいしっかり在庫管理とかできてないものなの?
95%信頼区間なんて難しい言葉を知っているのに、検定で分散分析表のどの値を使えばいいのか、ってのも
ちぐはぐな感じを受けます。余計なお世話かもしれませんが。

252 名前:132人目の素数さん [2012/04/04(水) 20:11:22.88 ]
この一昨夜4/2のNHK教育を見逃したんだが、統計学のどういう分野の
話題が出てきたの?
[stats:3110] NHK スーパープレゼンテーション Date: Mon, 02 Apr 2012
mid.ism.ac.jp/stats/msg01597.html

253 名前:132人目の素数さん [2012/04/04(水) 21:15:53.22 ]
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   私は只の数ヲタなんかとは付き合わないわ。
.     |   \ ∠イ  ,イイ|    ,`-' |      頭が良くて数学が出来てかっこいい人。それが必要条件よ。
     |     l^,人|  ` `-'     ゝ  |        さらに Ann.of Math に論文書けば十分条件にもなるわよ。
      |      ` -'\       ー'  人          一番嫌いなのは論文数を増やすためにくだらない論文を書いて
    |        /(l     __/  ヽ、           良い論文の出版を遅らせるお馬鹿な人。
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、         あなたの論文が Ann of Math に accept される確率は?
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            それとも最近は Inv. Math. の方が上かしら?
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄|
   |     /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_|
   |    |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/
    |   /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/



254 名前:132人目の素数さん [2012/04/05(木) 00:53:18.91 ]
>>248
なんかおかしい。
本当に、実際の店の人間なのか?

いまはどの店でも、他の方法でレジから
金を抜く店員を見つけています。


255 名前:132人目の素数さん mailto:sage [2012/04/05(木) 01:17:50.25 ]
監視カメラはないのか?なくても>>250で終わってる。

256 名前:132人目の素数さん mailto:sage [2012/04/05(木) 14:16:21.65 ]
>>250-255
そうなんですよね。通常の商品販売ではないので在庫管理や監視カメラといった方法で
チェックをすることができないんですよ…。
各人のモラルに頼っているだけの状態です。

>>254
その方法教えてください。もう統計学とは関係なくなってますが(笑)

257 名前:132人目の素数さん mailto:sage [2012/04/05(木) 15:45:21.27 ]
募金鷺の元締め!

いいいいいやあああああああああああぁ

258 名前:248 mailto:sage [2012/04/05(木) 15:59:49.69 ]
>>257
ワロス


でもまあ余りラジカルなことはしないことにしました。
今でも曜日別のグラフやレジの操作記録の統計を掲示して大きなお金をとったら分かるぞという”牽制”くらいはしてます。

ではではありがとうございました。

259 名前:132人目の素数さん mailto:sage [2012/04/05(木) 20:37:12.96 ]
在庫管理がきかなくて監視カメラも置けないけど
レジの操作は記録できる
担当は2人の交代制で売り上げに響くくらい横領ができるが
それを指摘することは難しい

どんな仕事なのか気になるな

駐輪所の管理人とかか?

260 名前:132人目の素数さん mailto:sage [2012/04/08(日) 12:31:51.86 ]
>>252
こういう2次元散布図だけれども3次元目に時間をとってアニメーション化
した管面ならではの動的散布図が、紹介されたらしい。
Data in Gapminder World
www.gapminder.org/data/

261 名前:132人目の素数さん mailto:sage [2012/04/13(金) 05:36:30.33 ]
>>260
それって去年閉鎖された「Google Labs」内にあった「Google Public Data
Explorer」と同じグラフ描画ソフトじゃないか。

262 名前:132人目の素数さん mailto:sage [2012/04/14(土) 14:24:05.08 ]
情報処理技術者試験の正解には偏りがあるという集計が出ている。
基本情報の正解は「ウ」が多く、応用情報の正解は「イ」が多いらしい。
お前らの出番だぞ!
https://twitter.com/#!/moriban/status/190999391035858945
https://twitter.com/#!/moriban/status/190987525005901824
https://twitter.com/#!/h_okumura/status/191015800684036096
https://twitter.com/#!/AkiraOkumura/status/191024337342562304

263 名前:sage [2012/04/14(土) 15:46:34.26 ]
質問なんですが,
よく移動平均で線形加重とか指数加重が使われるけど、
これを標準偏差に重みをつける時ってどうすればいいの?



264 名前:132人目の素数さん mailto:sage [2012/04/14(土) 17:00:41.08 ]
>>262
倍数ってか、割合だけではカイ二乗検定はできまへん。(本人は実際の数字を持っているのだろうけど。)

265 名前:132人目の素数さん mailto:sage [2012/04/14(土) 23:24:33.69 ]
>>264
1回あたり80問だから集計されてる全12回分で960問
選択肢は4つだから、その選択肢を全部足すと3840個になるはず

基本情報はこんな感じだな
ア 22.4% 860個
イ 23.13% 888個
ウ 27.5% 1056個
エ 26.98% 1036個

266 名前:132人目の素数さん mailto:sage [2012/04/15(日) 03:07:51.43 ]
>>265
おいおい正解は一つしかないから合計は問題数と同じ960だろ。
すると
ア 215
イ 222
ウ 264
エ 259
だな。この場合、カイ二乗値は7.858でちょうど5%ってところだ。
一方、応用情報の方はなぜか整数にならないので出題ミスですべての選択肢が
正解となったとか何か理由があると思うんだが、そのあたりは960問で
近似して解釈するとp値は2.4%になり、明らかに有意となる。
なんらかのくせはあるんだろうな。
ただ年によって違うし、自分で絞り込んだ方が正解する可能性は高くなると
思うけどね。

267 名前:132人目の素数さん mailto:sage [2012/04/15(日) 13:26:53.59 ]
>>266
お、さんきゅー
俺としたことが・・・やってしまった・・・

応用情報の合計が960問にならない話は、応用情報スレで出てたわ
2006年に正解なしって問題が1問あったらしい
ikura.2ch.net/test/read.cgi/lic/1334419325/8

268 名前:132人目の素数さん mailto:sage [2012/04/15(日) 17:53:47.08 ]
p=0.05未満だと「危険率5%で有意」でいいと思うのですが、
p=0.05以上0.10未満のときに「有意傾向」と言う人がいます。
この言葉をきちんと説明したテキストなり辞典はあるでしょうか。

有意水準なぞ慣習的または恣意的なものなのですから、「10%で有意」でいいと思うのですが。

むしろ、「あらかじめ定めた5%には達しなかった(というのも変な表現ですが)のだが、『惜しい』」から
くやしまぎれに『有意傾向』という言葉をつくり出した人がいるんじゃないかと思うのですが。
検定というのは、YESかNOかという二者択一のための手法なんじゃないんですかね。

269 名前:132人目の素数さん mailto:sage [2012/04/15(日) 22:18:06.52 ]
確かにみすぼらしい言葉だなw

270 名前:132人目の素数さん [2012/04/15(日) 23:07:29.13 ]
>>263
後で計算した標準偏差ほど重みを増やして、
標準偏差そのものの移動平均を出せばいいだけ。


271 名前:sage [2012/04/16(月) 11:57:02.54 ]
>>270
返信ありがとうございます。
実際にやってみたのですが, 標準偏差そのものに加線形加重や指数加重をかけても
平均をとってしまうので, 標準偏差そのものよりも反応が悪くなってしまいました。
時系列データの最新データの変動が激しい場合はより速く標準偏差を大きく, 時系列データの最新データの変動が小さくなる
ときにはより速く標準偏差を小さくするように加重をかけたいのですが、
何かいい方法はありませんか?

272 名前:132人目の素数さん mailto:sage [2012/04/16(月) 23:13:20.57 ]
>>270は標準偏差の移動平均なんだから鈍るのは当然

そういうことがやりたいならば偏差に重みをつけて
標準偏差を計算すればよい
近くのサンプルの数を割り増しするイメージ

あとはブートストラップするなりARMAで予測するなり
バリエーションはいくらでも考えられるが妥当性は保証しない。

273 名前:132人目の素数さん mailto:sage [2012/04/17(火) 12:44:47.79 ]
>>252
これじゃないの?
www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html



274 名前:132人目の素数さん [2012/04/19(木) 19:08:45.41 ]
主成分分析を行う時、データを正規化した後に相関係数行列を求める前提として、データが正規分布に従っている事が必要だと思いますが、データが正規分布に従っていないと判断される場合は、どうすればよいのでしょうか?

275 名前:132人目の素数さん mailto:sage [2012/04/19(木) 20:46:40.58 ]
>>274
Everitt, Brian and Hothorn, Torsten (2011)
An Introduction to Applied Multivariate Analysis with R
Springer-Verlag






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<282KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef