[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 12/23 01:43 / Filesize : 243 KB / Number-of Response : 874
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド 13



1 名前:132人目の素数さん [2011/02/11(金) 01:51:36 ]
2010.9上旬のkamomeサーバ霧散スレッド全損事件から5ヶ月、
運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。
引き続き、質問等どうぞ。

前スレ
統計学なんでもスレッド12
kamome.2ch.net/test/read.cgi/math/1283521346/

19 名前:132人目の素数さん [2011/02/16(水) 01:27:55 ]
aとbがCに及ぼす影響を調べるためにはどの分析方法が最も適切でしょうか
t検定も分散分析も違うような気がするのですが…
ちなみにaとbは不変と可変、のように対になる変数です
よろしくお願いします

20 名前:132人目の素数さん [2011/02/16(水) 10:35:21 ]
不変と可変って何?

21 名前:132人目の素数さん mailto:sage [2011/02/16(水) 22:35:17 ]
>>19
Cが量的変数なら、重回帰分析か数量化T類か実験計画法を使うのが普通だが。
「aとbは不変と可変」って、定数と変数ということですか?

22 名前:11 mailto:sage [2011/02/16(水) 22:53:01 ]
>>14
レスありがとうございます。
わざわざ時間かけてもらってすいません。

結果を見ても、差は誤差と考えるのが妥当ですね。
すっきりしました。

23 名前:132人目の素数さん [2011/02/17(木) 11:25:01 ]
以下の四つのジャーナルの内、最もレスポンスが早いのはどれでしょうか?
また、ジャーナルの評価も聞かせて下さい。

・日本統計学会誌(英文)
・Communications in statistics
・Statistica Sinica
・Annals of institute of statistical mathematics

24 名前:132人目の素数さん [2011/02/17(木) 23:13:28 ]
全データが与えられてるのを度数分布標作って平均値などを求めたんですが間違いになりますか?

25 名前:132人目の素数さん [2011/02/18(金) 16:33:21 ]
>>23
投稿の内容とか、そのとき選ばれたレフェリーによっても全然違うから、
基本的には、レスポンスが早いかどうか全くわからないと言っていい。

聞いた話とか、おれやおれの友人が投稿した感じでは以下のように思う。

(おれは一度、日本統計学会誌で3ヶ月放置されたことがあるけどね)

・日本統計学会誌(英文)=二ヶ月以内ぐらいには返事があるはず。
・Communications in statistics=まあまあ早い。一ヶ月ぐらい?
・Statistica Sinica =早い。リジェクトの場合4,5日で返事が来ることも。
・Annals of institute of statistical mathematics =むちゃ遅いらしい。半年?


26 名前:132人目の素数さん [2011/02/18(金) 19:11:13 ]
>>24
その「全データ」というのは母集団のこと?
つまり分析したい対象ということ?
それとも何かの標本?


27 名前:132人目の素数さん mailto:sage [2011/02/18(金) 21:22:50 ]
統計学では高校数学のどの知識が必要ですか?



28 名前:132人目の素数さん [2011/02/19(土) 20:54:07.72 ]
>>27
高校の教科書を見直してみた。
どこまでやりたいかによるけど、
初等幾何以外はほとんど必要だと思う。


29 名前:132人目の素数さん [2011/02/19(土) 22:13:05.42 ]
>>27
ある程度きちんとやるなら、微積分の知識がいる。
統計的に分析する時に確率の知識が必要で、確率は面積なので積分がいる。
統計的分析をするためには微分もいる。

複数の変数を分析するには、線形代数(行列)の知識がいる。

ただ、EXCELとかで結果だけだせればよくて、手法はそれほど細かく
わからなくても、とりあえず分析したいだけなら、数学というよりも
常識があればOK。

30 名前:132人目の素数さん [2011/02/20(日) 00:00:50.89 ]
統計なんてバカのやること
高校生レベルで十分

31 名前:132人目の素数さん mailto:sage [2011/02/20(日) 00:15:42.89 ]
                             |
                             |
      ∩___∩             |
      | ノ  _,  ,_ ヽ        ((  | プラプラ
     /  ●   ● |         (=)
     |    ( _●_)  ミ _ (⌒)   J  ))
    彡、   |∪|  ノ
⊂⌒ヽ /    ヽノ  ヽ /⌒つ
  \ ヽ  /         ヽ /
   \_,,ノ      |、_ノ


32 名前:132人目の素数さん [2011/02/20(日) 04:10:26.79 ]
実務で統計やってる人って何やってるかはわかんなくてただブラックボックス的にやってんの?

33 名前:132人目の素数さん [2011/02/20(日) 04:50:53.96 ]
実務家で統計やってる人は、
ほとんどブラックボックスだね。
アフォばっかり。
学者は狭い範囲でいろいろやって喜んでいるだけ。

広く深く、しかも実践的なことが出来る人は
ごく少数しかいない。
おれからしたら日本には30人ぐらいしかいない。


34 名前:132人目の素数さん [2011/02/20(日) 20:44:28.90 ]
複数の映像を見せて「どちらが迫力があったか」「どちらが爽快感があったか」などの質問に5段階で回答してもらったのですが
標本数が少なくp<0.1でも差が出ません
何とかどちらかが良いという結果を出したいのですが
このようなアンケート調査の場合どの程度まで有意水準をあげてもよいのでしょうか?

35 名前:132人目の素数さん mailto:sage [2011/02/20(日) 23:53:00.33 ]
どこまででも行けばいい
信じる人が減るだけかな

36 名前:132人目の素数さん mailto:sage [2011/02/21(月) 01:24:13.03 ]
>>34
どんな検定したのか分からないけど0.1より上げるのはないな。
本当には差があると思ってるんだったら検定法を変えると差が出るかもしれん。


37 名前:132人目の素数さん [2011/02/22(火) 16:13:03.01 ]
45点満点のテストで平均点22点標準偏差6のとき
36点とった場合、偏差値はいくつになるのか、出現率(1000人中での順位)という
のはどれぐらいになるのでしょうか?



38 名前:132人目の素数さん mailto:sage [2011/02/22(火) 17:21:31.71 ]
偏差値:50+10*(36-22)/6=73.333...
出現率の定義はよくわからないが、1000中での順位というのであれば、
正規分布で、x>2.333...の面積は、0.009815...。1000倍して切り上げし、10位と言うのが妥当だろう。

39 名前:132人目の素数さん [2011/02/22(火) 23:17:30.51 ]
ありがとうございます。
偏差値73の成績と偏差値65の成績の二つの試験の合計での
出現率や総合偏差値というのは推計できるのでしょうか?

40 名前:132人目の素数さん mailto:sage [2011/02/23(水) 01:34:25.91 ]
>>39

>>38ではないが、複数の変数(複数の試験の結果)を合わせた分布を
計算するのには、>>39の情報だけではできない。

試験Aの成績がいい人が、試験Bの成績もいいという関係があるのか、
逆の関係があるのか、その関係はどれくらいなのか、両方の試験の結果
にはあまり関係が無いのか、といった情報がないと、分布の形が特定
できないので計算もできない。

単純に二つの点数を足したもので、総合の偏差値を計算することは可能
なので、それが簡単かもしれないけど、二つの試験の総合点の標準偏差
の数値なんて持ってないよね。

ちなみに、偏差値73と65における順位と、合計したものの順位は異なる。
偏差値73と65の順位というのは、73よりも成績がよく、65よりもいいと
いう両方の条件を満たす人。
総合した場合には、どちらかが下回っている人が総合点で上に来ることが
あるので結果が違ってくる。

41 名前:132人目の素数さん mailto:sage [2011/02/23(水) 02:55:34.10 ]
>>39

>>40 の書いていることは、

数学と英語の試験があって、
1)片方の成績がいいともう片方の成績もいいとすると、英語で高得点を
取った人は数学でも高得点を取ることになる。

2)英語と数学の成績にはマイナスの相関があると、英語の成績がいい人で
数学の成績のいい人は少なくなる。

つまり、1)と2)を比べると零点から200点の間に、1)の方が広く分布
してて、2)の方が平均点の所に多く分布していることになる。
そのため、1)と2)では1)の方が分散が大きくなる。

あと、3)として、両方の試験にまったく相関が無い場合。
これは、英語で10点取ってる人たちと、90点取ってる人たちを比べると、
数学の成績の分布が一緒だってこと。
どちらにも、数学で10点の人とか90点の人が、同じようにいる状況。

二つの試験の点数の関係で結果が変わるので、その情報が無いと、計算が
できない。

42 名前:132人目の素数さん mailto:sage [2011/02/23(水) 09:13:04.87 ]
世界最速2バスの曲 DIMMU BORGIRの"The Chosen Legacy"
290〜300BPMの16ビート
detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1347376823
www.youtube.com/watch?v=JEj2hXC3TA4
DIMMU BORGIRの"The Chosen Legacy
www.youtube.com/watch?v=afzN_Ab2BhI

ドリームシアター64ビート   150BPMの64ビート
www.youtube.com/watch?v=KveVL5IN9eY

64ビートとは世界最速ドラマー「ヘルハマー」の2倍のスピードとなる事が判明した!

43 名前:132人目の素数さん [2011/02/23(水) 10:59:51.24 ]
39です。>4041ありがとうございます。
正規分布の面積で順位を算出することがわかりました。二つの試験の
場合は相関関係がわからないとだめなようですね。ありがとうございます。

44 名前:132人目の素数さん [2011/02/25(金) 18:17:46.83 ]
質問します。
glmを使い,説明変数の数を変えて複数のモデルを作りました。
複数モデルの中から最もあてはまりの良いものを知りたいので
AICを比較しようと考えたのですが,AICがInfとなり,表示してくれませんでした。
使っているソフトはRです。
AICが非常に小さいくて(おそらく2以下?)表示されないと考えているのですが,
これでは比較できません。
対処法をご存じの方がいらっしゃいましたら,教えていただきたく存じます。

45 名前:132人目の素数さん mailto:sage [2011/02/26(土) 00:04:38.76 ]
>>44
小さいから表示されないということはありません。
Infですから無限大なのでしょう。
glm後の出力で係数は表示されているのにAICのところのみInfと
なるということですね?他のモデルではAICが表示されるのなら
少なくともそのモデルはだめという結論でよいように思います。
AICを小さくするモデルを探索しているのですから。

46 名前:132人目の素数さん [2011/02/27(日) 23:33:43.39 ]
ARモデルで共分散定常性が成り立たないときはOLSで推計をするのは
妥当ではないと本に書いてありましたが理由は書かれていませんでした。
どなたか理由を教えていただけないでしょうか。

47 名前:132人目の素数さん mailto:sage [2011/03/01(火) 00:40:38.30 ]
>>46
定常でない時系列でARモデルを当てはめるってそもそもどういう仮定で
どうやって解くのだろう?その本にはそもそもそういうときにどうすれば
いいのかも書かれていないんですよね?それならば理由は仮定を満たして
いないからということでは。



48 名前:132人目の素数さん [2011/03/06(日) 18:40:50.90 ]
証明問題をやってて
具体的にiが1〜nまでみたいに決まってなくて
集合Aの範囲内のものを全て足し合わせるってことを書きたいんだけど

ΣAf(x) (Aは下に小さく書く)

って書き方でいいのかな?
それとも何か正しい書き方ってある?

49 名前:132人目の素数さん [2011/03/06(日) 23:01:08.91 ]
統計学会春季大会(立教大学)乙!
会場がちょいと寒かった。
暖房いれるとみんな寝ちゃうから?


50 名前:132人目の素数さん mailto:sage [2011/03/07(月) 00:27:45.84 ]
>>48
なんでここで訊いてるのか分からないが、TeXで書くと
\sum_{x \in A} f(x)
となるのでは?(\inは集合の含まれるの記号)

51 名前:132人目の素数さん mailto:sage [2011/03/17(木) 00:25:55.53 ]
>>49
これですね。興味深い発表は、どれでしたか?
第5回日本統計学会 春季集会
日 時:2011年3月6日 (日) 10:00 〜 17:30
場 所:立教大学 (東京都豊島区西池袋3-34-1)
www.jss.gr.jp/ja/convention/spring/05/JSSspring2011_program.html

52 名前:132人目の素数さん [2011/03/18(金) 07:53:20.20 ]
質問します。
教科書に、大標本と小標本なる用語があるのですが、定義が載って
おりません。標本数何ケが境目なのですか?

53 名前:132人目の素数さん mailto:sage [2011/03/22(火) 01:36:17.66 ]
明確な境目はないですよ。
10だと確かに少ないし、100だと多い方ですが、
どんな分析をどんな精度でするのかにも依存しますし。

54 名前:132人目の素数さん [2011/03/29(火) 15:50:34.70 ]
偏差値って正規分布専用の指標?

55 名前:132人目の素数さん mailto:sage [2011/03/29(火) 18:09:45.99 ]
>>54
逆に聞くけど、SDって正規分布専用?

56 名前:132人目の素数さん [2011/03/29(火) 23:34:19.30 ]
日本統計学会、・・・・プッ

57 名前:132人目の素数さん mailto:sage [2011/04/01(金) 22:41:27.66 ]
すみません
試行A   成功
29       5

試行B   成功
36       9

の二つの試行は違うと言えるのかどうかの検定ってどういう検定でできますか?



58 名前:52 [2011/04/02(土) 03:27:09.67 ]
>>53
応答ありがとうございます。
精度に依存するというのは、設定する許容誤差に連動するということですね。
許容誤差をαとすると、境目の標本数はどのような式で計算するのでしょうか?

59 名前:57 mailto:sage [2011/04/02(土) 11:02:17.11 ]
誰か教えてくれ・・・

60 名前:132人目の素数さん [2011/04/02(土) 14:22:25.84 ]
極限の問題だと思います。
このような問題をやったことが無いので、出来るだけ詳しい説明をしていただけると嬉しいです。
@lim(θ→0) sin5θ/sin2θ
Alim(u→0) u・log{1+(3/u)}
Blim(x→-∞) x+1/{√(x^2+x+1)-x}

宜しくお願いします。



61 名前:132人目の素数さん [2011/04/02(土) 14:24:01.03 ]
↑数学何でもスレッドと勘違いしました。
申し訳ないです><。

62 名前:132人目の素数さん mailto:sage [2011/04/02(土) 14:36:40.83 ]
>>58
無いよ。

例えば、標準正規分布を用いた検定と、t分布を用いた検定を考える。

この時、サンプルが30くらいあれば、どちらの方法でも目的としてる精度で分析できるなら、簡単な方を使う。

それと同じように考えればいい。

ただし、検定によっては、大標本の特性は数学的にもとまっていても、小標本の特性はわかってない時がある。
そんなときは、シミュレーションでサンプルサイズによる特性を調べて、それを使う。それが無理なら、とりあえず大標本の結果を利用する。

63 名前:132人目の素数さん mailto:sage [2011/04/02(土) 16:44:56.13 ]
>>57
分割表の独立性の検定

64 名前:132人目の素数さん mailto:sage [2011/04/02(土) 17:21:11.30 ]
>>62
挙げている例が説明と合ってないよ。
正規分布を用いた検定とt分布を用いた検定ではt分布の方が常に精度がよい。
しかし、たとえば標本の大きさが100ぐらいになるとその差は大してないので
正規分布を用いた検定でよいと考えたりする。
この場合明確に精度の差を考えたら切り替え基準も作れなくはない。
ただ精度の差は応用で違うし、主観的にもなるのでそういう議論をすることは
ほとんどない。

一般的にはこういうように説明できる方が珍しく小標本の方法の特性が
分かっていなかったり単純に比べられなかったりする場合が多いことは確か。

65 名前:132人目の素数さん mailto:sage [2011/04/02(土) 18:52:30.98 ]
>>63
ありがとうございます
たいして違いないみたいですね。

66 名前:132人目の素数さん mailto:sage [2011/04/04(月) 14:54:44.08 ]
>>55
答えはNOという事ですね
あり^^

67 名前:132人目の素数さん mailto:sage [2011/04/06(水) 14:29:57.53 ]
もし、真剣にロト6を統計したら一番期待が持てるのってどれなんだろうか?
過去30回分とかで計算したことある人は結構いそうだけど過去全部で計算したことある人っているか?



68 名前:132人目の素数さん mailto:sage [2011/04/06(水) 23:18:02.98 ]
どれとは?一番期待値が高くなる組み合わせってこと?
過去全部でもすべての組み合わせが出ているわけではないので
一番は決められないのでは?

69 名前:132人目の素数さん mailto:sage [2011/04/07(木) 19:24:30.11 ]
さらに言うと第138回から使う玉が変更されました
さらに言うとA〜Jセットまでがあって
頻度調整の為に恣意的に使われるセットが替わります
僕はデータベースにできる限りの情報を記録しています

70 名前:132人目の素数さん mailto:sage [2011/04/07(木) 22:08:27.61 ]
それってどのセットを使うのが事前には公表されないでしょ?
どのセットを使うかも予測するってこと?
セットを変えるのは本当に頻度調整のためなの?
(頻度調整となると出る玉に偏りがあることになるが、
それを立証できるの?)

71 名前:132人目の素数さん mailto:sage [2011/04/07(木) 23:29:51.04 ]
1レスに質問は一つにして下さい

72 名前:132人目の素数さん mailto:sage [2011/04/08(金) 14:00:17.39 ]
皆は学部どこ?
俺は経済学部なんだけど理学部数学科ばっかりか?

73 名前:132人目の素数さん [2011/04/09(土) 14:30:26.09 ]
統計解析についての質問。
企業がエクセルを導入したことによって、どのような統計解析が可能になったのか?
質問が雑であまりうまくまとめられてないので、すいません。
友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。

74 名前:132人目の素数さん [2011/04/09(土) 17:34:27.66 ]
お断りします。

75 名前:132人目の素数さん mailto:sage [2011/04/11(月) 19:11:17.73 ]
>>73
エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。

76 名前:132人目の素数さん mailto:sage [2011/04/11(月) 20:49:10.68 ]
1)が偽だったら何の意味もない議論だなw

77 名前:132人目の素数さん mailto:sage [2011/04/12(火) 18:15:07.51 ]
>>73
こういう本見て、そこの仕事と関係ある部分を箇条書きにすれば良いと思う。
www.amazon.co.jp/gp/product/479811958X/



78 名前:132人目の素数さん [2011/04/16(土) 22:29:22.99 ]
>>46
妥当ではないとは具体的に?

79 名前:132人目の素数さん [2011/04/16(土) 22:36:56.43 ]
非線形回帰モデル
y = a*x1 + a*b*x2 + u
において、y、x1、x2のデータがあるときにaとbの推定を考えます。
その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、
u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして
求める方法はどちらがいいのでしょうか?


80 名前:132人目の素数さん [2011/04/17(日) 00:31:45.15 ]
>>79
それ非線形なの?
線型にしか見えないけど?


81 名前:132人目の素数さん [2011/04/17(日) 02:11:01.55 ]
>>80
パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。

82 名前:132人目の素数さん [2011/04/17(日) 03:41:54.70 ]
>>81
両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの?


83 名前:132人目の素数さん [2011/04/17(日) 03:59:01.87 ]
>>82
でもa自体が未知なので変換は不可能じゃない?

84 名前:132人目の素数さん [2011/04/17(日) 15:07:32.72 ]
y = a*x1 + a*b*x2 + u

のa*b = cとおいて、

y = a*x1 + c*x2 + u

とすれば普通の回帰分析と同じ。
そして、aとcを求めてから、
cをaで割るとbが求まります。
よって線型と同じです。


85 名前:79 [2011/04/17(日) 15:51:49.81 ]
すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。
実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような
簡単な方法では扱えないモデルです。
問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。

86 名前:132人目の素数さん mailto:sage [2011/04/17(日) 16:44:18.49 ]
>>84
そのように置いたらaとcは独立ではないよね。

87 名前:132人目の素数さん [2011/04/17(日) 18:51:01.98 ]
>>86
ええ。そうしなくても独立ではないですよね?

>>85
こういうのをやりたいということですか?
www.cs.osakafu-u.ac.jp/hi/honda/mathematics2.htm




88 名前: 忍法帖【Lv=19,xxxPT】 mailto:sage [2011/04/17(日) 19:46:06.04 ]
通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。
ベイズ統計学はどういうところで使われているんですか?
普通の統計学にたいして利点と欠点とかってあるんでしょうか?

89 名前:79 [2011/04/17(日) 20:12:17.21 ]
具体的に言うと
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
という回帰モデルでa,b_1,...b_kの推定を考えています。


90 名前:132人目の素数さん [2011/04/17(日) 23:02:45.42 ]
>>88
ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。

利点はベイズの公式を利用できることですかね?
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。


91 名前:132人目の素数さん mailto:sage [2011/04/17(日) 23:17:48.07 ]
>>90
>欠点はないです。
ベイズは概して計算量が増えます。

92 名前:132人目の素数さん [2011/04/17(日) 23:37:54.83 ]
>>89
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u

これを書き換えると

y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u

x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。

93 名前:132人目の素数さん [2011/04/17(日) 23:40:48.41 ]
あ、ごめん、見間違ってた。

94 名前:132人目の素数さん [2011/04/18(月) 02:18:12.99 ]
計量経済で言うコクランオーカット法の推定と同じような問題かな?

95 名前:132人目の素数さん mailto:sage [2011/04/18(月) 18:11:22.42 ]
CRFってわざわざ名前つけるほど特別な方法でもないじゃん
なんで騒がれてんのか不明だわ

96 名前:132人目の素数さん mailto:sage [2011/04/18(月) 23:31:50.66 ]
>>87
aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。

97 名前:132人目の素数さん [2011/04/22(金) 09:25:33.58 ]
データが「正規分布に従う」と言うためには何をすれば(何を示せば)いいですか?



98 名前:132人目の素数さん mailto:sage [2011/04/22(金) 16:27:42.03 ]
>>97
宿題?それとも試験中?

99 名前:97 [2011/04/22(金) 19:36:59.20 ]
>>98
工学系の論文です。

100 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:51:27.25 ]
論文なのにこんなところで聞くのかw
参考文献に2chと書くのか?w

101 名前:132人目の素数さん mailto:sage [2011/04/22(金) 19:54:52.25 ]
胸が熱くなるな…

102 名前:97 [2011/04/22(金) 20:37:35.46 ]
>>100
ここで概要を聞いた後に文献を引いて詳細を調べようと思います。

103 名前:132人目の素数さん mailto:sage [2011/04/22(金) 21:34:04.74 ]
>>102
データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…

104 名前:97 [2011/04/22(金) 23:16:49.37 ]
>>103
正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか?
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test

105 名前:132人目の素数さん mailto:sage [2011/04/22(金) 23:18:35.61 ]
>>104
概要を聞いたら、詳細に調べるんじゃなかったっけ。

106 名前:97 [2011/04/23(土) 01:20:54.07 ]
>>105
はい、それぞれの手法の詳細は現在調べているところです。

最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。

107 名前:132人目の素数さん mailto:sage [2011/04/23(土) 08:13:17.77 ]
>>106
統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。



108 名前:97 [2011/04/23(土) 10:11:01.86 ]
>>107
ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。

>>98, 103
お礼が遅くなりましたが、ありがとうございます。>>107と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。

109 名前:132人目の素数さん [2011/04/24(日) 21:20:58.83 ]
ベキ分布でリスク管理のすすめ
f.blogos.livedoor.com/opinion/article/5513200/

110 名前:132人目の素数さん [2011/04/24(日) 22:09:22.10 ]
>>108
データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。

棄却されないために、わざと検定しない奴多いんですよ。(爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも?


111 名前:132人目の素数さん [2011/04/27(水) 13:01:13.59 ]
小説に歴史上の数学者を登場させたくて、
確率論、特に正規分布などの歴史について調べています。

Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。

112 名前:132人目の素数さん mailto:sage [2011/04/28(木) 13:24:03.84 ]
物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた

113 名前:132人目の素数さん mailto:sage [2011/04/28(木) 14:49:13.68 ]
>>112
ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。

114 名前:132人目の素数さん mailto:sage [2011/04/28(木) 21:49:10.37 ]
>>113
ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。

115 名前:132人目の素数さん mailto:sage [2011/04/28(木) 22:38:47.02 ]
>>114
おおっ。良くまとまっていますね!thanks!

116 名前:132人目の素数さん mailto:sage [2011/05/04(水) 20:17:27.97 ]
この問題はカイ二乗分布の表を使って解くのでしょうか?
どなたか詳しい解き方を教えて頂けたら嬉しいです。
なんかいまいち参考書を読んでも解き方がわからない...


正規分布に従う母集団から次の標本が存在する
66.303、15.102、84.942、53.234、93.443、63.132、45.295
この時、母集団の平均と分散を信頼係数95%で区間推定せよ。
(解答は小数点以下第4位まで求めよ)

117 名前:132人目の素数さん mailto:sage [2011/05/05(木) 01:07:45.13 ]
>>116
サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。



118 名前:132人目の素数さん [2011/05/05(木) 06:36:06.04 ]
平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。
統計表のどこを見ればわかるものなのでしょうか?

ttp://www.mext.go.jp/b_menu/houdou/21/11/__icsFiles/afieldfile/2009/11/30/1287227_1_1.pdf

119 名前:132人目の素数さん mailto:sage [2011/05/05(木) 07:21:36.82 ]
>>118
pdfは見ないで書くけど、ないなら他から探して持ってくる。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<243KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef