統計学なんでもスレッド9 at MATH
[2ch|▼Menu]
1:132人目の素数さん
08/11/18 13:14:26
理論的な話題から実務上の疑問点まで。
学校の宿題は自分で考えましょう。

前スレ:

統計学なんでもスレッド8
スレリンク(math板)
統計学なんでもスレッド7
スレリンク(math板)
統計学なんでもスレッド6
スレリンク(math板)
統計学なんでもスレッド5
スレリンク(math板)
統計学なんでもスレッド4
スレリンク(math板)
統計学なんでもスレッド3
スレリンク(math板)
統計学なんでもスレッド2
スレリンク(math板)
統計学なんでもスレッド
スレリンク(math板)

2:132人目の素数さん
08/11/18 13:14:56
関連スレ:

統計学なんて数学じゃないだろ
スレリンク(math板)
= 統計解析フリーソフト R 【第2章】 =
スレリンク(math板)
=統計解析= SASプログラミング
スレリンク(math板)
統計学
スレリンク(sociology板)
経済学で使う統計学スレッド
スレリンク(economics板)
生物学での統計学スレ
スレリンク(life板)
◆統計学について語るスレ
スレリンク(sim板)
統計・解析ソフトについて
スレリンク(bsoft板)

3:132人目の素数さん
08/11/25 16:10:37
早く立てるのなら後のこともちゃんとやってくれ

4:統計初心者^^;
08/11/25 21:37:39
初めまして★早速ですが質問があります><
もし、わかることがありましたら少しでも良いので教えてください。
えっと「平均の分布」と「分布の平均」というのがありまして、この二つは具体的にどう違うのかがさっぱりわかりません><


5:132人目の素数さん
08/11/26 21:00:28
>>4
「ヒモのパンツ」と「パンツのヒモ」の違いがわかれば簡単よ

6:132人目の素数さん
08/11/26 21:23:05
うるさい。

7:132人目の素数さん
08/11/27 20:02:30
>>5
king of kings がわかればの方がよくないか?

8:132人目の素数さん
08/11/27 20:09:03
>>5

算術平均と幾何平均の違いが判りません。
同じ平均なのになぜ違う値なのですか?

なにか面白い回答希望。

9:132人目の素数さん
08/11/27 21:51:17
VIPへ行け屑

10:132人目の素数さん
08/11/27 22:09:14
塩ラーメンと醤油ラーメンは、同じラーメンでも味が違うけどね

11:KingMind ◆KWqQaULLTg
08/11/28 00:09:52
Reply:>>7 私を呼んでないか。
Reply:>>8 同じ平均ではない。

12:132人目の素数さん
08/11/28 21:48:33
ベイズの手法のメリットとして、新たに得たデータを
これまでのデータに追加して分析を行えるというbayesian updateが
ありますが、この方法は、新たなデータをこれまでのデータに追加して、
頻度理論の手法で分析することと、どう違うのでしょうか。


13:12
08/11/28 21:53:15
ちなみに、面白い回答は希望しません。

14:132人目の素数さん
08/11/29 02:29:59
式の形が違う

15:132人目の素数さん
08/11/30 01:02:36
ブートストラップ法とは要するに、
少ないデータからさらにサンプル抽出して、
統計量を計算することを繰り返し、
その繰り返しの平均値をもって近似解が得られたとする手法のことですか?

16:132人目の素数さん
08/11/30 02:00:47
平均値だけじゃなく、
統計量の分布そのものがほぼ十分な精度で得られるから、
期待値だろうが信頼区間だろうが、何でも求まるよ。
しかも数式じゃなく数値の固まりだから、計算も楽(コンピュータなら)。

17:132人目の素数さん
08/11/30 13:52:22
データx(1〜1,000の)平均値をブートストラップ法で求めたいです。
下記方法でよろしいでしょうか?(エラーになりますが・・・)
また、ブースとラップ法とは意味があることなのでしょうか?
単純にmean(x)で良いような気が・・

> x <- 1:1000
> boot( x , mean , R = 1000 )


18:132人目の素数さん
08/11/30 18:04:47
>>16
つまり数学的素養がない人でも結果だけは使えるように
よく使うと思われる部分だけを抜き出したのが「〜法」
ってことでいいの?

19:132人目の素数さん
08/12/01 03:50:49
>>17
線形統計量の期待値に限らず、理論的にわかってるものを
自力導出させても意味ないよ。
理論的に解かれてないとか、理論化しようにも複雑すぎて
見当も付かないような問題で威力を発揮する。

>>18
言ってることは違ってるような希ガス
統計分布の密度関数は、式を書くだけなら簡単だけど、
積分値とかその逆関数を求めるのが大変なんだよ。



20:132人目の素数さん
08/12/01 06:14:03
計算式なんて線形計算しかないからMATHEMATICAに突っ込めば一発

21:132人目の素数さん
08/12/01 13:42:42
少しモンテカルロ法と
似てるな。

22:132人目の素数さん
08/12/01 15:21:48
>>20
線形計算て何の話?

>>21
パラメトリック・ブートストラップだと
母数を推定値にした同サンプルサイズのモンテカルロ

23:132人目の素数さん
08/12/03 01:27:24
大学のレポート(回帰分析)の質問です。統計学初心者の馬鹿でごめん。

回帰式の決定係数(R^2)が0.1と求められたのですが、
この式の回帰係数(β)について、t分布やP値による仮説検定を有意水準5%で行った結果
どちらも有意となってしまいました。
決定係数が0.1なのにこのような結果になることはあり得ますかね?

24:132人目の素数さん
08/12/03 02:05:19
観測個数が多ければ(数百以上とか)起きるよ。
データが十分沢山取れれば、どんな微妙な影響でも
しっかり検出できるからね

25:132人目の素数さん
08/12/03 02:58:03
サンクス!
サンプル数は47です。
考察書きにくいけど、そういうことって起きるんですね・・・

26:132人目の素数さん
08/12/03 17:04:35
まず、標準正規分布に従う乱数をいくつか作成します。
さらに、その乱数を用いて自由度nのカイ二乗分布に従う乱数を作成します。

そうして作成された乱数の平均値と分散を求めたところ、
理論上は平均値はn、分散は2nとなるはずですが、
実際に抽出するデータにはばらつきがあるため、
平均値と分散も理論上の値からややばらつきますよね。

そこでそのばらつきのある値が統計的に有意であることを示したいのですが、
そのためにはどういった証明の仕方が考えられるでしょうか?

27:132人目の素数さん
08/12/03 17:18:13
>>26
言ってることが良くわからない。

28:132人目の素数さん
08/12/03 17:20:54
>>25
もしかして、そのレポートの提出期限は明日までではないか?

29:132人目の素数さん
08/12/03 17:31:44
>>27
なるべく分かってもらえるように書いたつもりなんですが・・・理解が曖昧ですいません。
標準正規分布に従っていくつか作成というのは、エクセルによってランダムに生成するということです。
表現の誤用等ありましたら指摘お願いします。

30:132人目の素数さん
08/12/03 17:36:44
あと実際に抽出するデータとはランダムに生成された乱数のことを指します。
連続レス申し訳ない。

31:132人目の素数さん
08/12/03 17:40:19
>>26
χ^2分布に従う乱数を
生成したのなら平均、
分散は理論値になる
んじゃないの?
生成に問題があって
近似とかそういう話
なのかもしれないけど。

32:132人目の素数さん
08/12/03 18:11:09
>>31
χ^2分布に従う乱数すべての平均や分散を取ったら確かに理論値にならないとおかしいと思いますが、
χ^2分布に従う確率変数の一部をランダムに生成しただけでは理論値と一致する可能性は低く、
若干のばらつきが生じると思うのですが、いかがでしょうか?
つまり今回の質問では、そのばらつきが生じた値がどの程度信頼できるものであるか
(有意性があるか)を検証する手段をお聞きしたいということです。
分かりにくくて申し訳ないです。

33:132人目の素数さん
08/12/03 18:17:16
χ^2分布に従う確率変数
から得られたデータ
であれば、
理論値と一致する
と思うけど。ただし、
局所的にはχ^2分布
だけど全体としては
微妙に違う
あるいはその逆
とかいうケースであれば
話は違ってくる。

34:132人目の素数さん
08/12/03 19:00:11
>>26
本当は分布の検定だけど、知識なさそうだから
信頼区間を求めて入ってるかどうかで判定すれば?

35:132人目の素数さん
08/12/03 19:50:51
>>28
と同じ大学で同じ授業でワロタ
困ったときは2ちゃんねるwww

36:132人目の素数さん
08/12/03 19:52:07
>>35
おまえら大学どこだよ

37:132人目の素数さん
08/12/03 20:05:14
もう>>23の家に集まってやれよw

38:132人目の素数さん
08/12/03 21:10:45
大学の宿題を2ちゃんに
投げるのはいかがな
ものかと。まあ>>23
いいけど丸投げもたまに
あるからなあ。

39:24
08/12/04 01:32:38
>>25
観測個数47って、そういうケースとしては少ないなあ
と思ってたんだけど、今気が付いた。47って都道府県別データか?
だと北海道(変数による)とかを除いて推定したら、有意じゃなかったりしてw
大学のレポートなら、P値だけじゃなく、グラフも見ろよという例かもね。
もう提出期限すぎて手遅れみたいだけどw

40:25
08/12/04 21:32:28
>>39
いろいろサンクス。
提出する直前に周りの奴の見せてもらったら、
他にも似たような結果になっている人も多かったので、多分単位は大丈夫です。
なぜそうなるのか、ってとこまで考えて本当の勉強なんだろうけどww

41:132人目の素数さん
08/12/05 00:18:01
分布の検定ってどうやるの?

42:132人目の素数さん
08/12/05 03:19:44
稲垣宣生著 数理統計学を授業でやってるんですが、
ついていけないので自習しようかと思ってます。
この本は演習の解答が省略されすぎで自習できないので

で、この本のレベルについていける演習所とか問題集ってありますか?
本屋でざっと探したところ、レベルの低いものしかなかったんですが・・・

43:42
08/12/05 03:21:44
言葉が抜けた

この本は演習の解答が省略されすぎで、この本だけでは自習できないので

44:132人目の素数さん
08/12/05 12:27:42
>>41
適合度検定

45:132人目の素数さん
08/12/05 14:15:58
>>40
この時期に単位が出ると大学といえば、
国内で限られてくるよね。ニヤニヤ

46:132人目の素数さん
08/12/05 14:49:15
このスレの住人はルベーグ積分はなにで勉強しましたか?
やっぱ伊藤清三先生の本とか?


47:132人目の素数さん
08/12/07 13:18:06
オマンチン

48:132人目の素数さん
08/12/08 15:22:31
ゆとり用の統計学テキストおしえてください
経済分析のための統計的方法って本読んでるけどワケワカメ
IQ20でもわかるゆとり本を教えてください
ネバーギブアップ

49:132人目の素数さん
08/12/08 17:41:02
>>48
URLリンク(www.amazon.co.jp)

50:132人目の素数さん
08/12/08 19:24:22
出ると思ったw

51: ◆9Btz0kAixw
08/12/08 21:21:28
すみません。
非定常データ(予算支出)を定常化したいのですが、
adf.test(x)とpp.test(x)とでp値が違うのがよくわかりません。
両方とも、
帰無仮説:単位根あり
対立仮説:単位根なし
ですよね?変化率に変換することで定常化されたか確認したいのですが、これは、どうなのでしょうか。

> x <- Dataset$V2

> pp.test(diff(x)/x[1:length(x)-1])

Phillips-Perron Unit Root Test

data: diff(x)/x[1:length(x) - 1]
Dickey-Fuller Z(alpha) = -39.5082, Truncation lag parameter = 3,
p-value = 0.01
alternative hypothesis: stationary


> adf.test(diff(x)/x[1:length(x)-1])

Augmented Dickey-Fuller Test

data: diff(x)/x[1:length(x) - 1]
Dickey-Fuller = -2.3884, Lag order = 3, p-value = 0.4181
alternative hypothesis: stationary

52:132人目の素数さん
08/12/08 21:52:21
>>48
岩田さんの本ね。
つうことは慶応かな?
あの本は院生向きなんで
初心者向けじゃない。
ただ全部が全部理解不能
ってこともない
と思うが…。

53:132人目の素数さん
08/12/08 22:37:50
貴方一体なにもの!?
くわしすぎ・・・w

あの本は難しすぎます・・
でもマンガの本は簡単すぎます・・

54:132人目の素数さん
08/12/08 23:54:09
独立な確率変数x,yが、それぞれ区間[-1,1]の一様分布に従う時、
以下の確率変数u,vについて共分散、独立性を調べよ。
u=x+y
v=x-y

55:132人目の素数さん
08/12/09 02:12:25
             ___,,,,,..... -一ァ
         / ̄;;;´;;、;;;ヾ;;;, -─--、,!
.        /'´|;;;;,、;;;;;;;;;;/      ,!
.         /:.:.:.レ´:.ヾ;;;;;;i   断  だ ,!
       /:.:.:.:.:.:.:.:.:.:.:ヾ;i  る  が ,!
.      /:.;.イ:.:.:.:.:.:.:.:.:.:..ヽ       ,!
.       /レ' ;|:.:.:.:.:.:.:,:ィ:.:.:.:〉 __,.,!
     /-、ヽ,:|:.:.:,/ /:.:.://.:,:ィ:.:.:.,!
      /'ヽ、ヾi ゙´.:   /__;:;:-'"´ ,;|:.:.:.,!
.    /ゝ-`';:/ .:〈ニ=-=ニ二 ̄ヽレ',!
   /::::;;;;;/  ' ,, ニ`ー-,、__\〉ィ,!
.   /;:::::/ ::.    ::.,,\_ゞ;'> 〈;,!
  /i!:::::iヾ-'、::..       '';~ ,;:'/,!
. /;;;i!fi´l_、,.`        .: ,;:'  ,!
/;;;;;i' ('ー、ヽ      ..: ,;:''   ,!
ヽ、jゝ、`ヾ:、゙、   ,..:'.:'"    .: ,!
   ``ヽ.、_ ¨`  ,:'      (_r:,!
       ``ヽ.、..    ノr;ソ~,!
             ``ヾ、 / 7,!
                 ``ヽ,!

56:132人目の素数さん
08/12/09 02:30:37
ゆとり用つったから書き込み式の本とかを探してるのかと思ったよ。
とりあえず東京大学出版会から出てる奴とかを読めば良いんじゃない?

57:132人目の素数さん
08/12/09 12:54:56
>>54
>・・・調べよ。

>>55は断わったけど、俺は調べたよ。でも教えない

58:132人目の素数さん
08/12/09 21:46:48
>>56
じっくり読んでる時間がないので目がちかちかするような本じゃなくてハンバーガーの本買いました
どうもありがとうございました

59:132人目の素数さん
08/12/10 00:37:42
質問です
"ある調査機関は、25%の世帯が過去三年間に少なくとも一度は引越ししていると発表した
ところで、500世帯に対してインタビュー調査をしたところ、
120世帯が過去三年間に一度は引越ししたことがあるという結果を得た
有意水準5%でこの調査機関の発表が正しいか検定せよ"
という問題についてなんですが
自分がやったやりかたでは
25/100-120/500
――――=0.523
√120*380/200^3
となり正解の統計量-0.5155と違います
何が間違っているのか教えてください

60:132人目の素数さん
08/12/10 07:20:11
RのライブラリMASSの中にあるBostonデータで、どんな地域で犯罪発生率が高いのかを
調べたいのですが、どのような分析をしたらいいですか?

> Boston
crim zn indus chas nox rm age dis rad tax ptratio black lstat medv
1 0.00632 18.0 2.31 0 0.5380 6.575 65.2 4.0900 1 296 15.3 396.90 4.98 24.0
2 0.02731 0.0 7.07 0 0.4690 6.421 78.9 4.9671 2 242 17.8 396.90 9.14 21.6
3 0.02729 0.0 7.07 0 0.4690 7.185 61.1 4.9671 2 242 17.8 392.83 4.03 34.7

-------------------

504 0.06076 0.0 11.93 0 0.5730 6.976 91.0 2.1675 1 273 21.0 396.90 5.64 23.9
505 0.10959 0.0 11.93 0 0.5730 6.794 89.3 2.3889 1 273 21.0 393.45 6.48 22.0
506 0.04741 0.0 11.93 0 0.5730 6.030 80.8 2.5050 1 273 21.0 396.90 7.88 11.9

crim 人口あたり犯罪発生率
zn  一定面積以上の宅地の割合
indus 小売以外のビジネス用の土地の割合
chas Charles川に面しているか(yes=1,no=0)
nox 窒素酸化物の濃度
rm  平均部屋数
age 1940年以前建築物(自家用)の割合
dis 5つのボストン中心部(職場)への距離の加重平均
rad 放射線状のハイウェイへのアクセスの容易さ
tax 不動産税率(1万ドルあたり)
ptratio 生徒と先生の比率
black 黒人の比率をBkとするとき、1000(Bk - 0.63)^2 の値
lstat 下層階級の人口比率(%)
medv 住宅価格の中央値



61:132人目の素数さん
08/12/10 13:59:39
>>59
分母が違う。分子も逆。
あと微妙に模範解答の
数値も違う気がするが
まあ誤差の範囲だろう。
すぐ人に聞くのは
やめて、教科書の
母比率の検定の部分
を再度読み直す
ことを勧める。


62:132人目の素数さん
08/12/10 21:52:50
なんであなたはそんな
変な改行の仕方をする
んですか?読みづらくて
仕方がありません。

63:132人目の素数さん
08/12/11 00:23:26
携帯だからだろう

64:132人目の素数さん
08/12/11 13:34:35
重回帰分析の際に独立変数間に強い相関があると多重共線性の問題が生じますが、
偏相関分析ではそのような問題は生じないのでしょうか?
例えば、AとBに強い相関があるとき、Bを制御変数にしてAとCの偏相関を求めると
係数が不安定になるなどの問題は起こるのでしょうか?
数式を見てもよくわかりません……。ご教授ください。

65:132人目の素数さん
08/12/11 13:46:53
>>64
その場合だと
偏相関係数は
A-B,B-C間の相関性の
影響は取り除かれる
ような数式のはず。

66:132人目の素数さん
08/12/11 15:27:45
Excel VBAでのガウシアンフィッティングの仕方について教えて下さい。

A1・・・A1001にx軸の値が
B1・・・B1001にy軸の値が入っているとします。
このデータをグラフ化したのちに、ガウシアン関数y=a+b*exp(-(x-c)^2/d^2)に対してフィッティングを行い、それぞれの定数を算出及び、その算出されたグラフを上に乗せるということをしたいのですが、
Excel VBAを使ってどのようにすれば良いのでしょうか?

また、ピークが1本ではなく2本ある場合Multipeak Gaussian fittingというものでそれぞれのピークに対してフィッティングすることもできるそうなのですが、できればその方法についても教えて頂けないでしょうか?

自分でひな形くらい作って質問したいところですが、全くどうやって作れば良いのか検討もつかないのでどなたかよろしくお願い致します。

67:59
08/12/11 17:44:35
>>61
ありがとうございます

68:132人目の素数さん
08/12/11 19:15:47
計量経済学を学んでいる者です。
確率・統計の数学テキストを探しています。
しかし、巷にあるテキストや入門書だと、
証明を抜かしていたり、適当な説明で終わっていて
消化不良になってしまう。

そこで、少なくとも集合の基礎から書き起こしてあるくらいの、
解説のしっかりした確率・統計のテキストが欲しいと思っています。
なにか、定評のある、お勧めのテキストはご存じないでしょうか。

69:132人目の素数さん
08/12/11 20:17:15
>>66
こんなページはあるぞ。
URLリンク(nuclear.phys.tohoku.ac.jp)

70:132人目の素数さん
08/12/11 21:22:56
>>64
AとCの偏相関係数の式で、ABの相関係数を 1 に近づけてみればわかるよ。

71:132人目の素数さん
08/12/11 21:50:26
>>68
URLリンク(www.amazon.co.jp)

72:132人目の素数さん
08/12/11 22:17:05
>>71
いきなり英語で書かれた数学文献とは、なかなか厳しい
しかも2万3千円とは・・・

73:64
08/12/11 23:55:37
>65

レスありがとうございます。
そうだとは思うんですがどうも確証がもてなくて質問した次第です。

>70

ABの相関が高くなるとACの偏相関は小さくなっていく…ということでしょうか。

そもそも重回帰を数式レベルで理解していないので
偏相関との違いがわからず、多重共線性がなぜ生じるか(実際にどう係数が不安定になるのか)
というのがピンと来ないんですよね…。
重回帰のほうも勉強してきます。

74:132人目の素数さん
08/12/12 01:08:26
>>71
ちょw
ケンドールかよ…
この本出されたら平伏すほかない

75:132人目の素数さん
08/12/12 01:17:30
今のテキストはヤワだかんな。
昔は大学院1年目のテキストが
ケンドール&スチュワートの第一巻だったとか、、、

76:132人目の素数さん
08/12/12 02:03:55
>>73
マルチコリニアリティ(多重共線性)
は経済系の統計本に
載ってることが多い。
一例として
東大出版会の
「人文社会科学
の統計学」。
偏相関も重回帰も、
もっと言えば分散分析も
手法は違うが、発想的
には同じなんだけどね。
偏相関と回帰については
田中勝人さんの
「計量経済学」が
分かり易いと思う。

77:132人目の素数さん
08/12/12 20:39:45
場違いであるとは重々承知しておりますが、わたくし、宝くじ板の
【甲第弐拾五号証】ロト6・宝くじ・イカサマの可能性 というスレから
お邪魔させていただきます。
皆さんはどう思われますか。

392 :なんでだろー:2008/12/12(金) 18:33:46 ID:4phcCKn1
偏りのない数字に、理論値にかなり近い結果となりました。
第424回(08.12/11)03・13・17・25・40・41・B04
販売実績 22,388,787口
    理論値       実際
1等  3.7口      5口 (理論値×1.35)
2等  22.0口     22口 (理論値×1.00)
3等  793口      774口  (理論値×0.98)
4等  36,688口   37,821口  (理論値×1.03)
5等  570,695口  575,531口  (理論値×1.01)

393 :なんでだろー:2008/12/12(金) 18:36:46 ID:4phcCKn1
となると、第409回とかやっぱり不思議。
第409回(08.08/28)06・13・17・27・28・36・B33、キャリーオーバー発生中
販売実績 25,854,451口
    理論値       実際
1等  4.2口      6口 (理論値×1.43)
2等  25.4口     44口 (理論値×1.73)
3等  916口      1,497口  (理論値×1.63)
4等  42,367口   59,388口  (理論値×1.40)
5等  659,036口  805,669口  (理論値×1.22)
今回と特に変わらんような並びの数字と思うが、理論値をかなり上回る…
なんでだろー

78:132人目の素数さん
08/12/12 22:07:41
>>73
「プログラミングのための線形代数」ってのが、オーム社からでてる。
プログラミングのためのと書きながら中身は線形代数のわかりやすい教科書。

この中に画像処理の具体例でマルチコの問題点が示してある。

具体的には犬の画像を行列で変換する、それにノイズを乗せた上で
逆行列で元に戻す。これって、回帰分析とやってることは一緒。
ある情報(上記では変換されてノイズの乗った画像)から、ある情報
(基の犬の画像)を推定(再現)するってことね。

著者としてはデジカメとかの画像処理の話として説明しているけどね。

このとき、行列に含まれるベクトル(行または列ってこと)が似たよう
な状況(向きが近いってこと)だと、基の画像を再現するときに、ノイズ
が拡大されて、基の画像がうまく再現できなくなる。

マルチコってのは、似たようなベクトルを使って基の状態を再現しようと
するために、ノイズを拡大させてしまうこと。

行列の変換と面積の関係を理解した上で、逆行列をかけるとどうなるか
と考えるとわかりやすいと思うよ。

79:132人目の素数さん
08/12/13 01:09:54
>>77
どんな理論値かそれが正確でないだけだろ。

80:132人目の素数さん
08/12/13 16:45:41
>>78
線形空間なら、一次独立なベクトルの組(基底)と空間の次元で
終わってしまう話。
あとは、データと浮動小数点形式仮数部有効桁数の限界を
どう回避するか、と言った情報処理技術の問題だよな。

線形代数学や数値解析を知らないで、多変量解析を扱うのは、禁止すべき

81:132人目の素数さん
08/12/13 17:30:19
ルベーグ積分はどの本で学んだ?

82:132人目の素数さん
08/12/13 17:36:12
>>80
経済学、経営学でマルチコを教えるときに、変に数学的な説明を回避
するのでおかしなことになる。

一次独立なベクトルが取れなければ逆行列が計算できないので、俗に
いうマルチコは、基底を似たような方向で取ると逆行列による変換で
サイズの変化が大きくてデータにノイズがある場合は信頼性が失われ
る、ってだけなんだよね。

そこに検定を絡めてどれくらいなら許容できるかを考えないといけない
のはあるけど、基本的な発想を抜きにマルチコ、マルチコいってるのが
経済、経営に多いのが現状。

線形代数を学べば、自明で終わる話。

83:132人目の素数さん
08/12/13 19:57:08
質問させてください。
ある薬の効果があったものが
A群は14人中6人
B群は25人中3人
この両群の間に有意差があるのかどうかを求める場合には
どのような手法でどうやったらいいでしょうか?

84:132人目の素数さん
08/12/14 00:49:48
母比率の差の検定

85:132人目の素数さん
08/12/14 01:16:34
1要因3水準の分散分析を行ったところ,主効果に有意な差が認められた
次に多重比較を行ったら有意な差が認められなかった

一体,どういう事なんだろうか? 教えてエロイ人

86:77
08/12/14 02:21:05
>>79
レスありがとうございます。
理論値は、販売実績に各等の確率をかけて適当なところで四捨五入しました。
ロト6では、購入者が作為をもって6つの数字を選ぶわけですから、
なかなか理論値通りにいかないのは当然と思いますが、それでも第409回は
あまりに異常なんではないかと感じてしまう次第です。
特に当せん数字が偏ってるわけでもないのに。

87:132人目の素数さん
08/12/14 04:21:33
質問お願いします。

ベイズ確率と物理って何か関係あるんですか?
たとえば統計物理学とか。

88:132人目の素数さん
08/12/14 12:41:33
>>85
たぶん多重比較はTukey法だろう。
そうだとすると簡単な説明で言うと分散分析の棄却域は○型で
多重比較の棄却域は□型。うまく重ならないところで
そういうことは起こりうる。
そういうもんだと諦めるか、もっと高度な多重比較法を使う。


89:132人目の素数さん
08/12/14 12:47:22
>>86
ネットを探せばあると思うが、選ぶ数字の好き嫌いは結構偏りがあり、
それは数字の見かけの偏りだけではない。
たとえば、後者は6つの数字の内、5つがカレンダーに出てくる数字。
(自分の誕生日やなんらかの記念日を入れたいと思う人は多いらしい。)
そういった影響(他にもあると思う)があるのだろう。


90:132人目の素数さん
08/12/14 12:54:29
>>87
「ベイズ統計と統計物理」でぐぐれ。

91:85
08/12/14 17:51:41
>>88 レスサンクスです ちなみに統計処理はSASで多重比較はTukeyでした
   しかし、卒研でこの部分の結果と考察はマジ書き辛い どう言葉で説明してよいやらorz

92:132人目の素数さん
08/12/14 19:51:02
>>91
SASは今のバージョンだと高度な多重比較はできないんだっけ?
見てくれる人がその高度な多重比較を理解してくれているなら
手動でやる手もあるんだが。


93:77
08/12/14 21:09:02
>>89
なるほど。そのお答えでもう頭を悩ますことはやめます。
ありがとうございました。

94:132人目の素数さん
08/12/14 21:29:38
>>90 Thx
よく見たら本棚に眠ってたよその本。これから読んでみる。

95:132人目の素数さん
08/12/14 21:29:44
>>83
#分割表でいかがでしょう?

分割表
14.000000 6.000000 20.000000
25.000000 3.000000 28.000000
39.000000 9.000000 48.000000


期待値
16.250000 3.750000
22.750000 5.250000


検定統計量χ2はこれらの総和
0.311538 1.350000
0.222527 0.964286


帰無仮説:各群の母比率に差はない
χ2乗 = 2.8483516
P値 0.0914677
chi(0.05,1) = 3.8414651
帰無仮説を採択

続く

96:132人目の素数さん
08/12/14 21:30:39
イエーツの補正(連続性の補正)を適用した場合
帰無仮説:2群の母比率に差はない
χ2乗 = 1.7230769
P値 0.1892972
chi(0.05,1) = 3.8414651
帰無仮説を採択


注意 期待値が5未満のものが20%以上あります
フィッシャーの正確確率検定を適用

フィッシャーの正確確率検定(二項分布にもとづいて計算をする)
帰無仮説:2群の母比率に差はない
片側検定のP値 9.5387756618744282e-02
帰無仮説を採択
両側検定のP値 1.3657118428676662e-01
帰無仮説を採択



行と列に対応がある場合
b+cが充分大きい場合、マクネマー検定(χ2乗検定)でも良い
ここでは、二項分布にもとづいて計算をする
帰無仮説:行と列で変化はない
両側検定のP値 8.7791029363870621e-04
帰無仮説を棄却

#「行と列に対応がある場合」は不要かも知れない。
#あなたが、判断しておくれ。
#の無い行は、PCからの出力。コーディングはおいらなので、とても怪しい。


97:132人目の素数さん
08/12/15 13:42:48
来年統計学の研究所でなにか研究するんだけど、
卒業研究の課題で面白い課題ない?

98:132人目の素数さん
08/12/15 15:07:27
>>95
14人と6人の合計20と
25人と3人の合計28人
を何に使ったの?

99:132人目の素数さん
08/12/15 20:09:31
>>97
ジョークだよな?
それとも研究室の間違い?

100:132人目の素数さん
08/12/16 01:36:31
正規分布、平均50SD10の、30〜100の平均値とその計算式が分かりません。
65ではなく、いわば面積です。
学校の宿題ではないので、ご教授頂けると幸いです。
失礼あるかと思いますが、よろしくお願いいたします。

101:132人目の素数さん
08/12/16 08:24:25
>>100
とりあえず、ちょっと遠まわしに

基準化して、30と100にあたるところを正規分布表で探す。
で、100にあたるところから30にあたるところを引けば面積がわかる。

102:132人目の素数さん
08/12/16 10:20:13
>>100
なんで面積(確率値)
なのを平均値って
言ってるんだ?

103:132人目の素数さん
08/12/16 11:10:38
>>102
たぶん、テストかなんかで0点から100点で平均が50点、標準偏差が10の時に、
30点以下を除外(不可かな?)したときの平均点が知りたいんだと思う。

104:132人目の素数さん
08/12/16 12:57:24
>>97
「卒業研究における、自主的な課題選択の系時的変化と地域性」
なんてのどうだ



105:132人目の素数さん
08/12/16 13:04:18
>>103
サンクス。
そうじゃないかなとは
思ったけど…。
質問者の意図が
掴みにくい
ことがあるね。
できる限り正確に
お願したい。


106:132人目の素数さん
08/12/16 13:54:52
>>103
そうか、偏差値ね。

>>100
偏差値30→素点A を求め
素点A 以上の点数の人だけの平均値を計算

じゃないかな

107:132人目の素数さん
08/12/21 00:28:26
数学的にきれいなので各種分布とかを全部連続関数に直して使ってるんだけどどんな問題がある?

108:132人目の素数さん
08/12/21 09:09:29
いみふ

109:132人目の素数さん
08/12/21 13:31:09
離散を連続ってことか。
ケースバイケースだろうな。

110:132人目の素数さん
08/12/21 17:08:45
>>107
例えば、ベルヌーイ分布 X=0, 1, P(0)=1-p, P(1)=p を「連続化」したとして、
それを何に使うんだ?

111:132人目の素数さん
08/12/21 23:29:38
>>110
最尤法とか?

112:132人目の素数さん
08/12/22 00:10:03
107と目を合わせちゃダメーーー!

113:132人目の素数さん
08/12/22 00:29:28
超準解析を確率論に、ってとこ?

114:132人目の素数さん
08/12/22 01:12:49
>>98
んーとね、たぶん期待値のところ。

115:95
08/12/22 01:52:16
おっと、読み違えてたのね。
分割表
6.000000 8.000000 14.000000
3.000000 22.000000 25.000000
9.000000 30.000000 39.000000


期待値
3.230769 10.769231
5.769231 19.230769


検定統計量χ2はこれらの総和
2.373626 0.712088
1.329231 0.398769


帰無仮説:各群の母比率に差はない
χ2乗 = 4.8137143
P値 0.0282343
chi(0.05,1) = 3.8414651
帰無仮説を棄却

続く

116:132人目の素数さん
08/12/22 01:52:52
イエーツの補正(連続性の補正)を適用した場合
帰無仮説:2群の母比率に差はない
χ2乗 = 3.2323571
P値 0.0721968
chi(0.05,1) = 3.8414651
帰無仮説を採択


注意 期待値が5未満のものが20%以上あります
フィッシャーの正確確率検定を適用

フィッシャーの正確確率検定(二項分布にもとづいて計算をする)
帰無仮説:2群の母比率に差はない
片側検定のP値 3.7815029650643352e-02
帰無仮説を棄却
両側検定のP値 4.7455563484725571e-02
帰無仮説を棄却



行と列に対応がある場合
b+cが充分大きい場合、マクネマー検定(χ2乗検定)でも良い
ここでは、二項分布にもとづいて計算をする
帰無仮説:行と列で変化はない
両側検定のP値 2.2656250000000000e-01
帰無仮説を採択


117:132人目の素数さん
08/12/22 02:17:34
外の人なので、スルーを推奨。
と、自分で言っておこう。

統計は計算量が多いので、近似で済ませることが多い。
教育現場でも、0〜100しかないし、左右対象でもないのに、正規分布に近似して、偏差値出すし。
おいらが学生の頃は自由度に小数ついたものは、教えてくれなかった。

118:132人目の素数さん
08/12/23 11:48:27
有斐閣の『統計学 (New Liberal Arts Selection)』って
入門書プラスαとして結構いい感じだ
エクセルの使い方も学べるし、ボリュームもある
あれ一冊でかなりカバーしてると思う

119:132人目の素数さん
08/12/23 19:27:54
>118
URLリンク(aoki2.si.gunma-u.ac.jp)
URLリンク(oku.edu.mie-u.ac.jp)


120:132人目の素数さん
08/12/23 20:31:32
初歩的な質問すみません。

確率変数Xと関数gに対して、
g(X)の期待値を
E(g(X))=∫g(x)f_X(x)dx   (f_X:Xの密度関数)
と定義すると書いてあったのですが
これってY=g(X)自体を別の確率変数と見て(その密度関数は新たにf_Yとなりますが)
E(Y)=∫xf_Y(x)dxを計算しても、実は同じ結果になるってことですか?
でないとwell-definedじゃないですよね?

121:132人目の素数さん
08/12/23 20:56:28
>>120
積分の変数変換を思い出せ

122:132人目の素数さん
08/12/23 21:28:06
>>121ありがとうございます。とりあえずgが同相写像の場合はできました。

123:132人目の素数さん
08/12/23 21:35:31
>>120
E(Y)=∫y*f_Y(y)dy
を面積要素に注意して
変数変換すればいい。
面積要素を忘れやすい
から注意。


124:チャコ
08/12/23 22:43:19
高一の冬休みの宿題教えて下さい!!

等式(12−ルート3)a−(1−2ルート3)b=ab+3cルート3
を満たす正の整数の組(a,b,c)をすべて求めよ。

全然分からないので、できれば解き方と一緒に答えを教えて下さい

125:132人目の素数さん
08/12/23 23:01:24
>>124
難しすぎてわからない

126:132人目の素数さん
08/12/23 23:27:06
経済分析の統計的方法 とかいう本は数学科の学生でもそれなりに満足できる内容ですか?
回帰分析の説明が詳しいという話を聞いたんですが

127:132人目の素数さん
08/12/23 23:40:06
>>126
「経済分析のための統計的方法 第2版」岩田 暁一

ならば、いい本だよ。
ただし、実際の分析手法ではなくて、数理統計的な理論的背景を説明している本という意味ね。
特に回帰分析が詳しいとは思わないけど、行列を使った説明も含めてそれなりに満足できる本だと思う。

128:132人目の素数さん
08/12/23 23:43:22
>>127
わかりました。ありがとうございます

129:132人目の素数さん
08/12/24 00:08:24
ちょっと経済学の要素が強いけど、回帰分析なら「計量経済学の基礎」(戸田山田)東大出版
がオヌヌメ。matlabの擬似ソフトoctaveの使い方も説明されてる 計量経済学なんて書いてるけど
理論に偏ってるから経済学以外の人もいいと思う

130:132人目の素数さん
08/12/24 02:06:18
>>126
結構難しいけどね。
ただ岩田さんの本に
限らず、回帰分析自体
が線型代数の知識が
ないと深くは理解
できないと思う。
Σ計算だけでも
出来なくは
ないだろうが、
多変数になると
複雑すぎる。
線型代数は微積と
同じくらい重要。

131:132人目の素数さん
08/12/24 12:06:25
多変量二項分布ってありますか?

例えば,
X1 〜 B(n1,p1)
X2 〜 B(n2,p2)
で X1 と X2 は互いに独立ではないとして、
離散のデータの組 (x11,x21),(x12,x22)…(x1m,x2m)
からモーメント法(じゃなくてもいいですが)で
(X1,X2) の確率関数を推定したいのですが、
どうしたらいいでしょうか?

変数変換したら多項分布とみなせるのでしょうか?

質問が多くてすみません。ヒントや参考になりそうな本がありましたら
お教えください

132:132人目の素数さん
08/12/25 01:56:30
《124 a=1 b=11 c=1/3を代入して見てください。合っていたら解法書きます。

133:132人目の素数さん
08/12/25 02:44:15
オレは、118 じゃないけど。

>>119
スゲーな、それ。
Excel の危険性の具体的なものを、初めて知った。
もっと周知させるべきだ。

経営者が、販売分析などやって痛い目にあうのは、ありえる。
向上心のある農家でも、統計とか使いそうだし。
医療関係だともっと怖い。

134:132人目の素数さん
08/12/25 04:05:32
>>133
URLリンク(www.forest.impress.co.jp)
こっちの方も怖いです。


135:132人目の素数さん
08/12/25 04:19:48
Excelのひどさが認識されるのは良いことだな。

ただし問題は「MSという企業がダメ」なのではない。(確かにダメダメだがw)
「オープン・ソースでないソフトウェアが持つ宿命」だということ。
世の中はソフトウェア著作権保護ややアルゴリズム特許(人類の自殺行為)とかで、
これに完全に逆行しているが、その行き着く先はMSワールドだという警鐘。

Rが良いのはオープン・ソースだから。これはもう決定的な違いと言って良い

136:132人目の素数さん
08/12/25 06:41:02
>>124
マルチ

137:132人目の素数さん
08/12/25 08:18:49
いま経済統計のお勉強で、
正規分布の確率密度変数を使っているんだけど
この複雑な式の意味がさっぱりわからない
どの教科書見てもさらっとすまされていて
この式の記号がなにを意味してるかわからない
統計の数学全般についていえることだが、教科書が消化不良をおこすようにできてると思う
もっと詳しくよく納得できるような確率・統計の本ってないの?

138:132人目の素数さん
08/12/25 12:59:13
そこにはまっちゃったか・・・
>詳しくよく納得できるような
理数系出身ではなさそうなので、数理的な解釈に走ろうとなるとこりゃ大変
う〜〜ん


139:132人目の素数さん
08/12/25 13:35:09
>>137
統計学で正規分布の「式計算」は必要ないから、「実はこんな式だよ」と紹介するだけの本ばかりなのはしょうがない。

式の意味がわかりたくて、もし指数関数の微積分すら知らないレベルならあきらめるか、高校の理系教科書から始めるしかない。

指数関数を知ってるなら、正規分布の確率密度関数はeの肩が2次関数になっただけだから、それほど複雑な関数ではない。

いちばん簡単な2次関数はx^2。だからいちばん簡単な正規分布はe^(x^2) …と言いたいとこだけど、
これじゃxが大きくなるといくらでも大きくなって発散してしまうからマイナスのほうの2次関数でないとだめなので、e^(-x^2)

本質的にはこれだけだけど、確率密度ってことで積分して1にならないといけないから、e^(-x^2)の積分値で割っておく。
ちょうどベクトルを自分の長さで割って単位ベクトルにするようなもん。
その"規格化定数"が1/(√(2π))というのはちょっと難しい計算がいるけど、しょせん定数倍の調節にすぎない。

中心の位置や広がり具合が変化した一般の場合は、
2次関数で頂点の位置や開き具合が変化したものが a(x-p)^2+qになるのと同様。
ただし原点を通る2次関数しか考えないので、qはなくって、a(x-p)^2 でよい。
だから一般の正規分布は、要するに e^{-a(x-p)^2} という関数。

ただしa>0なのと、eの上に乗ってるせいで「aが小さい方が広がる」ことになるので、
aのかわりに1/σ^2と書く(こうすれば自動的に正だしσが大きいほど広がる)。
あと頂点のx座標はpじゃなくてmとかμを使う習慣。
なので e^{-(x-m)^2/σ^2} と書くことになるが、文字が変わっただけでしょ。

それと、積分値を1にするための調節の定数倍が、σの影響を受けて、1/(√(2π)σ)になる。
で結局1/(√(2π)σ)・e^{-(x-m)^2/σ^2} となる。

たしかに文字はいっぱいあるけど、定数・e^{2次関数}で、2次関数が平方完成された-a(x-p)^2の形になってるだけだろ?
傾き1で減点が頂点なら √(2π)・e^{-x^2} と簡単になるし(標準正規分布)、
一般の場合はこれを変数変換しただけ。

140:132人目の素数さん
08/12/25 14:07:13
正規分布の
確率密度関数の
証明はモーメント母関数
によるのが
解りやすいかな。
数理統計の教科書には
大抵載ってると思う。
1回は証明を理解
した方が良いかな。
自分で証明できんでも
いいけど、気持ち悪い
でしょ。出来る限り
丸覚えは避けられたい。

141:132人目の素数さん
08/12/25 14:56:12
式が分かっても、おそらく、じゃあ何でそんな関数に持っていくのか?
というところから気持ち悪いんだと思うぞ。

142:132人目の素数さん
08/12/25 14:56:44
>>131
iidじゃないが
ベルヌーイ分布に従う
複数の確率変数…
多項分布?
多変量2項分布って
多項分布じゃ
ないのかなあ…。
互いに排反事象と
言える必要があるが。
それに詳しい本は
不勉強で申し訳ないが
知らない。
β分布やディリクレ分布
を勉強してみると
い%

143:132人目の素数さん
08/12/25 15:00:15
>>137
というか、それを理解できるための準備に時間をかけるよりも、とりあえずは
そういうものだっていう形で進めないと、講義が終わらんのよ。

疑問に思ったのなら、それよりも難しい本を読んで勉強しなさい。

それと、正規分布の形が真ん中(平均)が厚くて、すそに行くほど薄くなるって
のは式の形から読めるので、正規分布の形(釣鐘型)になってるなってのがわか
ればOK。
全区間(−無限から+無限まで)を積分して1になるってのも、数学できるんなら計算
すればわかる。

仮に、上に書いたことがわからないようだと、そもそも数学の基礎が弱いということ
なので、なおさら説明に時間をかけても無駄です。

144:132人目の素数さん
08/12/25 15:00:20
>>131
iidじゃないが
ベルヌーイ分布に従う
複数の確率変数…
多項分布?
多変量2項分布って
多項分布じゃ
ないのかなあ…。
互いに排反事象と
言える必要があるが。
それに詳しい本は
不勉強で申し訳ないが
知らない。
β分布やディリクレ分布
を勉強してみると
いいかも…。


145:132人目の素数さん
08/12/25 15:03:35
>>143 の書いているなんでそんな形になんて話になると、誤差と最尤法の話になるから
もっとわからんと思う。

とりあえず、使ってみてなれておいて、それから考えた方がいい気はするね。
(んなこといいながら、私は気持ち悪いので納得するまで調べたが。w)

146:132人目の素数さん
08/12/25 16:01:05
>>137
ということで、
正規分布は良く出てくるので式を理解したい気持ちはわかるが
裏には恐ろしい理論がかくれている(文系では、まずお手上げ)というのが
実態。
二項分布とかで、分布とは何かを理解して。
>>143 の言っているようなことを、
前提に利用を考えることが必要。
でないと、>>145 のような世界まで入らないと理解はできない。

ね〜〜、その方向に入ると、そら恐ろしいほど大変そうでしょ。
ちゃ〜〜んとした本が一冊かける理論になっちゃう。
まずは利用に徹しよう!!


147:137
08/12/25 16:42:58
一から出直してきます

148:132人目の素数さん
08/12/25 19:10:01
>>147
だから利用が無理というわけじゃないからね。
利用できるように正規分布の理論を用意してくれていると考えていいよ。
言い換えれば、そこまで理解しなくても、統計を使う・利用することはできる
ということ。
数理統計が専門なら別だけど、応用分野の人は専門家でも多くは
そういうレベルと思っていいよ。

149:132人目の素数さん
08/12/25 19:52:36
>>139
∫ e^{-x^2} dx = 1 / √π
あれっ?

150:132人目の素数さん
08/12/25 19:54:00
蒸し返すつもりは
全くないけど>>137
一般的な数理統計の
本に書いてある証明
くらいは理解した方が
よいと思う。
釣り鐘型の一般的性質や
誤差の議論なんかは
まあ興味があればだけど。
式にある√(2π)とかも
重積分知ってれば
理解しやすいし、
モーメント母関数とかも
超重要だからね。
強要するつもりは
ないのでただ使えれば
いいと言うなら別だが、
興味があるなら高校の
数VC辺りからでも
地道にやることを
勧めたい。急がば回れ。

151:149
08/12/25 20:28:42
あぁぁ.. orz
∫ e^{-x^2} dx = √π

152:132人目の素数さん
08/12/26 10:49:06
>>146
文系では、まずお手上げ

旧帝レベルなら十分に解るよ。


153:132人目の素数さん
08/12/26 11:01:31
>>149,>>151

>>139ではx^2の係数に一貫して1/2が抜けてるね。


154:132人目の素数さん
08/12/26 13:05:30
ちょっと中心極限定理
と勘違いしてた。
正規分布の確率密度
の証明はベルヌーイ分布から
導くことができる。
中心極限定理だと
モーメント母関数を用いる
んだったかな。
関係性は高いが。
>>152
地底とかでも
そうなんだが理論自体
というより所謂
文科系学生は
前提となる数学知識
が圧倒的に不足してる
ケースが多い。例えば重積分
も知らないとなると
上記の話はどうにも
説明できなくなる。
数VCも未習となると
もはや何も理解できない
に近い。

155:132人目の素数さん
08/12/26 22:34:00
>>152
旧帝レベルでも、文系の数学しかやってないと、積分のスキルが足りないので
全区間で積分して1になるが導けないと思うよ。

156:132人目の素数さん
08/12/26 23:42:58
今はPCが使えるから、数値積分で確かめさせれば良いと思う。
ソフトは表計算(ただしエクセル以外w)で十分だし、、、

それで数理構造に興味を持った奴だけが、
解析学と線形代数を勉強してから、統計理論をマスターする。

あと、統計コース修了資格も作って、上と下の資格は区別するとかね


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

4923日前に更新/272 KB
担当:undef