[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 02/24 22:49 / Filesize : 314 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

統計学なんでもスレッド2



1 名前: ◆OHr6mNLYV6 [03/11/08 19:44]
(´Д`;三;´Д`)
語って下さい.偉大な統計学を...
質問にはやさしいお兄さんが答えてくれます.

前スレ
science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
【 確率論・統計学の実用の仕方 】
science.2ch.net/test/read.cgi/math/1041865872/
こんな確率もとめてみたい その1/2
science.2ch.net/test/read.cgi/math/1029400897/
■確率制御■
science.2ch.net/test/read.cgi/math/1017042903/

862 名前:132人目の素数さん mailto:sage [04/08/25 18:58]
撹乱項って英語でなんていうか知っている人いたら教えてくださいです。

863 名前:132人目の素数さん mailto:sage [04/08/30 19:09]
love3.2ch.net/test/read.cgi/kageki/1093825381/

上記のurlは過激な恋愛板の『同誕生日の人に中出しするスレ』
ってやつなんですが、ここで参加人数をx人、男女比をr(r<1)
と仮定した場合、カップルが成立する確率は何%になるんでしょう。

1. 全体の中で少なくとも1組以上成立する確率
2. ある人(個人)が相手に巡り会える確率

この2つを求めてみたいなと思ってます。

同じトリップが1組以上成立する確率は、誕生日パラドックスの話と
ほぼ同じなんですぐ分かるんですが(参加人数130人でだいたい9割)
男女比を考慮した場合、自分の力不足のせいで少々苦戦してます。

男女カップルであり、かつトリップが同じ場合の
同時分布で解けそうな気配はあるんですが…よくわかりません。

詳細はリンク先のスレで確認お願いします。
男女比以外の条件は皆同等の確率と断定して考えてます。

初歩的な質問ですみませんがご教授よろしくお願いします。

864 名前:132人目の素数さん [04/08/31 07:56]
ダイエット法にホットサンド法(H法)とオートミール法(O法)がある。
それぞれの方法に挑戦した人の中から10人をランダムに選び、減少した体重を測定
して偏差平方和を計算したところ、H法の偏差平方和=88、O法の偏差平方和=44が得られた。
2つのダイエット法の分散は等しいと言えるか否か検討しなさい。
ただし、F表より F(9,9;0.025)=4.026 F(9,9;0.05)=3.179である。

865 名前:132人目の素数さん [04/09/06 15:41]
850

866 名前:7 [04/09/06 21:52]
867

867 名前:7 [04/09/06 22:01]
>854
ボンフェローニの調整では検出力で損をしてしまいます。
この場合、時点毎の検定統計量間に相関が出てきますので、その相関を考慮した、
解析が考えられます。手順としては、混合モデルで相関を割り出し、多変量t分布を
積分してp値を算出することになります。

868 名前:132人目の素数さん mailto:sage [04/09/06 22:58]
統計学を独学で勉強しようと思ってるんですが数学の知識はどれくらい必要ですか?
数学の知識ゼロです

869 名前:FeaturesOfTheGod ◆UdoWOLrsDM [04/09/06 23:00]
Re:>868 積分は確実に要る。

870 名前:132人目の素数さん mailto:sage [04/09/06 23:00]
FeaturesOfTheGod ◆UdoWOLrsDMは、ウザイよ。
引っ込め。



871 名前:132人目の素数さん mailto:sage [04/09/07 02:12]
>868
どの程度の統計学を勉強しようとしているのか分からないので一概には言えませんが、
簡単な多変量解析などであれば高校数学(理系)の知識があれば、
統計ソフトを使うのには申し分ないと思います。
より高度な統計を理解するには微積や行列の深い知識が欲しくなってきますが、
必要になったときに勉強すればいいと思います。
がんばってください。

872 名前:132人目の素数さん [04/09/07 21:53]
>>871
本当にそう思ってる?
100歩譲ってSPSSは使えてもSASは実用的には使えないだろうな。

873 名前:132人目の素数さん [04/09/07 22:09]
>>872
SASは使ったことないんで知らないけど、SPSSやJMPやRなら高校数学程度の知識で
十分実用的に使えるでしょ。
というか、事前の知識よりも新たな知識を身に付けようとする努力の方が重要。

874 名前:132人目の素数さん mailto:sage [04/09/07 22:33]
>>873
仕事で統計を使ってないでしょ?


875 名前:とおりがかりの統計人 [04/09/08 00:04]
うー、今年の統計学会(連合大会)は南国育ちのおれにしては
ちょっと寒かったなあ。
生まれて初めて岩手県にいったよ。

でも、昼食の混雑はどうにかして欲しかったなあ・・・。
ま、なんとか発表を終えてほっとしようかと思った
矢先に地震と台風だもんねー。
あー、忙しい忙しい。

あ、それとね、お願いだから統計スレッドでは初心者の
方にはやさしくしてあげましょうね。
でないと統計やってる人が嫌な人に思われると困るしね。
よろしこ!


876 名前:871 mailto:sage [04/09/08 01:05]
>872
SPSSは日常的に使用(主に多次元尺度法と重回帰分析で)。
SASは使ったことないです。他には構造方程式関連のソフトを使ったり。
僕自身、高校数学の知識があれば統計ソフトを使うのに申し分ないというのは本当にそう信じてますよ。
向学心さえあればなんとでもなりますし。

877 名前:132人目の素数さん [04/09/09 00:23]
質問です。
marginal anova,marginal meanというのは何でしょうか?
そのまま訳すと周辺分散分析?よくわかりませんでいた。

手持ちの統計本には載ってなかったので困っています。
また,ネットで検索してもHitしませんでした。
英語のページが3件ほどヒットしましたが,具体的な説明は載っていないみたいでした。

これらはいったいどのようなものなのでしょうか。。
日本語訳だけでもご教授いただけないでしょうか。お願いします。

878 名前:873 [04/09/09 23:01]
>>874
残念ながら、毎日のように業務で統計を使ってます。
SPSSメインでJMPも併用。
AMOS、R、Wekaは時々使うぐらいだね。

ちなみに、私自身は学生時代からずっと文系で来て、高校数学だって
怪しいぐらいの知識しかなかったけど、社会人になってから必要に迫ら
れて統計学を身につけた口です。

879 名前:7 [04/09/12 02:38:54]
>878
うらやましいです。業種は何ですか?よろしければ教えてください。
共分散構造分析はどんな場合(業種)で使われているのですか?

880 名前:871 mailto:sage [04/09/12 10:22:18]
僕の場合は共分散構造分析は認知心理学系のことで使ってます。
広く言えばマーケティングに利用できるかな、というかんじです。



881 名前:132人目の素数さん mailto:sage [04/09/12 11:30:51]
程度が低いんだろうな。

882 名前:132人目の素数さん [04/09/12 14:12:12]
spssをメインで使ってる香具師に、873のようなタイプが多いね。
ま、色々な考えの分析者がいて良いのではないでしょうか?
時々笑わせてもらいますが。

883 名前:7 [04/09/12 14:33:07]
>880
共分散構造分析は前から気になっていました。
ですが、パスの構成方法が恣意的になりがちではありませんか?
何かモデルの良さを表す指標はありますか?

884 名前:132人目の素数さん [04/09/12 14:49:08]
>873
手法の難易度と求められる完成度によりますね。
たとえば線形回帰でしたら数理的な部分がわかっていなくてもできるが、
最終成果物の普遍性を考えるとやはり奥深いところまで理解していたほうがいいですね。


885 名前:132人目の素数さん [04/09/12 20:46:06]
ふたつのものさし(ひとつは既製品、もうひとつは手作り)の精度を比較するため、ある長さを60回づつ測りました。
平均値はほぼ同じでその差0.2mmでした。SD値もやはりほぼ同じ。
これでふたつのものさしはおなじ精度だといいたいが、
 そんなばあいは何検定をしたらいい?


886 名前:7 [04/09/12 21:27:56]
>885
この場合に普通のt検定を使うと測定回数が多くなるとほとんど差が無いのに
有意になってしまう可能性が考えられます。
この場合はベイズ的アプローチによる仮説検定がよいでしょう。
あまり使われていないと思いますが、積極的に両軍が同じであると
いいたいときには特に有効な手法です。

887 名前:132人目の素数さん [04/09/12 21:28:57]
【速報】冨樫義博、来年3月で引退【衝撃】
comic6.2ch.net/test/read.cgi/csaloon/1094987914/


888 名前:871 mailto:sage [04/09/12 21:57:59]
>883
測定方程式と構造方程式をそれぞれ別々に評価しようとするとき、
同時に評価しようとするときなどで数多くの方法が提案されています。
ですが、これぞ決定版!というものがないのが現状っぽいです。

889 名前:873 mailto:sage [04/09/12 22:34:26]
>>879
> 共分散構造分析はどんな場合(業種)で使われているのですか?

↓ここらへんの事例と同じような使い方をしています。
www.interscope.co.jp/method/a03.html
www.eiyo.ac.jp/kenkyu/lab/s051/gyoseki2.html

890 名前:132人目の素数さん mailto:sage [04/09/12 23:08:17]
【社会】インターネット利用率ついに100%に−総務省の実態調査で判明

 先月27日に実施された、インターネット利用に関するアンケートで
 インターネットの利用率が100%となっていたことが明らかになった。
 麻生総務大臣は「これは政府主導によるIT政策の効果の現れと言っていいだろう」
 とのコメントを発表した。

 調査したのは、総務省統計局統計センターなど。今年四月に
 インターネット上でアンケートを実施し、約二万三千人から回答を得た。



891 名前:132人目の素数さん [04/09/14 01:30:09]
↑笑えるよね!
インターネット上でアンケート取って、
インターネット利用率が100%とは!
がっはっは!


892 名前:132人目の素数さん mailto:sage [04/09/14 01:47:18]
言われて気付いた俺はかなり鈍くなっている様だ。笑った!

893 名前:132人目の素数さん [04/09/14 02:14:14]
パチスロの設定6で負ける確率を統計解析するオレはさすがですか?

894 名前:132人目の素数さん [04/09/14 11:58:46]
下記のデータは50人の生徒の評価の分布です。
数値は人数で、50人は1学期と2学期で同一です。

    1学期  2学期
良い   3    5
やや良い  13   16
普通   21   17
やや悪い  7   7
悪い    6   5

「1学期から2学期にかけて改善したか」についての検定はいろいろあると
思いますが、このデータをカイ2乗検定をしても良いのでしょうか?
順序尺度だとカイ二乗はダメなのでしょうか。

895 名前:132人目の素数さん [04/09/14 12:25:20]
ANOVAについての質問です。 STATISTICAというソフトで計算したいのです。ANOVA自体は理解していると
思うのですが、STATISTICAでどういうふうにデータ入力すればいいのか判らないのです。実は判らないのはTWO−WAY ANOVA
です(レベル4X4)。何方か、いいWEB SITEとか知ってたら教えてください。
簡潔な説明でも結構です。別のところに書いたんですが、ここを見つけたので、ここにも貼っておきます。

896 名前:132人目の素数さん mailto:sage [04/09/14 19:42:30]
>>894
もし貴方のクラスにその50人しかいないのなら、検定は意味がありませんね。

その50人が母集団からのランダムサンプルなら、順位尺度以上で用いること
のできる検定をすべき。この場合U検定かな。

897 名前:132人目の素数さん [04/09/15 01:21:10]
> 894 >896
この場合は、生徒ごとに、たとえば2学期の成績から1学期の成績を引いて、
符号付順位和検定(確かこんな名前)をするべき。
もともと良い人は良く、もともと悪い人は悪くなりがちになる点を考慮したほうが
よいでしょう。


898 名前:132人目の素数さん [04/09/15 01:30:32]
>890
アンケートを取る所が交絡要因になっているんですね。
アンケートを取る際に陥りやすい点ですね。

899 名前:896 mailto:sage [04/09/15 09:33:14]
>>897
なるほろ

900 名前:894 mailto:sage [04/09/15 09:33:56]
>>896>>897

生徒ごとに差をとって中央値の検定することは決まっていたのですが、
50人分を集計して何かできないかと思い聞いた次第です。

やはり2人がご指摘の方法がベストのようですね。
ありがとうございました。



901 名前:132人目の素数さん [04/09/16 09:39:17]
質問です。当方高校の知識しかありません。
>>112-114を読んで自分も常々疑問に感じてたことが書かれていて安心しました。
ところで標準偏差のかわりに絶対偏差をもちいた有用な理論とか公式はありますか?

902 名前:132人目の素数さん mailto:sage [04/09/16 22:50:53]
>>862
cherry term

903 名前:132人目の素数さん mailto:sage [04/09/17 05:30:13]
>>901
金融工学の分野で、絶対偏差モデルみたいのはないこともない。

904 名前:132人目の素数さん [04/09/19 14:46:00]
過去ログ読んでも無いよう(自分がわからないだけ?)なので質問させていただきます。

例えば1/200の確率で当たり出ると言われているくじがあります。
しかし、当たりが本当に1/200で出るかはわかりません。

このくじの当たりが本当に1/200で出る検証をしたいときに、くじを引く回数をどの程度に設定したらその検証は信頼出来るものと言えるでしょうか?
また、その検証の信頼度を確率と試行回数の式で表せるならそれを教えてください。

更にお願いで申し訳ありませんが、それらの説明が載っているHPや参考文型等がありましたら教えてください。
お願いします。

905 名前:132人目の素数さん [04/09/19 19:22:43]
↑そのくじってn本なの、それとも無限にあるの?
それによってちょっと違うから。


906 名前:904 [04/09/19 20:04:08]
>>905
すいません、くじの本数は無限です。
ただ、無限に引くって事は無理ですし、出来るだけ少ない数で検証をしたい
って事です。

907 名前:132人目の素数さん mailto:sage [04/09/19 20:17:38]
あたりが出る確率が1.0000000000001/200である(1/200ではない)、
というような可能性も考慮しないといけないのなら、検証は事実上不可能。
あたりが出る可能性が実は0/200あるいは2/200、3/200、・・・である、
という可能性だけ考えればよいのなら、なんとかなる。どちら?

908 名前:904 [04/09/19 20:30:56]
なんどもすいません。
実際の確率の方は1/210や1/250、1/300の可能性があるかもしれません。
10001/2000000 このような確率にもなるかもしれません。

言葉足らずで申し訳ありませんが、「また」以降の「確率」とは1/200の事です。
実際の確率はわからないですが、確率を1/200と仮定してくじを引き、
その時に必要であろう試行回数との関係式があれば・・・

って事です。

909 名前:FeaturesOfTheGod ◆UdoWOLrsDM [04/09/19 20:33:37]
Re:>908 統計的確率が何に近づいているか、それが問題だ。

910 名前:904 [04/09/19 21:04:42]
>>907
すいません、今意味がわかりました。
ちょっとの違いなら検証する事が出来ないって事ですね



911 名前:132人目の素数さん mailto:sage [04/09/19 21:40:31]
FeaturesOfTheGod
ウザイ

912 名前:132人目の素数さん mailto:sage [04/09/19 22:55:44]
>>904

n回ふったときに、x回当たりが出る確率は二項分布
nCx (1/200)^x (199/200)^(n-x)
期待される当たり数(二項分布の平均) n*(1/200)
また二項分布の分散はn*(1/200)*(199/200)
nが十分大なら正規近似できると考えて、推定される95%区間は
平均±1.96*標準偏差
= n*(1/200) ± 1.96*√n*(199/200^2)
この区間になければ1/200ではない(と断言して間違っている確率は5%以下)
20000回くじをひく場合、当たりの回数が80〜120
10000                36〜64
5000 15〜35

逆におおよその当たりの回数が推定できるなら、
逆算すれば何回くらいかはわかるんでないかい

913 名前:132人目の素数さん mailto:sage [04/09/19 23:10:05]
>>858-861
「まだ出ていない目が出る」確率と考えると

・最初はどの目でもOK = 確率はn/n (=1)
・以降出ていない目が出るたびに (n-1)/1、(n-2)/n となっていく

ので、全部で

n/n * (n-1)/n * (n-2)/n * ... * 1/n  =  n!/n^n

となって、
平均は n^n/n! 回になるなのでは?
(この辺は861にある「1/nの確率は、n回やればいいだろう」とい考えと
同じ、つまり単純に確率の逆数で求めてます)

あーだめだ、自信ないわ

914 名前:132人日の素数さん [04/09/20 13:27:53]
>>912
回数が少なければ少ないほど標準偏差が大きくなります。
信頼区間内であることをもって、割合が同じとする考え方では、回数が少なければ
成立してしまうので、適切ではありません。
割合が同じかどうかの検証だけが目的でしたら、ベイズ流の仮説検定が考えられる
でしょう。

915 名前:132人目の素数さん [04/09/20 19:25:17]
分散分析を生物統計学で独学してます
記号の意味が分からないので教えて下さい
測定値 y(I,J) = U + A(I) + e(I,J)
U    全体の平均
A(I)  因子Aの水準Iの効果 
e(I,J) 測定値Y(i,j)の誤差

この後、母数U,a(I)を推定する、と話が進んで上に^がついた
U,a(I)が出てくるのですが、これはどういう意味でしょうか?
また上に−のついたy..は全測定値の平均という意味でしょうか

916 名前:132人目の素数さん mailto:SAGE [04/09/20 19:27:04]
すみません a(I)はA(I)です

917 名前:132ん日の素数さ人 [04/09/20 20:35:04]
>>915
^の付いていないものは母集団の真の値、付いているものは標本による推定値。
y..は全測定値の平均値。上にマイナスが付いていたり付いていなかったりする。

918 名前:132人目の素数さん mailto:sage [04/09/22 05:22:53]
>>904
問題を、
「母比率の検定(帰無仮説:p=1/200、対立仮説:p≠1/200、有為水準1%)において、真の比率が1/200から〜以上異なるときに、仮説を採択する確率を1%以下にしたい。標本はいくつ以上取ればよいか?」

みたいにすれば答えは出るよ。

919 名前:132人目の素数さん [04/09/22 14:30:49]
初心者質問ですみません。
回帰係数と単相関で符号が違うのはどっちを見ればいいんですか?

920 名前:132人目の素数さん [04/09/23 02:07:25]
>>918
なるほど、そういう考え方があったのか!
918さん、あなたの職種(学生?)は何ですか?



921 名前:132人目の素数さん [04/09/25 13:09:25]
株とかで、適当な時点で購入、過去に付いた最大の価格より a円 だけ下がったら売却
という規則で売買したときの利益の分布を調べたいのですが良い計算方法っていうのはあるんでしょうか。

もう少し具体的に説明すると、
正規分布(似ていれば特にこれである必要はないです)で 0 から開始してランダムウオークする
数列があって、過去につけた最大値より a だけ小さい値になったときの価格を x とすると

分布関数
f(x) = 過去最大値よりaだけ小さくなったなった時の x の確率

となるような関数を計算してみたいです。

ちなみにパソコンで力ずくで計算してみると、a が小さい時は正規分布に近づいて a が大きい時は
指数分布の裾の広い感じの印象を受けます。(aが小さいときは数列を作る乱数の分布そのもののような気がします)


922 名前:132人目の素数さん [04/09/27 01:14:20]
P1,Q1を(Ω1,B1) 上の確率測度.L1をQ1のP1に対する導関数.
P2,Q2を(Ω2,B2) 上の確率測度.L2をQ2のP2に対する導関数.
PをP1とP2の直積測度.QをQ1とQ2の直積測度.LをQのPに対する導関数.
(LをQのPに対する導関数⇔
あるNが存在して,P(N)=0 かつ Q(A)=∫_A LdP+Q(N∩A) (任意のAに対して) かつ L≧0)

命題:LとL1×L2はほとんどいたる所 P で一致する.

上の命題が正しいかどうか自信がありません.
Q1がP1に対して絶対連続,Q2がP2に対して絶対連続のときに成立することは証明できました
(文献にものってました)が一般の場合はどうなるのか…?

どなたかご存知の方がいらっしゃったらお教え下さい。
当方統計専攻の院生です。

923 名前:132人目の素数さん [04/09/27 07:02:38]
平均=普通は成り立つの?

924 名前:132人目の素数さん mailto:sage [04/09/27 10:16:41]
メディアンのほうが「普通」には近いかも。
平均は極端なものに引っ張られちゃうから。

925 名前:132人目の素数さん [04/09/27 20:58:53]
>>924 メディアンってなに?

926 名前:132人目の素数さん [04/09/27 21:42:02]
>>924 正規分布するなら普通と言ってもいい?

927 名前:132人目の素数さん mailto:sage [04/09/27 22:05:19]
メディアン=中央値 です。

でも、それ以前に「普通」ってどういう定義なんでしょうねぇ。
しゃべり場10代みたいなテーマですが。

928 名前:132人目の素数さん mailto:sage [04/09/27 22:23:50]
「普通とは何か」となれば、それは統計学の範疇を超えますね。

929 名前:132人目の素数さん [04/09/28 01:53:22]
例えば平均身長は普通の身長っていうことになる?

930 名前:132人目の素数さん mailto:sage [04/09/28 10:15:23]
子供が0.97人いる家庭は平均的だが異常だぞ



931 名前:132人目の素数さん mailto:sage [04/09/28 10:22:09]
普通と平均がほぼ同じ意味で使われる場合と、そうでない場合がある。

932 名前:132人目の素数さん mailto:sage [04/09/28 10:30:27]
>>929
実際に1000人分くらいサンプルをとってみて、
全員の身長から算出された平均値が
ちょうど170cmだったとする。

171以上が499人、169以下が500人だった。
んで、ちょうど170cmが一人だけいた。

170の人の身長は平均的だと言えても、普通だと言える?
普通って言葉の意味は、多義的すぎておぼつかないんじゃないかな。

933 名前:132人目の素数さん [04/09/28 23:27:41]
>>932 でも身長の場合そんなにばらつきがないんじゃないかな?平均身長が170だとするとやっぱり170前後が一番多いんじゃないの?

934 名前:132人目の素数さん mailto:sage [04/09/29 08:27:20]
母数の平均が普通といえるんじゃないだろうか

935 名前:132人目の素数さん [04/09/29 21:26:12]
>>934 母数の平均とは?

936 名前:132人目の素数さん mailto:sage [04/09/29 23:43:11]
母平均

937 名前:132人目の素数さん [04/09/30 00:01:00]
日本のサラリーマンの賃金構造を調べるために、20才から30才の会社員40人を対象に調査を行なった。質問内容は次のとおりである。
基本給、性別、勤続年数、企業規模、学歴
そこで、基本給がどう決定されるかを見るために、回帰モデル、

を考える。ただし、各変数は次のとおりである。
WAGE: 基本給。単位は円。
SEX: 性別。男ならSEX=1、女ならSEX=0である。
CAREER: 勤続年数。
SMALL: 企業規模。中小企業ならSMALL=1、大企業ならSMALL=0である。
EUDC: 学歴。大卒ならEUDC=1、高卒ならEUDC=0である。
次の問いに答えよ。
(1) パラメータ ~ の値をデータより推定しなさい。


938 名前:132人目の素数さん [04/09/30 00:03:08]
WAGESEXCAREERSMALLEDUC
215,7001411
242,1001611
253,7001711
162,9001011
185,5001211
135,5001010
292,50011110
・・・・・

エクセルでどうやら求めるようなんですが、
どうやったらでるんでしょうか?
自分で計算していたんですが、数字が合わなくなって挫折しました。
推定しろって書いてあったので、自分で計算じゃだめなようです。

939 名前:132人目の素数さん [04/09/30 00:07:50]
あ、大事なところがでてませんでした。
回帰モデル
WAGE=B0+B1×SEX+B2×CAREER+B3×SMALL+B4×EDUC

WAGE   SEX   CAREER  SMALL   EDUC
215,700 1    4     1    1
242,100 1    6     1    1
253,700 1    7     1    1
162,900 1    0    1    1
185,500 1    2    1     1
135,500 1    0    1     0


940 名前:132人目の素数さん mailto:sage [04/09/30 11:18:06]
宿題は自分でやりましょう



941 名前:132人目の素数さん [04/09/30 12:19:03]
分析ツールの回帰分析でやればいいじゃん

942 名前:132人目の素数さん [04/09/30 12:22:40]
ツール→分析ツール→回帰分析

「入力Y範囲」にwageのデータ
「入力X範囲」に説明変数のデータ →OK

943 名前:132人目の素数さん mailto:sage [04/09/30 23:36:36]
>>942
そんなツールがあったんですか・・
どうやってやるかわからず、
今日締め切りだったのであきらめますたorz

944 名前:132人目の素数さん mailto:sage [04/10/01 01:05:31]
まずググれよ・・・

945 名前:132人目の素数さん [04/10/01 02:36:55]
たまに25,75パーセンタイル値に利用される
Tukeyのヒンジについて訊きたいのですが、

イメージ的には、
・中央値と最小値の「中間の順位の値」が
Tukeyのヒンジによる25パーセント点
・中央値と最大値の「中間の順位の値」が
Tukeyのヒンジによる75パーセント点という感じでしょうか?

だれかノンパラ統計量に詳しい人の解説キボン。

946 名前:132人目の素数さん [04/10/01 17:27:30]
N面体のサイコロがあって、それを最大K回投げる。
1の目が出たら、S回投げる回数から減算する。
投げれなくなったら終了する。
1の目がx回でる確率f(x)を求めよ。
という問題なのですが、
N=300 K=3000 S=100で1万回シミュレート実験はしてみたのですが、
実際にf(x)はどのような式になるのでしょうか?
近似できる分布はないでしょうか?
ご指導お願いいたします。

947 名前:132人目の素数さん mailto:sage [04/10/01 22:16:51]
>>946
問題設定がよくわからないのだが。
N,K,Sは固定だよね。
とりあえずN面体のサイコロ投げて、1が出たら何か減らすのはわかった。

Kは終了条件で、
サイコロの目が1出るたびにマイナスSしていって、
現在の試行数(仮にt)がt>Ktのときに終了するってこと?
(Ktは試行数tのときの終了回数)

948 名前:132人目の素数さん mailto:sage [04/10/02 06:17:44]
>>946
分布は難しいな…。
とりあえず、S=1のときの1が出る回数の期待値は、
(1/(N+1)^2)(1-(-1/N)^K)+K/(N+1)
となった。

949 名前:132人目の素数さん mailto:sage [04/10/03 22:00:23]
ブルー・バックスに豊田秀樹なる人物が何冊か書いてるが、どうなの?
偶然開いたページに「連続だから微分可能」とあって、のけぞったんだが。

950 名前:132人目の素数さん [04/10/03 22:42:04]




951 名前:132人目の素数さん [04/10/04 08:17:13]
豊田秀樹は早稲田の文学部の先生
心理学の視点からマーケティングのデータ分析とかしているような希ガス

952 名前:132人目の素数さん [04/10/05 22:13:10]
分散分析と等分散の検定ってどう違うの?
いま、2つの群のバラツキが異なると言えるかどうか調べたいんだけど、どちらの検定方法を使えばいいのか教えてください。

953 名前:132人目の素数さん mailto:sage [04/10/05 22:27:11]
>>952
2つの群のばらつきが異なるかどうかは、等分散の検定(F検定)で調べられます。
分散分析は2つ以上の群の平均値が同じであるかどうかを調べる検定です。

954 名前:132人目の素数さん [04/10/05 22:31:25]
>>953
平均値が同じかどうか調べるのにt検定ってありますよね。
分散分析は、言葉どおり「分散」=「ばらつき」も調べるってことでは、ないのでしょうか?

955 名前:132人目の素数さん mailto:sage [04/10/05 22:43:36]
>>954
t検定は2群の平均値が同じかどうかを調べる検定です。
もしもt検定が両側検定だったら、2群の場合の分散分析と同じ結果(p値)をはじき出します。
確か、t統計量の2乗が分散分析のF統計量になたはず。
因みに、2群以上のばらつきが同じかどうかを調べる検定にはバートレットの検定というものがあります。

956 名前:132人目の素数さん mailto:sage [04/10/05 22:46:04]
自己レスです。

> t検定は2群の平均値が同じかどうかを調べる検定です。
すみません、これはもうご存知ですね。

957 名前:132人目の素数さん [04/10/05 22:52:57]
>>955
なるほど、t検定と分散分析の関係、よくわかりました。ありがとうございます。
どうも、「分散」分析ということばに惑わされていたみたいです。

958 名前:132人目の素数さん mailto:sage [04/10/05 23:11:01]
>>957
統計学ではまぎらわしい名前が多いようです。
共分散分析はべつに共分散を分析しているわけでもないし、
共分散構造分析なんていう似たようなものもあるし。

959 名前:132人目の素数さん [04/10/08 12:09:36]
言語学の研究と統計に関して、質問があります。
どなたかわかる方、教えてください。

たとえば、現在の若者を対象にして、
ある状況ごとに、若者言葉「XX]を使用するかしないかを質問し、
状況ごとの有為差の有無を見たい場合って、
統計は、パラメトリックなのでしょうか?
それとも、ノンパラメトリックでしょうか?

言語使用の場合、文法ルールや、社会的習慣(社会言語学的ルール)
などによって、ある程度、規制されると思うので、
はたして、正規分布を前提に考えていいものかどうか
迷ってしまいます。
はたして、文法に規制される言語使用は、
歪度や尖度に特徴のある正規分布と考えていいのでしょうか?

960 名前:132人目の素数さん mailto:sage [04/10/08 21:54:35]
>>959
まず、考えられる一番単純な解析方法は「言語使用の有無」と、2水準の「状況」を用いた
カイ2乗検定。カイ2乗検定がパラメトリックか、ノンパラメトリックかは、あまり聞いたことがありません。
これはパラメトリックかな?分布には、「標準正規分布に従う確率変数」を2乗した変数の分布(カイ2乗分布)が使われています。
そして、「社会的習慣」が言語使用に影響を与えていると考えられる場合には、、色々と考えられるのですが、
「社会的習慣」を共変量としたロジスティック回帰分析。もう一つ挙げるとすると、
(こっちのほうが理論的にはきれいかな?)「社会的習慣」を変量効果とした、ロジスティック変量効果モデル。




961 名前:959 [04/10/09 01:04:11]
>960

早速のお返事をどうもありがとうございました。
自力で、統計を勉強しているので、大変助かります。

カイ二乗は、使ったことがあるので、何とかなりそうです。
ロジスティック回帰分析 & ロジスティック変量効果モデルは、
正直言って、何のことだかさっぱりわからないので、統計の本を読んで、
頑張って勉強します。

あと、すみません、もう少しお伺いしたいことがあるのですが、
実は、言語使用状況が3つあるのですが、カイ二乗を
3回繰り返す形でも大丈夫でしょうか? 
ちなみに、データは対応のある形です。




962 名前:959 [04/10/09 01:11:00]
連続の質問で、すみません。
できれば、もう一つお伺いしたいことがあります。

言語使用の有無と、その言語を使用した場合のイメージ
を関連付けたい場合は、どのような手法がいいのでしょうか?
具体的には、XXという若者言葉を使うか否かを質問し、
同時に、その言葉を使った場合のイメージも聞いて、
言語を使用する子はどういうイメージで話し、
使わない子は、その言葉にどういうイメージを持っているかというのを
調べたいのです。
どの統計手法が適切なのか、ご享受いただけると、
大変ありがたいです。


963 名前:132人目の素数さん mailto:sage [04/10/09 01:27:37]
>>959
ちょっと違うかもしれないけど、
chaidという手法を調べてみてはどうでしょう。

964 名前:132人目の素数さん [04/10/09 02:30:53]
>>961
帰無仮説の設定によってはカイ二乗検定を3回繰り返すという方法も考えられると思います。
ですが、もしもそれらの検定の内、「1回でも有意ならば有意」とするのでしたら「検定の多重性」という問題が起きてきます。
959さんは次のどちらを主張したいですか?それによって検定手法は変わってきます。
1.「状況Aと状況B、状況Cにおける言葉の使用率」は、「全て同じ使用率」ではない。
2.「状況AとB」、「BとC」、「CとA」の内、いずれかの使用率が異なる。

>>962
それぞれの状況において、イメージAは○%、イメージBは×%、イメージCは△%と考えていく方法が考えられます。

>>963
その方法は、それぞれの状況での割合を把握するときには使えると思いますが、検定は行っていませんね。

965 名前:959 (961& 962) [04/10/09 15:40:49]
> 963
早速のレスをいただき、どうもありがとうございました。 
chaidですね。検定をするかどうかは、まだ決めていませんので、
(データと、私の理解力次第になると思いますが、)
勉強してみます。


966 名前:959 (961& 962) [04/10/09 15:41:39]
> 964

早速、レスをいただき、どうもありがとうございました。
主張したいのは、2.の各2水準間での検定です。
(全ての言語使用状況間において有意差がでなくてもいいので。。)
ということは、カイ二乗を3回繰り返しても大丈夫ということですよね。

それから、言語使用の有無とイメージの関係の分析を
難しく考えていたので、コレスポンド分析など
使ったこともない手法が必要なのかと思っていたのですが、
おかげさまで、すっきり&安心しました。

いろいろとご享受いただき、
大変助かりました。
どうもありがとうございました。


967 名前:132人目の素数さん [04/10/09 16:22:15]
>>951
ふーん。使い方はともかく細部は信用しない方が良さそう。

968 名前:964 mailto:sage [04/10/09 16:48:51]
>>966
もしもカイ二乗検定を3回繰り返すのでしたら964にも書いた、「検定の多重性」という問題が起こってきます。
帰無仮説(A)、(B)、(C)の内、一つでも有意ならば有意とするとなると、実際にはあらかじめ決めた有意水準よりも大きい値で検定を行っていることになってしまいます。
つまり、有意ではないのに有意だといってしまう可能性が出てくるのです。
これを防ぐために色々な方法が考えられます。一番単純な方法は「ボンフェローニの調整」。
それぞれの検定から出てきたP値をそれぞれ3倍して、それから有意水準で検定を行うという方法です。
でも、この「ボンフェローニの調整」は検定の数が多くなればなるほど有意であるのに有意ではないといってしまう傾向があるので注意が必要です。
今回のように検定の数が3つぐらいだったら使用に耐えうるでしょう。

969 名前:132人目の素数さん [04/10/09 17:23:07]
統計は解析くらいの知識しか使ってないのにマジ難しいと思う。
数学的にある程度わかっても調査とか経験しないとよくは
わからない模様。

970 名前:132人目の素数さん mailto:sage [04/10/09 20:47:58]
3群の比較を3回の対比較で行うなら、各々の検定の有意水準は
全体の有意水準の1/2にしてもよい(1/3にする必要は無い)、はず。



971 名前:132人目の素数さん mailto:sage [04/10/10 04:07:37]
>>970
それは多重比較の何と言う手法ですか?

972 名前:132人目の素数さん mailto:sage [04/10/10 11:25:35]
>>971
たしか、Holm の方法。

973 名前:132人目の素数さん mailto:sage [04/10/11 18:07:47]
>>972
Holmの方法を使っても、初めから全体の有意水準の1/2で検定をできないようです。
まず全体の有意水準の1/3で、P値が一番小さいものを棄却できてから。

それと、k群の比率の差の検定にはライアンの方法というものがあるようです。
ttp://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/Pmul-Ryan.html


974 名前:132人目の素数さん [04/10/11 19:38:07]
次スレ
統計学なんでもスレッド3
science3.2ch.net/test/read.cgi/math/1097491056/

975 名前:kmath1107@yahoo.co.jp mailto:kmath1107@yahoo.co.jp [04/10/11 20:25:00]
658 : LettersOfLiberty ◆rCz1Zr6hLw :04/10/09 07:20:23
うんち食いたい 十万差し上げます。
659 :LettersOfLiberty ◆rCz1Zr6hLw:04/10/09 12:04:28
>>658
振込先おしえれ。
660 :LettersOfLiberty ◆rCZIZG7cQU :04/10/09 12:06:41
そうだ、早く教えろ
661 :LettersOfLiberty ◆rCz1Zr6hLw :04/10/09 12:06:46
Re:>659 それじゃあ、私にメール送ってくれ。アドレスは、kmath1107@yahoo.co.jp

976 名前:132人目の素数さん mailto:sage [04/10/11 21:10:15]
荒らしめ!!消えろ!

977 名前:132人目の素数さん mailto:sage [04/10/11 22:05:15]
P(X|X)って1ですか、それともP(X)?

978 名前:132人目の素数さん mailto:sage [04/10/11 22:11:18]
>>977
1

979 名前:132人目の素数さん mailto:sage [04/10/11 22:13:27]
どんな場合でも?

980 名前:132人目の素数さん mailto:sage [04/10/11 22:16:18]
すみません。では、P(X)って条件付き確率の形式で書くとどうなるの?かけない?



981 名前:132人目の素数さん mailto:sage [04/10/11 22:18:56]
>>979
そう、どんな場合でも。
  P(X|X) = P(X∩X) / P(X)
ここで、
  X∩X = X
だから、
  P(X|X) = P(X) / P(X) = 1

982 名前:132人目の素数さん mailto:sage [04/10/11 22:20:57]
P(X|1)?

983 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:25:23]
Re:>981 さて、P(X)=0のときはどうする?

984 名前:132人目の素数さん mailto:sage [04/10/11 22:26:35]
どうなるんですか?

985 名前:132人目の素数さん mailto:sage [04/10/11 22:36:06]
P(X|X)が不定ってどういう意味?

986 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:37:56]
Re:>985 いや、P(A|B)の定義はP(A∩B)/P(B)ではない。条件付期待値の定義を誰かupしてくれ。

987 名前:132人目の素数さん mailto:sage [04/10/11 22:39:48]
>>986
普通の集合の条件付確率のこと聞いてるんだろ?
それでいいじゃないか。

988 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:40:00]
条件付期待値を定義するのには、
部分集合の上での確率測度が必要なのだが、
あれってどうやって作るんだっけ?
存在することは分かっているらしいけど。

989 名前:132人目の素数さん mailto:sage [04/10/11 22:40:04]
ぜひ、おねがいします。

990 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:41:01]
Re:>987
P(B)>0ならば、P(A|B)=P(A∩B)/P(B)で問題ない。
この式では困るのは、P(B)=0のときだ。



991 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:43:21]
条件付確率P(A|B)は、条件付期待値E[1_A|B]のことで、
条件付期待値E[X|B]は、何らかの確率測度Qがあって∫_{B}XdQ
で定義されるのだが、このQはどうするんだっけ?

992 名前:132人目の素数さん mailto:sage [04/10/11 22:43:26]
P(X)=0からP(X)>0になるような場合に困ってるんです。

993 名前:132人目の素数さん mailto:sage [04/10/11 22:46:28]
その辺の事情がわかる本をおしえていただくのでもいいのですが。

994 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:47:38]
Re:>993 私は講義で条件付確率の話を聞いた。

995 名前:132人目の素数さん mailto:sage [04/10/11 22:48:18]
>>992
一応聞くが、Xは集合だろ?
確率変数じゃないよな?

996 名前:132人目の素数さん mailto:sage [04/10/11 22:49:00]
後者です。

997 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:50:11]
Re:>996 後者って何?確率変数XでP(X|X)なんて見たこと無い。

998 名前:132人目の素数さん mailto:sage [04/10/11 22:50:15]
P(X|Y)についてもP(Y)=0のときは同じ問題になりますか?

999 名前:LettersOfLiberty ◆rCz1Zr6hLw [04/10/11 22:51:20]
Re:>998 P(Y)>0なら簡単なんだけどね。

1000 名前:132人目の素数さん mailto:sage [04/10/11 22:51:37]
三百三十八日三時間七分。




1001 名前:1001 [Over 1000 Thread]
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<314KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef