[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 08/15 03:52 / Filesize : 421 KB / Number-of Response : 1067
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

数学 統計に詳しい人が語るコロナウイルス



1 名前:132人目の素数さん [2020/02/29(土) 02:18:41 ID:twdO677Q.net]
東大数学科卒の元官僚はこう分析してるが、お前らはどうなると思う?

www.zakzak.co.jp/soc/news/200220/dom2002200003-n2.html

中国国外感染者の中国国内との比率をみると、
1月20日の数字公表以降は、0・8〜2・6%で比較的安定している。
これは、新型肺炎の感染者のほとんどは中国国内、それも湖北省に集中しているからだ。
ちなみに中国国外での感染者数は、中国国内の1・1%だ(2月16日現在)。
本コラムで紹介したが、現時点では、最終的な中国国内の感染者数は20万人超と筆者は推計している。
となると、中国国外の感染者は数千人程度になるだろう。
中国国外のうち日本の比率は1割弱なので、日本の感染者数は数百人程度であろう。
その場合、死者も数人から10人程度になるだろう。

こうした推計をすると、今の感染者は氷山の一角だと思われるが、今後の増加ペースはどうなるだろうか。
新型コロナウイルスの検査は簡単に行えるので、今後、日本での感染者数は増えていくだろう。
ある時点ではそれがネズミ算的に増えるかのように思える局面もあるだろうが、
筆者の推計が正しければ、現時点ではせいぜい数百人が一つのメドだ。

67 名前:132人目の素数さん mailto:sage [2020/03/15(日) 18:44:20.15 ID:OTl1KJku.net]
>>65
発見率は平均値87/1524、0.01-0.10の区間の二項分布に従うと仮定する。
新型コロナ陽性患者を10人集めたい。
必要な被検者数の期待値と95%信頼区間を求めよ、とすると。

期待値175人 95%CIは142−210人

68 名前:132人目の素数さん mailto:sage [2020/03/15(日) 20:00:49.03 ID:1+9jqr1h.net]
https://blogos.com/article/443001/
■英国政府の分析と方針 名無しさんが作成したまとめ

・ピークは10〜14週間後にやってくると分析
・海外への修学旅行の中止や基礎疾患のある人のクルーズ船旅行の自粛を呼びかけ
・イギリスの実際の感染者は他国の検査数と陽性率を見ると5000人から1万人
・もはや感染を止めることは不可能なのでゆっくり感染して集団免疫を獲得すること目指す
・来シーズンにはワクチンが開発されている可能性があるため
 感染して免疫を獲得した人とワクチン接種を受けた人の割合をコントロールしながら60%に持っていく戦略
・今封じ込めすぎて感染のピークがNHS(国民医療サービス)の繁忙期である冬にやって来ると大変なので
 一番暇な夏に来るようにコントロールする
・最悪シナリオの罹患率はドイツの70%を上回る80%に設定して実行計画を立てている
・一斉休校はしない
 休校は効果はあるものの最小限であり、効果を上げるのは13〜16週間以上の休校が必要になる
 効果より害の方が大きい
・フライト制限についても中国便を95%削減してもエピデミックを1〜2日遅らすぐらいの効果しかなく
 50%ぐらい減らすのがちょうど良い
・イギリスの感染はイタリアより4週間遅れて進んでいる
・基本戦略
 (1)ハッピーバースデーを2回歌いながら石鹸と温水で手を洗う
 (2)熱や咳の症状がある人は1週間、自宅で自己隔離→ピークを20〜25%削減
 (3)家族全員を自宅で隔離→ピークを25%削減(未実施)
 (4)新型コロナウイルスに脆弱なお年寄りをケア→死亡率を20〜30%削減
・集団免疫を獲得するまで先は長いので今からあまり頑張りすぎないように

69 名前:132人目の素数さん mailto:sage [2020/03/16(月) 06:09:25.25 ID:CVVw1pKV.net]
国内で患者数が大幅に増えたときに備えた医療提供体制の確保について
今後、国内で新型コロナウイルス感染症患者数が大幅に増えたときに備え、各都道府県、保健所設置市及び特別区(以下「都道府県等」という。)における外来を受診する患者数等について、以下の数式を用いて計算いただき、ピーク時の医療需要の目安としてご活用の上、必要な医療提供体制を確保していただくようお願いいたします。
(1)(ピーク時において1 日あたり新たに新型コロナウイルス感染症を疑って外来を受診する患者数)=(0-14 歳人口)×0.18/100+(15-64 歳人口) ×0.29/100+(65 歳以上人口) ×0.51/100
(2)(ピーク時において1 日あたり新型コロナウイルス感染症で入院治療が必要な患者数)=(0-14 歳人口)×0.05/100+(15-64 歳人口)×0.02/ 100+(65 歳以上人口) ×0.56/100
(3)(ピーク時において1 日あたり新型コロナウイルス感染症で重症者として治療が必要な患者数)=(0-14 歳人口)×0.002/100+(15-64 歳人口) ×0.001/100+(65 歳以上人口) ×0.018/100
注1)ピーク時は、各都道府県等において疫学的関連性が把握できない程度に感染が拡大した時点から概ね3か月後に到来すると推計されている。ただし、公衆衛生上の対策を行うことにより、ピークが下がるとともに後ろ倒しされる。
注2)重症者とは、集中治療や人工呼吸器を要する管理が必要な患者を指す。
注3)当該計算式は、都道府県等の単位以下における医療提供体制を確保するためのものであるとともに、各都道府県等によってピークを迎える時期が異なるため、全国の人口を用いて計算することや単純に各自治体が算出するピークの数値を足し合

70 名前:わせることは、不適切な取扱いとなることに留意いただきたい。なお、当該計算式については、今後新たな知見等により変更される可能性がある。
注4)実際には、ピーク時に至るまでの日々の患者数の増加はばらつきがあり、増加曲線は推計通りの形にならない可能性が高いため、現実の患者の発生動向も踏まえて適切に体制を確保することが必要。
注5)当該計算式については、今後新たな知見等により変更される可能性がある。
[]
[ここ壊れてます]

71 名前:132人目の素数さん mailto:sage [2020/03/16(月) 06:50:44.79 ID:CVVw1pKV.net]
この行列を使って何か引き出せるだろうか?

> v=c(0.18,0.29,0.51,
+ 0.05,0.02,0.56,
+ 0.002,0.001,0.018)
> (mat=matrix(v,3,byrow=T))
[,1] [,2] [,3]
[1,] 0.180 0.290 0.510
[2,] 0.050 0.020 0.560
[3,] 0.002 0.001 0.018
> mat*100
[,1] [,2] [,3]
[1,] 18.0 29.0 51.0
[2,] 5.0 2.0 56.0
[3,] 0.2 0.1 1.8
>

72 名前:132人目の素数さん mailto:sage [2020/03/16(月) 08:14:56.44 ID:CVVw1pKV.net]
単なる連立方程式を解くだけだから、つまらんね。

問題 : ある都市でピーク時に外来1000人、入院600人、重症20人であったとすると、この都市の14歳以下の人口は何人と推測されるか?

v=c(0.18,0.29,0.51,
0.05,0.02,0.56,
0.002,0.001,0.018)
(mat=matrix(v*100,3,3,byrow=T))
# https://www.toukei.metro.tokyo.lg.jp/juukiy/2019/jy19qa0200.xls
(x=matrix(c(1601348,9035668,3103714)/1e4,ncol=1))
(y=round(mat%*%x))
solve(mat,y)

y=matrix(c(1000,600,20))
solve(mat,y)

73 名前:a4 ◆L1L.Ef50zuAv [2020/03/16(月) 09:58:31 ID:yKeJ8TdS.net]
「安倍晋三」を動かすための量子大域最適文章は?
「アベシトミナミヘイケ」
=(安倍氏と低学歴な大学である南カリフォルニア大学へ行け。|
安倍氏、富、並、へ行け。
あべし、と、南アフリカ共和国へ行け。)

「新型肺炎の強制入院」を動かすための量子大域最適文章は?
「哈佛死吧」
=(ハーバード大学は死ねばいいんじゃね?|統合失調症。)

74 名前:a4 ◆L1L.Ef50zuAv [2020/03/16(月) 10:10:58 ID:yKeJ8TdS.net]
僕は星籍を地球からアルファ星に変えました。地球を量子で軍事威嚇します。

75 名前:a4 mailto:sage [2020/03/16(月) 11:20:55.58 ID:yKeJ8TdS.net]
申し訳ございません。僕の統合失調症の陽性症状の急性期でした。数学板的には
ジョン・ナッシュとして定義があるでしょうか。でも僕の中国の友達も困ってるみたい
なので書き込みさせていただきました。情報としては、流行ってる地域と報道され
てるのに、その友達の友達に感染した人はいるか?と聞いても、いない、と返って
来ました。僕は一



76 名前:旦落ちますね。 []
[ここ壊れてます]

77 名前:132人目の素数さん mailto:sage [2020/03/16(月) 18:07:14.25 ID:KM2jIN+Z.net]
【y=X^2】イタリアさんの死者数と感染者数、指数関数的に増えていた
https://hayabusa9.5ch.net/test/read.cgi/news/1584296919/

78 名前:132人目の素数さん [2020/03/18(水) 15:35:44 ID:shuQMR+Y.net]
前川喜平氏が説く「数学必修廃止論」に疑問 出会い系バーでの「貧困調査」の具体的な成果なぜ示さないのか

 前川喜平・前文部科学事務次官が週刊東洋経済4月14日号で、貧困対策の一つとして、「高校中退をなくすには数学の必修を廃止するのがいい」と発言している。

 高校中退を防ぐという方向性はいいだろう。低学歴者は低所得になりがちで、犯罪率も高いことは各種の調査で示されている。

 せっかく「貧困調査」で出会い系バーに通ったのだから、前川氏には延べ何人の女の子を調査し、その中で高校中退の数は何人だったのかを示してもらいたかった。
さらに、高校中退の理由はどうだったのか。これも貧困調査を行ったのならば当然示せるだろう。そうした調査の成果が具体的に示されていないので、実のところ、前川氏が説く数学必修廃止論の理由はよく分からない。

数学をある程度知らないと、自然科学のみならず多くの社会科学を習得することはできない。数学の必修廃止は日本の国力を低下させることにつながるのではないか。特に、社会に必要なエンジニアの育成にも支障が出るだろう。

 文部科学省による調査をみても、高校の中退理由は、「学業不振」が1割弱、「学校生活への不適応」が4割、「進路変更」が3割強である。
つまり、数学必修を廃止しても、中退理由の1割も除くことができない。数学の必修化をやめれば中退が少なくなるとの結論を導き出すことはできないだろう。

 これらの理由の推移をみると、かつては学業不振が多かったが、最近は低下しており、学校生活への不適応が徐々に増えている。

 他校への転校などの進路変更はいいとして、学校生活の不適応をいかに減らすかが、中退を防ぐためには重要だろう。前川氏の出会い系バーにおけるフィールドワークに基づく具体的な対策を聞いてみたい。

https://www.zakzak.co.jp/soc/amp/180417/soc1804170006-a.html

79 名前:132人目の素数さん [2020/03/19(木) 21:03:10.68 ID:2Eqy074l.net]
ソースTBS
上昌広先生と森永先生
「ランダムに1000人にPCR検査すれば統計学的に市中感染率はわかるんですよ」

Twitterの東大生
「PCR検査が6割程度しか正確じゃないのに、なんでそんなことが言えるんだ」


どっちがただしい?
東大生が正しい場合、6割だとして、
何人に検査すれば信頼区間99%に収まる?

80 名前:132人目の素数さん [2020/03/19(木) 22:28:38.86 ID:mW+UfAsE.net]
>>68
https://www.mhlw.go.jp/content/000605276.pdf
これか。厚労省もけっこう悲惨な事態を想定してんだな

81 名前:132人目の素数さん mailto:sage [2020/03/20(金) 06:19:35 ID:p5Mf5Wxl.net]
>>76
PCRで診断確定するのに偽陰性ってどういうこと?
偽陰性と言われた人はどうやって新型コロナ肺炎だと確定されたんだ?

82 名前:132人目の素数さん mailto:sage [2020/03/21(土) 00:26:49.38 ID:Ivwmz468.net]
都道府県ごとのシミュレーションによる検討
ttps://www.fttsus.jp/covinfo/pref-simulation/

83 名前:132人目の素数さん mailto:sage [2020/03/21(土) 13:59:14 ID:bagTkMOY.net]
>>76
感染率をθとして検体をn回とった時の陽性者の数Xは
感度をp、(感染者が陽性と判定される確率)
特異率をq (非感染者が陽性と判定される確率)
とするとXの分布は平均が
pθ+q(1-θ)
となるのでこの値を推定すればθの値も推定できます。
感度-特異率
が正の値なら回数を増やせばいくらでも小さい99%信頼区間に入れることができます。
千回のとき実際どれくらいの市中感染者数をどれくらいの信頼度で測れるかは計算機ないとわかんね

84 名前:132人目の素数さん mailto:sage [2020/03/21(土) 18:03:20.37 ID:MXwMv06E.net]
確率微分方程式ですね

85 名前:132人目の素数さん mailto:sage [2020/03/21(土) 21:43:31 ID:RyI2Q/uv.net]
>>80
特異度qはTN/(TN+FP)だから
偽陽性率は1-qなので
X 〜 pΘ+(1-q)(1-Θ)
では?



86 名前:132人目の素数さん mailto:sage [2020/03/21(土) 23:12:32.18 ID:hCC4s83x.net]
>>80
特異度は「陰性のものを正しく陰性と判定する確率」です。(wikiより引用)
認識が間違っていたため、式も間違っているパターンですね。
82さんの式が正しい。

87 名前:132人目の素数さん mailto:sage [2020/03/21(土) 23:25:44.12 ID:bagTkMOY.net]
ありゃ?
記憶と反対だったか。

88 名前:132人目の素数さん mailto:sage [2020/03/21(土) 23:29:01.08 ID:bagTkMOY.net]
まぁそれなら
感度+特異度>1
のときは検査数を上げていいなら望むだけ市中感染率を正しく推定できる
ですな。
なので上先生の勝ち。
東大生の負け。

89 名前:132人目の素数さん mailto:sage [2020/03/21(土) 23:54:36.88 ID:RyI2Q/uv.net]
カレーで免疫ができるかの検定

某国の新型コロナ感染症の有病率を0.1、PCR検査の感度を0.7 特異度を0.9とする

検査陽性陰性の人を無作為に各々100人ずつ集めて、カレーを頻回に食べているかを調査した結果が
以下の通りであった。
カレーを頻食する新型コロナ感染に罹りにくいと結論できるか?

検査陽性 検査陰性
カレー頻食 a(=36) b(=60)
カレー稀食 c(=64) d(=40)

   PCR(+)  PCR(-)
Exposed 36 60 96
Nonexposed 64 40 104
Total 100 100 200

にPPV(陽性的中率),NPV(陰性的中率)を使って計算すると
Disease Nondisease Total
Exposed 17.89286 78.10714   96
Nonexposed 29.42857 74.57143   104
Total 47.32143   152.67857   200

検査陽性は有意にカレー暴露が少ないといえるが、
感染に関しては有意にカレー暴露が少ないとはいえない、

という結論になった。

p値は 各々 0.0007032002 と0.1092375975

達人の検算を希望。

90 名前:132人目の素数さん mailto:sage [2020/03/22(日) 01:10:50.10 ID:liILqu/N.net]
r=x/nとして
Θ = (q + r - 1)/(p + q - 1)

91 名前:132人目の素数さん mailto:sage [2020/03/22(日) 08:39:00.57 ID:liILqu/N.net]
>>85
プログラムを組んで計算させてみた(有病率の事前分布は一様分布を仮定)

感度0.7 特異度0.9として
100人に1人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(100,1)
mean median mode lower upper
0.0196 0.0166 0.0101 0.0004 0.0464

1000人に10人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(1000,10)
mean median mode lower upper
0.0110 0.0107 0.0099 0.0050 0.0175

10000人に100人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(10000,100)
mean median mode lower upper
0.0101 0.0101 0.0100 0.0082 0.0121

100000人に1000人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(100000,1000)
mean median mode lower upper
0.0100 0.0100 0.0100 0.0094 0.0106

92 名前:132人目の素数さん mailto:sage [2020/03/22(日) 08:53:48.86 ID:liILqu/N.net]
>>85
感度+特異度>1 の条件は必要?
感度0.4 特異度0.5でシミュレーションしてみたけど
nを増やせば信頼区間が狭くなっていく


> sim(100,1,sen=0.4,spc=0.5)
mean median mode lower upper
0.0196 0.0166 0.0102 0.0004 0.0463
> sim(1000,10,sen=0.4,spc=0.5)
mean median mode lower upper
0.0110 0.0107 0.0099 0.0050 0.0176
> sim(10000,100,sen=0.4,spc=0.5)
mean median mode lower upper
0.0101 0.0101 0.0101 0.0082 0.0121
> sim(100000,1000,sen=0.4,spc=0.5)
mean median mode lower upper
0.0100 0.0100 0.0100 0.0094 0.0106

93 名前:132人目の素数さん mailto:sage [2020/03/22(日) 09:13:41.93 ID:t2LOPpzl.net]
>>89
ああ、p+q<1だと逆にあてにならなすぎて逆張りしてθが推定できるんだな。

94 名前:132人目の素数さん mailto:sage [2020/03/22(日) 14:31:30.77 ID:liILqu/N.net]
プログラムにバグがあったので修正というより、stanでのMCMCに変更。

> PCR(100,1)
mean lower upper
0.01497496587 0.00004299248 0.04480331292
> PCR(1000,10)
mean lower upper
0.001642898836 0.000001299175 0.004982795701
> PCR(10000,100)
mean lower upper
0.000174692810 0.000000052897 0.000560041026
> PCR(10000,1000)
mean lower upper
0.003876080828 0.000002574352

95 名前: 0.010176384444

まあ、nを増やすほど信頼区間が狭くなるという結論には変わりない。
[]
[ここ壊れてます]



96 名前:132人目の素数さん mailto:sage [2020/03/22(日) 20:15:28 ID:liILqu/N.net]
【富山県最強伝説】新型コロナウイルスPCR検査件数 54人 陽性0人
https://asahi.5ch.net/test/read.cgi/newsplus/1584811696/

ある集団から54人を無作為に選んでPCR検査したら陽性0であった。PCR検査の感度0.7 特異度0.9としてこの集団の有病率の期待値と95%信頼区間を求めよ。

97 名前:132人目の素数さん mailto:sage [2020/03/22(日) 21:37:38.27 ID:liILqu/N.net]
>>92
> PCR(54,0)
mean lower upper
0.0282436750 0.0000053869 0.0839653803

98 名前:132人目の素数さん mailto:sage [2020/03/23(月) 03:28:01.22 ID:uvHIelYA.net]
日本人の平均身長を推測するのにその値は1〜2mの間であるという弱情報事前分布は合理的。
現時点での新型コロナの有病率は0.1未満の一様分布という弱情報事前分布として
【富山県最強伝説】新型コロナウイルスPCR検査件数 54人 陽性0人
ある集団から54人を無作為に選んでPCR検査したら陽性0であった。感度0.7 特異度0.9としてこの集団の有病率の期待値と9信頼区間を推測する。
事前分布のパラメータを変えるとstanだとコンパイルが必要になるのでjagsでプログラムを組んでみた。



# 感度SEN, 特異度SPCの検査でN人中X人が陽性であったときの推定有病率prevalence
# 弱情報事前分布はprevalence ~ dunif(0,UL) , UL:上限
library(rjags)
PCRj <- function(N,X,UL=1,SEN=0.7,SPC=0.9,verbose=TRUE){ # UL:upper limit of dunif(0,UL)
modelstring=paste0('
model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
prev ~ dunif(0,',UL,')
}
')
if(verbose & UL!=1) cat(modelstring)
writeLines(modelstring,'TEMPmodel.txt')
dataList=list(n=N,x=X,sen=SEN,spc=SPC)
jagsModel = jags.model( file="TEMPmodel.txt" ,data=dataList,quiet=TRUE)
update(jagsModel)
codaSamples = coda.samples( jagsModel ,
variable=c("prev","p"), n.iter=1e6, thin=10)
js=as.matrix(codaSamples)
BEST::plotPost(js[,'prev'],xlab='prevalence',showMode = TRUE) ; lines(density(js[,'prev']),col='skyblue')
round(c(mean=mean(js[,'prev']),HDInterval::hdi(js[,'prev'])[1:2]),10)
}

実行結果
> PCRj(54,0,UL=0.1)

model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
prev ~ dunif(0,0.1)
}
|**************************************************| 100%
mean lower upper
0.0245104429 0.0000003782 0.0703606657

99 名前:132人目の素数さん [2020/03/23(月) 09:55:27 ID:LegnQVLy.net]
統計のことははぜんぜんわからんが、確率論的には
検査陽性率の期待値=有病率×感度+(1-有病率)×(1ー特異度)
なんだから、
有病率<<1なら、検査陽性率の期待値≒有病率×感度+(1- 特異度)

っちゅうことで、感度70%で特異度が100%なら検査陽性率の3割増し
が有病率だとみなせばよろしいんでしょ。
一方、特異度が90%しかなかったりすると陽性率の期待値が10%も
水増しされちゃうから、有病率の推定が大幅に困難になる。

つまり、特異度がよほど高くなければ(99%とかね)、有病率が数%以下
の状況でランダム検査しても偽陽性が真陽性を上回って混乱をきたす。
(見かけ上致死率は下がる、ってのが南朝鮮の状況か)

100 名前:132人目の素数さん mailto:sage [2020/03/23(月) 11:25:41 ID:eyONmTBV.net]
>>95
同感。
有病率0.1%で特異度0.9なら偽陽性だらけになるんだよね。

101 名前:132人目の素数さん mailto:sage [2020/03/23(月) 14:59:33 ID:9TP9mpqz.net]
>>95-96
疾病率=陽性率、すなわち無作為抽出ならその算段も成立するかもね。
現行の制度では推定される市中感染率が1/10000程度で陽性率が5%ほどらしいから現行制度下での検査はうまく行ってますね。
ただ感度+特異度が1.7位あるので検査数増やした方が有益である事は間違いがない。

102 名前:132人目の素数さん mailto:sage [2020/03/23(月) 19:12:11 ID:O5lTfF0I.net]
>>95
誤解や、誤解を引き起こしかねない内容があったので、勝手に補足させていただきます。

>>っちゅうことで、感度70%で特異度が100%なら検査陽性率の3割増し
>>が有病率だとみなせばよろしいんでしょ。
この場合、検査陽性率の期待値=有病率×感度 なのだから、1/(0.7)=1.4285...
3割増しではなく、4割強増しと言うべき。

>>一方、特異度が90%しかなかったりすると陽性率の期待値が10%も
>>水増しされちゃうから、有病率の推定が大幅に困難になる。

感度70、特異度100で、有病率 1%、0.1%、0.01%、0.001%の時、10万人に検査したときの
検査陽性者数は700,70,7,0.7人です。 有病率に比例して増減し、これらは、はっきり見極めできます。
一方、感度70、特異度90で、同じ事をすると、それぞれ、10600,10060,10006,10000.6人です。
有病率に応じて差はあるのですが、常に偽陽性が約10000人いて、誤差を考えると、見極めは困難です。

「陽性率の期待値が10%も水増しされちゃうから」と書かれていますが、これは、
検査対象者10万人に対する約10%=1万人が常に水増しされているのであって、
陽性と判定される人の数が10%水増しされていると誤解しないよう、補足しておきます。

103 名前:132人目の素数さん [2020/03/24(火) 01:26:59.63 ID:EUfp1x4d.net]
>>98
心配性だねw
3割が4割でもたいして変わらんがな。
陽性率の期待値が10%水増しってのも、期待値の10%じゃなくて、
期待値そのものが10%上昇するんだってことくらい、元の式見りゃ
自明だしね。

そもそも感度や特異度の具体的な数値はよくわかんないんだから、
具体的な数字にこだわってもしょうがない。
有病率が低いときの、有病率と陽性率と特異度の関係がわかれば
よろし。

104 名前:132人目の素数さん mailto:sage [2020/03/24(火) 01:40:13 ID:TnHQvRcs.net]
こういう計算が必要になる。

事前分布を選択する(例. 有病率は高々10%として(0.0.1]の一様分布とする)、
陽性確率は真陽性確率と偽陽性確率の和、
陽性数はこの確率で二項分布、
以上を実際に得られた検査数と陽性数から最尤値となるパラメータとして有病率の分布を出して期待値や信頼区間を出す。
手計算では無理。

105 名前:132人目の素数さん mailto:sage [2020/03/24(火) 08:34:40.14 ID:TnHQvRcs.net]
感度0.7 特異度0.9でコンピュータに計算させると

陽性率が30%なら有病率の推測値は

> PCRj(100,30)
mean lower upper
0.3396123 0.1994400 0.4964517

> PCRj(1000,300)
mean lower upper
0.3343576 0.2876152 0.3832246
> PCRj(10000,3000)

mean lower upper
0.3333387 0.3186388 0.3481056
> PCRj(100000,30000)
mean lower upper
0.3332425 0.3286774 0.3380952

と 期待値も信頼区間もそれらしい値になるが、


陽性率が1%なら有病率の推測値は偽陽性が増えまくるので陽性率と有病率が乖離する、
> PCRs(100,1)
mean lower upper
0.01497496587 0.00004299248 0.04480331292
> PCRs(1000,10)
mean lower upper
0.001642898836 0.000001299175 0.004982795701
> PCRs(10000,100)
mean lower upper
0.000174692810 0.000000052897 0.000560041026
> PCRs(100000,1000)
mean lower upper
0.000016780530193 0.000000002738145 0.000051489256688


陽性率が60%なら、今度は偽陰性が増えまくるので偽陰性が増えまくるので陽性率と有病率が乖離する。
> PCRs(100,1)
> PCRs(100,60)
mean lower upper
0.8280581 0.6766480 0.9764282
> PCRs(1000,600)
mean lower upper
0.8335023 0.7826355 0.8825766
> PCRs(10000,6000)
mean lower upper
0.8334634 0.8187334 0.8492064
> PCRs(100000,60000)
mean lower upper
0.8332873 0.8289242 0.8379535



106 名前:132人目の素数さん mailto:sage [2020/03/24(火) 08:42:02.80 ID:TnHQvRcs.net]
Rとstanでベイズ統計ができるなら、以下のコードで実行可能。
パッケージ rstan と BEST(信頼区間グラフ描出用)が必要


library("BEST")
library("rstan")
rstan_options(auto_write = TRUE)
options(mc.cores = parallel::detectCores())
options(scipen = 5)

model.string='
data{
int n; // sample size
int x; // number of positive test
real<lower=0,upper=1> sen; // sensitivity 0.7
real<lower=0,upper=1> spc; // specificity 0.9
real<lower=0,upper=1> ul; // uniform(0,ul)
}

parameters{
real<lower=0,upper=1> prev; // prevalence
}

transformed parameters{
real<lower=0,upper=1> p;
p = prev*sen + (1-prev)*(1-spc) ; // probability of positive test result
}

model{
x ~ binomial(n,p);
prev ~ uniform(0,ul);
}

'
writeLines( model.string , con='model.stan' )
corona1.model=stan_model('model.stan')
# saveRDS(corona1.model,file='corona1.rds')
# corona1.model=readRDS('corona1.rds')

PCRs <- function(N=1000,X=10,UL=1,SEN=0.7,SPC=0.9,verbose=FALSE,...){
data = list(n=N,x=X,sen=SEN,spc=SPC,ul=UL)
fit.corona = sampling(corona1.model, data=data,
seed=1234,control=list(adapt_delta=0.99),...)
if(verbose) print(fit.corona, prob=c(0.025,0.5,0.975),pars=c('prev'),digits=8)
ms=rstan::extract(fit.corona)
BEST::plotPost(ms$prev,showMode = T,xlab='prevalence') ; lines(density(ms$prev),col='skyblue')
c(mean=mean(ms$prev),HDInterval::hdi(ms$prev)[1:2])
}

107 名前:132人目の素数さん mailto:sage [2020/03/24(火) 08:46:15.46 ID:TnHQvRcs.net]
>>102(補足)

非対称分布の信頼区間計算にパッケージHDIntervalも必要。

108 名前:132人目の素数さん mailto:sage [2020/03/24(火) 08:51:43.98 ID:TnHQvRcs.net]
>>76
偽陽性率が現時点での有病率を大きく上回るから東大生の言い分が正しい。
有病率が3割程度になれば上先生の言い分が正しい。

109 名前:132人目の素数さん mailto:sage [2020/03/24(火) 10:27:48 ID:TnHQvRcs.net]
>>104
1000人調べたときの検査陽性率と推定陽性率をグラフにしてみた。
灰色直線は検査陽性率=推定陽性率の直線
検査陽性率が低いときは過小評価、高いときは過大評価する。
https://i.imgur.com/wmOAj5i.png

110 名前:132人目の素数さん mailto:sage [2020/03/24(火) 10:29:17 ID:mBslr8ul.net]
何言ってんの?
市中感染率をいくらでも正しく推定できるかなんでしよ?
結論のために問題変えるなよ。
政治の話をここに持ち込むなよ。

111 名前:132人目の素数さん [2020/03/24(火) 10:52:19 ID:EUfp1x4d.net]
>>104
上の言い分も一理あるし、東大生の言い分も一理あるw

特異度が90%を越える高い値だという前提があればこうなる。

1)検査陽性率が低く(数%以下)、特異度がほぼ100%でないの
 なら、市中感染率を推定するのは難しい。とはいえ、上限は
 (検査陽性率/感度)程度で抑えられる。つまり10%以下くらいの
 ことは言えるが、0%かもしれない。

2)一方、検査陽性率が高ければ(数十%以上)、下限は検査
 陽性率程度と見込めるが、市中感染率は感度に依存して大きく
 変化する。つまり、数十%以上とは言えるが100%近いかどうか
 までは不明。

ってことで、検査陽性率からある程度市中感染率の目安は立つが、
それがどこまで意味があるとみなせるかは疑問。TPO次第か。

112 名前:132人目の素数さん [2020/03/24(火) 10:58:55 ID:EUfp1x4d.net]
あと、補足すると、感度と特異度が正確にわかっているのなら、
統計学的に市中感染率を推定することはある程度可能だけど、
実際はそうではないから、上様の言い分には意味がない。

113 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:03:07 ID:TnHQvRcs.net]
>>105
感度と特異度を変化させて、検査陽性率と推定有病率の関係をグラフにしてみた。
https://i.imgur.com/YEtcSfn.png

114 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:06:16 ID:mBslr8ul.net]
だから自分の言いたい結論が先に決まっててそれに合わせて好き勝手に問題読み替えてるだけじゃん?
そんな考え方しかできないなら理系板に来んなよ。

115 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:09:05 ID:TnHQvRcs.net]
>>108
感度も特異度も定数でなく何らかの分布に従うパラメータとしてモデルを組めばいいだけの話だろ。



116 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:48:05 ID:TnHQvRcs.net]
感度が最頻値0.7 標準偏差0.05のベータ分布β(58.229, 25.527 )
特異度が最頻値0.9 標準偏差0.05のベータ分布β(36.172, 4.908)
に従うと過程して

model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dunif(0,ul)
}
こういうモデルでMCMCすれば可能。

実行結果

> PCRj2(1000,10) # 陽性率1%で有病率を推定
mean lower upper
0.001667604624 0.000000053909 0.004956969423

> PCRj2(1000,300) # 陽性率30%で有病率を推定
0.33414 0.28797 0.38253

> PCRj2(1000,600) # 陽性率60%で有病率を推定
mean lower upper
0.8

117 名前:3296 0.78428 0.88496 []
[ここ壊れてます]

118 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:56:18 ID:TnHQvRcs.net]
β分布のパラメータを出すRスクリプト

# a,b to Mode,mean,variance
ab2Mmv<-function(a,b){
M<-(a-1)/(a+b-2)
m<-a/(a+b)
v<-a*b/((a+b)^2*(a+b+1))
cat('Mode =',M,'mean =',m,'variance =',v,'\n')
invisible(c(Mode=M,mean=m,variance=v))
}

# Mode,kappa to mean,variance
Mk2mvab= function( mode , kappa ) {
# if ( mode < 0 | mode > 1) stop("must have 0 <= mode <= 1")
# if ( kappa <2 ) stop("kappa must be >= 2 for mode parameterization")
a = mode * ( kappa - 2 ) + 1
b = ( 1.0 - mode ) * ( kappa - 2 ) + 1
m=a/(a+b)
v=m*(1-m)/(a+b+1)
return( c( mean=m , variance=v,a=a,b=b ) )
}

# Mode,variance to a,b
Mv2ab = function(mode,vari){
f=function(kappa) Mk2mvab(mode,kappa)[2] - vari
kappa=uniroot(f,c(2,10000))$root
ab=Mk2mvab(mode,kappa)[c('a','b')]
ab2Mmv(ab[1],ab[2])
return(ab)
}
(sn=Mv2ab(0.7,0.05^2))
curve(dbeta(x,sn[1],sn[2]),bty='l')
(sp=Mv2ab(0.9,0.05^2))
curve(dbeta(x,sp[1],sp[2]),bty='l')

119 名前:132人目の素数さん mailto:sage [2020/03/24(火) 11:57:10 ID:TnHQvRcs.net]
上記の準備をして以下で実行

PCRj2 <- function(
N,X,
UL=1,
SEN=0.7,
SPC=0.9,
SD=0.05,
print=TRUE){
# UL:upper limit of dunif(0,UL)
library(rjags)
library(BEST)
sn=Mv2ab(SEN,SD^2)
sp=Mv2ab(SPC,SD^2)

modelstring=paste0('
model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dunif(0,ul)
}
')
writeLines(modelstring,'TEMPmodelj.txt')
dataList=list(n=N,x=X,ul=UL,sen=SEN,spc=SPC,sn=sn,sp=sp)
jagsModel = jags.model( file="TEMPmodelj.txt" ,data=dataList, quiet=TRUE)
update(jagsModel)
codaSamples = coda.samples( jagsModel ,
variable=c("prev","p","sen","spc"), n.iter=1e5, thin=5)
js=as.matrix(codaSamples)
if(print){
BEST::plotPost(js[,'prev'],xlab='prevalence',showMode = TRUE)
lines(density(js[,'prev']),col='skyblue')}
re=c(mean=mean(js[,'prev']),HDInterval::hdi(js[,'prev'])[1:2])
return(re)
}

options(digits = 5)
options(scipen = 5)

PCRj2(1000,10) # 陽性率1%で有病率を推定
PCRj2(1000,300) # 陽性率30%で有病率を推定
PCRj2(1000,600) # 陽性率60%で有病率を推定

120 名前:132人目の素数さん mailto:sage [2020/03/24(火) 13:15:20 ID:/QqkwKRd.net]
>>99
期待値というのは、無次元量ではない。観測値とか物理量と同じように単位をつけて議論できる量。
従って「期待値が10%増える」等という言葉があれば、期待値が1.1倍になるのだろうと感じるのが普通。
そのような性質を持つ期待値に対し、「10%増える」と表現し、
「期待値の値そのものが、0.1増えることを意味している」
と説明しなければならないならば、やはり誤解を招きやすい表現だと思う。

今回の期待値は比率であり、無次元量であったから、「10%」と言うのが、
どちらの意味としても、通用したため発生したとは言えるが、読み手の立場に立った表現を望む。

似た議論に、選挙時の投票率がある。前回の投票率が40%。今回の投票率が50%だとする。
「前回に比べ、今回は10%増えました」
「前回に比べ、今回は25%増えました」
どちらも、言い得る表現。聞き手の混乱を避けるため、前者の意味で使う場合、
「10%ポイント増えました」とコメントするのを最近聞くようになった。
私にはよい傾向と感じるが、中には、違いは何かとか、混乱の源の存在さえ意識していない人もいるようだ。

「3割増も4割強増も大した差ではない」には、「式が違っても結果が誤差範囲なら問題ない」
という考えが背景に見える。そのような方が、混乱を引き起こしかねない表現を用いた。
だから、補足した。果たして本当に杞憂だったのだろうか?

121 名前:132人目の素数さん mailto:sage [2020/03/24(火) 14:42:23 ID:TnHQvRcs.net]
富山では62人PCR検査して陽性0人(3月22日までの集計)有病率を推定とその信頼区間を推定したい。

www.pref.toyama.jp/cms_pfile/00021629/01366377.pdf

PCR検査の感度は最頻値0.6標準偏差0.1、特異度は最頻値0.9標準偏差0.05のベータ分布(正規分布は負になったり1を超えるので不適)、
有病率は一様分布として、推定される有病率の期待値と95%を計算せよ。

図示するとこんな感じ。
https://i.imgur.com/Ip6gSCa.png

stanのモデルのスクリプトはこれ
sn,spはβ分布のパラメータ、その計算法は既述

data{
int n; // sample size
int x; // positive test result
real<lower=0,upper=1> ul; // uniform(0,ul)
real<lower=0> sn[2]; // sen ~ beta(sn[1],sn[2])
real<lower=0> sp[2]; // spc ~ beta(sp[1],sp[2])
}

parameters{
real<lower=0,upper=1> prev; // prevalence
real<lower=0,upper=1> sen; // sensitivity
real<lower=0,upper=1> spc; // specificity
}

transformed parameters{
real<lower=0,upper=1> p;
p = prev*sen + (1-prev)*(1-spc) ; // probability of positive test result
}

model{
x ~ binomial(n,p);
prev ~ uniform(0,ul);
sen ~ beta(sn[1],sn[2]);
spc ~ beta(sp[1],sp[2]);
}

122 名前:132人目の素数さん mailto:sage [2020/03/24(火) 14:54:23 ID:TnHQvRcs.net]
>>116
ここで問題
感度特異度の分布はそのベータ分布として
何人陰性が続けば95%信頼区間の上限が0.05を下回るか?

123 名前:132人目の素数さん mailto:sage [2020/03/24(火) 15:14:26 ID:mBslr8ul.net]
>>117
感度、特異度の分布???

124 名前:132人目の素数さん mailto:sage [2020/03/24(火) 15:56:48 ID:TnHQvRcs.net]
>>118
何でも確率変数にするのがベイズ推計。
p値の分布すら考えるぞ。

125 名前:132人目の素数さん mailto:sage [2020/03/24(火) 16:10:56 ID:TnHQvRcs.net]
PCR検査の感度は最頻値0.6標準偏差0.1、特異度は最頻値0.9標準偏差0.05のベータ分布を事前分布にしたけど、
事後分布はstanによるMCMCで
感度は期待値0.57 95%信頼区間は[0.37,0.77]
特異度は期待値0.96 95%信頼区間は[0.91,0.99]
とコンピュータが計算してくれる。



126 名前:132人目の素数さん mailto:sage [2020/03/24(火) 17:38:05 ID:TnHQvRcs.net]
>116のように弱情報事前分布を設定することで事後分布は次のように描ける。

https://i.imgur.com/J1Xqdfj.png

127 名前:132人目の素数さん mailto:sage [2020/03/24(火) 17:43:56 ID:TnHQvRcs.net]
>>54
いや、特異度の事前分布を設定することで事後分布をMCMCで求めることができる。
>116の設定での結果が>121

128 名前:132人目の素数さん [2020/03/24(火) 18:10:37.68 ID:EUfp1x4d.net]
>>122
結局事前分布の設定次第ってことはないの?

129 名前:132人目の素数さん mailto:sage [2020/03/24(火) 18:45:58.22 ID:TnHQvRcs.net]
>>123
日本人の平均身長を推測するのにその値は1〜2mの間であるという弱情報事前分布は合理的。
感度特異度の分布に正規分布を使うのはアホ。
負になったり、1を超えたりするから。

130 名前:132人目の素数さん mailto:sage [2020/03/24(火) 19:08:27.01 ID:TnHQvRcs.net]
>>123
感度を0.4-0.8の一様分布、特異度を0.8-1.0の一様分布にしても有病率の推定値は
> round(re$mci,5)
mean lower upper
0.02827 0.00000 0.08592
であまり変わらないね。

131 名前:132人目の素数さん mailto:sage [2020/03/24(火) 19:20:40 ID:TnHQvRcs.net]
sensitivity ~ N(m=0.6,sd=0.1) specificity ~ N(m=0.9, sd=0.05)
にしても推測有病率は平均3%弱で 95%CIは0-8%とあまり分布の形にはよらないね。
mean lower upper
0.026841384 0.000000153 0.081071379

確率だと定義域が0-1で計算しやすいのでβ分布を使うことが多い。

132 名前:132人目の素数さん mailto:sage [2020/03/24(火) 21:43:16 ID:mBslr8ul.net]
>>119
そう?
統計の推定の理論で推計する母数は確率変数ではないと習ったけど?

133 名前:132人目の素数さん mailto:sage [2020/03/25(水) 05:45:40 ID:jmNOx22O.net]
>>127
時代は頻度主義統計からベイズ統計だよ。

134 名前:132人目の素数さん mailto:sage [2020/03/25(水) 06:04:40 ID:jmNOx22O.net]
頻度主義統計でも最尤推定では
データを固定してパラメータを動かすだろ。

135 名前:132人目の素数さん mailto:sage [2020/03/25(水) 06:30:36 ID:jmNOx22O.net]
>>127
階層ベイズモデルを扱ったことないの?
>112は簡単な実例。



136 名前:132人目の素数さん mailto:sage [2020/03/25(水) 07:18:32 ID:yWXBkNWD.net]
>>128 >>130
何を持ってベイズ統計っていってんのか知らん。
pcr検査の感度とは被験者が感染者である場合の検査結果が陽性となる条件付き確率でしょ?
条件付き確率の分布ってどういうことよ?
確率がまた確率になるってなんの話してんの?
変数Xの平均とか分散とかは統計学においては推定すべき定数であって確定値。
それの分散なんて数学的に意味不明。
一体どこの統計学の教科書にそんなデタラメ書いてあんの?

137 名前:132人目の素数さん mailto:sage [2020/03/25(水) 07:23:50 ID:r1V62jxn.net]
まちがえた。
確率の平均がまた確率変数になるってどういうことよ、ね。
式でかけば確率変数Xの平均E(X)の分散ってなんの話ってことになる。
確率変数Xはある標本空間上の関数だけどE(X)は実数だよ?

138 名前:132人目の素数さん mailto:sage [2020/03/25(水) 09:57:10 ID:2o2 ]
[ここ壊れてます]

139 名前:7M3ww.net mailto: >>131
ベイズ階層モデルも組めない奴とは議論にならんね。
分散の事前分布に逆ガンマ分布でなく半コーシーを使う方がいいとかいう議論も理解できんだろ。
[]
[ここ壊れてます]

140 名前:132人目の素数さん mailto:sage [2020/03/25(水) 10:06:13 ID:2o27M3ww.net]
>>131
ベータ分布は定義域が[0,1]で二項分布の確率の確率密度関数としてベイズ階層モデルでは頻用されるよ。

ベイズ階層モデルを使わずにこの計算できるならやってみてくれ。
020/3/24 11:00時点で検査人数での陽性率は171/2013であるという。
新型コロナ肺炎のPCR検査の感度は5〜7割、特異度は9割前後らしい。幅をもたせた値を使って検査をうけたグループの有病率を計算せよ。

141 名前:132人目の素数さん mailto:sage [2020/03/25(水) 11:27:50 ID:82yASlvk.net]
>>133
まぁ言わんとする事はもちろんわかるし伝わるけど、疫学だから数学やってる人間がなんとなく伝わるではダメだろ?
数学だけの話ではなく、疫学は実社会とキチンと繋がってるんだから?
統計学ではあくまで検定する母数は定数。
それは確率モデルでは実数値であり、定数。
そして統計データを確率変数に割り当てる。
当然それらの確率変数は一つの測度空間の一つしかない確率変数であり、平均も分散もひとつしかない定数値。
それらをいっぱい考えてどうこう言ってるんだろうとは思うけどそんなの統計学や疫学の一般的な考えにはない。
何故なら現実世界はひとつしかなく、確率変数に対応している統計量も一個しかない。
もちろん母数がめちゃめちゃ大きい統計量で例えば10000個のデータを100こずつ切って100個の統計量を100の世界からとってきたなんて考えが無理クリできなくはないが、そんな考え方は普通しない。
それはあくまで100個ずつに区切られた10000個の一つの世界の確率変数としか扱わない。
そういうオリジナルな考えで捉えたいならそれは勝手だけど、それならそれで話の中で明示しないとダメ。
数学の世界なら言わずもがなの話は言わなくてもエスパーしてもらえても、疫学、統計学の世界では実社会とつながる話だからダメ。

142 名前:132人目の素数さん mailto:sage [2020/03/25(水) 12:30:50.29 ID:jmNOx22O.net]
>>135
能書きいいから、

ベイズ階層モデルを使わずにこの計算できるならやってみてくれ。

020/3/24 11:00時点で検査人数での陽性率は171/2013であるという。
新型コロナ肺炎のPCR検査の感度は5〜7割、特異度は9割前後らしい。幅をもたせた値を使って検査をうけたグループの有病率を計算せよ。

143 名前:132人目の素数さん mailto:sage [2020/03/25(水) 12:39:07.64 ID:jmNOx22O.net]
>>136
こういう判断が現実には必要。
検査特性を無視して単純な割り算だと検査を受けた人の有病率は8.5%弱になるけどこれは過大評価か過小評価か?

144 名前:132人目の素数さん mailto:sage [2020/03/25(水) 14:59:13.04 ID:jmNOx22O.net]
検査感度が5-7割、特異度が9割前後なら
検査陽性率=有病率とすると常に過大評価かどうか気になったので陽性数を変化させて計算してみた。
検査感度はmode=0.6,sd=0.1 特異度はmode=0.9,sd=0.05のベータ分布に設定してJAGSでベイズ階層モデルをたてて計算。


https://i.imgur.com/zTdxRrb.png

陽性率が20%未満のときは過大評価、それ以上のときは過小評価である、という結論になった。

ベイズ統計を理解できている人の検証希望。

145 名前:132人目の素数さん mailto:sage [2020/03/25(水) 17:30:41 ID:jmNOx22O.net]
>>138
プログラムの練習がてらに、
MCMCのアルゴリズムの異なるstanでベイズ階層モデルを組んで検証。
当然ながら、同様の結果。 検査陽性率が20%を境に過大評価と過小評価が入れ替わる。

https://i.imgur.com/ItSNWdD.png



146 名前:132人目の素数さん mailto:sage [2020/03/25(水) 21:21:08.00 ID:jmNOx22O.net]
>>136(自己レス)

今日の都の発表で(171+41)/(2013+89) に検査陽性率が増えたので再計算。

https://i.imgur.com/THdYDqT.png

147 名前:132人目の素数さん mailto:sage [2020/03/25(水) 21:33:22.10 ID:jmNOx22O.net]
>>138
サンプリング回数を増やしてグラフを完成。

https://i.imgur.com/kLjCD2y.png []
[ここ壊れてます]

149 名前:132人目の素数さん mailto:sage [2020/03/26(木) 16:25:58 ID:+rQz06p5.net]
>>140
89は検査数で検査人数は74という。
計算し直すと

> PCRj2(N,r,SEN=0.6,SD1=0.1,SPC=0.9,SD2=0.05,N.ITER=5e5)
|**************************************************| 100%
mean lower upper
0.05720165 0.00000015 0.1332385

150 名前:132人目の素数さん mailto:sage [2020/03/26(木) 16:34:28 ID:+rQz06p5.net]
41/74の推測有病率は

mean lower upper
0.8121975 0.5957315 0.9999992

151 名前:132人目の素数さん mailto:sage [2020/03/27(金) 11:07:27 ID:sdGiAEI7.net]
オリンピック延期発表後の検査陽性率は88/169で52%だが、
PCR検査の感度と特異度がはっきりしないので、検査陽性率をこの集団の有病率とするのは正しくない。
88/169のときの感度・特異度と推定有病率の関係をグラフにしてみた。
https://i.imgur.com/iQC88tZ.png
感度0.6、特異度0.9のときの推定有病率は85%で陽性率からの憶測は過小評価といえる。

152 名前:132人目の素数さん [2020/03/27(金) 18:36:04.97 ID:8rq7DP6B.net]
検査陽性率が小さいときには、実際の有病率より過大評価してるし、
検査陽性率が高いときは、過小評価してるだろうってことでしょ。
そのくらいは定性的に理解できる。

153 名前:132人目の素数さん mailto:sage [2020/03/27(金) 20:59:08.67 ID:sdGiAEI7.net]
>>145
どこが境目かは直感じゃわからんね。

154 名前:132人目の素数さん [2020/03/27(金) 22:15:19.84 ID:8rq7DP6B.net]
そりゃ感度や特異度次第だからな。

まあ、数%と数十%では違うんだということがわかればいいんじゃね?
境目なんかどうでもいいでしょ。

155 名前:132人目の素数さん mailto:sage [2020/03/27(金) 22:22:39.69 ID:sdGiAEI7.net]
陽性率が15%でこれを有病率の推測値に使うのは過大評価なのか過小評価がわからんのはまずいね。



156 名前:132人目の素数さん mailto:sage [2020/03/27(金) 23:24:27 ID:sdGiAEI7.net]
オリンピック延期決定以後の検査数と陽性数
subjects=c(74,95,87)
positives=c(41,47,40)
PCRs3(subjects,positives,iter=10000,warmup=1000)
として、
感度・特異度を考慮した推定有病率は
mean lower upper
0.77417 0.56756 0.99944
>
日々の陽性数が二項分布に従うとして計算。

157 名前:132人目の素数さん [2020/03/28(土) 03:24:30.89 ID:NK6wIjWT.net]
志村けんみたいな有名人がコロナに感染してることから日本全体のコロナ感染者数を推定してみる。

まず、日本の有名人が1000人いるとしよう。
つぎに、日本でコロナに感染していない確率をxとしよう。
すると、有名人1000人が一人も感染していない確率は、xの1000乗となる。これをyとおこう。すると、有名人が一人でも感染している確率は(1-y)となる、これをzとおこう。
まとめると以下の関係がなりたつ。

・コロナに感染しない確率:x
・有名人が一人もコロナに感染しない確率:y=x^1000
・有名人が一人でもコロナに感染している確率:z = 1-y

158 名前:132人目の素数さん [2020/03/28(土) 03:25:09.78 ID:NK6wIjWT.net]
志村は感染したわけなので、以下、2つのケースにわける

ケース1: zが10%のとき
z=0.1, 故にy = 1-0.1=0.9
故にx = y^0.001よりx=0.9^0.001=0.999894
これがコロナに感染していない確率なので、
コロナ感染確率は、1-0.999894=0.000106
よって日本のコロナ感染者数は推定
120,000,000*0.000106=12,720人

ケース2:zが50%のとき
ケース1と同様の計算で、
日本のコロナ感染者数は推定
120,000,000*0.000693=83,160人

159 名前:132人目の素数さん [2020/03/28(土) 09:37:19.12 ID:uwBdnirU.net]
検査が少ないから感染者増が緩やか?数学的に検証してみた
agora-web.jp/archives/2045047.html

主な関係国について、新型コロナ感染者数の片対数グラフがある。
agora-web.jp/cms/wp-content/uploads/2020/03/WS000876.jpg
FT.comより

感染者数の伸びが日本は緩やかと解釈するのが普通だが、検査が少ないからとする解釈もある。本当はどうなのか計算してみる。

結論を先に書くと、検査が多いか少ないかは関係ない。

160 名前:132人目の素数さん mailto:sage [2020/03/28(土) 09:40:23.67 ID:QZo3p56d.net]
対数をとると係数(感染者の発見率)は定数項になり、今回の片対数グラフ

161 名前:フ整理法の前提としてキャンセルされる
日本が展開しているのは患者認定の精度上昇であり、医療リソースの効果を最大化して死者数を低く抑えている要因の一つといえる
[]
[ここ壊れてます]

162 名前:132人目の素数さん mailto:sage [2020/03/28(土) 10:39:35.99 ID:BJlezchp.net]
キャバクラ客100人から無作為に5人から検体を採取してこの検体を混合攪拌してコロナ検査したところ陽性であった。

(1)100人のキャバクラ客の陽性数の期待値と95%信頼区間を求めよ。
(2)PCR検査の感度0.6、特異度0.9として100人のキャバクラ客の感染数の期待値と95%信頼区間を求めよ。

163 名前:132人目の素数さん mailto:sage [2020/03/28(土) 11:58:45.95 ID:BJlezchp.net]
>>151
> m=1000 # 有名人の人数
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 63590201/1002
> as.numeric(E)
[1] 63463.27

6万3000人と計算された。

164 名前:132人目の素数さん [2020/03/28(土) 12:46:07.99 ID:NK6wIjWT.net]
>>155
良く分からんが、ありがとう。
こちとら高校レベルの確率の知識しかないもんで。

165 名前:132人目の素数さん mailto:sage [2020/03/28(土) 15:42:06.57 ID:BJlezchp.net]
>>156
n(=10)人の中にi人の感染者がいるとき無作為にm(=2)人を選ぶ。
選ばれた2人の中に少なくとも一人の感染者がいる確率をP[x]として、
n個からr個選ぶ組み合わせの数をChoose(n,r)で表すと

P[xi]=1- choose(10-x,2)/choose(10,2)

xを0から10まで変化させて、

Σx*P[x]/(ΣP[x])で

期待値が求まる。



166 名前:132人目の素数さん mailto:sage [2020/03/28(土) 15:42:43.27 ID:BJlezchp.net]
タイプミス修正

P[x]=1- choose(10-x,2)/choose(10,2)

167 名前:132人目の素数さん mailto:sage [2020/03/28(土) 16:07:51.35 ID:qsSYTF8t.net]
何このアホスレ?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<421KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef