Example
得到癌症的概率是1%, 敏感性和特殊性都是90%, 癌症测试结果呈阳性的人患病的概率有多大?
得到癌症的概率:P(C) = 0.01
SENSITIVITY = 90%, 敏感性, 在P(C)中, 诊断的准确率为90%, 10%的人可能患有癌症, 却被诊断成正常人.
SPECITIVITY = 90%, 特异性, 在P(¬C)中, 诊断的正确率为90%, 10%的正常人被误诊为有癌症.
画图分析
上图中, C表示患有癌症的人, C Pos表示患有癌症且被确诊的人, Pos Bu ¬表示被误诊为癌症的正常人.
问题: 癌症测试结果呈阳性的人患病的概率有多大?
假设这里一共有总共有1000个人(All_People)
Pos But ¬(正常人被误诊) = All_People * (1 - SPECITIVITY)
= 1000 * (1 - 0.9)
= 100
C(实际患有癌症的人) = All_People * P(C)
= 1000 * 0.01
= 10
C Pos(实际上患有癌症且被确诊的人) = C * SENSITIVITY
= 10 * 0.9
= 9
癌症测试结果呈阳性的所有人 = (C Pos(实际上患有癌症且被确诊的人)) + (Pos But ¬(正常人被误诊))
= 9 + 100
= 109
癌症测试结果呈阳性的人患病的概率 = (C Pos(实际上患有癌症且被确诊的人) ) / (癌症测试结果呈阳性的所有人)
= 9 / 109
= 0.083(四舍五入到小数点后三位)
先验与后验
Prior Probability(校验之前所得到的概率) * Test Evidence(测试本身获得的一些证据) = Posterior Probability(后验概率)
将测试中的某些证据加入先验概率中, 以获得联合概率.
Prior(先验)
癌症的先验概率: P(C) = 0.01 = 1%
非癌症的先验概率: P(¬C) = 1 − P(C)
= 0.99
SENSITIVITY(敏感性): P(Pos | C) = 0.9 = 90%
SPECITIVITY(特异性): P(Neg | ¬C) = 0.9 = 90%
被误诊为癌症概率: P(Pos | ¬C) = 1 − SPECITIVITY
= 0.1
Joint(联合概率)
癌症的联合概率: P(C, Pos) = P(C) * SENSITIVITY
= 0.01 * 0.9
= 0.009
非癌症的联合概率: P(¬C, Pos) = P(¬C) * P(Pos | ¬C)
= 0.99 * 0.1
= 0.099
Normalization(归一化)
数字归一, 比例保持不变, 确保他们相加之和为1.
后验概率求和 = 癌症的后验概率 + 非癌症的后验概率
检测为阳性的概率: P(Pos) = P(C, Pos) + P(¬C, Pos)
= 0.009 + 0.099
= 0.108
Posterior(后验概率)
癌症的后验概率: P(C | Pos) = 癌症的联合概率 / 检测为阳性的概率
= (P(C, Pos)) / (P(Pos))
= 0.009 / 0.108
= 0.0833
非癌症的后验概率: P(¬C | Pos) = 非癌症的联合概率 / 检测为阳性的概率
= (P(¬C, Pos)) / (P(Pos))
= 0.099 / 0.108
= 0.9167
后验概率求和: 癌症的后验概率 + 非癌症的后验概率 = P(C | Pos) + P(¬C | Pos)
= 0.0833 + 0.9167
= 1
Be First to Comment