如何正确地使用frequentist置信区间
我知道这上面有很多线程(例如,这个优秀的线程)。我可能错过了它,但我似乎找不到一个能真正解释如何使用区间中包含的实际数字准确地报告一个常客的信心。所以
解答动态
您可以通过多种方式合理地使用置信区间语句,但以下语句的任何变化都可以。(由于您没有指定相反的内容,我假设这是一个95%的置信区间。如果没有,那么你应该在陈述中做出适当的改变。)重要的是你要清楚地给出你的信心水平和兴趣区间。您还应该确保正确区分估计值的符号和真参数值的符号。
我们对斜率的估计是$\hat{\beta}=3.4$($\text{95%CI}=[0.5,5.6]$).
95%置信度下,我们推断真实斜率值在$0.5\leqslant\beta\leqslant 5.6$区间内。
95%置信度下,我们发现$0.5\leqslant\beta\leqslant 5.6$。
“置信度”的概念在经典统计学中具有明确而众所周知的含义,因此,如果您指的是某个参数在某个区间内具有一定的置信度,那么这将自动理解为报告一个置信区间。你不必担心是否忠实于某个特定的框架——在实践中,概率论只有一个框架,而置信区间只有一个含义。事实上,当其他框架开发类似的概念时(例如,贝叶斯推理中的“可信区间”),它们确保精确地使用不同的术语,以避免在这个主题上的混淆。
如果您只是在做应用统计工作,那么就不必指定“置信度”的确切统计含义;。对大多数读者来说,这是微妙和混乱的,如果他们感兴趣,你可以合理地让他们承担阅读的责任。许多在任何领域有应用科学背景的人都会上过一些统计学入门课程,在那里他们学到了,然后忘记了置信区间的含义。大多数读者只会对统计界认可这个概念的事实感到满意。对于统计专家来说,他们会知道这个概念的确切含义,并且对你的总结报告同样满意。担心“概率”的正确解释是另一个顺序,在报告数据的统计分析时,这当然不是你需要关心的问题。如果感兴趣的读者真的愿意的话,他们可以深入到哲学和概率论基础的兔子洞里去。
$^\dagger$学术文献中偶尔会有一些研究“概率”的非标准版本(例如,使用复数等),但这些基本上都是废话这是一座金矿。它本身就值得一读。
置信区间解释是精确有用性权衡的一种实践:您可以精确地说明什么是置信区间,它将不会有用。随着精度的降低,它变得越来越有用。然而,这种精度的损失是一种代价,你对置信区间的解释越有用,就有越多的人会不同意你的观点(由于失去了精确性)。
解释置信区间的一种流行方法如下(根据链接的帖子):
相容性区间表明了一系列似是而非的真实治疗效果。
Or put不同的是,间隔内的参数表示参数的合理真值;。我不完全相信这种解释。这里的“true”取决于所选的$\alpha$,而我并不认为必须将$\alpha=0.05$作为真值。考虑到这一点,也许一个好的修正是
根据我们允许的假阳性率,相容性区间表明了一系列合理的真实治疗效果。
如果这是我学到的一件事,那就是人们对置信区间的解释仍然存在分歧。为了避免谈论这个问题(一次又一次),我只说
置信区间总结了参数空间中与数据一致的区域
我发现这种解释在有用性和精确性之间有足够好的平衡;我们对斜率的估计是$\hat{\beta}=3.4\(95\%\{\rm CI}=[0.5,5.6])$。quot;如果我们进行许多实验,95%的95%的区间构造将包含$beta$的真实值;当我教书的时候我确实会这么说(虽然我会用额外的解释和活动来补充),但我从不对客户说。这并不是一个对很多人都适用的说法。老实说,我发现需要为置信区间提供一个定义是很少见的。如果我这么做了,我说的就是如果我们的假设在这个区间内有任何值,我们就不能排除它相反:
如果我们的如果零假设值超出了这个区间,我们就可以排除它关于:
quot;- End
免责声明:
本页内容仅代表作者本人意见,若因此产生任何纠纷由作者本人负责,概与琴岛网公司无关。本页内容仅供参考,请您根据自身实际情况谨慎操作。尤其涉及您或第三方利益等事项,请咨询专业人士处理。