[统计学]一文看懂如何计算置信区间


计算置信区间

[统计学]一文看懂如何计算置信区间

        目录
    1.置信区间计算公式
    2.前提条件
    3.利用公式计算
    4.计算结果
    5.总结


    我们接着[统计学]推论统计中的区间估计是什么?如何理解置信水平和置信区间?中公司代表与公司高层交涉工资的栗子,接下来计算置信区间。

    1.置信区间计算公式
    为了让你不被公式吓到,更容易接受,咱先看一下用文字表述的计算公式。既然是计算区间,那结果肯定为一个范围值,有两个结果。为了简洁,我把置信区间的两边结果用①②来代替。

    将文字表述的计算公式用下图中的数学符号进行替换。下图中下划线的项目即是需要替换的项目。样本平均,样本标准差和自由度。
    关于自由度可以参考→[统计学]什么是无偏估计?为何方差的无偏估计要/n-1?中的第2个问题。

    替换之后得到可以用数字进行计算的计算公式。


    2.前提条件

    使用计算公式之前,有两个前提条件必须明确。

    前提条件1.假定全体员工去年存款符合正态分布。

    这个前提条件是非常合理的。
    1年存款在几万几十万的人最多,几百万的人几乎没有。反过来,几十万,几百万赤字的人也很少。所以应该是以几十万为中心,向左右两边扩展的山形分布。这样的分布当成正态分布也不会犯什么大错,所以我们假定存款符合正态分布。
    关于正态分布请参考→[统计学]什么是正态分布?图解来说清楚

    前提条件2.假定员工人数非常多。

    严密来讲,员工的人数必须是无限多。但是现实运用来讲,有几百人以上的话就可以当成无限多来应用。与员工数量少相比,假定员工数是无限多的情况道理更加简单,我们做这个假定。


    3.利用公式计算

    员工代表2人的存款分布为10万和20万,所以x1为10,x2为30。先分别求得样本平均,样本标准差,然后代入公式进行计算。

代入计算式

    关于自由度可以参考→[统计学]什么是无偏估计?为何方差的无偏估计要/n-1?中的第2个问题。

    这里的t需要查t分布表。
    ①确认自由度,因为自由度为1,所以找到自由度为1的行。
    ②决定置信水平,我们将置信水平定为90%。则t分布表中的P为0.10(理解P为不在区间内的概率),所以结果查表结果是6.314。

    ①②③④的结果如下。


    4.计算结果

    置信水平90%的置信区间是

    ⇒员工的平均存款90%置信区间为(-43.14万, 83.14万)

    同理,
    ⇒员工的平均存款95%置信区间为(-107.06万, 147.06万)


    5.总结

    我们对符合正态分布的总体,在总体中个体数量够多的情况下,利用t分布,区间估计了总体的平均值μ。其实如果知道总体的标准差,可以进行准确度更高的估计。但是现实情况几乎就跟栗子中的情况一样,总体的方差是无法知道的。