草庐IT

[概率论与数理统计]笔记:5.3 置信区间

feixianxing 2023-03-28 原文

5.3 置信区间

前言

点估计无法提供其估计的误差,而区间估计可以。

案例:“某人的月薪比2k多,比20k少”,这就是一个区间估计。

区间估计的好坏有两个衡量指标:

  • 区间长度
  • 真实值落在该区间的概率

我们希望区间长度足够小,而真实值落在该区间的概率又足够大。

事实上,这两个指标是矛盾的,如果概率很大,会导致区间变大;如果区间长度变小,落在区间内的概率就会变小。

定义

\[P\{\underline{\theta}<\theta<\overline{\theta}\}=1-\alpha \]

  • \(\theta\)是要估计的参数。
  • \((\underline{\theta},\overline{\theta})\)是置信区间,其中\(\underline{\theta}\)是置信下限,\(\overline{\theta}\)是置信上限。
  • \(1-\alpha\)是置信水平,或者叫置信度。

做题的时候一般是题目告知置信度,然后需要求解置信上下限。

表述

\((\underline\theta,\overline\theta)\)套住\(\theta\)的概率是\(1-\alpha\)

这里需要区分两种表述:

  1. \((\underline\theta,\overline\theta)\)套住\(\theta\)的概率是\(1-\alpha\)
  2. \(\theta\) 落在 \((\underline\theta,\overline\theta)\)的概率是\(1-\alpha\)

需要明确的是,\(\theta\)虽然是未知的,但是是确定的。\(\theta\)准确地固定在数轴上的一个位置,只是我们不知道在哪里。我们使用区间\((\underline\theta,\overline\theta)\)来做多次试验,每次试验的区间是随机的不同的,因此\(\theta\)有时会被区间套住,有时候不会。

因此,我们使用的表述是套住,而不是落在。后者是针对不确定的值时候的表述。


枢轴变量

定义

为了求解置信区间,需要构造枢轴变量

\[I=I(T,\theta) \]

其中\(\theta\)是未知参数,\(T\)是已知的,\(I\) 的分布已知且与\(\theta\)无关。

对于给定的\(1-\alpha\),确定\(F\)的上\(\frac{\alpha}{2}\)分位数,记为\(u_{\frac{\alpha}{2}}\);确定\(F\)的上\((1-\frac{\alpha}{2})\)分位数,记为\(u_{1-\frac{\alpha}{2}}\),那么就会有

\[P\{u_{1-\frac{\alpha}{2}}<I(T,\theta)<u_{\frac{\alpha}{2}}\}=1-\alpha \]

图解

对于给定的置信度,也就是概率\(1-\alpha\),我们的目的是求解区间上下限,也就是图中的\(m\)\(n\)

值得注意的是,我们希望区间长度小一些,如果研究的分布是正态分布,或者密度函数类似于上图,那么在置信度一定的情况下,即图中蓝色区域面积一定,只要选定区间位于中间,关于\(y\)轴对称,那么区间长度就是最小的。(因为峰值在中间)

当置信区间位于中间时,置信度为\(1-\alpha\),那么左右两个置信上下限就可以通过上侧分位数表示了。

中间的阴影面积为\(1-\alpha\),那么左右两侧的空白面积就分别是\(\frac{\alpha}{2}\)

置信上限使用上侧分位数表示就是:\(u_{\frac{\alpha}{2}}\).

置信下限使用上侧分位数表示就是:\(u_{1-\frac{\alpha}{2}}\).

总结

构造枢轴变量的目的是为了求解置信区间,将枢轴变量构造成我们熟悉的分布,比如正态分布,\(t\)分布,\(F\)分布。然后就可以利用这些分布的性质列出不等式,然后求解出我们要估计的参数的区间。

需要注意的是,枢轴变量只能包含一个未知的参数,即我们要估计的参数\(\theta\),只有这样才能进行不等式化简。


正态总体参数的置信区间

均值\(\mu\)的置信区间

情况1:方差\(\sigma^2\)已知

总体方差\(\sigma^2\)已知,估计\(\mu\),此时\(\mu\)是未知参数。

构造枢轴量:

\[U=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \]

相关知识点:?抽样分布相关的定理的推论.

:对于枢轴量\(U\)来说

  • \(\overline{X}\)\(\sqrt{n}\)由样本可以知道,是已知的。
  • \(\sigma\)由于总体方差\(\sigma^2\)已知,所以也是已知的。
  • \(U\)已知服从标准正态分布,该分布与未知参数\(\mu\)无关。

\(U\)服从标准正态分布,具有对称性

对于给定的置信度\(1-\alpha\),可以计算得到\(\frac{\alpha}{2}\),查表就可以得到上侧分位数\(u_{\frac{\alpha}{2}}\)的值,再根据对称性,就有

\[P\{-u_{\frac{\alpha}{2}}<\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}<u_{\frac{\alpha}{2}} \}=1-\alpha \]

于是就可以求解出\(\mu\)的置信区间:

\[\overline{X}-\frac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}} < \mu < \overline{X}+\frac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}} \]

理解

  • 如果增大置信度\(1-\alpha\),那么\(\alpha\)就会变小,于是上侧分位数\(u_{\frac{\alpha}{2}}\)会变大,代入上面的置信区间公式,就会发现置信上限变大了,置信下限变小了,即置信区间的区间长度变大了。
  • 观察到样本容量\(n\)位于分母位置,于是发现样本数增加可以缩小置信区间的区间长度。但是需要注意的是实际调研中,收集样本是需要投入时间和金钱的,更多的样本意味着更高的成本。

做题思路:代入已知数值求解区间上下限就行了?.


情况2:方差\(\sigma^2\)未知

总体方差\(\sigma^2\)未知,那么在构造枢轴变量的时候可以转而使用样本方差\(S^2\).

构造枢轴变量:

\[T=\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) \]

相关知识点:?抽样分布相关的定理

其中的\(S\)样本标准差

由于\(t\)分布是具有对称性的,对于给定的置信度\(1-\alpha\),有

\[P\{ -t_{\frac{\alpha}{2}}(n-1) < \frac{\overline{X}-\mu}{S/\sqrt{n}} < t_{\frac{\alpha}{2}}(n-1) \} =1-\alpha \]

同理可解得置信区间为

\[\overline{X}-\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) < \mu < \overline{X}+\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) \]

\(t_{\frac{\alpha}{2}}(n-1)\)是自由度为\(n-1\)\(t\)分布的上侧\(\frac{\alpha}{2}\)分位数,可以通过查表得到。


方差\(\sigma^2\)的置信区间

情况1:均值\(\mu\)已知

构造枢轴变量:

\[\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2 \sim \chi^2(n) \]

相关知识点:?抽样分布相关的定理

该枢轴变量只有总体方差\(\sigma^2\)是未知的。

:卡方分布不是对称的,但是由于习惯,在选择上侧分位数的时候仍然使用选择\(\frac{\alpha}{2}\),但是不能像正态分布或者\(t\)分布一样直接使用相反数(比如上面的\(t_{\frac{\alpha}{2}}(n-1)\)\(-t_{\frac{\alpha}{2}}(n-1)\)),而是要使用\(\chi^2_{1-\frac{\alpha}{2}}(n)\)\(\chi^2_{\frac{\alpha}{2}}(n)\).

\[\chi^2_{1-\frac{\alpha}{2}}(n) < \frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2 < \chi^2_{\frac{\alpha}{2}}(n) \]

可以解得:

\[\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)} < \sigma^2 < \frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)} \]


情况2:均值\(\mu\)未知

总体均值\(\mu\)未知,转而使用样本均值\(\overline{X}\)构造枢轴变量:

\[\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) \]

相关知识点:?抽样分布 定理 2

由于样本是已知的,所以样本容量\(n\)和样本方差\(S^2\)都是已知的,只有要估计的\(\sigma^2\)是未知的。

类似地,对于给定的置信度\(1-\alpha\),计算上侧分位数\(\chi^2_{1-\frac{\alpha}{2}}(n-1)\)\(\chi^2_{\frac{\alpha}{2}}(n-1)\).

于是有

\[P\{ \chi^2_{1-\frac{\alpha}{2}}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\frac{\alpha}{2}}(n-1) \} = 1-\alpha \]

可以解得:

\[\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)} < \sigma^2 < \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)} \]


总结

使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社

有关[概率论与数理统计]笔记:5.3 置信区间的更多相关文章

  1. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  2. Unity Shader 学习笔记(5)Shader变体、Shader属性定义技巧、自定义材质面板 - 2

    写在之前Shader变体、Shader属性定义技巧、自定义材质面板,这三个知识点任何一个单拿出来都是一套知识体系,不能一概而论,本文章目的在于将学习和实际工作中遇见的问题进行总结,类似于网络笔记之用,方便后续回顾查看,如有以偏概全、不祥不尽之处,还望海涵。1、Shader变体先看一段代码......Properties{ [KeywordEnum(on,off)]USL_USE_COL("IsUseColorMixTex?",int)=0 [Toggle(IS_RED_ON)]_IsRed("IsRed?",int)=0}......//中间省略,后续会有完整代码 #pragmamulti_c

  3. Tcl脚本入门笔记详解(一) - 2

    TCL脚本语言简介•TCL(ToolCommandLanguage)是一种解释执行的脚本语言(ScriptingLanguage),它提供了通用的编程能力:支持变量、过程和控制结构;同时TCL还拥有一个功能强大的固有的核心命令集。TCL经常被用于快速原型开发,脚本编程,GUI和测试等方面。•实际上包含了两个部分:一个语言和一个库。首先,Tcl是一种简单的脚本语言,主要使用于发布命令给一些互交程序如文本编辑器、调试器和shell。由于TCL的解释器是用C\C++语言的过程库实现的,因此在某种意义上我们又可以把TCL看作C库,这个库中有丰富的用于扩展TCL命令的C\C++过程和函数,所以,Tcl是

  4. ruby - 如何获取我的 Sinatra 应用程序的代码覆盖率统计信息? - 2

    我编写了一个Sinatra应用程序(网站),我想收集网站代码的代码覆盖率信息。我是Ruby的新手,但Google告诉我rcov是一个很好的代码覆盖工具。不幸的是,我在网上可以找到的所有信息只显示了如何获取有关测试用例的代码覆盖率信息-我想要有关我的站点本身的代码覆盖率信息。我想要分析的特定站点文件位于“sdk”和“sdk/vendor”目录中,因此我通常使用“rubysite.rb”运行我的站点的地方我改为尝试以下操作:rcov-Isdk-Isdk/vendorsite.rb它显示了Sinatra启动文本,但随后立即退出,而不是像我的Sinatra应用程序通常那样等待网络请求。有人能告

  5. ruby-on-rails - 收集 Rails 应用程序使用统计信息的最佳方式 - 2

    我有一个Rails应用程序,用户可以在其中设置他们的域并在其中发布内容。我需要收集公共(public)流量统计信息,例如网页浏览量等。此功能的一个很好的例子是我作为客户可以看到的flickr使用统计信息。问题是收集使用信息的最佳方式是什么。应该通过解析日志文件来完成还是应该在运行时收集并存储在数据库中?是否有任何工具或Rails插件已经提供了此功能?此解决方案应该可以很好地扩展,即使每月有数千个域和数百万次网页浏览。 最佳答案 GoogleAnalytics可能是您最好的选择... 关于

  6. 计算机网络笔记:TCP三次握手和四次挥手过程 - 2

    TCP是面向连接的协议,连接的建立和释放是每一次面向连接的通信中必不可少的过程。TCP连接的管理就是使连接的建立和释放都能正常地进行。三次握手TCP连接的建立—三次握手建立TCP连接①若主机A中运行了一个客户进程,当它需要主机B的服务时,就发起TCP连接请求,并在所发送的分段中用SYN=1表示连接请求,并产生一个随机发送序号x,如果连接成功,A将以x作为其发送序号的初始值:seq=x。主机B收到A的连接请求报文,就完成了第一次握手。客户端发送SYN=1表示连接请求客户端发送一个随机发送序号x,如果连接成功,A将以x作为其发送序号的初始值:seq=x②主机B如果同意建立连接,则向主机A发送确认报

  7. 华为数通笔记VXLAN&BGP EVPN - 2

    VXLAN简介定义RFC定义了VLAN扩展方案VXLAN(VirtualeXtensibleLocalAreaNetwork,虚拟扩展局域网)。VXLAN采用MACinUDP(UserDatagramProtocol)封装方式,是NVO3(NetworkVirtualizationoverLayer3)中的一种网络虚拟化技术。目的随着网络技术的发展,云计算凭借其在系统利用率高、人力/管理成本低、灵活性/可扩展性强等方面表现出的优势,已经成为目前企业IT建设的新趋势。而服务器虚拟化作为云计算的核心技术之一,得到了越来越多的应用。服务器虚拟化技术的广泛部署,极大地增加了数据中心的计算密度;同时,为

  8. ruby - 删除括号内的文本(括号内的括号概率) - 2

    我试图删除括号内的文本(连同括号本身),但遇到括号内有括号的情况时遇到问题。这是我正在使用的方法(在Ruby中):sentence.gsub(/\(.*?\)/,"")在我写出如下句子之前一切正常:"Thisis(atest(string))"然后上面就噎住了。任何人都知道如何做到这一点?我完全被难住了。 最佳答案 一种方法是从内向外替换括号组:x=string.dupwhilex.gsub!(/\([^()]*\)/,"");endx 关于ruby-删除括号内的文本(括号内的括号概率)

  9. Ruby:在代码中使用 rand() 但编写测试来验证概率 - 2

    我有一些代码可以根据加权随机数提供内容。权重越大的东西越有可能被随机选择。现在作为一名优秀的ruby​​ist,我当然想用测试覆盖所有这些代码。我想测试是否根据正确的概率获取了东西。那么我该如何测试呢?为应该是随机的东西创建测试使得很难比较实际与预期。我有一些想法,以及为什么它们不会很好地工作:在我的测试中stubKernel.rand以返回固定值。这很酷,但是rand()被调用了多次,我不确定我是否可以通过足够的控制来装备它来测试我需要的东西。多次获取随机项目,并将实际比率与预期比率进行比较。但除非我可以无限次地运行它,否则这永远不会完美,并且如果我在RNG中运气不佳,可能会间歇性地

  10. [蓝桥杯单片机]学习笔记——串口通信的基本原理与应用 - 2

    目录一、原理部分1、什么是串行通信(1)并行通信与串行通信(2)串行通信的制式(3)串行通信的主要方式  2、配置串口(1)SCON和PCON:串行口1的控制寄存器(2)SBUF:串行口数据缓冲寄存器 (3)AUXR:辅助寄存器​编辑(4)ES、PS:与串行口1中断相关的寄存器(5)波特率设置  3、串口框架编写二、程序案例一、原理部分1、什么是串行通信(1)并行通信与串行通信微控制器与外部设备的数据通信,根据连线结构和传送方式的不同,可以分为两种:并行通信和串行通信。并行通信:数据的各位同时发送与接收,每个数据位使用一条导线,这种方式传输快,但是需要多条导线进行信号传输。串行通信:数据一位一

随机推荐