[概率论与数理统计]笔记：2.3 常用的离散型分布

feixianxing 2023-03-28 原文

2.3 常用的离散型分布

退化分布

若随机变量$X$满足

\[P\{X=a\}=1 \]

则称$X$服从$a$处的退化分布，这种情况下，随机变量退化成了一个确定的常数。

两点分布

定义

若随机变量$X$只有两个可能取值，设其分布为

\[P\{X=x_1\}=p,\quad P\{X=x_2\}=1-p,\quad 0<p<1, \]

则称$X$服从$x_1,x_2$处参数为$p$的两点分布。

如果$x_1=1,x_2=0$，则称为0-1分布或伯努利分布，也称$X$为伯努利随机变量。

性质

当$x_1=1,x_2=0$时，有$EX=p,\quad DX=p(1-p)=pq$，其中$q=1-p$.

两点分布也可以表示为：$P\{X=k\}=p^k(1-p)^{1-k},\quad k=0,1$

两点分布是二项分布的特例

联系

伯努利试验

图像

n个点上的均匀分布

定义

如果随机变量$X$的分布满足

\[P\{X=x_i\}=\frac{1}{n},\quad i=1,2,\cdots,n, \]

则称$X$服从$n$个点$\{x_1,x_2,\cdots,x_n\}$上的均匀分布。

性质

$EX=\frac{1}{n}\sum\limits_{i=1}^nx_i=\overline{x}$

$DX=\frac{1}{n}\sum\limits_{n-1}^n(x_i-\overline{x})^2$

数学期望的本质是加权平均数，权重就是对应的概率，在均匀分布中，每个权重都是相等的，所以数学期望就等于算术平均数。

联系

古典概型

图像

二项分布

定义

事件$A$发生的概率为$p$，$n$次试验，发生了$k$次。

如果$X$的分布满足

\[P\{X=k\}=C_n^kp^k(1-p)^{n-k},\quad k=0,1,2,\cdots,n, \]

则称$X$服从参数为$n,p$的二项分布，并记作$X\sim B(n,p)$.

记$B(k;n,p)=C_n^kp^k(1-p)^{n-k}$.

当$n=1$时，二项分布$B(1,p)$就是参数为$p$的0-1分布。

性质

最可能值
- 若$(n+1)p$不为整数，则$[(n+1)p]$达最大值，其中$f(x)=[x]$是取整函数。
- 若$(n+1)p$为正数，则$(n+1)p,\ \ (n+1)p-1 $是最大值。
数学期望：$EX=np$
方差：$DX=npq$

联系

$n$重伯努利试验

图像

几何分布

定义

$P(A)=p$，第$k$次首次发生，前$k-1$次不发生的概率为

\[P\{X=k\}=(1-p)^{k-1}p=q^{k-1}p,\quad k\ge1 \]

这样的分布就叫几何分布，记为$X\sim G(p)$.

之所以称为“几何”是因为$q^{k-1}p$是一个几何数列（也叫等比数列）。

性质

数学期望：$EX=\frac{1}{p}$
方差：$DX=\frac{q}{p^2}$
无记忆性：$P\{X>m+n|X>m\}=P\{X>n\}$

对于无记忆性的理解：就算之前做过了$m$次试验，对于接下来的$n$次试验是没有影响的。

计算

$P\{X=k\}=q^{k-1}p$
$P\{X>m\}=\sum\limits_{k=m+1}^\infty q^{k-1}p$

图像

超几何分布

定义

$N$个元素分为两类，个数分别为$N_1,N_2$，即$N=N_1+N_2$。从$N$个元素中取出$n$个元素，设随机变量$X$为$n$个元素中属于第一类元素的个数，则

\[P\{X=k\}=\frac{C_{N_1}^kC_{N_2}^{n-k}}{C_N^n},\quad k=0,1,2,\cdots.min\{n,N_1\} \]

该分布称为超几何分布，记作$X\sim H(N,n,N_1)$，（也有$X\sim H(N,N_1,n)$的记法）。

有时候会把$N_1,N_2$记作$M,N-M$.

$X\sim H(N,n,M)$或$X\sim H(N,M,n)$

联系

超几何分布是不放回的抽取，二项分布是放回的抽取。
当$N,N_1,N_2$很大时，可以用二项分布作为超几何分布的近似：

当$N\to\infty,N_1\to\infty,N_2\to\infty$，且$\frac{N_1}{N}\to p,\ \frac{N_2}{N}\to q$，对于任意给定的$n$和$k$，有

\[\lim\limits_{N\to\infty}\frac{C_{N_1}^kC_{N_2}^{n-k}}{C_N^n}=C_n^kp^kq^{n-k} \]

理解：当$N_1$和$N_2$都很大时，从中拿走一个不放回，数量几乎不变，相当于放回。

性质

数学期望：$EX=n\cdot\frac{N_1}{N}$
方差：$DX=n\cdot\frac{N_1}{N}\cdot\frac{N_2}{N}\cdot\frac{N-n}{N_1}$

图像

这里的参数分别是$N=100,\ M=36,\ n=50.$

泊松分布

定义

如果一个随机变量$X$的概率分布为

\[P\{x=K\}=\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\cdots \]

其中$\lambda>0$为参数，则称$X$服从参数为$\lambda$的泊松分布，记作$X\sim P(\lambda)$.

这里的记号$P$是指Poisson。

联系

泊松分布可以用于近似表示二项分布，这是因为当二项分布的$n\to\infty,\ p\to0,\ np=\lambda$时，二项分布就成为了泊松分布。

泊松定理：在$n$重伯努利试验中，事件$A$在每次试验中发生的概率为$p_n$(这里的概率与试验总数$n$有关)，如果$n\to\infty$时，$np\to\lambda$（$\lambda>0$为常数），则对任意给定的$k$，有

\[\lim\limits_{n\to\infty}B(k;n,p)=\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} \]

证明过程如下：

前提条件有：$n\to\infty,\ p\to0,\ np=\lambda$，所以有$p=\frac{\lambda}{n}$.

需要用到的公式：$C_n^k=\frac{n!}{k!(n-k)!}$，$\lim\limits_{x\to\infty}(1+\frac{1}{x})^x=e$.

首先，将$p=\frac{\lambda}{n}$和组合数公式代入，则

\[\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\lim\limits_{n\to\infty}\frac{n!}{k!(n-k)!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} \]

将$n!$和$(n-k)!$进行化简：

\[\frac{n!}{k!(n-k)!}=\frac{n(n-1)\cdots(n-k+1)}{k!} \]

因此，

\[原式=\lim\limits_{n\to\infty}\frac{n(n-1)\cdots(n-k+1)}{k!}\frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})^{n-k} \]

此时关注分子的$n(n-1)\cdots(n-k+1)$，以及分母的$n^k$（两者都是有$k$项相乘）：

\[\begin{align*} \lim\limits_{n\to\infty}\frac{n(n-1)\cdots(n-k+1)}{n^k} &=\lim\limits_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n} \\ &=\lim\limits_{n\to\infty}1\times(1-\frac{1}{n})\times\cdots\times(1-\frac{k-1}{n}) \\ &=\lim\limits_{n\to\infty}1\times1\times\cdots\times1 \\ &=1 \end{align*} \]

因此，

\[原式=\lim\limits_{n\to\infty}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^{n-k} \]

此时，再关注$\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}$，

\[\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k} = \lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k} \]

其中，因为$n\to\infty$，且$\lambda,\ k$都是有限值，所以$(1-\frac{\lambda}{n})\to1$，所以$\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{-k}=1$

所以$\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}=\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n$

又因为

\[\begin{align*} \lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n &= \lim\limits_{n\to\infty}(1+\frac{1}{-\frac{n}{\lambda}})^n\quad\quad //\ \lambda从分子移到分母 \\ &= \lim\limits_{n\to\infty}[(1+\frac{1}{-\frac{n}{\lambda}})^{-\frac{n}{\lambda}}]^{-\lambda}\quad\quad //\ 指数拼凑出与自然对数重要极限一致的形式\\ &= e^{-\lambda} \end{align*} \]

因此

\[\begin{align*} 原式 &= \lim\limits_{n\to\infty}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^{n-k}\\ &= \frac{\lambda^k}{k!}\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}\quad\quad//\ 常数提取 \\ &= \frac{\lambda^k}{k!}\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n\quad\quad//\ 根据上面的推导 \\ &= \frac{\lambda^k}{k!}e^{-\lambda} \end{align*} \]

证明完毕，

\[\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} \]

证明思路和下面的案例分析来源于B站视频?泊松分布是怎么来的？应该怎么用？

性质

数学期望：$EX=\lambda$
方差：$DX=\lambda$

案例分析

假设有一停车场，1min进入了3辆车，目标是预测1min进入5辆车的概率。

将1min进行$n$等分，且$n\to\infty$，表示1min做了$n$次伯努利试验。

将$\frac{1}{n}$时间内进入一辆车的概率记为$p$，则$p\to0$。

此时，$\lambda=np=3$.

对应的泊松分布为：$P\{X=k\}=\frac{3^k}{k!}e^{-3}$

所以1min进入5辆车的概率为：$P\{X=5\}=\frac{3^5}{5!}e^{-3}\approx0.10081881$

图像

使用教材：
《概率论与数理统计》第四版中国人民大学龙永红主编高等教育出版社

数理笔记 span class inline 非技术区

有关[概率论与数理统计]笔记：2.3 常用的离散型分布的更多相关文章

ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2
大约一年前，我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞，我可以在一个地方轻松完成，而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
ruby - 分布式事务和队列，ruby，erlang，scala - 2
我有一个涉及多台机器、消息队列和事务的问题。因此，例如用户点击网页，点击将消息发送到另一台机器，该机器将付款添加到用户的帐户。每秒可能有数千次点击。事务的所有方面都应该是容错的。我以前从未遇到过这样的事情，但一些阅读表明这是一个众所周知的问题。所以我的问题。我假设安全的方法是使用两阶段提交，但协议(protocol)是阻塞的，所以我不会获得所需的性能，我是否正确？我通常写Ruby，但似乎Redis之类的数据库和Rescue、RabbitMQ等消息队列系统对我的帮助不大——即使我实现某种两阶段提交，如果Redis崩溃，数据也会丢失，因为它本质上只是内存。所有这些让我开始关注erlang和
LC滤波器设计学习笔记（一）滤波电路入门 - 2
目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》，侵权删。前言最近需要学习放大电路和滤波电路，但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放，所以也是相当从零开始学习了。滤波电路科普主要分类滤波器：主要是从不同频率的成分中提取出特定频率的信号。有源滤波器：由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波，最普通易于采用的无源滤波器结构是将电感与电容串联，可对主要次谐波（3、5、7）构成低阻抗旁路。无源滤波器：无源滤波器，又称
ruby-on-rails - 从 Rails 2.3 升级到 Rails 4.0 - 2
我们有一个目前在Rails2.3.12版和Ruby1.8.7版上运行的应用程序。我们想将我们的应用程序更新到Rails4.0和Ruby2.1.0。我们有大约200个模型和150个Controller。我想知道升级过程需要多大的努力。您还可以提供升级可以遵循的步骤。我们应该先升级Ruby然后再升级Rails还是相反？最佳答案您想要实现的目标将是史诗般的努力。我无法为您提供分步说明，因为不可能在一个答案中涵盖所有情况。我建议不要同时升级Ruby和Rails，而是分步升级。升级本身的复杂性是巨大的，但只要您的应用程序具有合理的测试覆盖
ruby-on-rails - Nokogiri 要求 Ruby 版本 < 2.3 - 2
我正在尝试让Rails在Windows10上运行。我正在使用Ruby2.3.0和Rails4.2.6，并且暂时使用Nokogiri1.6.3。当我尝试运行railsnewdemo时，它返回错误:Anerroroccurredwhileinstallingnokogiri(1.6.7.2),andBundlercannotcontinue.Makesurethat`geminstallnokogiri-v'1.6.7.2'`succeedsbeforebundling.当我运行geminstallnokogiri-v'1.6.7.2时，我得到:ERROR:Errorinstallingn
电脑怎么截图？进来看（8种常用截图方法） - 2
电脑上可以截取图片吗？如果可以，该如何操作呢？相信很多小伙伴都只知道一两种截图的方式，知道的并不全面。其实，电脑上有多种方式截图的，而且非常方便。电脑怎么截图？今天我们就来教大家如何使用电脑截取图片的8种常用方式！操作环境：演示机型：Delloptiplex7050系统版本：Windows10方法一：系统自带截图具体操作：同时按下电脑的自带截图键【Windows+shift+S】，可以选择其中一种方式来截取图片：截屏有矩形截屏、任意形状截屏、窗口截屏和全屏截图。方法二：QQ截图具体操作：在电脑登录QQ，然后同时按下【Ctrl+Alt+A】，可以任意截图你需要的界面，可以把截图的页面直接下载，
Unity Shader 学习笔记（5）Shader变体、Shader属性定义技巧、自定义材质面板 - 2
写在之前Shader变体、Shader属性定义技巧、自定义材质面板，这三个知识点任何一个单拿出来都是一套知识体系，不能一概而论，本文章目的在于将学习和实际工作中遇见的问题进行总结，类似于网络笔记之用，方便后续回顾查看，如有以偏概全、不祥不尽之处，还望海涵。1、Shader变体先看一段代码......Properties{ [KeywordEnum(on,off)]USL_USE_COL("IsUseColorMixTex?",int)=0 [Toggle(IS_RED_ON)]_IsRed("IsRed?",int)=0}......//中间省略，后续会有完整代码 #pragmamulti_c
Tcl脚本入门笔记详解（一） - 2
TCL脚本语言简介•TCL（ToolCommandLanguage）是一种解释执行的脚本语言（ScriptingLanguage）,它提供了通用的编程能力：支持变量、过程和控制结构；同时TCL还拥有一个功能强大的固有的核心命令集。TCL经常被用于快速原型开发，脚本编程，GUI和测试等方面。•实际上包含了两个部分：一个语言和一个库。首先，Tcl是一种简单的脚本语言，主要使用于发布命令给一些互交程序如文本编辑器、调试器和shell。由于TCL的解释器是用C\C++语言的过程库实现的，因此在某种意义上我们又可以把TCL看作C库，这个库中有丰富的用于扩展TCL命令的C\C++过程和函数，所以，Tcl是
ruby-on-rails - 模型范围正在破坏 rake db :migrate - rails 3. 2.3 postgres 9.1.3 - 2
我在新的Rails应用程序(3.2.3)中运行迁移时遇到了问题。我们正在使用postrgres9.1.3和-pg(0.13.2)-当我运行rakedb:create，然后运行rakedb:migrate，我得到->1.9.3-p194(master)rakedb:migrate--trace**Invokedb:migrate(first_time)**Invokeenvironment(first_time)**Executeenvironmentrakeaborted!PG::Error:ERROR:relation"roles"doesnotexistLINE4:WHEREa
ruby - 如何获取我的 Sinatra 应用程序的代码覆盖率统计信息？ - 2
我编写了一个Sinatra应用程序(网站)，我想收集网站代码的代码覆盖率信息。我是Ruby的新手，但Google告诉我rcov是一个很好的代码覆盖工具。不幸的是，我在网上可以找到的所有信息只显示了如何获取有关测试用例的代码覆盖率信息-我想要有关我的站点本身的代码覆盖率信息。我想要分析的特定站点文件位于“sdk”和“sdk/vendor”目录中，因此我通常使用“rubysite.rb”运行我的站点的地方我改为尝试以下操作:rcov-Isdk-Isdk/vendorsite.rb它显示了Sinatra启动文本，但随后立即退出，而不是像我的Sinatra应用程序通常那样等待网络请求。有人能告