[概率论与数理统计]笔记：5.2 参数的最大似然估计与矩估计

feixianxing 2023-03-28 原文

5.2 参数的最大似然估计与矩估计

估计其实就是猜数。

最大似然估计

基本思想

概率大的事件比概率小的事件更易发生。
将使事件\(A\)发生的概率最大的参数\(\theta\)作为估计值。

案例

总体：100个球（黑球或白球）

需要估计的参数：黑球的个数\(\theta=99\)或\(1\)

抽样：摸球并放回

结论：

如果经常摸出黑球，则估计\(\theta=99\)

如果经常摸出白球，则估计\(\theta=1\)

做题模板

写出总体的概率函数/密度函数。（分别对应离散型/连续型）
写出似然函数\(L(\theta)\).

似然函数表示取得样本的概率，所以是概率函数值相乘的格式，求导很复杂，所以要使用自然对数将乘除转化为加减。
两边取\(\ln\).
两边对参数\(\theta\)求(偏)导，令(偏)导数=0，使得似然函数取最大值的参数\(\theta\)就是估计值。

例题

泊松分布例题

例1：总体\(X\sim P(\lambda)\)，样本\((X_1,\cdots,X_n)\)，求\(\lambda\)的极大似然估计。

解：

总体的概率函数为：

\[P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda} \quad (k=0,1,2,\cdots) \]

则\(\lambda\)的似然函数为：

\[L(\lambda)=\prod\limits_{i=1}^n\frac{\lambda^{x_i}}{x_i!}e^{-\lambda} =\frac{\lambda^{x_1+x_2+\cdots+x_n}}{\prod\limits_{i=1}^nx_i!}e^{-n\lambda} \]

似然函数的因变量只有\(\lambda\).

这里的\(x_i\)都是具体的样本观测值，也就是常数，因此下面求导的时候可以直接去掉。

两边取\(\ln\)：

\[\ln L(\lambda)=-\ln \prod\limits_{i=1}^nx_i!+(x_1+\cdots+x_n)\ln \lambda-n\lambda \]

两边对\(\lambda\)求导，并令导数为0：

\[\frac{\mathrm{d}\ln L(\lambda)}{\mathrm{d}\lambda} =\frac{x_1+\cdots+x_n}{\lambda}-n =0 \]

因此\(\hat\lambda = \frac{x_1+\cdots+x_n}{n}=\overline{X}\)

指数分布例题

例2：总体\(X\sim e(\lambda)\)，样本\((X_1,\cdots,X_n)\)，求\(\lambda\)的极大似然估计。

总体的密度函数为：

\[f(x;\lambda)= \left\{ \begin{align*} & \lambda e^{-\lambda x},\quad x>0 \\ & 0, \quad\quad\quad x\le 0 \end{align*} \right. \]

则\(\lambda\)的似然函数为：

\[L(\lambda)=\prod\limits_{i=1}^n\lambda e^{-\lambda x} =\lambda^ne^{-\lambda(x_1+\cdots+x_n)} \]

这里的\(f(x;\lambda)\)不会取到0的情况，因为样本已经取到了，认为其概率就是大于0的。

存疑：概率为0的事件也可能会发生，但是这里似乎忽略了这种情况？

两边取\(\ln\)：

\[\ln L(\lambda)=n\lambda - \lambda(x_1+\cdots+x_n) \]

两边对\(\lambda\)求导，并令导数为0：

\[\frac{\mathrm{d}\ln L(\lambda)}{\mathrm{d}\lambda} =\frac{n}{\lambda}-(x_1+\cdots+x_n) =0 \]

因此\(\hat\lambda = \frac{n}{x_1+\cdots+x_n}=\frac{1}{\overline{X}}\)

正态分布例题

例3：总体\(X\sim N(\mu,\sigma^2)\)，样本\((X_1,\cdots,X_n)\)，求\(\mu,\sigma^2\)的极大似然估计。

总体的密度函数为：

\[f(x;\mu,\sigma^2)= \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]

则\(\mu, \sigma^2\)的似然函数为：

\[L(\mu, \sigma^2) =\prod\limits_{i=1}^n\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}} =(\frac{1}{\sqrt{2\pi}})^n(\frac{1}{\sigma})^ne^{-\frac{(x_1-\mu)^2+\cdots+(x_n-\mu)^2}{2\sigma^2}} \]

两边取\(\ln\)：

\[\ln L(\mu, \sigma^2) =n\ln\frac{1}{\sqrt{2\pi}}-\frac{n}{2}\ln\sigma^2-\frac{(x_1-\mu)^2+\cdots+(x_n-\mu)^2}{2\sigma^2} \]

先对\(\mu\)求偏导，并令偏导数为0：

\[\begin{align*} \frac{\partial\ln L(\mu,\sigma^2)}{\partial \mu} &= - \frac{[-2(x_1-\mu)]+\cdots+[-2(x_n-\mu)]}{2\sigma^2} \\ &= \frac{(x_1-\mu)+\cdots+(x_n-\mu)}{\sigma^2} \\ &= \frac{x_1+\cdots+x_n-n\mu}{\sigma^2} \\ &= 0 \end{align*} \]

因此\(\hat\mu= \frac{x_1+\cdots+x_n}{n}=\overline{X}\).

再将\(\sigma^2\)作为整体对其求偏导：

\[\frac{\partial\ln L(\mu,\sigma^2)}{\partial \sigma^2} =-\frac{n}{2}\frac{1}{\sigma^2}+\frac{(x_1-\mu)^2+\cdots+(x_n-\mu)^2}{2\sigma^4} =0 \]

化简得

\[\hat{\sigma^2} = \frac{\sum\limits_{i=1}^n(x_i-\mu)^2}{n}=B_2 \]

均匀分布例题

例4：总体\(X\)服从\([\theta_1,\theta_2]\)上的均匀分布，样本\((X_1,\cdots,X_n)\)，求\(\theta_1,\theta_2\)的极大似然估计。

总体的密度函数为：

\[f(x)= \left\{ \begin{align*} & \frac{1}{\theta_2-\theta_1},\quad x\in[\theta_1,\theta_2] \\ & 0, \quad\quad\quad\quad else \end{align*} \right. \]

则\(\theta_1,\theta_2\)的似然函数为：

\[L(\theta_1,\theta_2)=\prod\limits_{i=1}^n\frac{1}{\theta_2-\theta_1}=\frac{1}{(\theta_2-\theta_1)^n} \]

均匀分布是特殊情况，不能使用做题模板。

如果继续使用取对数求导的思路，会出现：

\[\frac{n}{\theta_2-\theta_1}=0 \]
这样的情况，无法再继续求解。

因此应该转换思路。

为了取得似然函数的最大值，那么\((\theta_2-\theta_1)\)应该取最小值，也就是区间越小越好，但又要包含样本。

因此：

\(\hat{\theta_1}=\min\{x_1,\cdots,x_n\}\)
\(\hat{\theta_2}=\max\{x_1,\cdots,x_n\}\)

矩估计

基本思想

使用相应的样本矩去估计总体矩。

使用相应的样本矩的函数去估计总体矩的函数。

"相应的"：一阶对应一阶，二阶对应二阶......

例题

例1：\(X\sim N(\mu, \sigma^2)\)，\((X_1,\cdots,X_n)\)是样本，求\(\mu,\sigma^2\)的矩估计。

总体的一阶原点矩：\(EX=\mu\)，
样本的一阶原点矩：\(\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i\)，

使用样本矩估计总体矩：\(\hat{\mu}=\overline{X}\)；

总体的二阶原点矩：\(EX^2\)

因为\(DX=EX^2-(EX)^2\)

所以\(EX^2=DX+(EX)^2=\sigma^2+\mu^2\)

样本的二阶原点矩：\(A_2=\frac{1}{n}\sum\limits_{i=1}^nX_i^2\).

所以\(\hat{EX^2}=\frac{1}{n}\sum\limits_{i=1}^nX_i^2\).

所以

\[\begin{align*} \hat{\sigma^2} &= \hat{EX^2}-\hat{\mu^2} \\ &= \frac{1}{n}\sum\limits_{i=1}^nX_i^2-\overline{X}^2 \\ &= \frac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{X})^2 \end{align*} \]

这里最后的等号没有写错，可以反过来计算证明其正确性：

\[\begin{align*} \frac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{X})^2 &= \frac{1}{n}\sum\limits_{i=1}^n(X_i^2-2X_i\overline{X}+\overline{X}^2) \\ &= \frac{1}{n}\sum X_i^2-2\overline{X}(\frac{1}{n}\sum X_i)+\frac{1}{n}n\overline{X}^2 \\ &= \frac{1}{n}\sum X_i^2-2\overline{X}\overline{X}+\overline{X}^2 \\ &= \frac{1}{n}\sum X_i^2 -\overline{X}^2 \end{align*} \]
因此：

\(\frac{1}{n}\sum X_i^2 -\overline{X}^2=\frac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{X})^2\)

这里的\(\frac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{X})^2\)其实就是二阶中心矩\(B_2\).

所以\(\hat{\sigma^2}=B_2\).

正态分布的两个参数的极大似然估计和矩估计的结果是一致的。

例2：\(X\sim P(\lambda)\)，\((X_1,\cdots,X_n)\)，求\(\lambda\)的矩估计.

泊松分布的期望和方差都是\(\lambda\)，也就是说可以列出两个方程：

\(\hat{\lambda}=\overline{X}\)
\(\hat{\lambda}=B_2\)

究竟使用哪个作为估计值可以采取评价估计量的标准进行评估，比如有效性。这里使用一阶的\(\hat{\lambda}=\overline{X}\)更好。

例3：\(X\)服从\([\theta_1,\theta_2]\)上的均匀分布，求\(\theta_1,\theta_2\)的矩估计。

根据均匀分布的性质，有

\(EX=\frac{1}{2}(\theta_1+\theta_2)\)
\(DX=\frac{(\theta_2-\theta_1)^2}{12}\)

第一个式子可以用均值估计：\(\frac{1}{2}(\hat{\theta_1}+\hat{\theta_2})=\overline{X}\)

同时，有\(DX=EX^2-(EX)^2=EX^2-\frac{(\theta_1+\theta_2)^2}{4}\)

所以\(EX^2=\frac{(\theta_2-\theta_1)^2}{12}+\frac{(\theta_1+\theta_2)^2}{4}\).

\(EX^2\)使用\(A_2=\frac{1}{n}\sum\limits_{i=1}^nX_i^2\)近似，样本是已知的，所以\(A_2\)是可计算的已知的量。

所以\(\frac{(\hat{\theta_2}-\hat{\theta_1})^2}{12}+\frac{(\hat{\theta_1}+\hat{\theta_2})^2}{4}=A_2\)

综上，可以列出两个方程用于求解\(\hat{\theta_1},\hat{\theta_2}\)：

\[\left\{ \begin{align*} & \frac{1}{2}(\hat{\theta_1}+\hat{\theta_2})=\overline{X} \\ & \frac{(\hat{\theta_2}-\hat{\theta_1})^2}{12}+\frac{(\hat{\theta_1}+\hat{\theta_2})^2}{4}=A_2 \\ \end{align*} \right. \]

求解得到：

\[\left\{ \begin{align*} & \hat{\theta_1} = \overline{X}-\sqrt{3B_2} \\ & \hat{\theta_2} = \overline{X}+\sqrt{3B_2} \end{align*} \right. \]

使用教材：
《概率论与数理统计》第四版中国人民大学龙永红主编高等教育出版社

数理笔记 span class inline 非技术区

有关[概率论与数理统计]笔记：5.2 参数的最大似然估计与矩估计的更多相关文章

ruby-on-rails - 如何在 ruby 中使用两个参数异步运行 exe？ - 2
exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby中使用两个参数异步运行exe吗？我已经尝试过ruby命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe，无需等待进程完成是否有任何rubygems会支持我的问题？最佳答案您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除
ruby - RSpec - 使用测试替身作为 block 参数 - 2
我有一些Ruby代码，如下所示:Something.createdo|x|x.foo=barend我想编写一个测试，它使用double代替block参数x，这样我就可以调用:x_double.should_receive(:foo).with("whatever").这可能吗？最佳答案 specify'something'dox=doublex.should_receive(:foo=).with("whatever")Something.should_receive(:create).and_yield(x)#callthere
ruby - 如何在 Ruby 中拆分参数字符串 Bash 样式？ - 2
我正在为一个项目制作一个简单的shell，我希望像在Bash中一样解析参数字符串。foobar"helloworld"fooz应该变成:["foo","bar","helloworld","fooz"]等等。到目前为止，我一直在使用CSV::parse_line，将列分隔符设置为""和.compact输出。问题是我现在必须选择是要支持单引号还是双引号。CSV不支持超过一个分隔符。Python有一个名为shlex的模块:>>>shlex.split("Test'helloworld'foo")['Test','helloworld','foo']>>>shlex.split('Test"
ruby - 检查方法参数的类型 - 2
我不确定传递给方法的对象的类型是否正确。我可能会将一个字符串传递给一个只能处理整数的函数。某种运行时保证怎么样？我看不到比以下更好的选择:defsomeFixNumMangler(input)raise"wrongtype:integerrequired"unlessinput.class==FixNumother_stuffend有更好的选择吗？最佳答案使用Kernel#Integer在使用之前转换输入的方法。当无法以任何合理的方式将输入转换为整数时，它将引发ArgumentError。defmy_method(number)
ruby-on-rails - 在默认方法参数中使用 .reverse_merge 或 .merge - 2
两者都可以defsetup(options={})options.reverse_merge:size=>25,:velocity=>10end和defsetup(options={}){:size=>25,:velocity=>10}.merge(options)end在方法的参数中分配默认值。问题是:哪个更好？您更愿意使用哪一个？在性能、代码可读性或其他方面有什么不同吗？编辑:我无意中添加了bang(!)...并不是要询问nobang方法与bang方法之间的区别最佳答案我倾向于使用reverse_merge方法:option
ruby - 定义方法参数的条件 - 2
我有一个只接受一个参数的方法:defmy_method(number)end如果使用number调用方法，我该如何引发错误？？通常，我如何定义方法参数的条件？比如我想在调用的时候报错:my_method(1) 最佳答案您可以添加guard在函数的开头，如果参数无效则引发异常。例如:defmy_method(number)failArgumentError,"Inputshouldbegreaterthanorequalto2"ifnumbereputse.messageend#=>Inputshouldbegreaterthano
ruby - rails 3 redirect_to 将参数传递给命名路由 - 2
我没有找到太多关于如何执行此操作的信息，尽管有很多关于如何使用像这样的redirect_to将参数传递给重定向的建议:action=>'something',:controller=>'something'在我的应用程序中，我在路由文件中有以下内容match'profile'=>'User#show'我的表演Action是这样的defshow@user=User.find(params[:user])@title=@user.first_nameend重定向发生在同一个用户Controller中，就像这样defregister@title="Registration"@user=Use
ruby - 字符串文字中的转义状态作为 `String#tr` 的参数 - 2
对于作为String#tr参数的单引号字符串文字中反斜杠的转义状态，我觉得有些神秘。你能解释一下下面三个例子之间的对比吗？我特别不明白第二个。为了避免复杂化，我在这里使用了'd'，在双引号中转义时不会改变含义("\d"="d")。'\\'.tr('\\','x')#=>"x"'\\'.tr('\\d','x')#=>"\\"'\\'.tr('\\\d','x')#=>"x" 最佳答案在tr中转义tr的第一个参数非常类似于正则表达式中的括号字符分组。您可以在表达式的开头使用^来否定匹配(替换任何不匹配的内容)并使用例如a-f来匹配一
ruby-on-rails - 如何生成传递一些自定义参数的 `link_to` URL？ - 2
我正在使用RubyonRails3.0.9，我想生成一个传递一些自定义参数的link_toURL。也就是说，有一个articles_path(www.my_web_site_name.com/articles)我想生成如下内容:link_to'Samplelinktitle',...#HereIshouldimplementthecode#=>'http://www.my_web_site_name.com/articles?param1=value1¶m2=value2&...我如何编写link_to语句“alàRubyonRailsWay”以实现该目的？如果我想通过传递一些
LC滤波器设计学习笔记（一）滤波电路入门 - 2
目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》，侵权删。前言最近需要学习放大电路和滤波电路，但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放，所以也是相当从零开始学习了。滤波电路科普主要分类滤波器：主要是从不同频率的成分中提取出特定频率的信号。有源滤波器：由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波，最普通易于采用的无源滤波器结构是将电感与电容串联，可对主要次谐波（3、5、7）构成低阻抗旁路。无源滤波器：无源滤波器，又称

[概率论与数理统计]笔记：5.2 参数的最大似然估计与矩估计

5.2 参数的最大似然估计与矩估计

最大似然估计

基本思想

做题模板

例题

泊松分布例题

指数分布例题

正态分布例题

均匀分布例题

矩估计

基本思想

例题

有关[概率论与数理统计]笔记：5.2 参数的最大似然估计与矩估计的更多相关文章

随机推荐