5.4假设检验概述假设检验问题的提法基本概述在实际问题中,总体分布通常是未知的,可能是分布的类型未知,也可能是分布的相关参数未知,比如已知是正态分布,但是不知道参数\(\mu,\sigma^2\)是多少。于是总体分布未知可以分为类型未知和参数未知两种情况。对于这些未知,我们可以提出一种推断,比如说”假设总体服从正态分布“,或者说”假设正态分布的\(\mu\)是100“,这些推断叫做假设。因为参数未知进行的推断叫做参数假设,而对其他未知比如类型未知进行的推断叫做非参数假设。假设之后,我们需要使用样本来证明我们推断的准确性,这个过程叫做假设检验。对参数假设进行的检验叫做参数假设检验,对非参数假设进
4.4抽样分布正态总体的抽样分布关注点:总体是正态分布,抽样,样本所构造的统计量的分布的相关研究。单正态总体的抽样分布定理正态总体\(X\simN(\mu,\sigma^2)\),\((X_1,X_2,\cdots,X_n)\)是样本,样本均值为\(\overline{X}\),样本方差为\(S^2\).其中\[\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i,\]\[S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2\]\(\overline{X}\simN(\mu,\frac{\sig
4.4抽样分布正态总体的抽样分布关注点:总体是正态分布,抽样,样本所构造的统计量的分布的相关研究。单正态总体的抽样分布定理正态总体\(X\simN(\mu,\sigma^2)\),\((X_1,X_2,\cdots,X_n)\)是样本,样本均值为\(\overline{X}\),样本方差为\(S^2\).其中\[\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i,\]\[S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2\]\(\overline{X}\simN(\mu,\frac{\sig
5.5单正态总体的参数假设检验均值\(\mu\)的检验对于参数\(\mu\)可以提出如下假设:\[\begin{align*}&H_0:\mu=\mu_0\leftrightarrowH_1:\mu\ne\mu_0\tag{A}\\&H_0:\mu\le\mu_0\leftrightarrowH_1:\mu>\mu_0\tag{B}\\&H_0:\mu\ge\mu_0\leftrightarrowH_1:\mu其中\((A)\)的\(H_1\),参数\(\mu\)可以取值在\(\mu_0\)两侧,称为双侧假设检验问题。对应地,\((B)\)和\((C)\)称为单侧假设检验问题。情况1:方差\(
5.5单正态总体的参数假设检验均值\(\mu\)的检验对于参数\(\mu\)可以提出如下假设:\[\begin{align*}&H_0:\mu=\mu_0\leftrightarrowH_1:\mu\ne\mu_0\tag{A}\\&H_0:\mu\le\mu_0\leftrightarrowH_1:\mu>\mu_0\tag{B}\\&H_0:\mu\ge\mu_0\leftrightarrowH_1:\mu其中\((A)\)的\(H_1\),参数\(\mu\)可以取值在\(\mu_0\)两侧,称为双侧假设检验问题。对应地,\((B)\)和\((C)\)称为单侧假设检验问题。情况1:方差\(
5.3置信区间前言点估计无法提供其估计的误差,而区间估计可以。案例:“某人的月薪比2k多,比20k少”,这就是一个区间估计。区间估计的好坏有两个衡量指标:区间长度真实值落在该区间的概率我们希望区间长度足够小,而真实值落在该区间的概率又足够大。事实上,这两个指标是矛盾的,如果概率很大,会导致区间变大;如果区间长度变小,落在区间内的概率就会变小。定义\[P\{\underline{\theta}\(\theta\)是要估计的参数。\((\underline{\theta},\overline{\theta})\)是置信区间,其中\(\underline{\theta}\)是置信下限,\(\over
5.3置信区间前言点估计无法提供其估计的误差,而区间估计可以。案例:“某人的月薪比2k多,比20k少”,这就是一个区间估计。区间估计的好坏有两个衡量指标:区间长度真实值落在该区间的概率我们希望区间长度足够小,而真实值落在该区间的概率又足够大。事实上,这两个指标是矛盾的,如果概率很大,会导致区间变大;如果区间长度变小,落在区间内的概率就会变小。定义\[P\{\underline{\theta}\(\theta\)是要估计的参数。\((\underline{\theta},\overline{\theta})\)是置信区间,其中\(\underline{\theta}\)是置信下限,\(\over
5.2参数的最大似然估计与矩估计估计其实就是猜数。最大似然估计基本思想概率大的事件比概率小的事件更易发生。将使事件\(A\)发生的概率最大的参数\(\theta\)作为估计值。案例总体:100个球(黑球或白球)需要估计的参数:黑球的个数\(\theta=99\)或\(1\)抽样:摸球并放回结论:如果经常摸出黑球,则估计\(\theta=99\)如果经常摸出白球,则估计\(\theta=1\)做题模板写出总体的概率函数/密度函数。(分别对应离散型/连续型)写出似然函数\(L(\theta)\).似然函数表示取得样本的概率,所以是概率函数值相乘的格式,求导很复杂,所以要使用自然对数将乘除转化为加减
5.2参数的最大似然估计与矩估计估计其实就是猜数。最大似然估计基本思想概率大的事件比概率小的事件更易发生。将使事件\(A\)发生的概率最大的参数\(\theta\)作为估计值。案例总体:100个球(黑球或白球)需要估计的参数:黑球的个数\(\theta=99\)或\(1\)抽样:摸球并放回结论:如果经常摸出黑球,则估计\(\theta=99\)如果经常摸出白球,则估计\(\theta=1\)做题模板写出总体的概率函数/密度函数。(分别对应离散型/连续型)写出似然函数\(L(\theta)\).似然函数表示取得样本的概率,所以是概率函数值相乘的格式,求导很复杂,所以要使用自然对数将乘除转化为加减
引言 在实际的业务统计需求中有时往往需要对区间进行分组统计查询,如分数区间,工资区间查询统计等!mysql中可以利用elt函数来实现此类需求!接下来看如下时间业务需求:1:现在要进行统计,小于100的,100~500的,500~1000的,1000以上的,这各个区间的id数mysql>select*fromk1;+------+------+|id|yb|+------+------+|1|100||2|11||3|5||4|501||5|1501||6|1|+------+------+现在要进行统计,小于100的,100~500的,500~1000的,1000以上的,这各个区间的id数利用