草庐IT

statistics

全部标签

python - 如何用 numpy 计算统计信息 "t-test"

我希望生成一些关于我在python中创建的模型的统计信息。我想对其进行t检验,但想知道是否有一种简单的方法可以使用numpy/scipy来执行此操作。周围有什么好的解释吗?例如,我有三个相关的数据集,如下所示:[55.0,55.0,47.0,47.0,55.0,55.0,55.0,63.0]现在,我想对它们进行学生t检验。 最佳答案 在scipy.stats中包有几个ttest_...功能。参见here中的示例:>>>print't-statistic=%6.3fpvalue=%6.4f'%stats.ttest_1samp(x,m

python - 如何用 numpy 计算统计信息 "t-test"

我希望生成一些关于我在python中创建的模型的统计信息。我想对其进行t检验,但想知道是否有一种简单的方法可以使用numpy/scipy来执行此操作。周围有什么好的解释吗?例如,我有三个相关的数据集,如下所示:[55.0,55.0,47.0,47.0,55.0,55.0,55.0,63.0]现在,我想对它们进行学生t检验。 最佳答案 在scipy.stats中包有几个ttest_...功能。参见here中的示例:>>>print't-statistic=%6.3fpvalue=%6.4f'%stats.ttest_1samp(x,m

来自 t 统计的 Python p 值

我有一些t值和自由度,想从中找到p值(它是双尾的)。在现实世界中,我会使用统计教科书背面的t检验表;如何在Python中进行等效操作?例如t-lookup(5,7)=0.00245或类似的东西。我知道在SciPy中如果我有数组我可以做scipy.stats.ttest_ind,但我没有。我只有t统计量和自由度。 最佳答案 从http://docs.scipy.org/doc/scipy/reference/tutorial/stats.htmlAsanexercise,wecancalculateourttestalsodirect

来自 t 统计的 Python p 值

我有一些t值和自由度,想从中找到p值(它是双尾的)。在现实世界中,我会使用统计教科书背面的t检验表;如何在Python中进行等效操作?例如t-lookup(5,7)=0.00245或类似的东西。我知道在SciPy中如果我有数组我可以做scipy.stats.ttest_ind,但我没有。我只有t统计量和自由度。 最佳答案 从http://docs.scipy.org/doc/scipy/reference/tutorial/stats.htmlAsanexercise,wecancalculateourttestalsodirect

python - 在 python scipy 中实现 Kolmogorov Smirnov 测试

我有一个关于N个数字的数据集,我想测试它的正态性。我知道scipy.stats有一个kstestfunction但是没有关于如何使用它以及如何解释结果的示例。有哪位熟悉的可以给我一些建议吗?根据文档,使用kstest返回两个数字,KS检验统计量D和p值。如果p值大于显着性水平(例如5%),那么我们不能拒绝数据来自给定分布的假设。当我通过从正态分布中抽取10000个样本并测试高斯性进行测试时:importnumpyasnpfromscipy.statsimportkstestmu,sigma=0.07,0.89kstest(np.random.normal(mu,sigma,10000)

python - 在 python scipy 中实现 Kolmogorov Smirnov 测试

我有一个关于N个数字的数据集,我想测试它的正态性。我知道scipy.stats有一个kstestfunction但是没有关于如何使用它以及如何解释结果的示例。有哪位熟悉的可以给我一些建议吗?根据文档,使用kstest返回两个数字,KS检验统计量D和p值。如果p值大于显着性水平(例如5%),那么我们不能拒绝数据来自给定分布的假设。当我通过从正态分布中抽取10000个样本并测试高斯性进行测试时:importnumpyasnpfromscipy.statsimportkstestmu,sigma=0.07,0.89kstest(np.random.normal(mu,sigma,10000)

获取 t 统计量的 Python 函数

我正在寻找一个Python函数(如果没有,也可以自己编写)来获取t统计量,以便在置信区间计算中使用。我找到了可以回答各种概率/自由度的表格,例如thisone,但我希望能够为任何给定的概率计算这个。对于任何不熟悉这种自由度的人来说,样本中的数据点数(n)-1和顶部列标题的数字是概率(p),例如如果您正在查找t分数以用于计算95%的置信度,则使用0.05的2尾显着性水平,即如果您重复n次测试,结果将落在平均值+/-置信区间内。我已经研究过在scipy.stats中使用各种函数,但我所看到的似乎都不允许我上面描述的简单输入。Excel对此有一个简单的实现,例如要获得1000样本的t分数,我

获取 t 统计量的 Python 函数

我正在寻找一个Python函数(如果没有,也可以自己编写)来获取t统计量,以便在置信区间计算中使用。我找到了可以回答各种概率/自由度的表格,例如thisone,但我希望能够为任何给定的概率计算这个。对于任何不熟悉这种自由度的人来说,样本中的数据点数(n)-1和顶部列标题的数字是概率(p),例如如果您正在查找t分数以用于计算95%的置信度,则使用0.05的2尾显着性水平,即如果您重复n次测试,结果将落在平均值+/-置信区间内。我已经研究过在scipy.stats中使用各种函数,但我所看到的似乎都不允许我上面描述的简单输入。Excel对此有一个简单的实现,例如要获得1000样本的t分数,我

python - 最高后密度区和中央可信区

给定一些参数Θ的后验p(Θ|D),可以define以下:最高后密度区域:HighestPosteriorDensityRegion是Θ最可能值的集合,总共构成100(1-α)%的后部质量。换句话说,对于给定的α,我们寻找满足以下条件的p*:然后得到HighestPosteriorDensityRegion作为集合:中央可信区:使用与上述相同的符号,可信区域(或区间)定义为:根据分布,可能有许多这样的间隔。中央可信区间定义为每条尾部上都有(1-α)/2质量的可信区间。计算:对于一般分布,给定分布中的样本,是否有任何内置函数可以在Python或PyMC中获得上述两个量?对于常见的参数分布(

python - 最高后密度区和中央可信区

给定一些参数Θ的后验p(Θ|D),可以define以下:最高后密度区域:HighestPosteriorDensityRegion是Θ最可能值的集合,总共构成100(1-α)%的后部质量。换句话说,对于给定的α,我们寻找满足以下条件的p*:然后得到HighestPosteriorDensityRegion作为集合:中央可信区:使用与上述相同的符号,可信区域(或区间)定义为:根据分布,可能有许多这样的间隔。中央可信区间定义为每条尾部上都有(1-α)/2质量的可信区间。计算:对于一般分布,给定分布中的样本,是否有任何内置函数可以在Python或PyMC中获得上述两个量?对于常见的参数分布(