草庐IT

Python进行时间序列平稳检验ADFtest(Augmented Dickey-Fuller Unit Root Test)

Python进行时间序列平稳检验ADFtest(AugmentedDickey-FullerUnitRootTest)  ADF检验全名叫Augmented Dickey-FullerTest,用来检验一个序列是否平稳(Stationarity),为什么这个和我们的量化交易扯上关系?看下面一段话:价格序列本身并不是一个均值回归的平稳序列,这个肉眼都能看出来,但价格的回报return是典型的均值回归平稳序列,除此之外很多其他基于价格基本信息生成的指标等都是平稳序列,当然也有部分不是,我们如何辨识?其中一个工具就是ADF检验.测试时间序列是否具有单位根,例如具有趋势,或更普遍地说是自回归的。假设条

Python进行时间序列平稳检验ADFtest(Augmented Dickey-Fuller Unit Root Test)

Python进行时间序列平稳检验ADFtest(AugmentedDickey-FullerUnitRootTest)  ADF检验全名叫Augmented Dickey-FullerTest,用来检验一个序列是否平稳(Stationarity),为什么这个和我们的量化交易扯上关系?看下面一段话:价格序列本身并不是一个均值回归的平稳序列,这个肉眼都能看出来,但价格的回报return是典型的均值回归平稳序列,除此之外很多其他基于价格基本信息生成的指标等都是平稳序列,当然也有部分不是,我们如何辨识?其中一个工具就是ADF检验.测试时间序列是否具有单位根,例如具有趋势,或更普遍地说是自回归的。假设条

python - 从 pandas apply() 返回多列

我有一个Pandas数据框,df_test。它包含一个“大小”列,它表示以字节为单位的大小。我使用以下代码计算了KB、MB和GB:df_test=pd.DataFrame([{'dir':'/Users/uname1','size':994933},{'dir':'/Users/uname2','size':109338711},])df_test['size_kb']=df_test['size'].astype(int).apply(lambdax:locale.format("%.1f",x/1024.0,grouping=True)+'KB')df_test['size_mb'

python - 从 pandas apply() 返回多列

我有一个Pandas数据框,df_test。它包含一个“大小”列,它表示以字节为单位的大小。我使用以下代码计算了KB、MB和GB:df_test=pd.DataFrame([{'dir':'/Users/uname1','size':994933},{'dir':'/Users/uname2','size':109338711},])df_test['size_kb']=df_test['size'].astype(int).apply(lambdax:locale.format("%.1f",x/1024.0,grouping=True)+'KB')df_test['size_mb'

python - 了解 scikit CountVectorizer 中的 min_df 和 max_df

我有五个文本文件输入到CountVectorizer。当向CountVectorizer实例指定min_df和max_df时,最小/最大文档频率究竟意味着什么?是某个词在其特定文本文件中的频率,还是该词在整个语料库(五个文本文件)中的频率?min_df和max_df以整数或float形式提供时有什么区别?Thedocumentation似乎没有提供详尽的解释,也没有提供示例来演示这两个参数的使用。有人可以提供一个解释或示例来演示min_df和max_df吗? 最佳答案 max_df用于删除出现过于频繁的术语,也称为“语料库特定的停用

python - 了解 scikit CountVectorizer 中的 min_df 和 max_df

我有五个文本文件输入到CountVectorizer。当向CountVectorizer实例指定min_df和max_df时,最小/最大文档频率究竟意味着什么?是某个词在其特定文本文件中的频率,还是该词在整个语料库(五个文本文件)中的频率?min_df和max_df以整数或float形式提供时有什么区别?Thedocumentation似乎没有提供详尽的解释,也没有提供示例来演示这两个参数的使用。有人可以提供一个解释或示例来演示min_df和max_df吗? 最佳答案 max_df用于删除出现过于频繁的术语,也称为“语料库特定的停用

python - 如何告诉 py.test 跳过某些目录?

我尝试使用norecursedirssetup.cfg中的选项告诉py.test不要从某些目录收集测试,但它似乎确实忽略了它。[tool:pytest]norecursedirs=lib/third当我运行py.test时,我确实看到了它是如何从lib/third内部获取测试的! 最佳答案 py.test--ignore=somedir为我工作在pytest.ini中:[pytest]addopts=--ignore=somedir--ignore=someotherdir 关于pyth

python - 如何告诉 py.test 跳过某些目录?

我尝试使用norecursedirssetup.cfg中的选项告诉py.test不要从某些目录收集测试,但它似乎确实忽略了它。[tool:pytest]norecursedirs=lib/third当我运行py.test时,我确实看到了它是如何从lib/third内部获取测试的! 最佳答案 py.test--ignore=somedir为我工作在pytest.ini中:[pytest]addopts=--ignore=somedir--ignore=someotherdir 关于pyth

python - 以某种方式使用 py.test 时,我可以使用 python 调试器进行调试吗?

我正在使用py.test对我的python程序进行单元测试。我希望以正常方式使用python调试器调试我的测试代码(我的意思是代码中的pdb.set_trace()),但我无法让它工作。将pdb.set_trace()放入代码中不起作用(引发IOError:在捕获输出时从标准输入读取)。我也尝试过使用--pdb选项运行py.test,但如果我想探索断言之前发生的事情,这似乎并不能解决问题。当断言失败时它会中断,并且从该行继续意味着终止程序。有没有人知道调试的方法,或者调试和py.test不应该在一起? 最佳答案 这真的很简单:在您想

python - 以某种方式使用 py.test 时,我可以使用 python 调试器进行调试吗?

我正在使用py.test对我的python程序进行单元测试。我希望以正常方式使用python调试器调试我的测试代码(我的意思是代码中的pdb.set_trace()),但我无法让它工作。将pdb.set_trace()放入代码中不起作用(引发IOError:在捕获输出时从标准输入读取)。我也尝试过使用--pdb选项运行py.test,但如果我想探索断言之前发生的事情,这似乎并不能解决问题。当断言失败时它会中断,并且从该行继续意味着终止程序。有没有人知道调试的方法,或者调试和py.test不应该在一起? 最佳答案 这真的很简单:在您想