草庐IT

scipy-spatial

全部标签

python - 将 scipy 稀疏矩阵存储为 HDF5

我想以HDF5格式压缩和存储一个巨大的Scipy矩阵。我该怎么做呢?我试过下面的代码:a=csr_matrix((dat,(row,col)),shape=(947969,36039))f=h5py.File('foo.h5','w')dset=f.create_dataset("init",data=a,dtype=int,compression='gzip')我遇到这样的错误,TypeError:Scalardatasetsdon'tsupportchunk/filteroptionsIOError:Can'tprepareforwritingdata(Noappropriatef

Python:处理大量数据。 Scipy 还是 Rpy?如何?

在我的python环境中,已经安装了Rpy和Scipy包。我要解决的问题是这样的:1)大量财务数据存储在一个文本文件中。无法加载到Excel中2)我需要对某些字段求和并得到总数。3)我需要根据总数显示前10行。哪个包(Scipy或Rpy)最适合这项任务?如果是这样,您能否提供一些可以帮助我实现解决方案的指示(例如文档或在线示例)?速度是一个问题。理想情况下,即使文件大到无法放入内存,scipy和Rpy也可以处理大文件 最佳答案 Rpy或Scipy都不是必需的,尽管numpy可能会使它更容易一些。这个问题似乎非常适合逐行解析器。只需打

python - 使用 Scipy 记录正态随机变量

我无法理解创建对数正态变量的基础知识here.Thelognormaldistributiontakesonmeanandvarianceasparameters.我想使用这些参数创建一个卡住分布,然后获取cdf、pdf等。但是,在文档中,他们使用fromscipy.statsimportlognorms=0.953682269606rv=lognorm(s)'s'似乎是标准偏差。我尝试使用'loc'和'scale'参数而不是's',但这产生了错误(s是必需参数)。如何生成具有位置和比例参数值“m”、“s”的卡住分布? 最佳答案 谜

python - 在脚本中以一种方式运行 scipy anova

我有一个问题。我想在一个脚本中运行scipy.statsf_oneway()ANOVA,该脚本加载一个包含带有numpy数组的组的数据存档,如下所示:archive{'group1':array([1,2,3,...,]),'group2':array([9,8,7,...,]),...}现在我的问题是,对于不同的数据存档,组的数量不是固定的。换句话说,我事先不知道文件中有多少组(也不一定知道他们的名字)。scipyimplementationofaonewayANOVA只接受逗号分隔的数组作为输入,如下所示:a=array([1,2,3,...,])b=array([9,8,7,..

python - scipy linregress 函数错误的标准错误返回?

我有一个奇怪的情况,scipy.stats.linregress似乎返回了一个不正确的标准错误:fromscipyimportstatsx=[5.05,6.75,3.21,2.66]y=[1.65,26.5,-5.93,7.96]gradient,intercept,r_value,p_value,std_err=stats.linregress(x,y)>>>gradient5.3935773611970186>>>intercept-16.281127993087829>>>r_value0.72443514211849758>>>r_value**20.5248062751362

python scipy Delaunay 绘图点云

我有一个点列表=[p1,p2,p3...]其中p1=[x1,y1],p2=[x2,y2]...我想使用scipy.spatial.Delaunay对这些点云进行三角剖分,然后绘制它我该怎么做?Delaunay的文档真的很少到目前为止我有这段代码fromsubprocessimportPopen,PIPEimportosos.environ['point_num']="2000"cmd='rbox$point_numD2|tail-n$point_num'sub_process=Popen(cmd,shell=True,stdout=PIPE,stderr=PIPE)output=sub

python - 使用 scipy.optimize.linprog 进行线性规划

我刚刚用scipy.optimize.linprog检查了简单的线性规划问题:1*x[1]+2x[2]->max1*x[1]+0*x[2]=10*x[1]+1*x[2]>=11*x[1]+1*x[2]得到了一个非常奇怪的结果,我预计x[1]会是1而x[2]会是5,但是:>>>printoptimize.linprog([1,2],A_ub=[[1,1]],b_ub=[6],bounds=(1,5),method='simplex')status:0slack:array([4.,4.,4.,0.,0.])success:Truefun:3.0x:array([1.,1.])messag

python - Cx_freeze ImportError 没有名为 scipy 的模块

大家好,我在转换为.exe的代码上使用cx_Freeze时遇到问题。当我运行cx_Freeze时,我得到以下ImportError,指出没有名为scipy的模块runninginstallrunningbuildrunningbuild_exeTraceback(mostrecentcalllast):File"setup.py",line25,inexecutables=executablesFile"C:\Python34\lib\site-packages\cx_Freeze\dist.py",line362,insetupdistutils.core.setup(**attrs

python - 没有名为 scipy.stats 的模块 - 为什么尽管安装了 scipy

如何使用python和scipy获取泊西奥随机变量?哇..我安装了scipy并且根据文档我得到没有名为scipy.stats的模块?我在ubuntu12.04上。所以......去图http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.poisson.htmlubuntu@ubuntu:~/Downloads$sudoapt-getinstallpython-scipyReadingpackagelists...DoneBuildingdependencytreeReadingstateinformation..

python - numpy/scipy 中的平方差和 (SSD)

我正在尝试使用Python和Numpy/Scipy来实现图像处理算法。探查器告诉我在以下函数(经常调用)上花费了大量时间,它告诉我两幅图像之间的平方差之和defssd(A,B):s=0foriinrange(3):s+=sum(pow(A[:,:,i]-B[:,:,i],2))returns我怎样才能加快速度?谢谢。 最佳答案 只是s=numpy.sum((A[:,:,0:3]-B[:,:,0:3])**2)(如果形状始终为(,,3),我预计可能只是sum((A-B)**2))也可以使用求和方法:((A-B)**2).sum()对吧