NUMPY

python - 将结构化数组转换为 numpy 数组以用于 Scikit-Learn

我很难将使用np.genfromtxt从CSV加载的结构化数组转换为np.array以使数据适合Scikit-Learn估算器。问题是在某些时候会发生从结构化数组到常规数组的强制转换，导致ValueError:can'tcastfromstructuretonon-structure。很长一段时间以来，我一直使用.view来执行转换，但这导致了NumPy的许多弃用警告。代码如下:importnumpyasnpfromsklearn.ensembleimportGradientBoostingClassifierdata=np.genfromtxt(path,dtype=float,de

结构化 Scikit-Learn code 39 section python arrays numpy

python - 将 numpy.digitize 扩展到多维数据

我有一组大型数组(每个数组大约有600万个元素)，我想基本上执行np.digitize但在多个轴上。我正在寻找有关如何有效执行此操作以及如何存储结果的一些建议。我需要数组A的所有索引(或所有值，或掩码)，其中数组B的值在一个范围内，数组C的值在另一个范围内，数组D在另一个范围内。我想要值、索引或掩码，以便我可以对每个bin中的A数组的值进行一些尚未确定的统计。我还需要每个bin中元素的数量，但len()可以做到这一点。这是我设计的一个看起来合理的例子:importitertoolsimportnumpyasnpA=np.random.random_sample(1e4)B=(np.ra

多维 digitize random code np python pandas numpy binning

python - Pandas 和 numpy 线程安全

我在Web服务器(apache+modwsgi+django)上使用pandas并且有一个难以重现的错误，现在我发现它是由pandas不是线程安全的引起的。经过大量代码缩减后，我终于找到了一个简短的独立程序，可用于重现该问题。你可以在下面看到它。重点是:与thisquestion的回答相反这个例子表明，即使使用不修改数据帧的非常简单的操作，pandas也可能会崩溃。我无法想象这个简单的代码片段怎么可能对线程不安全...问题是关于在网络服务器中使用pandas和numpy。可能吗？我应该如何使用Pandas修复我的代码？(使用锁的示例会有所帮助)这是导致段错误的代码:importthre

python Pandas section crash multithreading numpy

python - 使用 ATLAS 或 OpenBLAS 的 Numpy？

在花费大量时间从源代码构建ATLAS之后，我在OpenSUSE13.1存储库中发现了libopenblas和libatals。我的问题是存储库中易于安装(无需在您自己的计算机上调整)“libatlas”是否真的提高了计算性能？OpenBLAS是优于ATLAS，还是仅优于某种Linux存储库中易于安装的“libatlas”？参见ForfasterRuseOpenBLASinstead:betterthanATLAS,trivialtoswitchtoonUbuntu.我关注了这篇文章CompilingNumpywithOpenBLAS但找不到“numpy.core._dotblas”模块

OpenBLAS python 储库 strong numpy opensuse atlas

python - 在 numpy 中寻找最小跳跃过零点

对于数据分析任务，我想在一个numpy数组中找到零交叉点，它来自一个卷积，首先是一个类似sobel的内核，然后是一个墨西哥帽内核。零交叉允许我检测数据中的边缘。不幸的是，数据有些嘈杂，我只想找到具有最小跳跃大小的零交叉点，在以下示例中为20:importnumpyasnparr=np.array([12,15,9,8,-1,1,-12,-10,10])应该导致>>>array([1,3,7])或>>>array([3,7])其中3是-1的索引，就在第一次跳转的中间之前，7是的索引-10我尝试修改以下代码(来源:Efficientlydetectsign-changesinpython)

python numpy code array gt signal-processing

python - 压缩文件上的高效 numpy.fromfile？

我有一些大文件(甚至压缩到10GB左右)，其中包含一个ASCIIheader，然后原则上每个大约3MB的numpy.recarrays，我们称它们为“事件”。我的第一种方法是这样的:f=gzip.GzipFile(filename)f.read(10000)#fixedlengthasciiheaderevent_dtype=np.dtype([('Id','>u4'),#simplified('UnixTimeUTC','>u4',2),('Data','>i2',(1600,1024))])event=np.fromfile(f,dtype=event_dtype,count=1)

fromfile python code dtype 39 numpy zip

python - 元组索引 numpy 数组的奇怪行为

在使用元组列表(使用python2.7.8和numpy1.9.1)索引平面numpy数组时，我注意到一些令人困惑的行为。我的猜测是这与数组维度的最大数量(我认为是32)有关，但我一直无法找到文档。>>>a=np.arange(100)>>>tuple_index=[(i,)foriina]>>>a[tuple_index]#Thisworks(butmaybeitshouldn't)>>>a[tuple_index[:32]]#Thisworkstoo>>>a[tuple_index[:31]]#Thisbreaksfor2",line1,inIndexError:toomanyind

python numpy code tuple_index gt arrays indexing

python - 为什么 B = numpy.dot(A,x) 循环执行 B[i, :, :] = numpy. dot(A[i, :, :], x) ) 如此慢？

我得到了一些我无法解释的效率测试结果。我想组装一个矩阵B，其第i个条目B[i,:,:]=A[i,:,:].dot(x)，其中每个A[i,:,:]是一个二维矩阵，x也是。我可以通过三种方式来执行此操作，为了测试性能，我制作了随机(numpy.random.randn)矩阵A=(10,1000,1000),x=(1000,1200)。我得到以下时间结果:(1)单个多维点积B=A.dot(x)totaltime:102.361s(2)遍历i并进行二维点积#initializeB=np.zeros([dim1,dim2,dim3])foriinrange(A.shape[0]):B[i,:,:

numpy dot code shape time python multidimensional-array product

python - 用numpy求解矩阵方程时出错

我正在使用sympy和numpy在Python中编写自己的Newton-Raphson算法。代码如下，但您可以忽略它并跳到错误处:代码defnewtonRhapson(fncList,varz,x0):jacob=[]forfncinfncList:vec=[]forvarinvarz:res=fnc.diff(var)foriinrange(len(varz)):res=res.subs(varz[i],x0[i])vec.append(res)jacob.append(numpy.array(vec,dtype='float64'))fx0=[]forfncinfncList:re

时出求解 code res res2 python numpy sympy

python - 如何将 x、y、z 坐标数组转换为 numpy 中的 3D 路径

给定X、Y和Z坐标的三个一维数组，如何使用numpy将其转换为3D网格路径？我设法使用numpy为2D执行此操作(即没有for循环):importnumpydefpath_2d_numpy(x,y):m1,m2=numpy.meshgrid(x,y)m1[1::2]=m1[1::2,::-1]r=numpy.append(m1,m2)r.shape=2,-1returnr.Tfrommatplotlibimportlinesfrommatplotlibimportpyplotdefplot_path_2d(path):x,y=path.Tpyplot.plot(x,y,'-ro',lw

python numpy path coords 3d mesh

345 346 347348349 350 351