草庐IT

matrix_size

全部标签

python - CVXOPT QP 求解器 : TypeError: 'A' must be a 'd' matrix with 1000 columns

我正在尝试使用CVXOPTqp求解器计算支持向量机的拉格朗日乘数defsvm(X,Y,c):m=len(X)P=matrix(np.dot(Y,Y.T)*np.dot(X,X.T))q=matrix(np.ones(m)*-1)g1=np.asarray(np.diag(np.ones(m)*-1))g2=np.asarray(np.diag(np.ones(m)))G=matrix(np.append(g1,g2,axis=0))h=matrix(np.append(np.zeros(m),(np.ones(m)*c),axis=0))A=np.reshape((Y.T),(1,m)

python - 了解 Python 中的 return [0,size-1][nums[0]<nums[size-1]]

在处理一个简单的编码问题时,编写函数findPeakElement,我遇到了以下代码:deffindPeakElement(self,nums):size=len(nums)forxinrange(1,size-1):ifnums[x]>nums[x-1]andnums[x]>nums[x+1]:returnxreturn[0,size-1][nums[0]最后一行是什么意思? 最佳答案 最后一行是一种晦涩的写法ifthenelse表达。[0,size-1]创建一个包含两个元素的列表。nums[0]返回True或False当用作列表

python - 创建子图时 Matplotlib "dictionary changed size during iteration"错误

我写了一个函数来绘制由两个不同大小的子图组成的图形:defdraw_plot(data,function,sigma_value):gs=gridspec.GridSpec(1,5)ax1=subplot(gs[0,0:3])ax2=subplot(gs[0,3:5],sharey=ax1)gs.update(wspace=0.05)...我应该提到这是一个模块级函数,所以在该模块的顶部我进行了导入frompylabimport*importmatplotlib.gridspecasgridspec当我运行myplot.draw_plot(...),我得到RuntimeError.问题

python - 如何获得 csr_matrix 中列的均值和标准差?

我有一个通过scipy.sparse创建的稀疏988x1向量(csr_matrix中的一列)。有没有办法在不必将稀疏矩阵转换为密集矩阵的情况下获得其均值和标准差?numpy.mean似乎只适用于密集向量。 最佳答案 由于您正在执行列切片,因此最好使用CSC而不是CSR来存储矩阵。但这取决于您对矩阵进行的其他操作。要计算CSC矩阵中列的平均值,您可以使用mean()矩阵的函数。要有效地计算标准偏差,需要付出更多的努力。首先,假设您得到这样的稀疏列:col=A.getcol(colindex)然后像这样计算方差:N=col.shape[

python - Matplotlib imshow : how to apply a mask on the matrix

我正在尝试以图形方式分析二维数据。matplotlib.imshow在这方面非常有用,但我觉得如果我可以从我的矩阵中排除一些单元格,我可以更多地利用它,这些单元格的值超出了感兴趣的范围。我的问题是这些值在我感兴趣的范围内“拉平”了颜色图。排除这些值后,我可以获得更高的颜色分辨率。我知道如何在我的矩阵上应用掩码来排除这些值,但它在应用掩码后返回一个一维对象:mask=(myMatrix>lowerBound)&(myMatrix有没有办法将掩码传递给imshowhowtoreconstructa2darray? 最佳答案 您可以使用n

python - Pandas scatter_matrix - 绘制分类变量

我正在查看Kaggle竞赛中著名的泰坦尼克号数据集:http://www.kaggle.com/c/titanic-gettingStarted/data我已使用以下方式加载和处理数据:#importrequiredlibrariesimportpandasaspdimportmatplotlib.pyplotasplt%matplotlibinline#loadthedatafromthefiledf=pd.read_csv('./data/train.csv')#importthescatter_matrixfunctionalityfrompandas.tools.plottin

python - numpy np.array 与 np.matrix(性能)

在使用numpy时,我经常发现这种区别很烦人-当我从矩阵中提取一个向量或一行,然后使用np.array执行操作时,通常会出现问题。为了减少麻烦,为了简单起见,我有时只使用np.matrix(将所有np.arrays转换为np.matrix)。但是,我怀疑会有一些性能影响。任何人都可以评论这些可能是什么以及原因吗?看起来如果它们都只是引擎盖下的数组,那么元素访问只是一个获取值的偏移量计算,所以如果不通读整个源代码我不确定可能有什么区别。更具体地说,这对性能有什么影响:v=np.matrix([1,2,3,4])#versusthebeloww=np.array([1,2,3,4])谢谢

Matrix 上的 Python PCA 太大而无法放入内存

我有一个100,000行x27,000列的csv,我正在尝试对其进行PCA以生成100,000行X300列的矩阵。csv有9GB大。这是我目前正在做的事情:fromsklearn.decompositionimportPCAasRandomizedPCAimportcsvimportsysimportnumpyasnpimportpandasaspddataset=sys.argv[1]X=pd.DataFrame.from_csv(dataset)Y=X.pop("Y_Level")X=(X-X.mean())/(X.max()-X.min())Y=list(Y)dimensions

python - 'index 0 is out of bounds for axis 0 with size 0' 是什么意思?

我是python和numpy的新手。我运行了我编写的代码,我收到了这条消息:'索引0超出了大小为0的轴0的范围'没有上下文,我只想弄清楚这是什么意思。问这个问题可能很愚蠢,但是轴0和大小0是什么意思?索引0表示数组中的第一个值..但我无法弄清楚轴0和大小0是什么意思。“数据”是一个文本文件,在两列中包含大量数字。x=np.linspace(1735.0,1775.0,100)column1=(data[0,0:-1]+data[0,1:])/2.0column2=data[1,1:]x_column1=np.zeros(x.size+2)x_column1[1:-1]=xx_colum

python - 将一列零添加到 csr_matrix

我有一个MxN稀疏csr_matrix,我想在矩阵的右侧添加一些只有零的列。原则上,数组indptr、indices和data保持不变,所以我只想改变矩阵的维度。但是,这似乎没有实现。>>>A=csr_matrix(np.identity(5),dtype=int)>>>A.toarray()array([[1,0,0,0,0],[0,1,0,0,0],[0,0,1,0,0],[0,0,0,1,0],[0,0,0,0,1]])>>>A.shape(5,5)>>>A.shape=((5,7))NotImplementedError:Reshapingnotimplementedforcs