草庐IT

python - 随机矩阵的 Numpy 数组

我是python/numpy的新手,我需要创建一个包含随机数矩阵的数组。到目前为止我得到的是:foriinxrange(samples):SPN[]=np.random.random((6,5))*np.random.randint(0,100)这对作为PHP开发人员的我来说很有意义,但不适用于python。那么我该如何创建一个3维数组来包含这个矩阵/数组呢? 最佳答案 两者都是np.random.randint和np.random.uniform,像大多数np.random函数一样,接受一个size参数,所以在numpy中我们一步

python - 在 python 中绘制二维矩阵,代码和最有用的可视化

我有一个“numpy”矩阵格式的非常大的矩阵(10x55678)。该矩阵的行对应于一些“主题”,列对应于单词(文本语料库中的独特单词)。该矩阵中的每个条目i,j都是一个概率,表示词j属于主题i的概率为x。因为我使用的是id而不是真实的单词,而且矩阵的维度非常大,所以我需要以某种方式将其可视化。你建议使用哪种可视化?一个简单的情节?还是更复杂、信息更丰富的?(我问这些是因为我不知道有用的可视化类型)。如果可能的话,你能给我一个使用numpy矩阵的例子吗?谢谢我问这个问题的原因是我想对我的语料库中的词-主题分布有一个大概的了解。欢迎任何其他方法 最佳答案

python - 按组排序 float 列表

我有一个float数组,它是无序的。我知道这些值总是落在一些未知的点附近。为了说明,这个列表[10.01,5.001,4.89,5.1,9.9,10.1,5.05,4.99]值集中在5和10左右,所以我希望[5,10]作为答案。我想为具有1000多个值的列表找到那些集群,其中集群的数量可能在10左右(对于某些给定的容差)。如何有效地做到这一点? 最佳答案 检查python-cluster.有了这个库,你可以做这样的事情:fromclusterimport*data=[10.01,5.001,4.89,5.1,9.9,10.1,5.0

python - 在 numpy 数组中按最大值或最小值分组

我有两个等长的一维numpy数组,id和data,其中id是重复的有序整数序列,定义data上的子窗口。例如:iddata1217132829210313-10我想通过在id上分组并取最大值或最小值来聚合data。在SQL中,这将是一个典型的聚合查询,如SELECTMAX(data)FROMtablenameGROUPBYidORDERBYid。有没有一种方法可以避免Python循环并以矢量化方式执行此操作? 最佳答案 最近几天我看到了一些关于堆栈溢出的非常相似的问题。以下代码与numpy.unique的实现非常相似,因为它利用了底

python - 在python中制作一个0到n的向量

我是一个新的python用户,我想知道如何制作一个0到n的向量。我希望用户能够输入n的整数,并接收[0,1,2,3,4,5...,n]的输出。这就是我到目前为止所做的......fromnumpyimportmatrixn=int(raw_input("n="))foriinrange(n,0,-1):K=matrix(i)printK但这是我得到的输出:[0][1][2][3][4][5]...[n]转置矩阵没有帮助。我做错了什么?感谢您的帮助! 最佳答案 使用内置函数:range(n)(好吧,如果你想要一个列表是[0,1,...

Python获取图像矩阵PIL

我正在尝试加载图像、转换它并打印矩阵。我有以下代码;im=Image.open("1.jpg")im=im.convert("L")printim当我打印“我”时,我得到这个.我怎样才能看到图像矩阵? 最佳答案 你可以使用numpy.asarray():>>>importImage,numpy>>>numpy.asarray(Image.open('1.jpg').convert('L')) 关于Python获取图像矩阵PIL,我们在StackOverflow上找到一个类似的问题:

python - 如何 'zero' 输出数组中的行和列

我有一个二维数组来表示多对多映射:0313300010003000将与此数组中特定索引对应的行和列条目“归零”的最快方法是什么? 最佳答案 arr[i]=0#zeroesoutrowiarr[:,i]=0#zeroesoutcolumni 关于python-如何'zero'输出数组中的行和列,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/17482955/

python - 我怎样才能绘制ca。 2000 万个点作为散点图?

我正在尝试使用由ca组成的matplotlib创建一个散点图。约2000万个数据点。即使在最终没有任何可见数据之前将alpha值设置为最低,结果也只是一个完全黑色的图。plt.scatter(timedPlotData,plotData,alpha=0.01,marker='.')x轴是大约2个月的连续时间轴,y轴由150k连续整数值组成。有没有办法绘制所有点,以便它们随时间的分布仍然可见?感谢您的帮助。 最佳答案 有不止一种方法可以做到这一点。很多人建议使用热图/内核密度估计/2d直方图。@Bucky建议使用移动平均线。此外,您可

Python - 读取奇怪的 utf-16 格式的文本文件

我正在尝试将文本文件读入python,但它似乎使用了一些非常奇怪的编码。我像往常一样尝试:file=open('data.txt','r')lines=file.readlines()forlineinlines[0:1]:printline,printline.split()输出:0.02001971.97691e-005['0\x00.\x000\x002\x000\x000\x001\x009\x007\x00','\x001\x00.\x009\x007\x006\x009\x001\x00e\x00-\x000\x000\x005\x00']打印线条效果很好,但在我尝试拆分线

小数选项大于 2 的 python np.round()

Python有默认的round()函数,但我用cython编程,想用numpy函数替换pythonic代码。但是,在终端中进行实验时,我得到了以下结果。>>>np.around(1.23456789)1.0>>>np.around(1.23456789,decimals=0)1.0>>>np.around(1.23456789,decimals=1)1.2>>>np.around(1.23456789,decimals=2)1.23>>>np.around(1.23456789,decimals=3)1.2350000000000001>>>np.around(1.23456789,d