草庐IT

genfromtxt

全部标签

python - 从包含缺失值的文本文件中读取数据

我想从一个有很多缺失值的文件中读取数据,如本例所示:1,2,3,4,56,,,7,8,,9,10,11我正在使用numpy.loadtxt函数:data=numpy.loadtxt('test.data',delimiter=',')问题是缺失值会破坏loadtxt(我得到一个“ValueError:无法将字符串转换为float:”,毫无疑问是因为两个或多个连续的分隔符)。有没有办法使用loadtxt或其他函数自动执行此操作,还是我必须硬着头皮手动解析每一行? 最佳答案 我可能会使用genfromtxt:>>>fromnumpyim

python - numpy 中的 "Got 1 columns instead of ..."错误

我正在编写以下代码,用于对训练集和测试集执行随机森林分类;fromsklearn.ensembleimportRandomForestClassifierfromnumpyimportgenfromtxt,savetxtdefmain():dataset=genfromtxt(open('filepath','r'),delimiter='',dtype='f8')target=[x[0]forxindataset]train=[x[1:]forxindataset]test=genfromtxt(open('filepath','r'),delimiter='',dtype='f8'

python - Numpy genfromtxt 列名

如何让genfromtxt返回由names=True自动检索的列名list?当我这样做时:data=np.genfromtxt("test.csv",names=True,delimiter=",",dtype=None)printdata['col1']它打印col1的整个列值。但是,我需要遍历所有的列名。我该怎么做?我尝试了data.keys()和各种其他方法,但是genfromtxt返回的任何内容似乎都不是字典兼容对象。我想我可以自己传递列名的list,但从长远来看,这对我来说是无法维护的。有什么想法吗? 最佳答案 genfr

python - numpy.genfromtxt 和 numpy.loadtxt 的区别,以及 Unpack

我很想知道这个线程标题中提到的两个函数之间的区别。在包含文档的网站上,它说,“numpy.loadtxt[is][an]没有数据丢失时的等效函数。”这到底是什么意思?这是否意味着,例如,如果我有一个csv文件,在包含数据的两列之间有一个空白列,我不应该numpy.loadtxt?还有,这是什么意思,"unpack:bool,optionalIfTrue,thereturnedarrayistransposed,sothatargumentsmaybeunpackedusingx,y,z=loadtxt(...)"我不太确定这是什么意思。非常感谢您的帮助,谢谢!

python - numpy.genfromtxt 和 numpy.loadtxt 的区别,以及 Unpack

我很想知道这个线程标题中提到的两个函数之间的区别。在包含文档的网站上,它说,“numpy.loadtxt[is][an]没有数据丢失时的等效函数。”这到底是什么意思?这是否意味着,例如,如果我有一个csv文件,在包含数据的两列之间有一个空白列,我不应该numpy.loadtxt?还有,这是什么意思,"unpack:bool,optionalIfTrue,thereturnedarrayistransposed,sothatargumentsmaybeunpackedusingx,y,z=loadtxt(...)"我不太确定这是什么意思。非常感谢您的帮助,谢谢!

python - 将 CSV 文件读取到 numpy 数组,第一行为字符串,其余为 float

我将数据存储在CSV中,其中第一行是字符串(列名),其余行是数字。如何将其存储到numpy数组中?我能找到的只是如何为列设置数据类型,而不是为行设置数据类型。现在我只是跳过标题来进行计算,但我需要在最终版本中包含标题。但是,如果我将标题保留在其中,则会将整个数组设置为字符串,并且计算会失败。这就是我所拥有的:data=np.genfromtxt(path_to_csv,dtype=None,delimiter=',',skip_header=1) 最佳答案 如果您在函数np.genfromtxt中使用names=True参数,则可以

python - 将 CSV 文件读取到 numpy 数组,第一行为字符串,其余为 float

我将数据存储在CSV中,其中第一行是字符串(列名),其余行是数字。如何将其存储到numpy数组中?我能找到的只是如何为列设置数据类型,而不是为行设置数据类型。现在我只是跳过标题来进行计算,但我需要在最终版本中包含标题。但是,如果我将标题保留在其中,则会将整个数组设置为字符串,并且计算会失败。这就是我所拥有的:data=np.genfromtxt(path_to_csv,dtype=None,delimiter=',',skip_header=1) 最佳答案 如果您在函数np.genfromtxt中使用names=True参数,则可以

python - numpy.genfromtxt 生成看起来像元组的数组,而不是二维数组——为什么?

我正在运行genfromtxt,如下所示:date_conv=lambdax:str(x).replace(":","/")time_conv=lambdax:str(x)a=np.genfromtxt(input.txt,delimiter=',',skip_header=4,usecols=[0,1]+radii_indices,converters={0:date_conv,1:time_conv})input.txt来自thisgist.当我查看结果时,它是一维数组而不是二维数组:>>>np.shape(a)(918,)它似乎是一个元组数组:>>>a[0]('06/03/200

python - numpy.genfromtxt 生成看起来像元组的数组,而不是二维数组——为什么?

我正在运行genfromtxt,如下所示:date_conv=lambdax:str(x).replace(":","/")time_conv=lambdax:str(x)a=np.genfromtxt(input.txt,delimiter=',',skip_header=4,usecols=[0,1]+radii_indices,converters={0:date_conv,1:time_conv})input.txt来自thisgist.当我查看结果时,它是一维数组而不是二维数组:>>>np.shape(a)(918,)它似乎是一个元组数组:>>>a[0]('06/03/200

python - 如何使用 genfromtxt() 从 NumPy 中的文本文件中读取不同长度的列?

我有数百个这样的文本文件,每列由三个空格分隔。数据是一年的:12个月,每个月31天。下面,我只在下面展示与问题相关的内容:001DIST-ADILABADANDHRA平均温度DATEJANFEBMAR....NOVDEC0121.524.327.125.822.40221.424.227.125.822.4..................2723.626.830.323.121.32823.827.030.622.921.32923.431.022.921.23023.531.122.621.43123.831.2....21.6我想将每一列读入一个数组,然后取平均。为此,我使用g