草庐IT

csv_export

全部标签

python - 从 CSV 文件 Python 制作对象

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭8年前。Improvethisquestion我试图在Python中创建一个对象集合,这些对象的属性来自CSV文件。目前,我有一个简单的类:classmyClass:name=""age=0hobbies=[]def__init__(self,var1,var2,var3)self.name=var1self.age=var2self.hobbies=var3为了存储大量数据而不会使代码困惑,我创建了一个CSV文件,如下所示:RobertSamson

python - 从 hdfs 读取 csv 文件作为数据帧

我正在使用pydoop从hdfs读取文件,当我使用时:importpydoop.hdfsashdwithhd.open("/home/file.csv")asf:printf.read()它向我显示了标准输出中的文件。我有什么办法可以将这个文件作为数据框读入吗?我试过使用pandas的read_csv("/home/file.csv"),但它告诉我找不到该文件。确切的代码和错误是:>>>importpandasaspd>>>pd.read_csv("/home/file.csv")Traceback(mostrecentcalllast):File"",line1,inFile"/us

Python 使用 pandas 将 xlsx 转换为 csv 文件。如何删除索引列?

我正在使用以下代码将.xlsx文件转换为.csv文件。importpandasaspddata_xls=pd.read_excel('excelfile.xlsx','Sheet2',index_col=None)data_xls.to_csv('csvfile.csv',encoding='utf-8')代码正在运行,但是我得到了一个索引列,其中包含我不想要的单元格编号。无论如何不包括或删除该索引列?文件输出UnnamedData00.9931961310.9931961320.9931961330.9931961340.9931961350.99319613

python - 读取 CSV 文件并将其插入 python 中的二维列表

我想在Python中将CSV文件的数据(网络数据,如:时间、IP地址、端口号)插入到二维列表中。代码如下:importcsvdatafile=open('a.csv','r')datareader=csv.reader(datafile,delimiter=';')data=[]forrowindatareader:data.append(row)print(data[1:4])结果是:[['1','6','192.168.4.118','1605','','115.85.145.5','80','','60','0.000000000','0x0010','Jun15,201018:

python - 将多个 .CSV 文件发送到 .ZIP 而无需在 Python 中存储到磁盘

我正在为我的Django支持的网站开发一个报告应用程序。我想运行多个报告并让每个报告在内存中生成一个.csv文件,该文件可以作为.zip文件批量下载。我想在不将任何文件存储到磁盘的情况下执行此操作。到目前为止,要生成单个.csv文件,我遵循的是常见操作:mem_file=StringIO.StringIO()writer=csv.writer(mem_file)writer.writerow(["Mycontent",my_value])mem_file.seek(0)response=HttpResponse(mem_file,content_type='text/csv')resp

Python UTF-16 CSV 阅读器

我有一个必须阅读的UTF-16CSV文件。Pythoncsv模块似乎不支持UTF-16。我正在使用python2.7.2。我需要解析的CSV文件很大,有几GB的数据。下面是JohnMachin问题的答案printrepr(open('test.csv','rb').read(100))输出内容只有abc的test.csv'\xff\xfea\x00b\x00c\x00'我认为csv文件是在美国的Windows机器上创建的。我正在使用MacOSXLion。如果我使用phihag提供的代码和包含一条记录的test.csv。使用的示例test.csv内容。下面是printrepr(open(

python - low_memory 和 memory_map 标志在 pd.read_csv 中做什么

pandas.read_csv的函数签名提供以下选项:read_csv(filepath_or_buffer,low_memory=True,memory_map=False,iterator=False,chunksize=None,...)我找不到任何关于low_memory或memory_map标志的文档。我很困惑这些功能是否已经实现,如果是的话它们是如何工作的。具体而言,memory_map:如果实现,它是否使用np.memmap,如果是,它是否将各个列存储为memmap或行。low_memory:它是否指定像cache这样的东西存储在内存中?我们可以将现有的DataFrame

python - CSV 数据(时间戳和事件)的时间序列图 : x-label constant

(本题可单独阅读,但为:TimeseriesfromCSVdata(Timestampandevents)的续集)我想使用python的pandas模块(参见下面的链接)通过时间序列表示来可视化CSV数据(来自2个文件)。df1的示例数据:TIMESTAMPeventid02017-03-2002:38:24112017-03-2105:59:41122017-03-2312:59:58132017-03-2401:00:07142017-03-2703:00:131“eventid”列始终包含值1,我试图显示数据集中每一天的事件总和。第二个数据集df0具有相似的结构,但仅包含零:df

python - 如何将 csv 文件直接压缩成 zip 存档?

我正在使用以下代码动态生成许多csv文件:importcsvfieldnames=['foo1','foo2','foo3','foo4']withopen(csvfilepath,'wb')ascsvfile:csvwrite=csv.DictWriter(csvfile,delimiter=',',fieldnames=fieldnames)csvwrite.writeheader()forrowindata:csvwrite.writerow(row)为了节省空间,我想压缩它们。使用gzip模块非常简单:withgzip.open("foo.gz","w")ascsvfile:c

python - 如何强制 pandas read_csv 对所有浮点列使用 float32?

因为我不需要double我的机器内存有限,我想处理更大的数据集我需要将提取的数据(作为矩阵)传递给BLAS库,单精度的BLAS调用比double等效调用快2倍。请注意,并非原始csv文件中的所有列都具有浮点类型。我只需要将float32设置为浮点列的默认值。 最佳答案 尝试:importnumpyasnpimportpandasaspd#Sample100rowsofdatatodeterminedtypes.df_test=pd.read_csv(filename,nrows=100)float_cols=[cforcindf_t