草庐IT

csv-import

全部标签

Python-import导入上级目录文件

假设有如下目录结构:--dir0  |file1.py  |file2.py  |dir3   |file3.py  |dir4   |file4.pydir0文件夹下有file1.py、file2.py两个文件和dir3、dir4两个子文件夹,dir3中有file3.py文件,dir4中有file4.py文件。1.导入同级模块python导入同级模块(在同一个文件夹中的py文件)直接导入即可。importxxx如在file1.py中想导入file2.py,注意无需加后缀".py":importfile2#使用file2中函数时需加上前缀"file2.",即:#file2.fuction_na

python - 从 hdfs 读取 csv 文件作为数据帧

我正在使用pydoop从hdfs读取文件,当我使用时:importpydoop.hdfsashdwithhd.open("/home/file.csv")asf:printf.read()它向我显示了标准输出中的文件。我有什么办法可以将这个文件作为数据框读入吗?我试过使用pandas的read_csv("/home/file.csv"),但它告诉我找不到该文件。确切的代码和错误是:>>>importpandasaspd>>>pd.read_csv("/home/file.csv")Traceback(mostrecentcalllast):File"",line1,inFile"/us

python - 导入错误 : cannot import name '_win32stdio'

我正在使用Scrapy框架从网站上抓取数据,但在命令提示符下出现以下错误:ImportError:cannotimportname'_win32stdio'Traceback作为屏幕截图附上。如果需要我的程序目录的目录结构,请回复。 最佳答案 如果你做一些小的调整,Scrapy可以在Windows上与Python3一起工作:将_win32stdio和_pollingfile复制到site-packages下的适当目录。即,twisted-dir\internet。从https://github.com/twisted/twisted

Python 使用 pandas 将 xlsx 转换为 csv 文件。如何删除索引列?

我正在使用以下代码将.xlsx文件转换为.csv文件。importpandasaspddata_xls=pd.read_excel('excelfile.xlsx','Sheet2',index_col=None)data_xls.to_csv('csvfile.csv',encoding='utf-8')代码正在运行,但是我得到了一个索引列,其中包含我不想要的单元格编号。无论如何不包括或删除该索引列?文件输出UnnamedData00.9931961310.9931961320.9931961330.9931961340.9931961350.99319613

python - 读取 CSV 文件并将其插入 python 中的二维列表

我想在Python中将CSV文件的数据(网络数据,如:时间、IP地址、端口号)插入到二维列表中。代码如下:importcsvdatafile=open('a.csv','r')datareader=csv.reader(datafile,delimiter=';')data=[]forrowindatareader:data.append(row)print(data[1:4])结果是:[['1','6','192.168.4.118','1605','','115.85.145.5','80','','60','0.000000000','0x0010','Jun15,201018:

python - 将多个 .CSV 文件发送到 .ZIP 而无需在 Python 中存储到磁盘

我正在为我的Django支持的网站开发一个报告应用程序。我想运行多个报告并让每个报告在内存中生成一个.csv文件,该文件可以作为.zip文件批量下载。我想在不将任何文件存储到磁盘的情况下执行此操作。到目前为止,要生成单个.csv文件,我遵循的是常见操作:mem_file=StringIO.StringIO()writer=csv.writer(mem_file)writer.writerow(["Mycontent",my_value])mem_file.seek(0)response=HttpResponse(mem_file,content_type='text/csv')resp

python - Django 错误配置 : WSGI application 'myproject.wsgi.application' could not be loaded; Error importing module

我几乎全新安装了django,当我运行pythonmanage.pyrunserver时。它给我这个错误:ImproperlyConfigured:WSGIapplication'myproject.wsgi.application'couldnotbeloaded;Errorimportingmodule.设置.pyWSGI_APPLICATION='myproject.wsgi.application'wsgi.pyimportosfromdjango.core.wsgiimportget_wsgi_applicationos.environ.setdefault("DJANGO_

python - "from MODULE import _"在 python 中做什么?

在Gettingthingsgnome代码库中,我偶然发现了这个import语句fromGTGimport_不知道这是什么意思,在文档中从未见过这个,所以/谷歌快速搜索没有找到任何东西。 最佳答案 fromGTGimport_将_函数从GTG模块导入“当前”命名空间。通常,_函数是gettext.gettext()的别名。,一个显示给定消息的本地化版本的函数。该文档给出了一个很远很远的模块中其他地方通常发生的事情的图片:importgettextgettext.bindtextdomain('myapplication','/pat

Python UTF-16 CSV 阅读器

我有一个必须阅读的UTF-16CSV文件。Pythoncsv模块似乎不支持UTF-16。我正在使用python2.7.2。我需要解析的CSV文件很大,有几GB的数据。下面是JohnMachin问题的答案printrepr(open('test.csv','rb').read(100))输出内容只有abc的test.csv'\xff\xfea\x00b\x00c\x00'我认为csv文件是在美国的Windows机器上创建的。我正在使用MacOSXLion。如果我使用phihag提供的代码和包含一条记录的test.csv。使用的示例test.csv内容。下面是printrepr(open(

python - low_memory 和 memory_map 标志在 pd.read_csv 中做什么

pandas.read_csv的函数签名提供以下选项:read_csv(filepath_or_buffer,low_memory=True,memory_map=False,iterator=False,chunksize=None,...)我找不到任何关于low_memory或memory_map标志的文档。我很困惑这些功能是否已经实现,如果是的话它们是如何工作的。具体而言,memory_map:如果实现,它是否使用np.memmap,如果是,它是否将各个列存储为memmap或行。low_memory:它是否指定像cache这样的东西存储在内存中?我们可以将现有的DataFrame