草庐IT

csv-import

全部标签

python - 使用 Pandas 计算 CSV 行中的分隔符

我有一个csv文件如下:name,agesomethingtom,20当我将它放入数据框时,它看起来像:df=pd.read_csv('file',header=None)011nameage2somethingNaN3tom20我如何获得原始行数据中逗号的计数。例如,答案应如下所示:#inpseudocodedf['_count_separators']=len(df.raw_value.count(','))01_count_separators1nameage12somethingNaN03tom201 最佳答案 非常简单,将

python - 为什么我不能在函数中使用 `import *`?

这个问题在这里已经有了答案:Python:Whyshould'fromimport*'beprohibited?(6个答案)关闭上个月。这按预期工作defouter_func():fromtimeimport*printtime()outer_func()我可以在上下文中定义嵌套函数并从其他嵌套函数中调用它们:defouter_func():deftime():return'123456'definner_func():printtime()inner_func()outer_func()我什至可以导入单个函数:defouter_func():fromtimeimporttimedef

python - 从加密导入随机 -> ImportError : cannot import name Random

我已经将pycrypto(版本2.3)安装到/usr/local/lib/python2.6/dist-packages/Crypto/并且我能够在那里看到随机包。但是当我尝试导入Crypto.Random时,它让我很兴奋fromCrypto.Randomimport*ImportError:NomodulenamedRandom有谁知道为什么会发生这种情况?谢谢。importCryptoimportosprint(Crypto.__file__);print(dir(Crypto));print(os.listdir(os.path.dirname(Crypto.__file__))

python - beautifulSoup html csv

晚上好,我使用BeautifulSoup从一个网站中提取了一些数据,如下所示:fromBeautifulSoupimportBeautifulSoupfromurllib2importurlopensoup=BeautifulSoup(urlopen('http://www.fsa.gov.uk/about/media/facts/fines/2002'))table=soup.findAll('table',attrs={"class":"table-horizontal-line"})printtable这给出了以下输出:[AmountCompanyorpersonfinedDat

python - 从 matplotlib.backends 导入 _tkagg ImportError : cannot import name _tkagg

尝试运行this测试matplotlib如何与Tkinter一起工作的示例,我收到错误:(env)fieldsofgold@fieldsofgold-VirtualBox:~/new$pythontest.pyTraceback(mostrecentcalllast):File"test.py",line7,infrommatplotlib.backends.backend_tkaggimportFigureCanvasTkAgg,NavigationToolbar2TkAggFile"/home/fieldsofgold/new/env/local/lib/python2.7/sit

Python CSV 阅读器和迭代

我有一个如下所示的CSV文件:"Company,Inc.",,,,,,,,,,,,10/30/09A/RSummaryAgedAnalysisReport,,,,,,,,,,,,10:35:01AllClients,,,,,,,,,,,,USERClientAccount,CustomerName,15-Jan,16-30,31-60,61-90,91-120,120-Over,Total,Status,CreditLimit1000001111,CLIENTA,0,0,"3,711.32",0,0,"18,629.64","22,340.96",COD,"20,000.00"1000

python - 如何附加到 CSV 文件?

使用Python附加CSV文件,我每隔一行获取数据。我该如何解决?importcsvLL=[(1,2),(3,4)]Fn=("C:\Test.csv")w=csv.writer(open(Fn,'a'),dialect='excel')w.writerows(LL)C:\test.csv打开后如下所示:1,23,41,23,4 最佳答案 追加与问题无关;请注意前两行(来自原始文件的行)也是双倍行距。真正的问题是您以文本模式打开文件。不管你信不信,CSV是一种二进制格式。csv模块按预期将误导性命名的“lineterminator(应

python - 从 csv 文件逐 block 读取和反转数据并复制到新的 csv 文件

假设我正在处理一个非常大的csv文件。所以,我只能把数据一block一block地读入内存。预期的事件流应如下所示:1)Readchunk(eg:10rows)ofdatafromcsvusingpandas.2)Reversetheorderofdata3)Copyeachrowtonewcsvfileinreverse.Soeachchunk(10rows)iswrittentocsvfrombeginninginreversedorder.最后,csv文件应该以相反的顺序进行,并且应该在不将整个文件加载到Windows操作系统的内存中的情况下完成。我正在尝试进行时间序列预测,我需

python - 为什么来自 s3 的 dask read_csv 保留了这么多内存?

我正在使用dask(SQL查询的替代品)从s3读取一些压缩数据。但是,看起来有一些数据文件的缓存,或者在系统内存中某处保存的解压缩文件。注意,这应该是可运行的,这里的测试数据来自公共(public)s3存储桶中的pandas测试套件。importdask.dataframeasddimportpandasaspdimportpsutilaspsimportos#foreasiervismb=1048576defmytestfunc(file):process=ps.Process(os.getpid())print('initialmemory:{0}'.format(process.

python - "from x.y import z"和 "import x.y.z as z"之间的区别

在您想将嵌套模块导入命名空间的情况下,我总是这样写:fromconcurrentimportfutures不过,我最近意识到这也可以使用“as”语法来表达。请参阅以下内容:importconcurrent.futuresasfutures它具有看起来与其他进口产品更相似的主观优势:importsysimportosimportconcurrent.futuresasfutures...增加冗长的缺点。两者之间是否存在功能差异,或者在PEP或其他方面是官方首选? 最佳答案 有一些功能差异。首先,正如评论中已经提到的,importpac