草庐IT

chart_readings

全部标签

python - 带参数的 Pandas read_sql

有没有关于如何在Pandas中通过SQL查询传递参数的示例?特别是我使用SQLAlchemy引擎连接到PostgreSQL数据库。到目前为止,我发现以下工作:df=psql.read_sql(('select"Timestamp","Value"from"MyTable"''where"Timestamp"BETWEEN%sAND%s'),db,params=[datetime(2014,6,24,16,0),datetime(2014,6,24,17,0)],index_col=['Timestamp'])Pandas文档说params也可以作为dict传递,但我似乎无法通过尝试使其

Python Pandas : How to read only first n rows of CSV files in?

我有一个非常大的数据集,我无法读取整个数据集。所以,我正在考虑只读取其中的一部分进行训练,但我不知道该怎么做。任何想法将不胜感激。 最佳答案 如果您只想读取前999,999(非标题)行:read_csv(...,nrows=999999)如果您只想读取第1,000,000...1,999,999行read_csv(...,skiprows=1000000,nrows=999999)nrows:int,defaultNone要读取的文件行数。对...有用读取大文件*skiprows:类列表或整数文件开头要跳过的行号(0索引)或要跳过的

python - 获取 pandas.read_csv 以将空值读取为空字符串而不是 nan

我正在使用pandas库来读取一些CSV数据。在我的数据中,某些列包含字符串。字符串"nan"是一个可能的值,空字符串也是如此。我设法让Pandas将“nan”读取为字符串,但我不知道如何让它不将空值读取为NaN。这是示例数据和输出One,Two,Threea,1,oneb,2,two,3,threed,4,nane,5,fivenan,6,g,7,seven>>>pandas.read_csv('test.csv',na_values={'One':[],"Three":[]})OneTwoThree0a1one1b2two2NaN3three3d4nan4e5five5nan6Na

python - Lisp 的 read-eval-print 循环与 Python 的有何不同?

我遇到了以下statementbyRichardStallman:'WhenyoustartaLispsystem,itentersaread-eval-printloop.Mostotherlanguageshavenothingcomparabletoread,nothingcomparabletoeval,andnothingcomparabletoprint.Whatgapingdeficiencies!'现在,我很少用Lisp进行编程,但我已经用Python编写了大量代码,最近还用Erlang编写了一些代码。我的印象是这些语言也提供read-eval-print循环,但Sta

Python urllib2 : Reading content body even during HTTPError exception?

我正在使用urllib2通过HTTP获取页面。有时,当我的请求包含错误时,资源会引发HTTP错误400(错误请求)。但是,该响应还包含一个提供详细错误消息的XML元素。能够看到该错误而不仅仅是urllib2返回的HTTPError异常会非常方便。如何在异常情况下返回文档内容? 最佳答案 importurllib2try:request=urllib2.Request('http://www.somesite.com')response=urllib2.urlopen(req)excepturllib2.HTTPErrorase:er

python - 如何在 Pandas read_csv 函数中过滤加载行?

如何使用pandas筛选要加载到内存中的CSV行?这似乎是一个应该在read_csv中找到的选项。我错过了什么吗?示例:我们有一个带有时间戳列的CSV,我们希望只加载时间戳大于给定常量的行。 最佳答案 在将CSV文件加载到pandas对象之前,没有过​​滤行的选项。您可以加载文件然后使用df[df['field']>constant]进行过滤,或者如果您有一个非常大的文件并且您担心内存耗尽,那么使用迭代器并在连接文件block时应用过滤器,例如:importpandasaspditer_csv=pd.read_csv('file.c

python - pandas read_csv 和使用 usecols 过滤列

当我使用usecols过滤列并使用多个索引时,pandas.read_csv无法正确输入csv文件。importpandasaspdcsv=r"""dummy,date,loc,xbar,20090101,a,1bar,20090102,a,3bar,20090103,a,5bar,20090101,b,1bar,20090102,b,3bar,20090103,b,5"""f=open('foo.csv','w')f.write(csv)f.close()df1=pd.read_csv('foo.csv',header=0,names=["dummy","date","loc","x

python - 使用 pandas read_csv 时出现内存错误

我正在尝试做一些相当简单的事情,将一个大的csv文件读入pandas数据帧。data=pandas.read_csv(filepath,header=0,sep=DELIMITER,skiprows=2)代码要么因MemoryError而失败,要么永远不会完成。任务管理器中的内存使用停止在506Mb并且在5分钟没有变化并且进程中没有CPU事件后,我停止了它。我使用的是Pandas版本0.11.0。我知道文件解析器曾经存在内存问题,但根据http://wesmckinney.com/blog/?p=543这应该已经解决了。我要读取的文件是366Mb,如果我将文件缩减为较短的文件(25Mb

python - AttributeError ("' str' 对象没有属性 'read'")

在Python中出现错误:Exception:(,AttributeError("'str'objecthasnoattribute'read'",),)给定python代码:defgetEntries(self,sub):url='http://www.reddit.com/'if(sub!=''):url+='r/'+subrequest=urllib2.Request(url+'.json',None,{'User-Agent':'Redditdesktopclientby/user/RobinJ1995/'})response=urllib2.urlopen(request)j

javascript - MongoDB shell : reading a line from the console

有没有办法从Mongoshell中读取一行?readline()未定义,system.stdin也未定义。我需要在交互模式下执行此操作,而不是向MongoDBshell执行的脚本提供输入。 最佳答案 根据@Stennie的评论,目前这是不可能的。 关于javascript-MongoDBshell:readingalinefromtheconsole,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/q