草庐IT

panda_link

全部标签

python - 在不添加新日期的情况下重新采样日内 pandas DataFrame

我想在不添加新日期的情况下对一些日内数据进行下采样df.resample('30Min')会增加周末等,这是不受欢迎的。有什么办法吗? 最佳答案 组合的groupby/resample可能有效:In[22]:dates=pd.date_range('01-Jan-2014','11-Jan-2014',freq='T')[0:-1]...:dates=dates[dates.dayofweek 关于python-在不添加新日期的情况下重新采样日内pandasDataFrame,我们在St

python - Pandas read_csv dtype 前导零

所以我正在读取来自NOAA的站点代码csv文件,如下所示:"USAF","WBAN","STATIONNAME","CTRY","FIPS","STATE","CALL","LAT","LON","ELEV(.1M)","BEGIN","END""006852","99999","SENT","SW","SZ","","","+46817","+010350","+14200","","""007005","99999","CWOS07005","","","","","-99999","-999999","-99999","20120127","20120127"前两列包含气象站的代

python - 使用 pandas 从日志文件分析生成 session

我正在分析一个Apache日志文件,并将其导入到一个pandas数据框中。'65.55.52.118--[30/May/2013:06:58:52-0600]"GET/detailedAddVen.php?refId=7954&uId=2802HTTP/1.1"2004514"-""Mozilla/5.0(compatible;bingbot/2.0;+http://www.bing.com/bingbot.htm)"'我的数据框:我想根据IP、代理和时差将其分组到session中(如果持续时间大于30分钟,则应该是一个新session)。通过IP和Agent对数据帧进行分组很容易,但

python - Pandas 系列的groupby不起作用

我无法对Pandas系列对象进行分组。DataFrames很好,但我似乎无法对Series进行分组。有没有人能够让这个工作?>>>importpandasaspd>>>a=pd.Series([1,2,3,4],index=[4,3,2,1])>>>a41322314dtype:int64>>>a.groupby()Traceback(mostrecentcalllast):File"",line1,inFile"/share/apps/install/anaconda/lib/python2.7/site-packages/pandas/core/generic.py",line15

python - 将 Pandas 中的两个系列沿着它们的索引组合起来

这个问题在这里已经有了答案:CombiningtwoSeriesintoaDataFrameinpandas(9个回答)关闭9年前。我有两个pandas系列。系列1:idcount_1133194155562和系列2:idcount_21331415261我如何根据id组合表格以形成下面的表格?idcount_1count_213331914151552621

python - 从 Pandas 中的单个字符串列创建新的二进制列

我以前见过这个,只是想不起这个函数。假设我有一列“速度”,每一行都有这些值中的一个:'Slow','Normal','Fast'我如何创建一个新的数据框,其中包含除“速度”列之外的所有行,该列现在是3列:“慢速”、“正常”和“快速”,其中我的所有行在任何一列中都标有1旧的“速度”栏是。所以如果我有:printdf['Speed'].ix[0]>'Normal'我没想到会这样:printdf['Normal'].ix[0]>1printdf['Slow'].ix[0]>0 最佳答案 您可以使用pd.get_dummies(docs)轻

python - Pandas:检查系列 A 中的单词是否以系列 B 中的一个单词结尾的最快方法

我想检查名为strings的系列中的单词是否以系列ending_strings中的一个单词结尾。strings=Series(['om','foo_nom','nom','bar_foo','foo','blah'])ending_strings=Series(['nom','foo'])expected_results=Series([False,True,True,True,True,False])我想出了以下代码,但是否有更快或更pandas风格的方法来做到这一点?frompandasimportSeriesdefew(v):returnstrings.str.endswith(

python - 在 Pandas 中使散点图的标签垂直和水平

我正在使用Pandas绘制散点图矩阵:frompandas.tools.plottingimportscatter_matrix。问题是DataFrame中列的名称太长,我需要它们在x轴上是垂直的,在y轴上是水平的,这样它们才能适合。我完全不知道如何在Pandas中做到这一点。我知道如何在matplotlib中执行此操作,但在Pandas中不知道。我的代码:pylab.clf()df=pd.DataFrame(X,columns=the_labels)axs=scatter_matrix(df,alpha=0.2,diagonal='kde')编辑:我需要使用pylab.clf()因为

python - 使用 Pandas 导入每行具有不同列数的 csv

使用Pandas或CSV模块将每行具有不同列数的CSV导入PandasDataFrame的最佳方法是什么。"H","BBB","D","AjxxxDxxxs""R","1","QH","DTR","","","spxxtrixxls,raxxxd","1"使用这段代码:importpandasaspddata=pd.read_csv("smallsample.txt",header=None)产生如下错误Errortokenizingdata.Cerror:Expected4fieldsinline2,saw8 最佳答案 在read

python Pandas : Getting the locations of a value in dataframe

假设我有以下数据框:'a''b'000110201301有没有办法获取存在特定值的索引/列值?例如,类似于以下内容:values=df.search(1)将有values=[(1,'a'),(2,'b'),(3,'b')]。 最佳答案 df[df==1].stack().index.tolist()产量[(1,'a'),(2,'b'),(3,'b')] 关于pythonPandas:Gettingthelocationsofavalueindataframe,我们在StackOverfl