pyhton_Pandas_草庐IT

python - 通过将 x 添加到前一行 pandas 来填充 na 值

我有一个数据框，其中包含名为SAM的列以及以下数据SAM359NanNan2440Nan57现在我想在Nan值中分别插入12、15和43(因为9+3=12、12+3=15和40+3=43)。换句话说，通过将3添加到上一行(也可以是Nan)来填充任何Nan行。我知道这可以通过遍历for循环来完成。但是我们可以用向量化的方式来做吗？就像pandas.fillna()中ffill的一些修改版本(如果我们没有连续的NaN就可以在这里使用)。最佳答案您可以尝试这种矢量化方法:nul=df['SAM'].isnull()nul.groupb

python - Pandas 数据框的连接列表，但忽略列名

副标题:让pandas变傻，别再耍小聪明了。我有一个单列pandas数据框列表(res)，每个数据框都包含相同类型的数字数据，但每个都有不同的列名。行索引没有意义。我想将它们放入一个非常长的单列数据框中。当我执行pd.concat(res)时，每个输入文件得到一列(以及NaN单元格的加载和加载)。我已经为参数(*)尝试了各种值，但没有一个能满足我的要求。编辑:示例数据:res=[pd.DataFrame({'A':[1,2,3]}),pd.DataFrame({'B':[9,8,7,6,5,4]}),pd.DataFrame({'C':[100,200,300,400]}),]我有一个

python - 如何从 dtype 为列表的 Pandas 系列中删除 NaN？

我有一个pandas.Series，其中每一行的dtype是一个列表对象。例如>>>importnumpyasnp>>>importpandasaspd>>>x=pd.Series([[1,2,3],[2,np.nan],[3,4,5,np.nan],[np.nan]])>>>x0[1,2,3]1[2,nan]2[3,4,5,nan]3[nan]dtype:object如何删除列表中每行的nan？期望的输出是:>>>x0[1,2,3]1[2]2[3,4,5]3[]dtype:object这个有效:>>>x.apply(lambday:pd.Series(y).dropna().valu

python - 在 Python Flask 中将 Pandas 数据框作为 JSONP 响应返回

我想在Flask中将数据作为JSONP响应返回。数据来自Pandasdataframe，我可以使用以下行将其作为JSON返回:json_data=dataframe.to_json(orient='values')returnjson_data工作正常，我得到了如下所示的数据:[[1487310600000,1038,1042,1038,1038,-2.243,6.8933],[1487310900000,1042,1042,1038,1038,-1.3626,4.3058],[1487311200000,1042,1042,1038,1038,-1.4631,17.8684]]但我需

计算 Pandas 数据框中条纹的Pythonic方法

给定dfdf=pd.DataFrame([[1,5,2,8,2],[2,4,4,20,2],[3,3,1,20,2],[4,2,2,1,3],[5,1,4,-5,-4],[1,5,2,2,-20],[2,4,4,3,-8],[3,3,1,-1,-1],[4,2,2,0,12],[5,1,4,20,-2]],columns=['A','B','C','D','E'],index=[1,2,3,4,5,6,7,8,9,10])基于thisanswer，我创建了一个函数来计算条纹(向上，向下)。defstreaks(df,column):#Createsigncolumndf['sign']

python - 如何使用 Pandas 从 InfluxDB 中检索超过 10k 行？

我正在尝试使用InfluxDB的Python客户端检索存储在InfluxDB上的数据，但不能超过10k行。我(未成功)遵循的示例是here.总结:importinfluxdbdfclient=influxdb.DataFrameClient('localhost',8086,'root','root','mydb')q="select*fromsome_measurement"df=dfclient.query(q,chunked=True)#Returnsonly10kpoints该问题似乎与记录在案的InfluxDB的内部限制有关here(即max-row-limit配置选项)。我

python - 当 pandas 数据帧到临时文件 csv 时权限被拒绝

我正在尝试将pandas数据帧存储到csv格式的临时文件(在Windows中)，但遇到了以下问题:[Errno13]权限被拒绝:'C:\Users\Username\AppData\Local\Temp\tmpweymbkye'importtempfileimportpandaswithtempfile.NamedTemporaryFile()astemp:df.to_csv(temp.name)其中df是数据帧。我还尝试将临时目录更改为我确定我具有写入权限的目录:tempfile.tempdir='D:/Username/Temp/'这给了我同样的错误信息编辑:当我将循环更改为:wi

python - 如何有效地填充由列表中值的成对组合组成的不完整 pandas 数据框？

假设我有一个值列表，lst=['orange','apple','banana','grape','lemon']我还有一个形式为df的pandas数据框:SourceDestinationWeightorangeapple0.4bananaorange0.67grapelemon0.1grapebanana0.5这些行是lst中所有成对组合的子集。请注意，每个组合最多出现一次。我想要的是一个新的数据框，其中剩余的组合用值0填充。例如，new_df:SourceDestinationWeightorangeapple0.4bananaorange0.67grapelemon0.1gra

python - Pandas 在连接后对 MultiIndex 进行排序

当我一次性创建一个多索引表时，sortlevel()按预期工作。但是，如果我连接多个表来创建同一个多索引表，我就不能再使用sortlevel()了。完整示例如下:importpandasaspda=pd.DataFrame({'country':'Zimbabwe','name':'Fred'},index=[1])b=pd.DataFrame({'country':'Albania','name':'Jeff'},index=[0])not_working=pd.concat([a,b],keys=['second','first'])working=pd.DataFrame({'c

python - 如何获取 pandas 数据框对象值的模式？

我有一个pandas.DataFrame包含许多列。我只对type='object'的那些列('names')中的一个感兴趣。关于本专栏，我想回答三个问题:什么值最常出现，不包括nan值？有多少值符合该标准(答案#1中的值计数)？这些值多久出现一次？我从一个大数据框(df)开始。我感兴趣的专栏称为“名称”。首先，我使用collection.Counter获取“名称”列中每个唯一值的出现次数:In[52]:cntr=collections.Counter([rfori,rindf['names'].dropna().iteritems()])Out[52]:Counter({'Erk':