pandas-datareader

python - Pandas : Delete rows based on other rows

我有一个看起来像这样的Pandas数据框:qseqidsseqidqstartqend21125345411503203215045062253008250500我想根据具有这些条件的其他行值删除行:如果另一行(r2)存在相同的sseqid，则必须删除行(r1)和r1[qstart]>r2[qstart]和r1[qend].这对Pandas来说可能吗？最佳答案 df=pd.DataFrame({'qend':[345,320,450,300,500],'qseqid':[2,4,3,6,8],'qstart':[125,150,1

rows python code 39 merged pandas dataframe

python - pandas 如何使用 groupby 在标签中按日期对列进行分组？

我有一个数据框10730行×249列，我有列:Index(['RegionID','Metro','CountyName','SizeRank','1996-04','1996-05','1996-06','1996-07','1996-08','1996-09',...'2015-11','2015-12','2016-01','2016-02','2016-03','2016-04','2016-05','2016-06','2016-07','2016-08'],dtype='object',length=249)所以我需要做的是按季度对列进行分组，从1月到3月Q1，依此类推，直

groupby python 2016 39 code python-3.x pandas dataframe group-by

python - 使用 Pandas 读取数据(.dat 文件)

如何使用Pandas读取以下(两列)数据(来自.dat文件)TIMEXGSM2004006010001376001200400601000232800520040060100032800082004006010004232001120040060100051840017列分隔符(至少)是2个空格。我试过了df=pd.read_table("test.dat",sep="\s+",usecols=['TIME','XGSM'])printdf但是它会打印TIMEXGSM2004620046200462004620046 最佳答案您可

python Pandas 2004 006 code dataframe

python - 通过将 x 添加到前一行 pandas 来填充 na 值

我有一个数据框，其中包含名为SAM的列以及以下数据SAM359NanNan2440Nan57现在我想在Nan值中分别插入12、15和43(因为9+3=12、12+3=15和40+3=43)。换句话说，通过将3添加到上一行(也可以是Nan)来填充任何Nan行。我知道这可以通过遍历for循环来完成。但是我们可以用向量化的方式来做吗？就像pandas.fillna()中ffill的一些修改版本(如果我们没有连续的NaN就可以在这里使用)。最佳答案您可以尝试这种矢量化方法:nul=df['SAM'].isnull()nul.groupb

python pandas code section SAM dataframe

python - Pandas 数据框的连接列表，但忽略列名

副标题:让pandas变傻，别再耍小聪明了。我有一个单列pandas数据框列表(res)，每个数据框都包含相同类型的数字数据，但每个都有不同的列名。行索引没有意义。我想将它们放入一个非常长的单列数据框中。当我执行pd.concat(res)时，每个输入文件得到一列(以及NaN单元格的加载和加载)。我已经为参数(*)尝试了各种值，但没有一个能满足我的要求。编辑:示例数据:res=[pd.DataFrame({'A':[1,2,3]}),pd.DataFrame({'B':[9,8,7,6,5,4]}),pd.DataFrame({'C':[100,200,300,400]}),]我有一个

列名 python code pre DataFrame pandas rbind

python - 如何从 dtype 为列表的 Pandas 系列中删除 NaN？

我有一个pandas.Series，其中每一行的dtype是一个列表对象。例如>>>importnumpyasnp>>>importpandasaspd>>>x=pd.Series([[1,2,3],[2,np.nan],[3,4,5,np.nan],[np.nan]])>>>x0[1,2,3]1[2,nan]2[3,4,5,nan]3[nan]dtype:object如何删除列表中每行的nan？期望的输出是:>>>x0[1,2,3]1[2]2[3,4,5]3[]dtype:object这个有效:>>>x.apply(lambday:pd.Series(y).dropna().valu

python Pandas code section dtype list numpy nan

python - 在 Python Flask 中将 Pandas 数据框作为 JSONP 响应返回

我想在Flask中将数据作为JSONP响应返回。数据来自Pandasdataframe，我可以使用以下行将其作为JSON返回:json_data=dataframe.to_json(orient='values')returnjson_data工作正常，我得到了如下所示的数据:[[1487310600000,1038,1042,1038,1038,-2.243,6.8933],[1487310900000,1042,1042,1038,1038,-1.3626,4.3058],[1487311200000,1042,1042,1038,1038,-1.4631,17.8684]]但我需

python code 1038 section json pandas flask jsonp

计算 Pandas 数据框中条纹的Pythonic方法

给定dfdf=pd.DataFrame([[1,5,2,8,2],[2,4,4,20,2],[3,3,1,20,2],[4,2,2,1,3],[5,1,4,-5,-4],[1,5,2,2,-20],[2,4,4,3,-8],[3,3,1,-1,-1],[4,2,2,0,12],[5,1,4,20,-2]],columns=['A','B','C','D','E'],index=[1,2,3,4,5,6,7,8,9,10])基于thisanswer，我创建了一个函数来计算条纹(向上，向下)。defstreaks(df,column):#Createsigncolumndf['sign']

中条 Pythonic 39 cumsum code python python-3.x pandas numpy dataframe

python - 如何使用 Pandas 从 InfluxDB 中检索超过 10k 行？

我正在尝试使用InfluxDB的Python客户端检索存储在InfluxDB上的数据，但不能超过10k行。我(未成功)遵循的示例是here.总结:importinfluxdbdfclient=influxdb.DataFrameClient('localhost',8086,'root','root','mydb')q="select*fromsome_measurement"df=dfclient.query(q,chunked=True)#Returnsonly10kpoints该问题似乎与记录在案的InfluxDB的内部限制有关here(即max-row-limit配置选项)。我

InfluxDB python code section pandas influxdb-python

python - 当 pandas 数据帧到临时文件 csv 时权限被拒绝

我正在尝试将pandas数据帧存储到csv格式的临时文件(在Windows中)，但遇到了以下问题:[Errno13]权限被拒绝:'C:\Users\Username\AppData\Local\Temp\tmpweymbkye'importtempfileimportpandaswithtempfile.NamedTemporaryFile()astemp:df.to_csv(temp.name)其中df是数据帧。我还尝试将临时目录更改为我确定我具有写入权限的目录:tempfile.tempdir='D:/Username/Temp/'这给了我同样的错误信息编辑:当我将循环更改为:wi

python pandas section code csv temporary-files

31 32 333435 36 37