dataframe

python - 在 Pandas 数据框中找到条纹

我有一个Pandas数据框如下:timewinnerloserstat1AB02CB03DB14EB05FA06GA07HA08IA1每一行是一个匹配结果。第一列是比赛时间，第二列和第三列包含赢家/输家，第四列是比赛的一个统计数据。我想检测每个失败者的此统计数据的零条纹。预期的结果应该是这样的:timewinnerloserstatstreak1AB012CB023DB104EB015FA016GA027HA038IA10在伪代码中，算法应该像这样工作:.groupby失败者列。然后遍历每个失败者组的每一行在每一行中，查看stat列:如果它包含0，则将上一行的streak值增加0。如果

python - 使用 pandas 数据帧中的前向和后向填充填充缺失值(ffill 和 bfill)

Pandas数据框初学者。我在下面设置了此数据集，其中A列和B列(Test.csv)缺少值:DateTimeAB01-01-201703:2701-01-201703:2801-01-201703:290.18127718-0.17883573701-01-201703:300.186923018-0.18326085301-01-201703:3101-01-201703:3201-01-201703:330.18127718-0.178835737我可以使用此代码通过前向传播来填充值，但这只会填充03:31和03:32，而不是03:27和03:28。importpandasaspd

缺失 python 2017 01 code pandas dataframe

python - 在 pandas DataFrame 中快速应用字符串操作

假设我有一个DataFrame，它有10万行和一列name。我想尽可能有效地将这个名字分成名字和姓氏。我目前的方法是，defsplitName(name):returnpandas.Series(name.split()[0:2])df[['first','last']]=df.apply(lambdax:splitName(x['name']),axis=1)不幸的是，DataFrame.apply真的非常慢。我能做些什么来使这个字符串操作几乎和numpy操作一样快吗？谢谢! 最佳答案尝试(需要pandas>=0.8.1):sp

DataFrame python code section 39 pandas

python - 如何获取 pandas.Series 或 pandas.DataFrame 中第 i 个项目的索引？

我正在尝试获取我拥有的Series中第6项的索引。这是头部的样子:UnitedStates1.536434e+13China6.348609e+12Japan5.542208e+12Germany3.493025e+12France2.681725e+12为了获取第6个索引名称(排序后的第6个国家/地区)，我通常使用s.head(6)并从那里获取第6个索引。s.head(6)给我:UnitedStates1.536434e+13China6.348609e+12Japan5.542208e+12Germany3.493025e+12France2.681725e+12UnitedKin

pandas DataFrame code section pre python series

python - 如何从一个 pandas 数据帧中减去另一个数据帧的行？

我想做的操作类似于合并。例如，通过inner合并，我们得到一个数据框，其中包含存在于第一个和第二个数据框中的行。通过outer合并，我们得到一个数据帧，它要么出现在第一个数据帧中，要么出现在第二个数据帧中。我需要的是一个数据框，其中包含存在于第一个数据框中但不存在于第二个数据框中的行？有没有一种快速而优雅的方法来做到这一点？最佳答案考虑以下:df_one是第一个DataFramedf_two是第二个DataFrame出现在第一个DataFrame中，不出现在第二个DataFrame中解决方案:通过索引df=df_one[~df_

python pandas strong section DataFrame merge

python - 将 Pandas DataFrame 中的列值与 "NaN"值连接起来

我正在尝试将PandasDataFrame列与NaN值连接起来。In[96]:df=pd.DataFrame({'col1':["1","1","2","2","3","3"],'col2':["p1","p2","p1",np.nan,"p2",np.nan],'col3':["A","B","C","D","E","F"]})In[97]:dfOut[97]:col1col2col301p1A11p2B22p1C32NaND43p2E53NaNFIn[98]:df['concatenated']=df['col2']+','+df['col3']In[99]:dfOut[99]:c

DataFrame amp 39 34 col python pandas concatenation

python - 从 Pandas 数据框中删除闰年

我知道了。数据框:datetime2012-01-01125.50102012-01-02125.50102012-01-03125.50102012-02-04125.50102012-02-05125.50102012-02-29125.50102012-02-28125.50102016-01-07125.50102016-01-08125.50102016-02-2981.6237我想删除与2月29日对应的所有行，导致foll。数据框:datetime2012-01-01125.50102012-01-02125.50102012-01-03125.50102012-02-04

python Pandas 125.5010 5010 2012 dataframe datetime

python - 如何获取 Pandas 数据框中单元格值的长度？

有一个pandas数据框:idxEvent0abc/def1abc2abc/def/hij运行:df['EventItem']=df['Event'].str.split("/")得到:idxEventItem0['abc','def']1['abc']2['abc','def','hij']想要获取每个cell的长度，运行df['EventCount']=len(df['EventItem'])得到:idxEventCount061626如何获得正确的计数？idxEventCount021123 最佳答案您可以使用.str.le

格值 python code 39 pre pandas dataframe

python - pandas DataFrame 中的级别是什么？

我一直在阅读文档，许多解释和示例都将levels视为理所当然。恕我直言，文档缺乏对数据结构和定义的基本解释。数据框中的级别是什么？MultiIndex索引中的级别是什么？最佳答案我在分析myownquestion的答案时偶然发现了这个问题，但我觉得约翰的回答不够令人满意。经过几次实验后，我认为我理解了这些级别并决定分享:简答:级别是索引或列的一部分。长答案:我认为这个多列DataFrame.groupby示例很好地说明了索引级别。假设我们有时间记录问题报告数据:report=pd.DataFrame([[1,10,'John']

DataFrame 级别 code strong python pandas multi-index

python - pandas - 具有非数值的 pivot_table？ (数据错误 : No numeric types to aggregate)

我正在尝试对包含字符串作为结果的表进行数据透视。importpandasaspddf1=pd.DataFrame({'index':range(8),'variable1':["A","A","B","B","A","B","B","A"],'variable2':["a","b","a","b","a","b","a","b"],'variable3':["x","x","x","y","y","y","x","y"],'result':["on","off","off","on","on","off","off","on"]})df1.pivot_table(values='res

pivot_table aggregate 34 NaN variable python pandas pivot-table dataframe

47 48 495051 52 53