pandas

python - 为什么我不能重命名列？

我有以下df:TAN.SKSHA.LOA 0.050.01S 0.040.44D 0.08 -0.18我希望新的df是这样的:TANSHAA 0.050.01S 0.040.44D 0.08 -0.18基本上从列名中删除.SK和.LO这是我试过的:df.rename(columns=lambdax:x.split('.')[0])df.columns=df.split('.')[0]第二种情况在df.index的情况下完美运行最佳答案

命名 python code section pre pandas

python - 将多索引转换为逐行多维 NumPy 数组。

假设我有一个类似于MultiIndexdocs中的示例的MultiIndexDataFrame.>>>df0123firstsecondbarone0123two4567bazone891011two12131415fooone16171819two20212223quxone24252627two28293031我想从这个具有3维结构的DataFrame生成一个NumPy数组，例如>>>desired_arrarray([[[0,4],[1,5],[2,6],[3,7]],[[8,12],[9,13],[10,14],[11,15]],[[16,20],[17,21],[18,22]

多维多索 code section pre python pandas numpy dataframe

python - Kaggle 类型错误 : slice indices must be integers or None or have an index method

我正在尝试在Kaggle上绘制seaborn直方图笔记本这样:sns.distplot(myseries,bins=50,kde=True)但是我得到这个错误:TypeError:sliceindicesmustbeintegersorNoneorhavean__index__method这是Kaggle笔记本:https://www.kaggle.com/asindico/slice-indices-must-be-integers-or-none/这是系列头:058500001600000025700000313100000416331452Name:price_doc,dtype

integers indices code statsmodels noreferrer python pandas jupyter seaborn kaggle

python - 从节点列表中提取边和社区

我有一个包含超过50k个节点的数据集，我正在尝试从中提取可能的边和社区。我确实尝试使用一些图形工具，如gephi、cytoscape、socnet、nodexl等来可视化和识别边缘和社区，但节点列表对于这些工具来说太大了。因此，我正在尝试编写脚本来确定边缘和社区。其他列是带有GPS位置的连接开始日期时间和结束日期时间。输入:Id,开始时间,结束时间,gps1,gps20022d9064bc,1073260801,1073260803,819251,44000600022d9064bc,1073260803,1073260810,819213,43995400904b4557d3,107

边和 python code 34 2004 pandas nodes networkx edge-list

python - 如何有效地填充由列表中值的成对组合组成的不完整 pandas 数据框？

假设我有一个值列表，lst=['orange','apple','banana','grape','lemon']我还有一个形式为df的pandas数据框:SourceDestinationWeightorangeapple0.4bananaorange0.67grapelemon0.1grapebanana0.5这些行是lst中所有成对组合的子集。请注意，每个组合最多出现一次。我想要的是一个新的数据框，其中剩余的组合用值0填充。例如，new_df:SourceDestinationWeightorangeapple0.4bananaorange0.67grapelemon0.1gra

中值 python orange code banana pandas numpy

python - 属性错误 : 'Series' object has no attribute 'rolling'

Traceback(mostrecentcalllast):File"mov_avg.py",line9,indata_frame['100ma']=data_frame['AdjClose'].rolling(window=100,min_periods=0).mean()File"/usr/lib/python3/dist-packages/pandas/core/generic.py",line2360,in__getattr__(type(self).__name__,name))AttributeError:'Series'objecthasnoattribute'rolli

amp 39 section rolling python pandas

python - Pandas 在连接后对 MultiIndex 进行排序

当我一次性创建一个多索引表时，sortlevel()按预期工作。但是，如果我连接多个表来创建同一个多索引表，我就不能再使用sortlevel()了。完整示例如下:importpandasaspda=pd.DataFrame({'country':'Zimbabwe','name':'Fred'},index=[1])b=pd.DataFrame({'country':'Albania','name':'Jeff'},index=[0])not_working=pd.concat([a,b],keys=['second','first'])working=pd.DataFrame({'c

MultiIndex python 39 working code pandas

python - Numpy dtype - 不理解的数据类型

我有一个数据框，我正在查看与每一列关联的数据类型。当我运行时:In[23]:df.dtype.descrOut[24]:[(u'date','我想将货币数据类型设置为S7。我正在做:In[25]:dtype_new[-1]=(u'currency',"|S7")In[26]:printdtype_newOut[27]:[(u'date','它看起来是正确的格式。所以我试着把它放回我的df:In[28]:df=df.astype(np.dtype(dtype_new))我得到了错误:TypeError('datatypenotunderstood',)我应该改变什么？谢谢你。在我最近更新

python Numpy 39 code dtype pandas

python - 带有颜色图的散点图使 X 轴消失

我想散点图以下pandas.DataFrame的前两列，第三列作为颜色值。>>>df=pd.DataFrame({'a':{'1128':-2,'1129':0,'1146':-4,'1142':-3,'1154':-2,'1130':-1,'1125':-1,'1126':-2,'1127':-5,'1135':-2},'c':{'1128':5300,'1129':6500,'1146':8900,'1142':8900,'1154':9000,'1130':5600,'1125':9400,'1126':6000,'1127':7200,'1135':7700},'b':{'11

python 带有 39 code section pandas matplotlib

python - 如何获取 pandas 数据框对象值的模式？

我有一个pandas.DataFrame包含许多列。我只对type='object'的那些列('names')中的一个感兴趣。关于本专栏，我想回答三个问题:什么值最常出现，不包括nan值？有多少值符合该标准(答案#1中的值计数)？这些值多久出现一次？我从一个大数据框(df)开始。我感兴趣的专栏称为“名称”。首先，我使用collection.Counter获取“名称”列中每个唯一值的出现次数:In[52]:cntr=collections.Counter([rfori,rindf['names'].dropna().iteritems()])Out[52]:Counter({'Erk':

python pandas 39 code section python-3.x dataframe counter

34 35 363738 39 40