panda_草庐IT

python - 恢复 Pandas 中的默认显示上下文

我曾遇到过不小心运行的情况:pd.option_context('display.max_columns',None,'display.max_rows',None,'display.width',None,'display.max_colwidth',0)没有with子句。不幸的是，这改变了我所有print语句的默认打印选项。我的问题是:如何恢复默认的context？不带参数调用pd.option_context()不起作用，我得到:ValueError:Needtoinvokeasoption_context(pat,val,[(pat,val),...)).

python - pandas plot 在 ipython notebook 中不显示为内联

我试图在ipython笔记本内联中绘制图形，但是.plot()方法只显示对象信息，如但没有图表。我也可以用plt.show()让它显示图表，但我想内联。所以我尝试了%matplotlibinline和ipythonnotebook--matplotlib=inline，但没有帮助。如果我使用%matplotlibinline，则.plot()显示/Users//Library/Enthought/Canopy_64bit/User/lib/python2.7/site-packages/IPython/core/formatters.py:239:FormatterWarning:Ex

python - DF、 Pandas 的标准偏差

例如我有一个pandasDataFrame，它看起来是这样的:abc123456789我想计算此DF中所有值的标准差。df.std()函数让我返回值pro列。当然我可以创建下一个代码:sd=[]sd.append(list(df['a']))sd.append(list(df['b']))sd.append(list(df['c']))numpy.std(sd)是否可以简化此代码并为此DF使用一些pandas函数？最佳答案 df.values返回一个NumPy数组，其中包含df中的值。然后，您可以将np.std应用于该数组:In[

python - 如何在使用 Pandas 从 CSV 中读取整数时优雅地回退到 `NaN` 值？

在Pandas中使用read_csv时，如果我想将给定的列转换为类型，格式错误的值将中断整个操作，而不会指示有问题的值。例如，运行如下内容:importpandasaspdimportnumpyasnpdf=pd.read_csv('my.csv',dtype={'my_column':np.int64})将导致以错误结尾的堆栈跟踪:ValueError:cannotsafelyconvertpasseduserdtypeof如果我在错误消息中有行号或违规值，我可以将其添加到已知NaN值列表中，但这样我就无能为力了。有没有办法告诉解析器忽略失败并在这种情况下返回np.nan？PostS

Python pandas 汇总表图

真的无法掌握如何绘制pandasdf的汇总表。我确定这不是数据透视表的情况，也不是显示数据的转置方法。我能找到的最好的是:PlottableanddisplayPandasDataframe我的代码尝试只是没有到达那里:dc=pd.DataFrame({'A':[1,2,3,4],'B':[4,3,2,1],'C':[4,3,2,1]})data=dc['A'],dc['B'],dc['C']ax=plt.subplot(111,frame_on=False)ax.xaxis.set_visible(False)ax.yaxis.set_visible(False)cols=["A",

python - numpy 和 pandas timedelta 错误

在Python中，我有一个使用pandas生成(或从CSV文件中读取)的日期数组，我想为每个日期添加一年。我可以使用pandas但不能使用numpy来让它工作。我究竟做错了什么？还是pandas或numpy中的错误？谢谢!importnumpyasnpimportpandasaspdfrompandas.tseries.offsetsimportDateOffset#Generaterangeofdatesusingpandas.dates=pd.date_range('1980-01-01','2015-01-01')#Addoneyearusingpandas.dates2=dat

python - Pandas 将 NaN 强制到每个索引处每列的底部

我有一个DataFrame，其中多行跨越每个索引。以第一个索引为例，有这样一个结构:df=pd.DataFrame([["A","first",1.0,1.0,np.NaN],[np.NaN,np.NaN,2.0,np.NaN,2.0],[np.NaN,np.NaN,np.NaN,3.0,3.0]],columns=["ID","Name","val1","val2","val3"],index=[0,0,0])Out[4]:IDNameval1val2val30Afirst11NaN0NaNNaN2NaN20NaNNaNNaN33我想对每一列进行排序/排序，使NaN位于给定索引处每一

python - 使用 applymap 替换 Pandas Dataframe 中的空值

我有一个“年龄”列，但有时会显示NaN值。我知道我可以为此目的使用“fillna”，但我尝试定义自己的函数(并学习这样做)并将applymap用于数据框到目前为止没有成功。Age6949NaN54NaN我试过了defget_rid_of_nulls(value):ifvalue==np.nan:return'IsNullvalue'else:returnvalue这个也行不通ifvalue==Noneifvalueisnullifvalue==np.naifvalue==''ifvalue==NaNifvalue=='NaN'所有的比较似乎都不起作用。我肯定错了，但我被卡住了，我非常固

python - Pandas - 从分类列创建 bool 列

我在Pandas数据框中有Place列，如下所示:**Place**BerlinPragueMexicoPragueMexico...我想做以下事情:is_Berlinis_Pragueis_Mexico100010001010001我知道我可以单独创建列:df['is_Berlin']=df['Place']df['is_Prague']=df['Place']df['is_Mexico']=df['Place']然后为每一列创建一个字典并应用一个映射函数。#Examplejustforis_Berlincolumnd={'Berlin':1,'Prague':0,'Mexico':

python - 错误 : The truth value of a Series is ambiguous - Python pandas

我知道以前有人问过这个问题，但是，当我尝试执行if语句时出现错误。我看了这个link，但对我来说没有多大帮助。我的dfs是一个数据帧列表。我正在尝试以下操作，foriindfs:if(i['var1']出现以下错误:ValueError:ThetruthvalueofaSeriesisambiguous.Usea.empty,a.bool(),a.item(),a.any()ora.all().AND我尝试了以下操作并遇到了同样的错误。fori,jinenumerate(dfs):if(j['var1']我的var1数据类型是float32。我没有使用任何其他logical运算符和&或