草庐IT

pandas-datareader

全部标签

python - 从 pandas.Series 中选择局部最小值和最大值

有一个scipy.signal.argrelextrema与ndarray一起使用的函数,但是当我尝试在pandas.Series上使用它时,它返回错误。将它与pandas一起使用的正确方法是什么?importnumpyasnpimportpandasaspdfromscipy.signalimportargrelextremas=pd.Series(randn(10),range(10))sargrelextrema(s,np.greater)-----------------------------------------------------------------------

python - 在 Python Pandas read_csv 中使用多字符定界符

pandasread_csv函数似乎只允许使用单个字符分隔符/分隔符。有没有什么方法允许使用像“*|*”或“%%”这样的字符串? 最佳答案 Pandas现在做supportmulticharacterdelimitersimportpandaaspdpd.read_csv(csv_file,sep="\*\|\*") 关于python-在PythonPandasread_csv中使用多字符定界符,我们在StackOverflow上找到一个类似的问题: http

python - Pandas Dataframe 比较和浮点精度

我正在比较两个应该相同的数据帧。但是由于浮点精度,我被告知这些值不匹配。我在下面创建了一个示例来模拟它。我怎样才能得到正确的结果,以便最终比较数据框对两个单元格都返回true?a=pd.DataFrame({'A':[100,97.35000000001]})b=pd.DataFrame({'A':[100,97.34999999999]})printaA0100.00197.35printbA0100.00197.35print(a==b)A0True1False 最佳答案 好的,您可以使用np.isclose为此:In[250]

python - 将 Pandas Dataframe 单元格中的嵌套数组值拆分为多行

我有一个PandasDataFrame以下形式每年(2008年-2015年)每个ID一行。对于MaxTemp、MinTemp和Rain列,每个单元格都包含一个值数组,对应于当年的某一天,即上面的框架frame3.iloc[0]['MaxTemp'][0]是2011年1月1日的值frame3.iloc[0]['MaxTemp'][364]是2011年12月31日的值。我知道这是错误的结构,但这是我必须处理的数据。它以这种方式存储在MongoDB中(其中这些行之一相当于Mongo中的文档)。我想拆分这些嵌套数组,这样我就不会每年每个ID一行,而是每天每个ID一行。但是,在拆分数组时,我还想

python - 如何使用带有 gzip 压缩选项的 pandas read_csv 读取 tar.gz 文件?

我有一个非常简单的csv,包含以下数据,压缩在tar.gz文件中。我需要使用pandas.read_csv在数据框中读取它。AB014125236importpandasaspdpd.read_csv("sample.tar.gz",compression='gzip')但是,我收到错误:CParserError:Errortokenizingdata.Cerror:Expected1fieldsinline440,saw2以下是一组read_csv命令和我遇到的不同错误:pd.read_csv("sample.tar.gz",compression='gzip',engine='py

python - 将 model.predict() 的结果与原始 pandas DataFrame 合并?

我正在尝试将predict方法的结果与pandas.DataFrame对象中的原始数据合并。fromsklearn.datasetsimportload_irisfromsklearn.cross_validationimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifierimportpandasaspdimportnumpyasnpdata=load_iris()#bearwithmeforthenextfewsteps...I'mtryingtowalkyouthrough#howmydataobjectl

python - 将 pandas.core.series.Series 转换为具有适当列值的数据框 python

我正在运行一个变量为pandas.core.series.Series类型的函数。typeoftheseriesshownbelow.product_id_y1159730count1Name:6159402,dtype:object我想把它转换成一个数据框,这样,我得到product_id_ycount11597301我试过这样做:series1=series1.to_frame()结果不对转换为dataframe之后6159402product_id_y1159730count1在重置索引后,我series1=series1.reset_index()index61594020pr

python - Python中字典和pandas系列的区别

我需要将数据保存在键值对中。我在python中搜索并找到了2种方法:默认数据结构字典。x={'key':value}value=x['key']pandas数据结构系列。x=pandas.Series({'key':value})value=x.key除了语法之外,我想知道这两者之间的区别。 最佳答案 总是先阅读文档但是既然你问了:Dictionaries是python的默认数据结构之一允许您存储key:value对并提供一些内置方法操作您的数据,您可以在文档中阅读这些数据(hereisagoodsummary以快速开始您的阅读过程

python - Pandas:.ix 的替代品

鉴于pandas0.20.0和deprecationof.ix的更新,我想知道使用剩余的.loc和.iloc获得相同结果的最有效方法是什么。我刚刚回答了thisquestion,但第二个选项(不使用.ix)似乎效率低下且冗长。片段:printdf.iloc[df.loc[df['cap'].astype(float)>35].index,:-1]当同时使用条件和索引位置过滤时,这是正确的方法吗? 最佳答案 您可以通过将特定索引与位置切片来获取所需的索引值,从而留在单个loc的世界中。df.loc[df['cap'].astype(f

python - 将 Numpy 数组按列转换为 Pandas DataFrame(作为单行)

我有一个像这样的numpy数组:a=np.array([35,2,160,56,120,80,1,1,0,0,1])然后我尝试将该数组转换为具有逻辑“一列一值”的pandas数据框,如下所示:columns=['age','gender','height','weight','ap_hi','ap_lo','cholesterol','gluc','smoke','alco','active']values=adf=pd.DataFrame(a,columns=columns)这种方法引发ValueError:传递值的形状是(1,11),索引暗示(11,11)。我做错了什么以及如何以正