草庐IT

Pandas-Datareader

全部标签

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 如何使用 Pandas 从 Excel 中读取某些列 - Python

我正在阅读Excel工作表,并且我想阅读某些列:第0列,因为它是行索引,第22:37列。现在这就是我要做的:importpandasaspdimportnumpyasnpfile_loc="path.xlsx"df=pd.read_excel(file_loc,index_col=None,na_values=['NA'],parse_cols=37)df=pd.concat([df[df.columns[0]],df[df.columns[22:]]],axis=1)但我希望有更好的方法来做到这一点!我知道如果我这样做parse_cols=[0,22,..,37]我可以做到,但对于大

python - 如何使用 Pandas 从 Excel 中读取某些列 - Python

我正在阅读Excel工作表,并且我想阅读某些列:第0列,因为它是行索引,第22:37列。现在这就是我要做的:importpandasaspdimportnumpyasnpfile_loc="path.xlsx"df=pd.read_excel(file_loc,index_col=None,na_values=['NA'],parse_cols=37)df=pd.concat([df[df.columns[0]],df[df.columns[22:]]],axis=1)但我希望有更好的方法来做到这一点!我知道如果我这样做parse_cols=[0,22,..,37]我可以做到,但对于大

python - 使用 PYODBC 从 pandas 获取数据到 SQL 服务器

我试图了解python如何将数据从FTP服务器提取到pandas中,然后将其移动到SQL服务器中。我的代码至少可以说是非常简陋的,我正在寻找任何建议或帮助。我曾尝试先从FTP服务器加载数据,但效果很好。...服务器似乎引起了问题。importpyodbcimportpandasfromftplibimportFTPfromStringIOimportStringIOimportcsvftp=FTP('ftp.xyz.com','user','pass')ftp.set_pasv(True)r=StringIO()ftp.retrbinary('filname.csv',r.write)

python - 使用 PYODBC 从 pandas 获取数据到 SQL 服务器

我试图了解python如何将数据从FTP服务器提取到pandas中,然后将其移动到SQL服务器中。我的代码至少可以说是非常简陋的,我正在寻找任何建议或帮助。我曾尝试先从FTP服务器加载数据,但效果很好。...服务器似乎引起了问题。importpyodbcimportpandasfromftplibimportFTPfromStringIOimportStringIOimportcsvftp=FTP('ftp.xyz.com','user','pass')ftp.set_pasv(True)r=StringIO()ftp.retrbinary('filname.csv',r.write)

python - Pandas 离开并更新现有列

我是pandas的新手,似乎无法使用合并功能:>>>left>>>rightabcacd0149017131251012814236112391534712使用a列的左连接,我想通过连接键更新公共(public)列。注意c列中的最后一个值来自LEFT表,因为没有匹配项。>>>finalabcd01471312581423691534712NAN我应该如何使用Pandas合并功能来做到这一点?谢谢。 最佳答案 您可以在left和right之间使用merge()和how='left'在>'a'列。In[74]:final=left.me

python - Pandas 离开并更新现有列

我是pandas的新手,似乎无法使用合并功能:>>>left>>>rightabcacd0149017131251012814236112391534712使用a列的左连接,我想通过连接键更新公共(public)列。注意c列中的最后一个值来自LEFT表,因为没有匹配项。>>>finalabcd01471312581423691534712NAN我应该如何使用Pandas合并功能来做到这一点?谢谢。 最佳答案 您可以在left和right之间使用merge()和how='left'在>'a'列。In[74]:final=left.me

python - 用 $ 将货币转换为 Python pandas 中的数字

我在Pandas数据框中有以下数据:state1st2nd3rd0California$11,593,820$109,264,246$8,496,2731NewYork$10,861,680$45,336,041$6,317,3002Florida$7,942,848$69,369,589$4,697,2443Texas$7,536,817$61,830,712$5,736,941我想用三列(1st、2nd、3rd)执行一些简单的分析(例如sum、groupby),但是这三列的数据类型是对象(或字符串)。所以我使用以下代码进行数据转换:data=data.convert_objects

python - 用 $ 将货币转换为 Python pandas 中的数字

我在Pandas数据框中有以下数据:state1st2nd3rd0California$11,593,820$109,264,246$8,496,2731NewYork$10,861,680$45,336,041$6,317,3002Florida$7,942,848$69,369,589$4,697,2443Texas$7,536,817$61,830,712$5,736,941我想用三列(1st、2nd、3rd)执行一些简单的分析(例如sum、groupby),但是这三列的数据类型是对象(或字符串)。所以我使用以下代码进行数据转换:data=data.convert_objects