草庐IT

python - 使用 PYODBC 从 pandas 获取数据到 SQL 服务器

我试图了解python如何将数据从FTP服务器提取到pandas中,然后将其移动到SQL服务器中。我的代码至少可以说是非常简陋的,我正在寻找任何建议或帮助。我曾尝试先从FTP服务器加载数据,但效果很好。...服务器似乎引起了问题。importpyodbcimportpandasfromftplibimportFTPfromStringIOimportStringIOimportcsvftp=FTP('ftp.xyz.com','user','pass')ftp.set_pasv(True)r=StringIO()ftp.retrbinary('filname.csv',r.write)

python - 使用 PYODBC 从 pandas 获取数据到 SQL 服务器

我试图了解python如何将数据从FTP服务器提取到pandas中,然后将其移动到SQL服务器中。我的代码至少可以说是非常简陋的,我正在寻找任何建议或帮助。我曾尝试先从FTP服务器加载数据,但效果很好。...服务器似乎引起了问题。importpyodbcimportpandasfromftplibimportFTPfromStringIOimportStringIOimportcsvftp=FTP('ftp.xyz.com','user','pass')ftp.set_pasv(True)r=StringIO()ftp.retrbinary('filname.csv',r.write)

python - Pandas 离开并更新现有列

我是pandas的新手,似乎无法使用合并功能:>>>left>>>rightabcacd0149017131251012814236112391534712使用a列的左连接,我想通过连接键更新公共(public)列。注意c列中的最后一个值来自LEFT表,因为没有匹配项。>>>finalabcd01471312581423691534712NAN我应该如何使用Pandas合并功能来做到这一点?谢谢。 最佳答案 您可以在left和right之间使用merge()和how='left'在>'a'列。In[74]:final=left.me

python - Pandas 离开并更新现有列

我是pandas的新手,似乎无法使用合并功能:>>>left>>>rightabcacd0149017131251012814236112391534712使用a列的左连接,我想通过连接键更新公共(public)列。注意c列中的最后一个值来自LEFT表,因为没有匹配项。>>>finalabcd01471312581423691534712NAN我应该如何使用Pandas合并功能来做到这一点?谢谢。 最佳答案 您可以在left和right之间使用merge()和how='left'在>'a'列。In[74]:final=left.me

python - 用 $ 将货币转换为 Python pandas 中的数字

我在Pandas数据框中有以下数据:state1st2nd3rd0California$11,593,820$109,264,246$8,496,2731NewYork$10,861,680$45,336,041$6,317,3002Florida$7,942,848$69,369,589$4,697,2443Texas$7,536,817$61,830,712$5,736,941我想用三列(1st、2nd、3rd)执行一些简单的分析(例如sum、groupby),但是这三列的数据类型是对象(或字符串)。所以我使用以下代码进行数据转换:data=data.convert_objects

python - 用 $ 将货币转换为 Python pandas 中的数字

我在Pandas数据框中有以下数据:state1st2nd3rd0California$11,593,820$109,264,246$8,496,2731NewYork$10,861,680$45,336,041$6,317,3002Florida$7,942,848$69,369,589$4,697,2443Texas$7,536,817$61,830,712$5,736,941我想用三列(1st、2nd、3rd)执行一些简单的分析(例如sum、groupby),但是这三列的数据类型是对象(或字符串)。所以我使用以下代码进行数据转换:data=data.convert_objects

python - 分组并找到前 n 个 value_counts Pandas

我有一个出租车数据数据框,其中有两列如下所示:NeighborhoodBoroughTimeMidtownManhattanXMelroseBronxYGrantCityStatenIslandZMidtownManhattanALincolnSquareManhattanB基本上,每一行代表该行政区该街区的出租车接送服务。现在,我想找出每个行政区中上客次数最多的前5个社区。我试过这个:df['Neighborhood'].groupby(df['Borough']).value_counts()这给了我这样的东西:boroughBronxHighBridge3424MottHaven

python - 分组并找到前 n 个 value_counts Pandas

我有一个出租车数据数据框,其中有两列如下所示:NeighborhoodBoroughTimeMidtownManhattanXMelroseBronxYGrantCityStatenIslandZMidtownManhattanALincolnSquareManhattanB基本上,每一行代表该行政区该街区的出租车接送服务。现在,我想找出每个行政区中上客次数最多的前5个社区。我试过这个:df['Neighborhood'].groupby(df['Borough']).value_counts()这给了我这样的东西:boroughBronxHighBridge3424MottHaven

Python pandas to_excel 'utf8' 编解码器无法解码字节

我正在尝试在Pythonpandas中进行一些数据工作,但在写出我的结果时遇到了麻烦。我将我的数据作为CSV文件读取,并将每个脚本导出为它自己的CSV文件,它工作正常。最近虽然我尝试用工作表导出1个Excel文件中的所有内容,但其中一些工作表给了我一个错误“'utf8'编解码器无法解码位置1的字节0xe9:无效的继续字节”我什至不知道如何开始查找可能导致导出到Excel出现问题的任何字符。不知道为什么它可以很好地导出到CSV:(相关行frompandasimportExcelWriterdata=pd.read_csv(input)writer=ExcelWriter(output)#

Python pandas to_excel 'utf8' 编解码器无法解码字节

我正在尝试在Pythonpandas中进行一些数据工作,但在写出我的结果时遇到了麻烦。我将我的数据作为CSV文件读取,并将每个脚本导出为它自己的CSV文件,它工作正常。最近虽然我尝试用工作表导出1个Excel文件中的所有内容,但其中一些工作表给了我一个错误“'utf8'编解码器无法解码位置1的字节0xe9:无效的继续字节”我什至不知道如何开始查找可能导致导出到Excel出现问题的任何字符。不知道为什么它可以很好地导出到CSV:(相关行frompandasimportExcelWriterdata=pd.read_csv(input)writer=ExcelWriter(output)#