草庐IT

python - 在 Pandas 中生成给定范围内的随机日期

这是一个self回答的帖子。一个常见的问题是在给定的开始日期和结束日期之间随机生成日期。有两种情况需要考虑:带有时间分量的随机日期,以及没有时间的随机日期例如,给定一些开始日期2015-01-01和结束日期2018-01-01,我如何使用Pandas? 最佳答案 是否可以转换为unix时间戳?defrandom_dates(start,end,n=10):start_u=start.value//10**9end_u=end.value//10**9returnpd.to_datetime(np.random.randint(sta

python - 获取 pandas DataFrame 的名称

如何获取DataFrame的名称并将其打印为字符串?例子:boston(分配给csv文件的变量名称)importpandasaspdboston=pd.read_csv('boston.csv')print('ThewinneristeamAbasedonthe%stable.)%boston 最佳答案 您可以使用以下名称命名数据框,然后在任何您喜欢的地方调用名称:importpandasaspddf=pd.DataFrame(data=np.ones([4,4]))df.name='Ones'printdf.name>>>Ones

python - 获取 pandas DataFrame 的名称

如何获取DataFrame的名称并将其打印为字符串?例子:boston(分配给csv文件的变量名称)importpandasaspdboston=pd.read_csv('boston.csv')print('ThewinneristeamAbasedonthe%stable.)%boston 最佳答案 您可以使用以下名称命名数据框,然后在任何您喜欢的地方调用名称:importpandasaspddf=pd.DataFrame(data=np.ones([4,4]))df.name='Ones'printdf.name>>>Ones

Python pandas - 在 groupby 之后过滤行

例如,我有下表:index,A,B0,0,01,0,82,0,83,1,54,1,3按A分组后:0:index,A,B0,0,01,0,82,0,81:index,A,B3,1,54,1,3我需要的是从每个组中删除行,其中列B中的数字小于组列B中所有行的最大值。好吧,我在将这个问题翻译成英文时遇到了问题,所以这里是示例:0组中B列中行的最大值:8所以我想删除索引0的行并保留索引1和2的行1组中B列中行的最大值:5所以我想删除索引4的行并保留索引3的行我曾尝试使用pandas过滤功能,但问题是它一次对组中的所有行进行操作:data=grouped=data.groupby("A")fil

Python pandas - 在 groupby 之后过滤行

例如,我有下表:index,A,B0,0,01,0,82,0,83,1,54,1,3按A分组后:0:index,A,B0,0,01,0,82,0,81:index,A,B3,1,54,1,3我需要的是从每个组中删除行,其中列B中的数字小于组列B中所有行的最大值。好吧,我在将这个问题翻译成英文时遇到了问题,所以这里是示例:0组中B列中行的最大值:8所以我想删除索引0的行并保留索引1和2的行1组中B列中行的最大值:5所以我想删除索引4的行并保留索引3的行我曾尝试使用pandas过滤功能,但问题是它一次对组中的所有行进行操作:data=grouped=data.groupby("A")fil

python - 从具有复合(分层)索引的 Pandas 数据框中选择行

我怀疑这是微不足道的,但我还没有发现可以让我根据分层键的值从Pandas数据框中选择行的咒语。因此,例如,假设我们有以下数据框:importpandasdf=pandas.DataFrame({'group1':['a','a','a','b','b','b'],'group2':['c','c','d','d','d','e'],'value1':[1.1,2,3,4,5,6],'value2':[7.1,8,9,10,11,12]})df=df.set_index(['group1','group2'])df看起来和我们预期的一样:如果df没有在group1上被索引,我可以执行以下

python - 从具有复合(分层)索引的 Pandas 数据框中选择行

我怀疑这是微不足道的,但我还没有发现可以让我根据分层键的值从Pandas数据框中选择行的咒语。因此,例如,假设我们有以下数据框:importpandasdf=pandas.DataFrame({'group1':['a','a','a','b','b','b'],'group2':['c','c','d','d','d','e'],'value1':[1.1,2,3,4,5,6],'value2':[7.1,8,9,10,11,12]})df=df.set_index(['group1','group2'])df看起来和我们预期的一样:如果df没有在group1上被索引,我可以执行以下

python - 使用 SQLAlchemy 批量插入 Pandas 数据帧

我有一些相当大的pandasDataFrame,我想使用新的批量SQL映射通过SQLAlchemy将它们上传到MicrosoftSQLServer。pandas.to_sql方法虽然不错,但速度很慢。我在编写代码时遇到问题...我希望能够将此函数传递给我正在调用table的pandasDataFrame、我正在调用schema的模式名称和一个表我正在调用name的名称。理想情况下,该函数将1.)如果表已存在,则删除该表。2.)创建一个新表3.)创建一个映射器和4.)使用映射器和pandas数据进行批量插入。我被困在第3部分。这是我的(诚然粗略)代码。我正在为如何让映射器功能与我的主键一

python - 使用 SQLAlchemy 批量插入 Pandas 数据帧

我有一些相当大的pandasDataFrame,我想使用新的批量SQL映射通过SQLAlchemy将它们上传到MicrosoftSQLServer。pandas.to_sql方法虽然不错,但速度很慢。我在编写代码时遇到问题...我希望能够将此函数传递给我正在调用table的pandasDataFrame、我正在调用schema的模式名称和一个表我正在调用name的名称。理想情况下,该函数将1.)如果表已存在,则删除该表。2.)创建一个新表3.)创建一个映射器和4.)使用映射器和pandas数据进行批量插入。我被困在第3部分。这是我的(诚然粗略)代码。我正在为如何让映射器功能与我的主键一

python - Pandas Dataframe 在网页上显示

我正在使用Flask,但这可能适用于很多类似的框架。我构建了一个Pandas数据框,例如@app.route('/analysis/')defanalysis(filename):x=pd.DataFrame(np.random.randn(20,5))returnrender_template("analysis.html",name=filename,data=x)模板analysis.html看起来像{%extends"base.html"%}{%blockcontent%}{{name}}{{data}}{%endblock%}这可行,但输出看起来很糟糕。它不使用换行符等。我玩