panda_草庐IT

python - 在 Pandas 中生成给定范围内的随机日期

这是一个self回答的帖子。一个常见的问题是在给定的开始日期和结束日期之间随机生成日期。有两种情况需要考虑:带有时间分量的随机日期，以及没有时间的随机日期例如，给定一些开始日期2015-01-01和结束日期2018-01-01，我如何使用Pandas？最佳答案是否可以转换为unix时间戳？defrandom_dates(start,end,n=10):start_u=start.value//10**9end_u=end.value//10**9returnpd.to_datetime(np.random.randint(sta

中生给定 39 datetime 2015 python pandas random

python - 获取 pandas DataFrame 的名称

如何获取DataFrame的名称并将其打印为字符串？例子:boston(分配给csv文件的变量名称)importpandasaspdboston=pd.read_csv('boston.csv')print('ThewinneristeamAbasedonthe%stable.)%boston 最佳答案您可以使用以下名称命名数据框，然后在任何您喜欢的地方调用名称:importpandasaspddf=pd.DataFrame(data=np.ones([4,4]))df.name='Ones'printdf.name>>>Ones

DataFrame python section code boston pandas attributes

python - 获取 pandas DataFrame 的名称

如何获取DataFrame的名称并将其打印为字符串？例子:boston(分配给csv文件的变量名称)importpandasaspdboston=pd.read_csv('boston.csv')print('ThewinneristeamAbasedonthe%stable.)%boston 最佳答案您可以使用以下名称命名数据框，然后在任何您喜欢的地方调用名称:importpandasaspddf=pd.DataFrame(data=np.ones([4,4]))df.name='Ones'printdf.name>>>Ones

DataFrame python section code boston pandas attributes

Python pandas - 在 groupby 之后过滤行

例如，我有下表:index,A,B0,0,01,0,82,0,83,1,54,1,3按A分组后:0:index,A,B0,0,01,0,82,0,81:index,A,B3,1,54,1,3我需要的是从每个组中删除行，其中列B中的数字小于组列B中所有行的最大值。好吧，我在将这个问题翻译成英文时遇到了问题，所以这里是示例:0组中B列中行的最大值:8所以我想删除索引0的行并保留索引1和2的行1组中B列中行的最大值:5所以我想删除索引4的行并保留索引3的行我曾尝试使用pandas过滤功能，但问题是它一次对组中的所有行进行操作:data=grouped=data.groupby("A")fil

groupby Python code section strong pandas filter lambda group-by

Python pandas - 在 groupby 之后过滤行

例如，我有下表:index,A,B0,0,01,0,82,0,83,1,54,1,3按A分组后:0:index,A,B0,0,01,0,82,0,81:index,A,B3,1,54,1,3我需要的是从每个组中删除行，其中列B中的数字小于组列B中所有行的最大值。好吧，我在将这个问题翻译成英文时遇到了问题，所以这里是示例:0组中B列中行的最大值:8所以我想删除索引0的行并保留索引1和2的行1组中B列中行的最大值:5所以我想删除索引4的行并保留索引3的行我曾尝试使用pandas过滤功能，但问题是它一次对组中的所有行进行操作:data=grouped=data.groupby("A")fil

groupby Python code section strong pandas filter lambda group-by

python - 从具有复合(分层)索引的 Pandas 数据框中选择行

我怀疑这是微不足道的，但我还没有发现可以让我根据分层键的值从Pandas数据框中选择行的咒语。因此，例如，假设我们有以下数据框:importpandasdf=pandas.DataFrame({'group1':['a','a','a','b','b','b'],'group2':['c','c','d','d','d','e'],'value1':[1.1,2,3,4,5,6],'value2':[7.1,8,9,10,11,12]})df=df.set_index(['group1','group2'])df看起来和我们预期的一样:如果df没有在group1上被索引，我可以执行以下

中选 python 39 group section pandas dataframe multi-index

python - 从具有复合(分层)索引的 Pandas 数据框中选择行

我怀疑这是微不足道的，但我还没有发现可以让我根据分层键的值从Pandas数据框中选择行的咒语。因此，例如，假设我们有以下数据框:importpandasdf=pandas.DataFrame({'group1':['a','a','a','b','b','b'],'group2':['c','c','d','d','d','e'],'value1':[1.1,2,3,4,5,6],'value2':[7.1,8,9,10,11,12]})df=df.set_index(['group1','group2'])df看起来和我们预期的一样:如果df没有在group1上被索引，我可以执行以下

中选 python 39 group section pandas dataframe multi-index

python - 使用 SQLAlchemy 批量插入 Pandas 数据帧

我有一些相当大的pandasDataFrame，我想使用新的批量SQL映射通过SQLAlchemy将它们上传到MicrosoftSQLServer。pandas.to_sql方法虽然不错，但速度很慢。我在编写代码时遇到问题...我希望能够将此函数传递给我正在调用table的pandasDataFrame、我正在调用schema的模式名称和一个表我正在调用name的名称。理想情况下，该函数将1.)如果表已存在，则删除该表。2.)创建一个新表3.)创建一个映射器和4.)使用映射器和pandas数据进行批量插入。我被困在第3部分。这是我的(诚然粗略)代码。我正在为如何让映射器功能与我的主键一

SQLAlchemy python 39 射器 create pandas

python - 使用 SQLAlchemy 批量插入 Pandas 数据帧

我有一些相当大的pandasDataFrame，我想使用新的批量SQL映射通过SQLAlchemy将它们上传到MicrosoftSQLServer。pandas.to_sql方法虽然不错，但速度很慢。我在编写代码时遇到问题...我希望能够将此函数传递给我正在调用table的pandasDataFrame、我正在调用schema的模式名称和一个表我正在调用name的名称。理想情况下，该函数将1.)如果表已存在，则删除该表。2.)创建一个新表3.)创建一个映射器和4.)使用映射器和pandas数据进行批量插入。我被困在第3部分。这是我的(诚然粗略)代码。我正在为如何让映射器功能与我的主键一

SQLAlchemy python 39 射器 create pandas

python - Pandas Dataframe 在网页上显示

我正在使用Flask，但这可能适用于很多类似的框架。我构建了一个Pandas数据框，例如@app.route('/analysis/')defanalysis(filename):x=pd.DataFrame(np.random.randn(20,5))returnrender_template("analysis.html",name=filename,data=x)模板analysis.html看起来像{%extends"base.html"%}{%blockcontent%}{{name}}{{data}}{%endblock%}这可行，但输出看起来很糟糕。它不使用换行符等。我玩

Dataframe python code section analysis pandas flask