草庐IT

python - 如何去除一列中的日期信息,只保留时间

我正在使用Pandas数据框。有一个特定的列有时间信息。原始数据是这样的:5:15am5:28am6:15am所以我需要将原始数据转换成日期时间格式:format='%I:%M%p'dataset['TimeStamp']=pd.to_datetime(dataset['TimeStamp'],format)但是,我得到了:2014-07-0405:15:002014-07-0405:28:002014-07-0406:15:00我不需要年份和日期信息,只需要时间。我怎样才能删除它。谢谢。 最佳答案 从0.17.0版本开始,您可以这

python - 如何使用 Pandas 选择所有非 NaN 列和非 NaN 最后一列?

如果标题有点困惑,请原谅。假设我有test.h5。以下是使用df.read_hdf('test.h5','testdata')读取此文件的结果01234560123444111321NaNNaNNaN112234113672132900321211254332145NaNNaN我想选择最后一个非Nan列。我的预期结果是这样的03211900245我还想选择除最后一个非NaN列之外的所有列。我的预期结果大概是这样的。它可能在numpy数组中,但我还没有找到任何解决方案。012345601234441111122341136721323212112543321我在线搜索并找到df.iloc

python - 删除 Treeview 对象的空第一列

我正在尝试编写一个程序,使用sqlite3从数据库中检索记录,然后使用Treeview显示它们。我成功地用记录创建了一个表,但我就是无法删除第一个空列。defexecutethiscommand(search_str):comm.execute(search_str)records=comm.fetchall()rows=records.__len__()columns=records[0].__len__()win=Toplevel()list_columns=[columnames[0]forcolumnamesincomm.description]tree=ttk.Treevie

python - 在 Pandas 中单独打印一列的原始值?

我有一个数据框:df=pd.DataFrame([{'name':'george','age':23},{'name':'anna','age':26}])现在我想检索乔治的年龄:df[df.name=='george'].age但这会输出一些额外的信息以及原始值:023Name:age,dtype:int64我如何让它打印23? 最佳答案 您可以使用loc+values用于将Serie转换为numpyarray然后通过[0]选择第一个值:print(df.loc[df.name=='george','age'].values)[2

python - 将一列零添加到 csr_matrix

我有一个MxN稀疏csr_matrix,我想在矩阵的右侧添加一些只有零的列。原则上,数组indptr、indices和data保持不变,所以我只想改变矩阵的维度。但是,这似乎没有实现。>>>A=csr_matrix(np.identity(5),dtype=int)>>>A.toarray()array([[1,0,0,0,0],[0,1,0,0,0],[0,0,1,0,0],[0,0,0,1,0],[0,0,0,0,1]])>>>A.shape(5,5)>>>A.shape=((5,7))NotImplementedError:Reshapingnotimplementedforcs

python - Pandas ,对于一列中的每个唯一值,在另一列中获取唯一值

我有一个数据框,其中每一行都包含与单个Reddit评论(例如作者、subreddit、评论文本)相关的各种元数据。我想做以下事情:对于每个作者,我想获取他们在其中发表评论的所有subreddits的列表,并将此数据转换为pandas数据框,其中每一行对应一个作者,以及所有的列表他们发表评论的独特子版block。我目前正在尝试以下的一些组合,但无法理解:尝试1:group=df['subreddit'].groupby(df['author']).unique()list(group)尝试2:fromcollectionsimportdefaultdictsubreddit_dict=d

python - 高效地将值从一列替换为另一列 Pandas DataFrame

我有一个像这样的PandasDataFrame:col1col2col310.20.30.320.20.30.3300.40.44000.3500060.10.40.4仅当col1值等于0时,我想用第二列(col2)中的值替换col1值,之后(对于剩余的零值),再次执行此操作,但使用第三列(col3)。期望的结果是下一个:col1col2col310.20.30.320.20.30.330.40.40.440.300.3500060.10.40.4我使用pd.replace函数完成了它,但它似乎太慢了。我认为必须有一种更快的方法来完成它。df.col1.replace(0,df.col

python - 在 Pandas 中使用 groupby 来计算一列中与另一列相比的内容

也许groupby是错误的方法。似乎它应该工作,但我没有看到它...我想按结果对事件进行分组。这是我的数据框(df):StatusEventSUCCESSRunSUCCESSWalkSUCCESSRunFAILEDWalk这是我想要的结果:EventSUCCESSFAILEDRun21Walk01我正在尝试制作一个分组对象,但我不知道如何调用它来显示我想要的内容。grouped=df['Status'].groupby(df['Event']) 最佳答案 试试这个:pd.crosstab(df.Event,df.Status)Sta

python - 使用第一列作为索引的 Excel 到 Pandas DataFrame

我在Excel中有一个非常简单的表格,我正在尝试将其读入DataFrame代码:frompandasimportDataFrame,Seriesimportpandasaspddf=pd.read_excel('params.xlsx',header=[0,1],index_col=None)这会产生以下DataFrame:我没想到param1.key会成为索引,尤其是在设置了index_col=None之后。有没有一种方法可以使用生成的索引而不是第一列的数据将数据放入DataFrame中?更新—以下是您尝试reset_index()解决问题时发生的情况:版本信息:python3.5.

Python加入csv文件,其中键是第一列值

我尝试加入两个csv文件,其中键是第一列的值。没有标题。文件具有不同的行数和行数。必须保留文件a的顺序。文件:john,red,34andrew,green,18tonny,black,50jack,yellow,27phill,orange,45kurt,blue,29mike,pink,61文件b:tonny,driver,newyorkphill,scientist,boston期望的结果:john,red,34andrew,green,18tonny,black,50,driver,newyorkjack,yellow,27phill,orange,45,scientist,b