草庐IT

python - 如何去除一列中的日期信息,只保留时间

我正在使用Pandas数据框。有一个特定的列有时间信息。原始数据是这样的:5:15am5:28am6:15am所以我需要将原始数据转换成日期时间格式:format='%I:%M%p'dataset['TimeStamp']=pd.to_datetime(dataset['TimeStamp'],format)但是,我得到了:2014-07-0405:15:002014-07-0405:28:002014-07-0406:15:00我不需要年份和日期信息,只需要时间。我怎样才能删除它。谢谢。 最佳答案 从0.17.0版本开始,您可以这

python - 如何按特定月份/日期过滤日期数据框?

所以我的代码如下:df['Dates'][df['Dates'].index.month==11]我正在做一个测试,看看我是否可以过滤月份,以便它只显示11月的日期,但这没有用。它给了我以下错误:AttributeError:'Int64Index'objecthasnoattribute'month'。如果我这样做printtype(df['Dates'][0])然后我得到类“pandas.tslib.Timestamp”,这让我相信存储在数据框中的对象类型是时间戳对象。(我不确定'Int64Index'来自哪里......因为之前的错误)我想要做的是:dataframe列包含从20

python - 将组总计添加到 Pandas 中的数据框的最佳方法

我有一个简单的任务,我想知道是否有更好/更有效的方法来完成。我有一个看起来像这样的数据框:GroupScoreCount0A51001A1502A353B1404B2205B160我想添加一个包含组总计数值的列:GroupScoreCountTotalCount0A51001551A1501552A351553B1401204B2201205B160120我这样做的方式是:Grouped=df.groupby('Group')['Count'].sum().reset_index()Grouped=Grouped.rename(columns={'Count':'TotalCount'

python - 在 Pandas DATAFRAME 中移动列

我已将数据从csv文件读取到一个由25000多行和15列组成的数据框中,我需要将所有行(包括最左边的->索引)向右移动一列,以便我得到一个空索引并能够用整数填充它。然而,列的名称应该留在同一个地方。所以,基本上我需要将除列名以外的所有内容都向右移动一个位置。我试图重新索引它,但出现错误:ValueError:cannotreindexfromaduplicateaxis有什么办法吗? 最佳答案 在pandas中,您只能在右侧创建一列,除非您在两个数据框之间进行连接。然后您可以根据自己的喜好重新排列。importpandasaspdd

python - 如何删除 pandas 数据框中具有重复列值的行?

我有一个pandas数据框,看起来像这样。Column1Column2Column30cat1C1dog1A2cat1B我想确定cat和bat是重复的相同值,因此想删除一条记录并仅保留第一条记录。结果数据框应该只有。Column1Column2Column30cat1C1dog1A 最佳答案 将drop_duplicates与带有列列表的subset结合使用以检查重复项,并使用keep='first'保留第一个重复项。如果dataframe是:df=pd.DataFrame({'Column1':["'cat'","'toy'","

python - 如何使用 Python 计算 Excel 文件中的工作表总数

我正在使用python读取excel文件。importpandasaspdimportosxls=pd.ExcelFile('D:\DirectoryProject\Mapping.xlsx')它有几个我不知道的数据表。如何使用Python计算Mapping.xlsx文件中的工作表总数? 最佳答案 openpyxlimportopenpyxlwb=openpyxl.load_workbook('file.xlsx')res=len(wb.sheetnames)Pandasimportpandasaspdxl=pd.ExcelFile

python - 如何一次检测和删除 pandas 数据帧每一列中的异常值?

这个问题在这里已经有了答案:DetectandexcludeoutliersinapandasDataFrame(18个答案)关闭12个月前。我有一个包含六列的pandas数据框,我知道每列中都有一些异常值。所以我有这两行代码,它们几乎可以做我想做的事情。但它只从数据框的一列中删除异常值。那么,如果我想从每一列中一起删除异常值怎么办?df=pd.DataFrame({'stlines':np.random.normal(size=533)})df=df[np.abs(df.stlines-df.stlines.mean())执行此操作的优雅方法是什么?

python - 如何在新图像上使用 .predict_generator() - Keras

我使用ImageDataGenerator和flow_from_directory进行训练和验证。这些是我的目录:train_dir=Path('D:/Datasets/Trell/images/new_images/training')test_dir=Path('D:/Datasets/Trell/images/new_images/validation')pred_dir=Path('D:/Datasets/Trell/images/new_images/testing')ImageGenerator代码:img_width,img_height=28,28batch_size=

python - matplotlib 中的 figsize 没有改变图形大小?

这个问题在这里已经有了答案:HowdoIchangethesizeoffiguresdrawnwithMatplotlib?(21个回答)关闭4年前。如您所见,代码生成的条形图不那么清晰,我想让图形变大以便更好地查看值。这不行。什么是正确的方法?x是数据框,x['user']是图中的x轴,x['number']是y。importmatplotlib.pyplotasplt%matplotlibinlineplt.bar(x['user'],x['number'],color="blue")plt.figure(figsize=(20,10))带有plt.figure的行不会改变初始尺寸

python - 检查数据框列中的所有值是否相同

我想快速轻松地检查counts的所有列值在数据框中是否相同:在:importpandasaspdd={'names':['Jim','Ted','Mal','Ted'],'counts':[3,4,3,3]}pd.DataFrame(data=d)输出:namescounts0Jim31Ted42Mal33Ted3我只想要一个简单的条件,即如果所有计数=相同的值然后print('True')。有没有快速的方法来做到这一点? 最佳答案 一种有效的方法是将第一个值与其余值进行比较,然后使用all:defis_unique(s):a=s.