草庐IT

dataframe

全部标签

python - 剥离/修剪数据帧的所有字符串

在python/pandas中清理多类型数据框的值,我想修剪字符串。我目前正在按照两个说明进行操作:importpandasaspddf=pd.DataFrame([['a',10],['c',5]])df.replace('^\s+','',regex=True,inplace=True)#frontdf.replace('\s+$','',regex=True,inplace=True)#enddf.values这很慢,我有什么可以改进的? 最佳答案 您可以使用DataFrame.select_dtypes选择string列,然

python - 数据框未在 Pycharm 中显示

我正在使用PyCharm2016.2.1。当我尝试通过调试器中新添加的功能“查看为数据帧”查看Pandas数据帧时,这对于小型(例如4x4)数据帧可以正常工作。但是,当我尝试查看约10,000行x约50列的DataFrame(由自定义脚本生成)时,我收到消息:“Nothingtoshow”。当我在Spyder中运行相同的脚本(生成DataFrame)时,我可以查看它,所以我很确定这不是我的脚本中的错误。有谁知道在PyCharm中可以查看的DataFrame是否有最大大小,是否有办法改变它?编辑:似乎允许的最大大小是1000x15,因为在某些情况下它会被截断到这个大小(当行数太大时,但是

python - 数据框未在 Pycharm 中显示

我正在使用PyCharm2016.2.1。当我尝试通过调试器中新添加的功能“查看为数据帧”查看Pandas数据帧时,这对于小型(例如4x4)数据帧可以正常工作。但是,当我尝试查看约10,000行x约50列的DataFrame(由自定义脚本生成)时,我收到消息:“Nothingtoshow”。当我在Spyder中运行相同的脚本(生成DataFrame)时,我可以查看它,所以我很确定这不是我的脚本中的错误。有谁知道在PyCharm中可以查看的DataFrame是否有最大大小,是否有办法改变它?编辑:似乎允许的最大大小是1000x15,因为在某些情况下它会被截断到这个大小(当行数太大时,但是

python - 将函数应用于 DataFrame 中的每个单元格

我有一个可能如下所示的数据框:ABCfoobarfoobarbarfoofoobar我想查看每一行的每个元素(或每一列的每个元素)并应用以下函数来获取后续的DF:deffoo_bar(x):returnx.replace('foo','wow')ABCwowbarwowbarbarwowwowbar是否有一个简单的单行程序可以将函数应用于每个单元格?这是一个简单的示例,因此除了应用函数之外,可能还有一种更简单的方法来执行此特定示例,但我真正要问的是如何在数据框中的每个单元格中应用函数。 最佳答案 您可以使用applymap()这对你

python - 将函数应用于 DataFrame 中的每个单元格

我有一个可能如下所示的数据框:ABCfoobarfoobarbarfoofoobar我想查看每一行的每个元素(或每一列的每个元素)并应用以下函数来获取后续的DF:deffoo_bar(x):returnx.replace('foo','wow')ABCwowbarwowbarbarwowwowbar是否有一个简单的单行程序可以将函数应用于每个单元格?这是一个简单的示例,因此除了应用函数之外,可能还有一种更简单的方法来执行此特定示例,但我真正要问的是如何在数据框中的每个单元格中应用函数。 最佳答案 您可以使用applymap()这对你

python - 在 Pandas 的数据框中查找非数字行?

我在pandas中有一个大数据框,除了用作索引的列应该只有数值:df=pd.DataFrame({'a':[1,2,3,'bad',5],'b':[0.1,0.2,0.3,0.4,0.5],'item':['a','b','c','d','e']})df=df.set_index('item')如何找到其中包含非数字值的数据帧df的行?在本例中,它是数据帧中的第四行,在a列中有字符串'bad'。如何以编程方式找到该行? 最佳答案 您可以使用np.isreal检查每个元素的类型(applymap将函数应用于DataFrame中的每个元

python - 在 Pandas 的数据框中查找非数字行?

我在pandas中有一个大数据框,除了用作索引的列应该只有数值:df=pd.DataFrame({'a':[1,2,3,'bad',5],'b':[0.1,0.2,0.3,0.4,0.5],'item':['a','b','c','d','e']})df=df.set_index('item')如何找到其中包含非数字值的数据帧df的行?在本例中,它是数据帧中的第四行,在a列中有字符串'bad'。如何以编程方式找到该行? 最佳答案 您可以使用np.isreal检查每个元素的类型(applymap将函数应用于DataFrame中的每个元

python pandas从日期时间: df ['year' ] = df ['date' ].中提取年份不起作用

我通过read_csv导入了一个数据帧,但由于某种原因无法从df['date']系列中提取年份或月份,尝试给出AttributeError:'Series'对象没有属性'year':dateCount6/30/20105257/30/20101368/31/20101259/30/20108410/29/20104469df=pd.read_csv('sample_data.csv',parse_dates=True)df['date']=pd.to_datetime(df['date'])df['year']=df['date'].yeardf['month']=df['date']

python pandas从日期时间: df ['year' ] = df ['date' ].中提取年份不起作用

我通过read_csv导入了一个数据帧,但由于某种原因无法从df['date']系列中提取年份或月份,尝试给出AttributeError:'Series'对象没有属性'year':dateCount6/30/20105257/30/20101368/31/20101259/30/20108410/29/20104469df=pd.read_csv('sample_data.csv',parse_dates=True)df['date']=pd.to_datetime(df['date'])df['year']=df['date'].yeardf['month']=df['date']

python - 如何将 XML 文件转换为漂亮的 pandas 数据框?

假设我有一个这样的XML:我想阅读这个XML文件并将其转换为pandasDataFrame:keytypelanguagefeaturewebdatae95324a9a6c790ecb95e46cf15bE232ee517651XXXENxxwww.foo_bar_exmaple.comAlargetextwithlotsofstringsandpunctuationssymbols[...]bc360cfbafc39970587547215162f0dbXXXENxxwww.foo_bar_exmaple.comAlargetextwithlotsofstringsandpunctu