dataframe_草庐IT

python - Pandas 唯一值多列

df=pd.DataFrame({'Col1':['Bob','Joe','Bill','Mary','Joe'],'Col2':['Joe','Steve','Bob','Bob','Steve'],'Col3':np.random.random(5)})返回'Col1'和'Col2'的唯一值的最佳方法是什么？想要的输出是'Bob','Joe','Bill','Mary','Steve' 最佳答案 pd.unique从输入数组、DataFrame列或索引返回唯一值。此函数的输入需要是一维的，因此需要组合多个列。最简单的方法是选择所

多列 python 39 code unique pandas dataframe

python - Pandas 唯一值多列

df=pd.DataFrame({'Col1':['Bob','Joe','Bill','Mary','Joe'],'Col2':['Joe','Steve','Bob','Bob','Steve'],'Col3':np.random.random(5)})返回'Col1'和'Col2'的唯一值的最佳方法是什么？想要的输出是'Bob','Joe','Bill','Mary','Steve' 最佳答案 pd.unique从输入数组、DataFrame列或索引返回唯一值。此函数的输入需要是一维的，因此需要组合多个列。最简单的方法是选择所

多列 python 39 code unique pandas dataframe

python - 从列中的字符串中删除不需要的部分

我正在寻找一种有效的方法来从DataFrame列中的字符串中删除不需要的部分。数据如下:timeresult109:00+52A210:00+62B311:00+44a412:00+30b513:00-110a我需要将这些数据修剪为:timeresult109:0052210:0062311:0044412:0030513:00110我尝试了.str.lstrip('+-')和.str.rstrip('aAbBcC')，但出现错误:TypeError:wrapper()takesexactly1argument(2given)任何指针将不胜感激! 最佳答案

python 的 code section pre string pandas dataframe

python - 从列中的字符串中删除不需要的部分

我正在寻找一种有效的方法来从DataFrame列中的字符串中删除不需要的部分。数据如下:timeresult109:00+52A210:00+62B311:00+44a412:00+30b513:00-110a我需要将这些数据修剪为:timeresult109:0052210:0062311:0044412:0030513:00110我尝试了.str.lstrip('+-')和.str.rstrip('aAbBcC')，但出现错误:TypeError:wrapper()takesexactly1argument(2given)任何指针将不胜感激! 最佳答案

python 的 code section pre string pandas dataframe

python - Pandas read_csv中的日期时间dtypes

我正在读取一个包含多个日期时间列的csv文件。我需要在读取文件时设置数据类型，但日期时间似乎是个问题。例如:headers=['col1','col2','col3','col4']dtypes=['datetime','datetime','str','float']pd.read_csv(file,sep='\t',header=None,names=headers,dtype=dtypes)运行时报错:TypeError:datatype"datetime"notunderstood事后通过pandas.to_datetime()转换列不是一个选项我不知道哪些列将是日期时间对象。

read_csv python code 39 datetime csv pandas dataframe

python - Pandas read_csv中的日期时间dtypes

我正在读取一个包含多个日期时间列的csv文件。我需要在读取文件时设置数据类型，但日期时间似乎是个问题。例如:headers=['col1','col2','col3','col4']dtypes=['datetime','datetime','str','float']pd.read_csv(file,sep='\t',header=None,names=headers,dtype=dtypes)运行时报错:TypeError:datatype"datetime"notunderstood事后通过pandas.to_datetime()转换列不是一个选项我不知道哪些列将是日期时间对象。

read_csv python code 39 datetime csv pandas dataframe

python - 如何估计 Pandas 的 DataFrame 需要多少内存？

我一直在想...如果我正在将一个400MB的csv文件读入pandas数据帧(使用read_csv或read_table)，有没有办法猜测这需要多少内存？只是想更好地了解数据帧和内存... 最佳答案 df.memory_usage()将返回每列占用多少字节:>>>df.memory_usage()Row_ID20906600Household_ID20906600Vehicle20906600Calendar_Year20906600Model_Year20906600...要包含索引，请传递index=True。所以要获得整体内存

DataFrame python code section 20906600 pandas

python - 如何估计 Pandas 的 DataFrame 需要多少内存？

我一直在想...如果我正在将一个400MB的csv文件读入pandas数据帧(使用read_csv或read_table)，有没有办法猜测这需要多少内存？只是想更好地了解数据帧和内存... 最佳答案 df.memory_usage()将返回每列占用多少字节:>>>df.memory_usage()Row_ID20906600Household_ID20906600Vehicle20906600Calendar_Year20906600Model_Year20906600...要包含索引，请传递index=True。所以要获得整体内存

DataFrame python code section 20906600 pandas

python - 查找名称包含特定字符串的列

我有一个带有列名的数据框，我想找到一个包含某个字符串但不完全匹配的数据框。我在'spike-2'、'heyspike'、'spiked-等列名中搜索'spike'in'('spike'部分始终是连续的)。我希望列名作为字符串或变量返回，因此我稍后使用df['name']或df[name]访问该列像平常一样。我试图找到方法来做到这一点，但无济于事。有什么建议吗？最佳答案只需遍历DataFrame.columns，现在这是一个示例，您最终会得到一个匹配的列名列表:importpandasaspddata={'spike-2':[1,

python 查找 code spike 列名 python-3.x string pandas dataframe

python - 查找名称包含特定字符串的列

我有一个带有列名的数据框，我想找到一个包含某个字符串但不完全匹配的数据框。我在'spike-2'、'heyspike'、'spiked-等列名中搜索'spike'in'('spike'部分始终是连续的)。我希望列名作为字符串或变量返回，因此我稍后使用df['name']或df[name]访问该列像平常一样。我试图找到方法来做到这一点，但无济于事。有什么建议吗？最佳答案只需遍历DataFrame.columns，现在这是一个示例，您最终会得到一个匹配的列名列表:importpandasaspddata={'spike-2':[1,

python 查找 code spike 列名 python-3.x string pandas dataframe