panda_草庐IT

python - 使用 Pandas 和/或 Numpy 进行读/写操作的最快文件格式

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题，以便用事实和引用来回答它。关闭2年前。Improvethisquestion我已经使用非常大的DataFrame工作了一段时间，并且一直在使用csv格式来存储输入数据和结果。我注意到读取和写入这些文件需要花费大量时间，例如，这会大大减慢数据的批处理速度。我想知道文件格式本身是否相关。有没有更快地读取/写入PandasDataFrame和/或Numpy数组的首选文件格式？最佳答案

最快 python section noreferrer stackoverflow numpy pandas

python 和 Pandas : How to query if a list-type column contains something?

我有一个数据框，其中包含有关电影的信息。它有一个名为genre的列，其中包含它所属的流派列表。例如:df['genre']##returns0['comedy','sci-fi']1['action','romance','comedy']2['documentary']3['crime','horror']...我想知道如何查询数据帧，以便返回电影属于某种类型的电影？例如，可能像df['genre'].contains('comedy')返回0或1。我知道一个列表，我可以做这样的事情:'comedy'in['comedy','sci-fi']但是，在pandas中，我没有找到类似的东

list-type something code 39 section python pandas

python 和 Pandas : How to query if a list-type column contains something?

我有一个数据框，其中包含有关电影的信息。它有一个名为genre的列，其中包含它所属的流派列表。例如:df['genre']##returns0['comedy','sci-fi']1['action','romance','comedy']2['documentary']3['crime','horror']...我想知道如何查询数据帧，以便返回电影属于某种类型的电影？例如，可能像df['genre'].contains('comedy')返回0或1。我知道一个列表，我可以做这样的事情:'comedy'in['comedy','sci-fi']但是，在pandas中，我没有找到类似的东

list-type something code 39 section python pandas

python - 将 numpy.array 存储在 Pandas.DataFrame 的单元格中

我有一个数据框，我想在其中存储“原始”numpy.array:df['COL_ARRAY']=df.apply(lambdar:np.array(do_something_with_r),axis=1)但似乎pandas试图“解包”numpy.array。有解决方法吗？除了使用包装器(见下面的编辑)？我尝试reduce=False没有成功。编辑这行得通，但我必须使用'dummy'Data类来环绕数组，这不能令人满意并且不是很优雅。classData:def__init__(self,v):self.v=vmeas=pd.read_excel(DATA_FILE)meas['DATA']

DataFrame python code 39 pre pandas numpy

python - 将 numpy.array 存储在 Pandas.DataFrame 的单元格中

我有一个数据框，我想在其中存储“原始”numpy.array:df['COL_ARRAY']=df.apply(lambdar:np.array(do_something_with_r),axis=1)但似乎pandas试图“解包”numpy.array。有解决方法吗？除了使用包装器(见下面的编辑)？我尝试reduce=False没有成功。编辑这行得通，但我必须使用'dummy'Data类来环绕数组，这不能令人满意并且不是很优雅。classData:def__init__(self,v):self.v=vmeas=pd.read_excel(DATA_FILE)meas['DATA']

DataFrame python code 39 pre pandas numpy

python - Pandas DataFrame.to_csv 引发 IOError : No such file or directory

嗨:我正在尝试使用PandasDataFrame.to_csv方法将dataframe保存到csv文件:filename='./dir/name.csv'df.to_csv(filename)但是我得到了错误:IOError:[Errno2]Nosuchfileordirectory:'./dir/name.csv'如果文件不存在，to_csv方法是否应该能够创建文件？这就是我打算让它做的事情。最佳答案 to_csv如您所说，如果文件不存在，则确实会创建该文件，但不会创建不存在的目录。确保首先创建了您尝试保存文件的子目录。我在工作

DataFrame directory code section csv python python-2.7 pandas

python - Pandas DataFrame.to_csv 引发 IOError : No such file or directory

嗨:我正在尝试使用PandasDataFrame.to_csv方法将dataframe保存到csv文件:filename='./dir/name.csv'df.to_csv(filename)但是我得到了错误:IOError:[Errno2]Nosuchfileordirectory:'./dir/name.csv'如果文件不存在，to_csv方法是否应该能够创建文件？这就是我打算让它做的事情。最佳答案 to_csv如您所说，如果文件不存在，则确实会创建该文件，但不会创建不存在的目录。确保首先创建了您尝试保存文件的子目录。我在工作

DataFrame directory code section csv python python-2.7 pandas

python - 字典中的 Pandas 数据框

我有一个用户项目评级的python字典，看起来像这样:sample={'user1':{'item1':2.5,'item2':3.5,'item3':3.0,'item4':3.5,'item5':2.5,'item6':3.0},'user2':{'item1':2.5,'item2':3.0,'item3':3.5,'item4':4.0},'user3':{'item2':4.5,'item5':1.0,'item6':4.0}}我希望将其转换为具有类似结构的pandas数据框col1col2col30user1item12.51user1item23.52user1item3

python Pandas item 39 user

python - 字典中的 Pandas 数据框

我有一个用户项目评级的python字典，看起来像这样:sample={'user1':{'item1':2.5,'item2':3.5,'item3':3.0,'item4':3.5,'item5':2.5,'item6':3.0},'user2':{'item1':2.5,'item2':3.0,'item3':3.5,'item4':4.0},'user3':{'item2':4.5,'item5':1.0,'item6':4.0}}我希望将其转换为具有类似结构的pandas数据框col1col2col30user1item12.51user1item23.52user1item3

python Pandas item 39 user

python - pandas DataFrame 对角线

什么是获取正方形DataFrame的对角线的有效方法。我希望结果是一个Series和一个MultiIndex有两个级别，第一个是DataFrame的索引，第二个级别是DataFrame的列。设置importpandasaspdimportnumpyasnpnp.random.seed([3,1415])df=pd.DataFrame(np.random.rand(3,3)*5,columns=list('abc'),index=list('ABC'),dtype=np.int64)我想看看这个:printdf.stack().loc[[('A','a'),('B','b'),('C',

DataFrame python code section 39 numpy pandas