pyspark-dataframes

python - 选择两个日期之间的 DataFrame 行

我正在从csv创建一个DataFrame，如下所示:stock=pd.read_csv('data_in/'+filename+'.csv',skipinitialspace=True)DataFrame有一个日期列。有没有办法创建一个新的DataFrame(或只是覆盖现有的DataFrame)，它只包含日期值在指定日期范围内或两个指定日期值之间的行？最佳答案有两种可能的解决方案:使用bool掩码，然后使用df.loc[mask]将日期列设置为DatetimeIndex，然后使用df[start_date:end_date]使用

python - 将列表列表获取到 pandas DataFrame

我正在将电子表格的内容读入pandas。DataNitro有一个方法可以将矩形单元格选择作为列表返回。所以table=Cell("A1").table给予table=[['Heading1','Heading2'],[1,2],[3,4]]headers=table.pop(0)#givestheheadersaslistandleavesdata我正忙着写代码来翻译这个，但我的猜测是它是如此简单的使用，必须有方法来做到这一点。似乎无法在文档中找到它。任何指向可以简化此方法的方法的指针？最佳答案直接调用pd.DataFrame构

DataFrame python section code table pandas datanitro

python - python - 如何按两列或多列对python pandas中的dataFrame进行排序？

假设我有一个包含a、b和c列的数据框，我想按列b按升序排列，c列按降序排列，我该怎么做？最佳答案从0.17.0版本开始，sort方法被弃用，取而代之的是sort_values.sort在0.20.0版本中被完全删除。论据(和结果)保持不变:df.sort_values(['a','b'],ascending=[True,False])您可以使用sort的升序参数:df.sort(['a','b'],ascending=[True,False])例如:In[11]:df1=pd.DataFrame(np.random.randin

python 多列 code sort pandas python-2.7 sorting data-analysis

python - 如何检查 pandas DataFrame 是否为空？

如何检查pandasDataFrame是否为空？就我而言，如果DataFrame为空，我想在终端中打印一些消息。最佳答案您可以使用属性df.empty来检查它是否为空:ifdf.empty:print('DataFrameisempty!')来源:PandasDocumentation 关于python-如何检查pandasDataFrame是否为空？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co

DataFrame python section code pandas

python - 从变量中的值构造pandas DataFrame给出 "ValueError: If using all scalar values, you must pass an index"

这可能是一个简单的问题，但我不知道该怎么做。假设我有两个变量如下。a=2b=3我想由此构造一个DataFrame:df2=pd.DataFrame({'A':a,'B':b})这会产生一个错误:ValueError:Ifusingallscalarvalues,youmustpassanindex我也试过这个:df2=(pd.DataFrame({'a':a,'b':b})).reset_index()这给出了相同的错误消息。最佳答案错误消息表明，如果您要传递标量值，则必须传递一个索引。因此，您不能对列使用标量值-例如使用列表:

ValueError DataFrame section code python pandas scalar

python - pandas:使用运算符链接过滤 DataFrame 的行

pandas中的大多数操作都可以通过操作符链来完成(groupby、aggregate、apply等)，但我发现过滤行的唯一方法是通过普通括号索引df_filtered=df[df['column']==value]这并不吸引人，因为它需要我将df分配给一个变量，然后才能过滤其值。有没有更类似于以下的内容？df_filtered=df.mask(lambdax:x['column']==value) 最佳答案我不完全确定你想要什么，你的最后一行代码也无济于事，但无论如何:“链接”过滤是通过“链接”bool索引中的条件来完成的。In

运算符 DataFrame code section 39 python pandas

python - 将多个 CSV 文件导入 pandas 并连接到一个 DataFrame

我想从一个目录中读取几个CSV文件到pandas中，并将它们连接到一个大DataFrame中。我一直无法弄清楚。这是我目前所拥有的:importglobimportpandasaspd#Getdatafilenamespath=r'C:\DRO\DCL_rawdata_files'filenames=glob.glob(path+"/*.csv")dfs=[]forfilenameinfilenames:dfs.append(pd.read_csv(filename))#ConcatenatealldataintooneDataFramebig_frame=pd.concat(dfs,

DataFrame python code files prettyprint-override pandas csv concatenation

python - 随机播放 DataFrame 行

我有以下数据框:Col1Col2Col3Type0123114561...207892211011122...451314153461617183...DataFrame是从CSV文件中读取的。Type1的所有行都在最上面，然后是Type2的行，然后是Type3的行，依此类推。我想打乱DataFrame行的顺序，以便混合所有Type。可能的结果是:Col1Col2Col3Type0789211314153...201231211011122...454561461617183...我怎样才能做到这一点？最佳答案使用Pandas执

DataFrame python code section pre pandas permutation shuffle

python - 使用索引为 pandas DataFrame 中的特定单元格设置值

我创建了一个Pandas数据框df=DataFrame(index=['A','B','C'],columns=['x','y'])得到了这个xyANaNNaNBNaNNaNCNaNNaNNow,Iwouldliketoassignavaluetoparticularcell,forexampletorowCandcolumnx.Iwouldexpecttogetthisresult:xyANaNNaNBNaNNaNC10NaNwiththiscode:df.xs('C')['x']=10但是，df的内容并没有改变。数据框再次仅包含NaNs。有什么建议吗？

DataFrame python code 39 pandas cell nan

python - 如何获取 Pandas DataFrame 的行数？

如何获取pandas数据帧df的行数？最佳答案对于数据帧df，可以使用以下任何一种:len(df.index)df.shape[0]df[df.columns[0]].count()(==numberofnon-NaNvalues在第一列)重现情节的代码:importnumpyasnpimportpandasaspdimportperfplotperfplot.save("out.png",setup=lambdan:pd.DataFrame(np.arange(n*3).reshape(n,3)),n_range=[2**kf

DataFrame python code section df pandas