草庐IT

dask 从 spark 读取镶木地板文件

daskreadparquetfilefromspark对于从spark写入的parquet文件(没有任何分区),它的目录如下所示:12345%lsfoo.parquetpart-00017-c17ab661-2564-428e-8233-e7a9951fb012-c000.gz.parquetpart-00018-c17ab661-2564-428e-8233-e7a9951fb012-c000.gz.parquetpart-00019-c17ab661-2564-428e-8233-e7a9951fb012-c000.gz.parquet_SUCCESS尝试通过pandas读取时:1pd.