草庐IT

spark-csv

全部标签

windows - 如何在 Windows 上访问 Spark 中的本地文件?

我在Windows上使用Spark。我知道在*nix中,访问本地文件代码是这样的:valtextFile=sc.textFile("file:///usr/local/spark/README.md")但是如何在Windows上访问本地文件?我尝试了以下方法:vallogFile="C:\spark-1.3.1-bin-hadoop2.4\README.md"vallogFile="file\\C:\spark-1.3.1-bin-hadoop2.4\README.md"但都行不通。 最佳答案 不幸的是,在Windows中你必须转义

windows - 将日志数据转换为所需格式的 csv 文件

我有一个日志数据:Name:MarkCity:LondonCountry:UKName:BenCity:ParisCountry:FranceName:TomCity:AthensCountry:Greece我需要生成格式为CSV的输出:NameCityCountryMarkLondonUKBenParisFranceTomAthensGreece我为此创建的批处理是转换为CSV的简单批处理。具体如下:@echooffcd/d%~dp0setinfilenm=abc.logsetoutfilenm=abc.csvsetbeforestr=setafterstr=,typenul>%ou

php - 在 Windows 上安装 codeigniter sparks 管理器

已解决,请阅读帖子底部:我正在尝试按照officialinstructions在Windows上安装Sparks包管理器.发出此命令:php-r"$(curl-fsSLhttp://getsparks.org/go-sparks)"导致此错误消息:Parseerror:syntaxerror,unexpected':'inCommandlinecodeonline1如果我只在上述行中执行curl命令,即:curl-fsSLhttp://getsparks.org/go-sparks它回显位于URL上的php脚本。所以我认为问题是将curl输出管道传输到PHP以某种方式失败。我尝试了几种

windows - 将具有属性的目录批处理到 csv

我花了很多时间搜索这个(和其他)网站试图解决这个问题,但我最终承认我被困住了。我是初学者,所以如果我的术语/解释令人困惑,我提前道歉。操作系统:Windows7我正在处理单个批处理文件,该文件将创建一个.csv文件,其中包含批处理文件当前文件夹位置的所有文件夹和文件(包括子文件夹)的属性和路径。我正在针对属性的所有可能场景进行迭代。下面是我的代码的解释:**在csv文件中创建一个标题:@echoonechoFoldervs.File,Hidden,SystemFolder,ReadOnly,Path>FoldersAndFilesWithAttributes.csv**将具有特定属性的

windows - 将特殊字符保存到 CSV 文件中,可以在 PC(Excel) 和 Mac(Numbers) 上打开

我有一个脚本(我在Mac上运行)将摄氏度(摄氏温度单位)写入CSV文件。我希望在Excel和Numbers中查看此文件。问题是它在Numbers上打开很好,但在Excel上显示奇怪的字符(Windows,我没有在Mac上测试过Excel)。我尝试了℃(unicode字符)和°C(度数字符后跟C)。在Excel上我得到这个:我很确定csv文件是UTF-8编码的,所以我不知道是什么导致了这个问题。这是我注意到的其他事情,如果我另存为.txt而不是.csv并在excel中打开它,则会显示一个导入向导。如果我只是将任何内容保留为默认值并选择“完成”,那么该符号就会正确显示。但这并不理想,因为我

windows - odo 在 csv 和 mysql 之间转换数据

当使用pythonodo模块将.csv之一转换为pd.DataFrame时,我收到一个TypeErrorTypeError:Cannotcastarrayfromdtype('float64')todtype('int64')accordingtotherule'safe'适用于其他csv的代码#csvtablefilenamecsvNm='table.csv'#convertmysqltabletocsvodo_csv=odo(tstConn.connect_string+'::'+tbl,csvNm)#convertcsvtopandasodo_df=odo(odo_csv,pd.

java - 使用 Java 8 在 Windows 上调试 spark 进程

我可以使用cmd.exe中的命令在Windows上运行spark:setCLASS=org.apache.spark.deploy.SparkSubmit%SPARK_HOME%\bin\spark-class2.cmd%CLASS%--class"com.sel2in.TstFac"--masterlocal[4]target\scala-2.11\theApp_2.11-1.0.jar在spark-class2.cmd中要添加远程调试选项:setJOPTS=setJOPTS=-agentlib:jdwp=transport=dt_socket,server=y,address=80

windows - Spark WindowedApplication,监听keyUp事件

我有一个WindowedApplication,我需要监视keyUp以便我可以在按下转义键时关闭应用程序。但是,我的代码不起作用:似乎这个事件根本没有触发,我什至试图覆盖keyUpHandler并追踪一些信息,但没有。 最佳答案 我找到了thissimilarquestion在Adob​​e论坛上,它帮助解决了问题。我通过监听applicationComplete然后在处理程序中将keyUp监听器附加到stage来解决。 关于windows-SparkWindowedApplicatio

sql - 使用自定义文件名路径复制 csv

我在尝试使用COPY函数将查询导出到CSV时遇到了一些问题。如果未在TO上使用自定义文件名,COPY运行正常并成功导出查询。此问题与向创建的文件名添加“日期戳”(有点)有关。declarevar1varchar(25);DECLARESTATEMENTTEXT;selectintovar1current_date-1;STATEMENT:='COPY(SELECT*frommyTable)To''E'C:\\Exports\\export_'||var1||'.csv'''WithCSV';EXECUTESTATEMENT;在这种情况下,var1得到一个类似于2013-12-16的值,

windows - R csv.bz2 Shell Windows 计算行数

我在计算困惑的csv.bz2文件中的行数时遇到问题。由于这是一个巨大的文件,我希望能够在使用read.csv()函数读取bzip2文件之前预先分配一个数据帧。正如您在以下测试中看到的,我的结果变化很大,并且没有一个与csv.bz2文件中的实际行数相对应。>system.time(nrec1nrec1[1]1060906>system.time(nrec2nrec2[1]126715>system.time(nrec3nrec3[1]1232705>system.time(nrec4nrec4[1]533062最有趣的结果是我称为nrec4的结果,因为它不花时间,而且它返回的行数大约是n