草庐IT

spark-packages

全部标签

Spark 下载安装配置详解文档 (spark-2.4.8-bin-hadoop2.7.tgz)

下载安装配置spark:官网地址:https://archive.apache.org/dist/spark/上传spark-2.4.8-bin-hadoop2.7.tgz 解压tar-zxvfspark-2.4.8-bin-hadoop2.7.tgz-C/opt/moudel/重命名mvspark-2.4.8-bin-hadoop2.7spark-2.4.8配置环境变量vim/etc/profile#SPARK_HOMEexportSPARK_HOME=/opt/moudel/spark-2.4.8exportPATH=$PATH:$SPARK_HOME/bin执行source/etc/pr

windows - "nuget install"、 "Install-Package"和 "choco install"之间有什么区别?

以及更具体的问题。我的理解对吗:“nugetinstall”总是安装到您运行它的目录吗?“chocoinstall”安装到特殊的choco目录,然后运行脚本在系统中传播它?“nugetinstall”只是安装包的包装器? 最佳答案 NuGet是一个打包框架,为NuGet、PowerShell模块(PowerShellGallery)和Chocolatey提供打包。PackageManagement(又名OneGet)是一个包管理器Manager(是的,真的)它实现了Install-Package以与包管理器一起工作(称为提供者),例

windows - 带有 Hadoop 发行版的 Apache Spark 无法在 Windows 上运行

我尝试使用Cygwin在Windows上运行spark-1.5.1-bin-hadoop2.6发行版(以及具有相同结果的较新版本的Spark)。尝试在bin文件夹中执行spark-shell脚本时,我得到以下输出:错误:无法找到或加载主类org.apache.spark.launcher.Main我尝试将CLASSPATH设置为lib/spark-assembly-1.5.1-hadoop2.6.0.jar的位置,但无济于事。(仅供引用:我可以在我的MAC上运行相同的发行版,无需额外的设置步骤)请协助寻找在Windows上执行Cygwin的解决方案。 最佳答

python - 如何将 spark 与 python 或 jupyter 笔记本一起使用

我正在尝试在python中处理12GB的数据,我迫切需要使用Spark,但我想我太愚蠢了,不能自己使用命令行或使用互联网,这就是为什么我想我必须转向SO,所以到目前为止,我已经下载了spark并解压缩了tar文件或其他任何东西(对语言感到抱歉,但我觉得自己很愚蠢而且出局)但现在我无处可去。我在spark网站文档中看到了说明,上面写着:Spark还提供了一个PythonAPI。要在Python解释器中以交互方式运行Spark,请使用bin/pyspark但在哪里执行此操作?请帮忙。编辑:我正在使用Windows10注意::我在尝试安装某些东西时总是遇到问题,主要是因为我似乎无法理解命令提

windows - 为什么 Zeppelin 0.6.2 笔记本在 Windows 上使用 Spark 2.0 失败并显示 "The input line is too long"?

我在带有Spark2.0的Windows中运行Zeppelin0.6.2SPARK_HOME=C:\Users\anbarasu.r\Desktop\Archive\spark-2.0.0-bin-hadoop2.6JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=512m;supportwasremovedin8.0SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/C:/Users/anbarasu.r/De

c# - 使用 System.IO.Packaging 生成 ZIP 文件

我知道通常建议使用DotNetZip或SharpZipLib库之类的库来使用.net语言(在我的例子中是C#)创建ZIP文件,但使用System并非不可能.IO.Packaging生成ZIP文件。我认为尝试在C#中开发一个例程可能会很好,它可以做到这一点,而无需下载任何外部库。有没有人有一个或多个使用System.IO.Packaging生成ZIP文件的方法的好例子? 最佳答案 让我为你谷歌这个->system.io.packaging+generate+zip第一个链接http://weblogs.asp.net/jongallo

c# - 如何在 C# 中运行 Apache Spark 源代码

我想通过将sparkjava/scalaapi转换为dll文件来从C#运行apachespark源代码。我已经提到ikvm/ikvmc将sparkjar文件转换为dll文件,但无法获得正确的结果。有没有办法在C#中运行spark源?请指导我解决这个问题?ApacheSpark已经支持Java、Scala、R、Python语言运行spark。future是否会提供对C#的支持? 最佳答案 ApacheSpark的C#语言绑定(bind)现在可通过Mobius获得。参见https://github.com/Microsoft/Mobiu

Spark搭建/Hadoop集群

一、Spark概述.Spark于2009年诞生于美国加州大学伯克利分校的AMP实验室,它是一个可应用于大规模数据处理的统一分析引擎。Spark不仅计算速度快,而且内置了丰富的API,使得我们能够更加容易编写程序。Spark在2013年加入Apache孵化器项目,之后获得迅猛的发展,并于2014年正式成为Apache软件基金会的顶级项目。Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎,它是基于内存计算的大数据并行计算框架,适用于各种各样的分布式平台的系统。在Spark生态圈中包含了SparkSQL、SparkStreaming、GraphX、MLlib等组件。 图1-1 

c# - 在独立应用程序中使用 Spark View Engine

我的客户端应用程序需要生成HTML。我想使用像Spark这样的模板/View引擎解决方案,但我不确定Spark是否可以在ASP.NET应用程序之外使用。有谁知道以这种方式使用Spark的任何示例或文档?(如果您知道其他可以独立使用的View引擎解决方案,我也很想知道。) 最佳答案 除了其他示例之外,我还在Spark源代码中找到了一个简单的示例。Xpark项目是一个使用Spark转换XML的命令行应用程序。LouisDeJardin,Spark的创造者,描述了howXparkworks在他的博客上。相关代码片段为://Createan

c# - package.config 更新不更新引用

我有多个项目引用同一个NuGet包。当我获得最新代码时,我意识到其中一个项目更新了package.config并且还更新了对该包提供的Dll的引用。现在,我还更新了其他项目的package.config,希望一旦我对该NuGet引擎进行升级,就会看到它并为我获取新的DLL。好吧,它没有发生。之后我尝试了以下操作,但没有一个起作用:删除旧版本的DLL,然后做Restorepackage删除包文件夹,重新启动我的VS2015并恢复包此外,有趣的是,当我转到管理Nuget包并查看我需要新DLL的包时,它显示它已经是新版本,我不需要升级它。有什么方法可以让NuGet引擎升级这些包?