草庐IT

Learning PySpark - 2017.pdf @ pyspark实战指南 - 2017.pdf

python测试开发 2023-09-21 原文

Learning PySpark - 2017.pdf

image.png

在本地构建数据密集型应用程序,并使用Python和Spark 2.0的强大功能进行大规模部署。

Apache Spark是一个高效集群计算的开源框架,具有强大的数据并行和容错接口。本书将向您展示如何利用Python的强大功能并将其用于Spark生态系统。首先,您将深入了解Spark 2.0体系结构以及如何为Spark设置Python环境。

您将熟悉PySpark中可用的模块。您将学习如何使用RDD和DataFrame抽象数据并了解PySpark的流功能。此外,您将全面了解使用ML和MLlib的PySpark的机器学习功能,使用GraphFrames的图形处理以及使用Blaze的多语言持久性。最后,您将学习如何使用spark-submit命令将应用程序部署到云。

在本书的最后,您将对Spark Python API及其如何用于构建数据密集型应用程序有一个深入的了解。

本书采用了非常全面的循序渐进的方法,因此您可以了解Spark生态系统如何与Python一起使用来开发高效,可扩展的解决方案。每一章都是独立的,以非常易于理解的方式编写,重点关注每个概念的方法和原理。

关于本书

  • 了解为何以及如何有效地使用Python处理数据并在Apache Spark 2.0中构建机器学习模型
  • 开发和部署高效,可扩展的实时Spark解决方案
  • 通过本跳转入门指南,将您对Spark的使用理解提升到新的水平

参考资料

你会学到什么

  • 了解Apache Spark和Spark 2.0架构
  • 使用Spark SQL构建Spark DataFrames并与之交互
  • 了解如何分别使用GraphFrames和TensorFrame解决图形和深度学习问题
  • 读取,转换和理解数据并使用它来训练机器学习模型
  • 使用MLlib和ML构建机器学习模型
  • 了解如何使用spark-submit以编程方式提交应用程序
  • 将本地构建的应用程序部署到群集

面向读者

pyspark实战指南 - 2017.pdf

如果您是想要了解Apache Spark 2.0生态系统的Python开发人员,那么本书适合您。对Python的深刻理解有望在本书中发挥最大作用。熟悉Spark会很有用,但不是强制性的

有关Learning PySpark - 2017.pdf @ pyspark实战指南 - 2017.pdf的更多相关文章

  1. ruby-on-rails - Prawn PDF : I need to generate nested tables - 2

    我需要一个表,其中行实际上是2行表,一个嵌套表是..我怎样才能在Prawn中做到这一点?也许我需要延期..但哪一个? 最佳答案 现在支持子表:Prawn::Document.generate("subtable.pdf")do|pdf|subtable=pdf.make_table([["sub"],["table"]])pdf.table([[subtable,"original"]])end 关于ruby-on-rails-PrawnPDF:Ineedtogeneratenested

  2. 微信小程序开发入门与实战(Behaviors使用) - 2

    @作者:SYFStrive @博客首页:HomePage📜:微信小程序📌:个人社区(欢迎大佬们加入)👉:社区链接🔗📌:觉得文章不错可以点点关注👉:专栏连接🔗💃:感谢支持,学累了可以先看小段由小胖给大家带来的街舞👉微信小程序(🔥)目录自定义组件-behaviors    1、什么是behaviors    2、behaviors的工作方式    3、创建behavior    4、导入并使用behavior    5、behavior中所有可用的节点    6、同名字段的覆盖和组合规则总结最后自定义组件-behaviors    1、什么是behaviorsbehaviors是小程序中,用于实现

  3. ruby-on-rails - CarrierWave - PDF - 只选择第一页 - 2

    我的Rails应用程序中安装了carrierwave。但是,当用户上传多页pdf时,我只希望应用程序获取文档中的第一页并将其转换为jpeg。这可能吗?用什么命令?这是我的uploader。#encoding:utf-8classImageUploader[200,300]##defscale(width,height)##dosomething#end#Createdifferentversionsofyouruploadedfiles:version:thumbdoprocess:resize_to_fill=>[150,210]process:convert=>:jpgdefful

  4. Ruby 和指南针路径与 yeoman 项目 - 2

    我安装了ruby​​、yeoman,当我运行我的项目时,出现了这个错误:Warning:Running"compass:dist"(compass)taskWarning:YouneedtohaveRubyandCompassinstalledthistasktowork.Moreinfo:https://github.com/gruUse--forcetocontinue.Use--forcetocontinue.我有进入可变session目标的路径,但它不起作用。谁能帮帮我? 最佳答案 我必须运行这个:geminstallcom

  5. Simulink方法总结和避坑指南(一)——Simulink入门与基本调试方法 - 2

    文章目录一、项目场景二、基本模块原理与调试方法分析——信源部分:三、信号处理部分和显示部分:四、基本的通信链路搭建:四、特殊模块:interpretedMATLABfunction:五、总结和坑点提醒一、项目场景  最近一个任务是使用simulink搭建一个MIMO串扰消除的链路,并用实际收到的数据进行测试,在搭建的过程中也遇到了不少的问题(当然这比vivado里面的debug好不知道多少倍)。准备趁着这个机会,先以一个很基本的通信链路对simulink基础和相关的debug方法进行总结。  在本篇中,主要记录simulink的基本原理和基本的SISO通信传输链路(QPSK方式),计划在下篇记

  6. ruby - Ruby gems 的问题(损坏?)试图让指南针在 npm 中工作 - 2

    我不是Ruby专家,但想弄清楚发生了什么,因为我试图让指南针在节点应用程序中工作,但我的Ruby似乎坏了。打字:ruby--version让我:ruby2.1.1p76(2014-02-24revision45161)[x86_64-darwin13.0]我安装了Homebrew,之前遇到过Ruby版本的问题,但它似乎已安装并且可以正常工作。但是,当我使用gem输入请求时,出现此错误:$gem-hErrorloadingRubyGemsplugin"/Users/user_dir/.rvm/gems/ruby-2.1.1@global/gems/executable-hooks-1.3

  7. ruby - 如何使用远程 API 将 Confluence "Space"导出为 PDF - 2

    如何将Confluence的“空间”导出为pdf文件?看起来Confluence5.0可能仍然支持使用XML-RPCAPI。不过,我找不到调用什么的示例。https://developer.atlassian.com/display/CONFDEV/Remote+API+Specification+for+PDF+Export#RemoteAPISpecificationforPDFExport-XML-RPCInformation该链接表示调用应以pdfexport为前缀,但没有列出任何调用或给出示例。 最佳答案 这可以使用Bob

  8. ruby-on-rails - 保存 PDFKit 中间件显示的 PDF 文件 - 2

    如果有人有兴趣将PDF文件保存在PDFKit中间件gem显示的文件系统中,那么这里是...重写middleware.rb文件的call方法。在覆盖中只需替换这一行:body=PDFKit.new(translate_paths(body,env),@options).to_pdf与pdf=PDFKit.new(translate_paths(body,env),@options)file=pdf.to_file('Your/file/name/path')Mymodel.my_method()#Youcanwriteyourmethodheretousethatfilebody=pdf

  9. ruby - 如何使用 Ruby Prawn 替换现有 PDF 中的单词? - 2

    -你好桑迪普。我是绝地大师尤达的学徒。我的主人相信Ruby社区的力量很强大,并选择了我来完成一项使用Ruby语言完成的简单任务:我需要使用PrawnPDFgem来完成任务。我有一个名为Dooku.pdf的现有pdf文档-它包含有关EvilCountDooku事件的敏感信息。在Dooku.pdf中有一个名为{galaxy}的文本。{galaxy}始终位于pdf文档每一页的相同位置。我需要打开Dooku.pdf,将{galaxy}的每个实例替换为{planet},然后保存/关闭Dooku.pdf。我如何使用PrawnPDFgem完成这个任务?-愿原力与你同在 最

  10. ruby - 如何使用 Gnuplot 创建多页 PDF 文件? - 2

    我通过ruby-gnuplot在Mac上使用Gnuplot绘制了十几个图.如果我重新运行我的ruby​​脚本,那么带有绘图的打开窗口的数量就会翻倍。如果我可以在预览中打开的PDF中输出所有这些图,那么该文件将在每次重新运行后自动更新,我不需要费心关闭众多窗口。目前我只能通过每个PDF文件绘制一个图来实现这一点:Gnuplot.opendo|gp|Gnuplot::Plot.new(gp)do|plot|plot.arbitrary_lines我如何使用Gnuplot将我的所有图形制作成一个PDF? 最佳答案 嗯,至少在UN*x的gn

随机推荐