草庐IT

apache-spark-2.3

全部标签

ruby-on-rails - 为什么在部署 Rails 应用程序时需要 Apache 服务器?

虽然我们可以用webrick或mongrel部署它 最佳答案 大多数Ruby应用程序服务器只会运行一个Ruby进程(Ruby有一个全局解释器锁,这使得多线程变得毫无意义),这意味着它一次只能处理一个请求。至少可以说,这不会给你很好的表现。有两种解决方法:运行多个Ruby应用程序服务器并在它们前面放置一个负载平衡器或反向代理,例如Nginx或Apache在一堆Mongrels或瘦服务器前面(您运行的进程数反射(reflect)了您将能够并行处理的请求数)。或者你运行Passenger,它是一个Apache或Nginx模块,管理一个应用

ruby-on-rails - 有必要把Unicorn放在Nginx(或Apache)后面吗

我对这个架构有点困惑。在我正在进行的一个项目中,Unicorn被选为Rails服务器。它放在Nginx网络服务器后面。据我了解,Unicorn是功能齐全的Web服务器,我们不打算在同一服务器实例上托管任何其他Rails应用程序。所以我的问题是:在链中添加附加层有什么好处:client->nginx->unicorn->unicornworker 最佳答案 Unicorn不是为处理“慢客户端”而设计的。您可以在PHILOSOPHY中阅读更多相关信息帮助文件:Mostbenchmarkswe’veseendon’ttellyouthis

ruby-on-rails - 如何在 Windows 中为 Ruby on Rails 配置 Apache 2.2?

我正尝试着手编写一些RubyonRails应用程序并在Mongrel上取得了成功,但是,我想将我的应用程序部署到Windows上的Apache2.2实例吗?我发现的所有教程似乎都已过时,并且适用于旧版本的Apache/Rails。有人知道为RubyonRails应用程序配置Apache2.2的最新好教程吗? 最佳答案 编辑:至少在Win出现PhusionPassenger之前,Apache+Mongrel是可行的方法。您可以在没有Mongrel的情况下使用Apache+FastCGI,但在实际负载下您会遇到(更多)僵尸进程和(更多)

ruby-on-rails - 在 Apache 下的子目录中配置 Ruby On Rails App

我在Windows上安装了apache2.2。我正在尝试同时提供颠覆(/svn)和redmine(/redmine)。我的svn使用此配置运行良好:DAVsvnSVNParentPathC:/svn_repository...这很好用——我的svn用户可以点击http://mybox/svn就好了。现在我想为Rails应用程序(RedMine)添加另一个目录:我遵循了thisquestion中的建议设置杂种服务器并让apache代理客户端连接到它。如果我将它设为根目录,它工作正常——但我在将它设为子目录时遇到了问题:ProxyPasshttp://localhost:3000/Prox

ruby-on-rails - 使用 passenger 在 Apache 上设置 Rails 应用程序 - Rails 似乎无法加载

我正在尝试按照https://help.ubuntu.com/community/RubyOnRails等文档在Ubuntu实例上设置Rails.我正在尝试从此处的Rails入门页面设置应用程序:http://guides.rubyonrails.org/getting_started.html.到目前为止我做了什么:通过RVM和GEM安装Ruby/RubyGems/Rails(这安装了Ruby1.9.2和Rails3.0.7)安装mysql和mysql2模块(后者不起作用)创建Rails应用程序(教程指导的博客应用程序)/home/me/www/blog/public/来自/var/

ruby-on-rails - Ruby on Rails 3 + Apache2 + Phusion Passenger:Bundler::GemNotFound 异常

我正在尝试使用PhusionPassenger在Apache2服务器上部署Rails应用程序。虽然一切都在本地运行良好,但我在部署时遇到了臭名昭著的“Bundler::GemNotFound”错误:Couldnotfindabstract-1.0.0inanyofthesources(Bundler::GemNotFound)我所有的gem都安装在我的本地主文件夹中。因此,我的Apache2配置文件中的乘客配置行如下:LoadModulepassenger_module/home/regis/.gem/gems/passenger-3.0.7/ext/apache2/mod_passe

ruby-on-rails - 为什么 Apache 还没有可行的 mod_ruby?

尽管Ruby和Rails很流行,但这个问题似乎早就解决了。JRuby和mod_rails都很好,很花哨,但为什么没有直接用于Ruby的Apachemod? 最佳答案 有PhusionPassenger,一个强大的Apache模块,可以运行Rack最低配置的应用程序。它对共享主机越来越有吸引力,将任何程序变成Rack应用程序都非常容易:ARackapplicationisanRubyobject(notaclass)thatrespondstocall.Ittakesexactlyoneargument,theenvironmenta

ruby - 在 Apache 中设置 Ruby CGI

我想通过CGI在Apache中使用Ruby。我的配置文件中有以下内容:DocumentRoot/home/ceriak/rubyOptions+ExecCGIAddHandlercgi-script.rbtest.rb是放在/home/ceriak/ruby/下的测试文件,#!/usr/bin/ruby包含在第一行并赋予可执行权限。不过,当我访问localhost/test.rb时,我会看到一个下载窗口并可以获得源代码。有趣的是,当我将相同的脚本放在/usr/lib/cgi-bin/下并调用localhost/cgi-bin/test.rb时,它按预期工作.(Ubuntu9.10上的A

Spark RDD转换成DataFrame的两种方式

spark官方提供了两种方法实现从RDD转换到DataFrame。第一种方法是利用反射机制来推断包含特定类型对象的Schema,这种方式适用于对已知的数据结构的RDD转换; 第二种方法通过编程接口构造一个Schema,并将其应用在已知的RDD数据中。一、反射机制推断Schema实现反射机制Schema需要定义一个caseclass样例类,定义字段和属性,样例类的参数名称会被反射机制利用作为列名objectRddToDataFrameByReflect{//定义一个student样例类caseclassStudent(name:String,age:Int)defmain(args:Array[

Spark Kafka流媒体 - 如何确定批次的末端

我使用Kafka流媒体从KAFKA主题中消费。(KafkaDirect流)此主题中的数据每5分钟从另一个来源到达。现在,我需要处理每5分钟后到达的数据,并将其转换为SparkDataFrame。现在,流是数据的连续流。我的问题是,如何确定我已经完成了在Kafka主题中加载的第一组数据的阅读?(以便我可以将其转换为数据框架并开始我的工作)我知道我可以提及某个数字的批处理间隔(在JavastreamingContext中),但是即使那样,我也永远无法确定源将数据将数据推到主题的时间。欢迎任何建议。看答案如果我正确理解您的问题,您希望不创建批处理,直到阅读5分钟的所有数据。开箱即用的Spark不会提