草庐IT

ajax - HTML5 Ajax 到不同的域?

全部标签

ruby-on-rails - 如何使用 Nokogiri 解析 HTML 表格?

我正在尝试解析一个表,但我不知道如何从中保存数据。我想将每一行中的数据保存为:['Rawname1',2,094,0,017,0,098,0,113,0,452]示例表是:html=TablenameColumnname1Columnname2Columnname3Columnname4Columnname5Rawname12,0940,0170,0980,1130,452...Rawname52,0940,0170,0980,1130,452EOT我的爬虫代码是:doc=Nokogiri::HTML(open(html),nil,'UTF-8')tables=doc.css('div

ruby - Jekyll - 生成 JSON 文件和 HTML 文件

我想让Jekyll为每个页面和帖子创建一个HTML文件和一个JSON文件。这是为了提供我的Jekyll博客的JSONAPI——例如可以在/posts/2012/01/01/my-post.html或/posts/2012/01/01/my-post.json访问帖子有谁知道是否有Jekyll插件,或者我将如何开始编写这样的插件来并排生成两组文件? 最佳答案 我也在寻找类似的东西,所以我学习了一些ruby​​并制作了一个脚本来生成Jekyll博客文章的JSON表示。我仍在努力,但大部分都在那里。我将其与Gruntjs、Sass、Bac

ruby - 将 HTML 转换为纯文本(包含 <br>s)

是否可以使用Nokogiri将HTML转换为纯文本?我还想包括标签。例如,给定这个HTML:alamakotaikottoidiota我想要这个输出:alamakotaikottoidiota当我调用Nokogiri::HTML(my_html).text它不包括标签:alamakotaikottoidiota 最佳答案 我没有编写复杂的正则表达式,而是使用了Nokogiri。工作解决方案(K.I.S.S!):defstrip_html(str)document=Nokogiri::HTML.parse(str)document.c

ruby - 选择一个随机选项,其中每个选项被选中的概率不同

假设给您三个“选项”,A、B和C。您的算法必须随机选择并返回一个。为此,只需将它们放在一个数组{A,B,C}中并生成一个随机数(0、1或2),这将是元素在返回数组。现在,这个算法有一个变体:假设A有40%的机会被选中,B有20%,而C40%。如果是这种情况,您可以采用类似的方法:生成一个数组{A,A,B,C,C}并生成一个随机数(0,1,2,3,4)选择要返回的元素。行得通。但是,我觉得效率很低。想象一下,将此算法用于大量选项。你会创建一个有点大的数组,可能有100个元素,每个元素代表1%。现在,这仍然不是很大,但假设您的算法每秒使用多次,这可能会很麻烦。我考虑过创建一个名为Slot的

ruby-on-rails - bundler Rails 在开发中需要不同的 gem

我正在尝试设置用于开发Railsgem的开发环境。我想在开发模式下从本地源加载gem,在生产模式下通过ruby​​gems加载gem。我想做如下事情:gem文件group:productiondogem'my_gem','1.0.0'endgroup:developmentdogem'my_gem',:path=>'~/apps/my_gem'end当我运行bundle命令时,bundler提示你不能加载同一个gem两次。有没有办法根据Rails环境要求不同版本的gem? 最佳答案 我遇到过同样的问题,并且是这样解决的:ifENV[

ruby-on-rails - Standalone ruby​​ -- 如何从database.yml加载不同环境

我有一个修改数据库中记录的后台进程。模型使用如下方式连接到数据库:dbconfig=YAML::load(File.open('database.yml'))ActiveRecord::Base.establish_connection(dbconfig["development"])classClcar所有模型类的顶部都有这些行。我同意这是一种糟糕的做法。有没有更好的方法来连接到模型类?如何将连接传递给模型?我希望能够在不同的环境(比如“生产”)中运行我的后台进程。我该如何实现? 最佳答案 我会在您的后台进程开始时设置一次连接。一

ruby - 使用 Mechanize 读取本地 HTML 文件

我正在构建一个爬虫,我知道如何使用ruby​​mechanize使用以下代码从网上读取页面:require'mechanize'agent=Mechanize.newagent.get"http://google.com"但是我可以使用Mechanize从文件系统中读取HTML文件吗?怎么办? 最佳答案 仅使用file://协议(protocol)对我来说效果很好:html_dir=File.dirname(__FILE__)page=agent.get("file:///#{html_dir}/example-file.html"

ruby - 我如何使用 .html.erb 作为 Sinatra View 的文件扩展名?

如果我有以下Sinatra代码:get'/hi'doerb:helloend如果我有一个名为views/hello.erb的文件,这会很好用。但是,如果我有一个名为views/hello.html.erb的文件,Sinatra找不到该文件并给我一个错误。我如何告诉Sinatra我希望它查找.html.erb作为有效的.erb扩展名? 最佳答案 Sinatra使用Tilt呈现其模板,并将扩展与其相关联。您所要做的就是告诉Tilt它应该使用ERB来呈现该扩展:Tilt.registerTilt::ERBTemplate,'html.er

ruby-on-rails - 为什么一个空的 Rails 进程每次启动时都会有不同的内存占用?

我们一直在努力找出如何通过识别内存消耗大的gem并寻找替代方案或解决方案来减少我们的Rails应用程序的启动内存占用量。但在OSX上有一种行为令我感到莫名其妙。使用全新生成的Rails应用程序(railsnewmemoryusage),没有Gemfile,没有模型,没有数据,也没有事务,启动railsc时内存每次启动时,对应的ruby​​进程的OSX显示都会有所不同,从低至60MB到高至65MB,没有明显的模式说明为什么同一个应用程序每次执行可能需要更少或更多的内存。我想这在某种程度上与Ruby分配内存的方式有关,但我不完全清楚为什么对于相同的代码且没有变量处理,它的内存分配会变化如此

ruby - 运行脚本与 IRB 控制台时的不同行为?

我有一个简单的代码片段,它定义了一个方法(在Ruby的主对象上),然后检查它是否已定义。puts"#{self}#{self.class}"deffoo;endputsself.methods.include?(:foo)当我在Ruby控制台中运行它时。我得到:mainObjecttrue如果我将此代码粘贴到.rb文件中并像这样运行该文件rubytest_script.rb,我会得到以下输出mainObjectfalse我不明白为什么我会看到这种行为。方法正在在脚本中定义,因为我可以调用该方法。我都在Ruby2.3.4上运行 最佳答案