java - 容错 java xml 解析器

ruby - 在 Ruby 中解析大文件的最快方法

我有一个大约150MB的简单文本文件。我的代码将读取每一行，如果它与某些正则表达式匹配，它就会写入输出文件。但是现在，遍历文件的所有行(几分钟)只需要很长时间，就像File.open(filename).eachdo|line|#dosomestuffend我知道循环遍历文件行需要一段时间，因为即使我对“#dosomestuff”中的数据不做任何操作，它仍然需要很长时间。我知道一些unix程序几乎可以立即解析这样的大文件(比如grep)，所以我想知道为什么ruby(MRI1.9)读取文件需要这么长时间，有什么方法可以让它更快吗？最佳答案

大文最快长时 code section ruby

ruby - 我怎么知道 BigDecimal 是否解析失败？

我正在从csv导入数据，我需要将一些值转换为BigDecimal，如果无法解析则引发错误。根据测试，BigDecimal("invalidnumber")返回0的BigDecimal。这没问题，但有点乱，除了有效值为0...Float("invalidnumber")的行为不同并抛出异常...我目前的解决方案是:classStringdefto_bdbeginFloat(self)rescueraise"Unabletoparse:#{self}"endBigDecimal(self)endend我是否完全遗漏了什么？最佳答案在

BigDecimal ruby section code

ruby - 如何使用 SASS 解析 .scss 文件中所有 CSS 选择器的列表？

我想以编程方式解析.scss文件以生成该文件中使用的选择器的平面列表，主要作为某些静态代码分析的基础。在SASS术语中，我正在寻找一种方法来获取给定.scss文件的所有Sass::Tree::RuleNode的列表。到目前为止，我正在使用Sass::Engine.for_file创建树。然后，根据文档，为了在各个节点上使用Sass::Tree::RuleNode.resolved_rules，我必须使用Tree::Visitors::Cssize。但是某处有一个(可能很简单的)错误。require'sass'sass_engine=Sass::Engine.for_file('file

ruby SASS visitors visit

ruby-on-rails - 我如何解析一个 Excel 文件，它会给我提供与视觉上完全一样的数据？

我正在使用Rails5(Ruby2.4)。我想阅读.xls文档，我想将数据转换为CSV格式，就像它出现在Excel文件中一样。有人推荐我使用Roo，所以我有book=Roo::Spreadsheet.open(file_location)sheet=book.sheet(0)text=sheet.to_csvarr_of_arrs=CSV.parse(text)但是，返回的内容与我在电子表格中看到的内容不同。例如，电子表格中的一个单元格有16:45.81当我从上面获取CSV数据时，返回的是"0.011641319444444444"如何解析Excel文档并准确获取我所看到的内容？我不在

ruby-on-rails Excel code section pre ruby ruby-on-rails-5 xls roo-gem

ruby - 如何解析 Ruby 中以制表符分隔的文本行？

我发现Ruby的each函数有点令人困惑。如果我有一行文本，each循环会给我每个空格分隔的单词，而不是每个单独的字符。那么检索由制表符分隔的字符串部分的最佳方法是什么。目前我有:line.split.eachdo|word|...end但这并不完全正确。最佳答案我不确定我是否完全理解你的问题，但如果你想在制表符上拆分行，你可以将其指定为拆分的参数:line.split("\t").each...或者您可以将其指定为正则表达式:line.split(/\t/).each...Each基本上只是遍历数组中的所有项目，split从字

制表符本行 section code ruby parsing delimiter lexical-analysis csv

ruby - 如何从可能具有前导零的字符串中解析数字？

在ruby中，我正在解析以下格式的日期:24092008。我想将每个部分(年、月、日)转换为数字。我使用正则表达式将它们拆分，生成三个字符串，我将它们传递给Integer构造函数。date=~/^([\d]{2})([\d]{2})([\d]{4})/year=Integer($3)month=Integer($2)day=Integer($1)当它到达月份线时，它崩溃如下:`Integer':invalidvalueforInteger:"09"(ArgumentError)我花了一段时间才意识到它将前导零解释为八进制数，而09不是有效的八进制数(它与“07”一起工作正常)。是否

ruby 如何 Integer section code string date types

ruby-on-rails - Rails 3 - 'Couldn' t 解析 Yaml'

我不知道我做错了什么。我尝试运行“railsc”，但它只是给我一个错误。它在10分钟前工作。:\C:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse':couldn'tparseYAMLatline2column12(Psych::SyntaxError)fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse_stream'fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:119:in`parse'fromC:/Ruby192/lib/ruby/1.9.1/psych.

amp ruby-on-rails gems lib from ruby ruby-on-rails-3 yaml psych

ruby - 我无法从 Nokogiri 解析的字符串中删除空格

我无法从字符串中删除空格。我的HTML是:CenaproVás:139 Kč我的代码是:#encoding:utf-8require'rubygems'require'mechanize'agent=Mechanize.newsite=agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky")price=site.search("//p[@class='your-price']/strong/text()")val=price.first.text=>"139 "val.strip=>"139 "val.g

Nokogiri ruby code section 34 whitespace mechanize mechanize-ruby

支持 WikiWord 的 ruby markdown 解析器？

我正在使用git-wiki用于我的个人笔记存储。它工作得很好，除了WikiWords在markdown解析阶段之前使用正则表达式转换为链接。这会弄乱很多东西，例如指向外部wiki页面的链接或block引号(如果我要引用某些内容，我不希望将WikiWord更改为链接)。是否有能够理解WikiLinks的基于ruby的Markdown解析器？最佳答案最好的解析器是基于C的解析器(upskirt/sundown)，它的ruby迭代是红地毯:https://github.com/tanoku/redcarpet出于性能和安全原因

WikiWord markdown section noreferrer https ruby git wiki

ruby - 基于 OOP 的文本游戏中的优雅命令解析

我正在玩用Ruby编写MUD/文本冒险(请不要笑)。谁能给我任何关于解析输入文本的优雅的、基于oop的解决方案的建议？我们在这里谈论的只是“把魔杖放在table上”更复杂的事情。但是一切都需要柔软；我想稍后轻松地扩展命令集。我目前的想法，稍微简化一下:每个项目类别(盒子、table、房间、播放器)都知道如何识别“属于”它的命令。游戏类理解一种特定于领域的语言，涉及诸如“将对象X移入对象Y”、“显示对象X的描述”等Action。游戏类询问房间中的每个项目是否识别输入命令。先说是赢。然后它将控制传递给项目类中处理命令的方法。此方法重新表述DSL中的命令，将其传递回游戏对象以实现它。必须有一

ruby OOP section 的游戏类 language-agnostic nlp

5 6 789 10 11