java - 容错 java xml 解析器
全部标签 我有一个大约150MB的简单文本文件。我的代码将读取每一行,如果它与某些正则表达式匹配,它就会写入输出文件。但是现在,遍历文件的所有行(几分钟)只需要很长时间,就像File.open(filename).eachdo|line|#dosomestuffend我知道循环遍历文件行需要一段时间,因为即使我对“#dosomestuff”中的数据不做任何操作,它仍然需要很长时间。我知道一些unix程序几乎可以立即解析这样的大文件(比如grep),所以我想知道为什么ruby(MRI1.9)读取文件需要这么长时间,有什么方法可以让它更快吗? 最佳答案
我正在从csv导入数据,我需要将一些值转换为BigDecimal,如果无法解析则引发错误。根据测试,BigDecimal("invalidnumber")返回0的BigDecimal。这没问题,但有点乱,除了有效值为0...Float("invalidnumber")的行为不同并抛出异常...我目前的解决方案是:classStringdefto_bdbeginFloat(self)rescueraise"Unabletoparse:#{self}"endBigDecimal(self)endend我是否完全遗漏了什么? 最佳答案 在
我想以编程方式解析.scss文件以生成该文件中使用的选择器的平面列表,主要作为某些静态代码分析的基础。在SASS术语中,我正在寻找一种方法来获取给定.scss文件的所有Sass::Tree::RuleNode的列表。到目前为止,我正在使用Sass::Engine.for_file创建树。然后,根据文档,为了在各个节点上使用Sass::Tree::RuleNode.resolved_rules,我必须使用Tree::Visitors::Cssize。但是某处有一个(可能很简单的)错误。require'sass'sass_engine=Sass::Engine.for_file('file
我正在使用Rails5(Ruby2.4)。我想阅读.xls文档,我想将数据转换为CSV格式,就像它出现在Excel文件中一样。有人推荐我使用Roo,所以我有book=Roo::Spreadsheet.open(file_location)sheet=book.sheet(0)text=sheet.to_csvarr_of_arrs=CSV.parse(text)但是,返回的内容与我在电子表格中看到的内容不同。例如,电子表格中的一个单元格有16:45.81当我从上面获取CSV数据时,返回的是"0.011641319444444444"如何解析Excel文档并准确获取我所看到的内容?我不在
我发现Ruby的each函数有点令人困惑。如果我有一行文本,each循环会给我每个空格分隔的单词,而不是每个单独的字符。那么检索由制表符分隔的字符串部分的最佳方法是什么。目前我有:line.split.eachdo|word|...end但这并不完全正确。 最佳答案 我不确定我是否完全理解你的问题,但如果你想在制表符上拆分行,你可以将其指定为拆分的参数:line.split("\t").each...或者您可以将其指定为正则表达式:line.split(/\t/).each...Each基本上只是遍历数组中的所有项目,split从字
在ruby中,我正在解析以下格式的日期:24092008。我想将每个部分(年、月、日)转换为数字。我使用正则表达式将它们拆分,生成三个字符串,我将它们传递给Integer构造函数。date=~/^([\d]{2})([\d]{2})([\d]{4})/year=Integer($3)month=Integer($2)day=Integer($1)当它到达月份线时,它崩溃如下:`Integer':invalidvalueforInteger:"09"(ArgumentError)我花了一段时间才意识到它将前导零解释为八进制数,而09不是有效的八进制数(它与“07”一起工作正常)。是否
我不知道我做错了什么。我尝试运行“railsc”,但它只是给我一个错误。它在10分钟前工作。:\C:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse':couldn'tparseYAMLatline2column12(Psych::SyntaxError)fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:148:in`parse_stream'fromC:/Ruby192/lib/ruby/1.9.1/psych.rb:119:in`parse'fromC:/Ruby192/lib/ruby/1.9.1/psych.
我无法从字符串中删除空格。我的HTML是:CenaproVás:139 Kč我的代码是:#encoding:utf-8require'rubygems'require'mechanize'agent=Mechanize.newsite=agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky")price=site.search("//p[@class='your-price']/strong/text()")val=price.first.text=>"139 "val.strip=>"139 "val.g
我正在使用git-wiki用于我的个人笔记存储。它工作得很好,除了WikiWords在markdown解析阶段之前使用正则表达式转换为链接。这会弄乱很多东西,例如指向外部wiki页面的链接或block引号(如果我要引用某些内容,我不希望将WikiWord更改为链接)。是否有能够理解WikiLinks的基于ruby的Markdown解析器? 最佳答案 最好的解析器是基于C的解析器(upskirt/sundown),它的ruby迭代是红地毯:https://github.com/tanoku/redcarpet出于性能和安全原因
我正在玩用Ruby编写MUD/文本冒险(请不要笑)。谁能给我任何关于解析输入文本的优雅的、基于oop的解决方案的建议?我们在这里谈论的只是“把魔杖放在table上”更复杂的事情。但是一切都需要柔软;我想稍后轻松地扩展命令集。我目前的想法,稍微简化一下:每个项目类别(盒子、table、房间、播放器)都知道如何识别“属于”它的命令。游戏类理解一种特定于领域的语言,涉及诸如“将对象X移入对象Y”、“显示对象X的描述”等Action。游戏类询问房间中的每个项目是否识别输入命令。先说是赢。然后它将控制传递给项目类中处理命令的方法。此方法重新表述DSL中的命令,将其传递回游戏对象以实现它。必须有一