Parsing

ruby - 如何用ruby解析word文档？

有人知道我可以在OSX/Linux上使用的库来解析Word文件并将内容输出为HTML吗？我看过win32ole，但据我所知，它仅适用于Windows，尽管我可能错了。有什么建议吗？最佳答案 Word文档格式(暂时忽略docx)很糟糕，而且一直在变化。恕我直言，这就是为什么很少(阅读:零)Ruby库可以解析它们。我推荐的做法是使用JRuby和一些已建立的Java库来阅读文档格式。Google应该可以帮助您:http://schmidt.devlib.org/java/libraries-word.html.有一个用于读取MIcros

何用 ruby section noreferrer http parsing ms-word ms-office

ruby-on-rails - 为什么这两个日期时间不同？

为什么Time.current不等于其解析的等价物？current=Time.current#Wed,16Sep201517:10:56CEST+02:00parsed=Time.zone.parse('16Sep201517:10:56')#Wed,16Sep201517:10:56CEST+02:00current==parsed#false我实际上在RubyonRails应用程序中遇到了这个问题，我尝试根据已解析的日期时间属性查找记录，如最后几行所示。我真的不明白。时区相同，时间相同，精确到秒。这里发生了什么？此外，我应该如何继续根据解析的日期时间查找记录？

ruby-on-rails rails section current parsed ruby parsing datetime

ruby-on-rails - 来自 URL 的 Ruby on Rails 和 JSON 解析器

我使用'gemjson'并需要从一些url加载JSON数据，例如:“http://locallhost:3000/qwerty/give_json.json”与{"one":"Omg","two":125,"three":"Hu"}我有Rails应用程序classQwertyController我得到错误JSON::ParserErrorinQwertyController#get_json795:unexpectedtokenat'http://localhost:3000/qwerty/give_json.json'在字符串中:@data=JSON.parse(JSON.load(

ruby-on-rails Rails 34 code JSON ruby parsing

ruby - Ruby 中从 URL 中删除参数的最优雅的方法是什么？

我想通过名称从URL中取出一个参数，但不知道它是哪个参数，然后重新组合URL。我想我自己使用CGI或URI编写一些东西并不难，但我想这样的功能已经存在了。有什么建议吗？在:http://example.com/path?param1=one¶m2=2¶m3=something3输出:http://example.com/path?param2=2¶m3=something3 最佳答案我更喜欢使用:require'addressable/uri'uri=Addressable::URI.parse('http

ruby param 34 section url parsing

ruby - 如何在 ruby 中读取没有 quote_char 的 CSV？

我有一个没有引号字符的TSV文件。每当数据中出现\t时，它总是分隔列，而不是列值的一部分。每当"出现时，它始终是列值的一部分，并且永远不会包含列值。我想用Ruby阅读这个CSV，但它给了我/Users/.rvm/rubies/ruby-1.9.3-p545/lib/ruby/1.9.1/csv.rb:1925:in`block(2levels)inshift':Illegalquotinginline9506.(CSV::MalformedCSVError)我的代码是:CSV.foreach(input_file,{:col_sep=>"\t",:headers=>true})do|r

ruby 何在 section code 引号 parsing csv double-quotes

ruby - 如何解析 URL 并提取所需的子字符串

假设我有这样一个字符串:"http://something.example.com/directory/"我想做的是解析这个字符串，并从字符串中提取"something"。第一步，显然要检查以确保字符串包含"http://"-否则，它应该忽略该字符串。但是，我如何才能提取该字符串中的"something"？假设这将要评估的所有字符串都具有相似的结构(即我正在尝试提取URL的子域-如果正在检查的字符串确实是一个有效的URL-其中有效以"http://").谢谢。附言我知道如何检查第一部分，即我可以简单地在"http://"处拆分字符串，但这并不能解决全部问题，因为这会产生"http://

并提 ruby code section something parsing

ruby - 学习树顶

我正在尝试自学Ruby的Treetop语法生成器。我发现，不仅“最佳”文档的文档少得可怜，而且它似乎也不像我希望的那样直观地工作。在高层次上，我真的很喜欢比现场文档或视频更好的教程，如果有的话。在较低的层次上，这是一个我根本无法使用的语法:grammarSimpleTestrulenum(float/integer)endrulefloat((('+'/'-')?plain_digits'.'plain_digits)/(('+'/'-')?plain_digits('E'/'e')plain_digits)/(('+'/'-')?plain_digits'.')/(('+'/'-')

树顶 ruby SyntaxNode plain_digits offset parsing grammar treetop

Ruby 1.9.2 - 读取和解析远程 CSV

我正在寻找一种在本地读取和解析远程CSV(托管在特定网站上)的方法。我在Internet上发现了几个使用FasterCSV的有趣示例，在ruby1.9.2中已将其合并到CSV中。我发现您可以通过这种方式使用gems'csv'和'open-uri'读取远程CSV:require'csv'require'open-uri'defread(url)open(url)do|f|f.each_linedo|l|CSV.parse(l)do|row|putsrowendendendend但是当我调用这个函数时，我得到一个异常:ERRORIOError:closedstream谁能告诉我为什么？

Ruby CSV code open parsing rvm

Ruby:将嵌套数组的字符串表示形式解析为数组？

假设我有字符串"[1,2,[3,4,[5,6]],7]"我如何将其解析为数组[1,2,[3,4,[5,6]],7]?嵌套结构和模式在我的用例中是完全任意的。我目前的临时解决方案包括在每个句点后添加一个空格并使用YAML.load，但如果可能的话，我想要一个更简洁的解决方案。(如果可能，不需要外部库的一个) 最佳答案使用JSON正确解析了该特定示例:s="[1,2,[3,4,[5,6]],7]"#=>"[1,2,[3,4,[5,6]],7]"require'json'#=>trueJSON.parses#=>[1,2,[3,4,[5

为数 Ruby code section pre regex arrays parsing

ruby - 如何在 Nokogiri/Ruby 解析期间检查页面上是否存在元素？

在使用Nokogiri(Rubygem)解析HTML页面期间，我如何检查页面上是否存在元素(在本例中为div)？在我的测试页面上，它确实存在，因此pp会产生预期的Nokogiri输出。但是if语句不起作用，==true似乎是错误的方法。有什么改进建议吗？干杯，克里斯pppage.at('.//div[@class="errorMsg"]')ifpage.at('.//div[@class="errorMsg"]')==truethenputs"Errormessagefoundonpage"end 最佳答案与true比较不是正确的

何在 Nokogiri code section ruby parsing

3 4 567 8 9