草庐IT

Word-Aware

全部标签

ruby - 尝试从 Word 文档中获取内容时获取 "Ole::Storage::FormatError: OLE2 signature is invalid"

我正在使用Rails5。我想从Word文档(.doc)中获取文本,所以我正在使用这段代码text=nilMSWordDoc::Extractor.load(file_location)do|ctl00_MainContent_List1_grdData|text=contents.whole_contentsend但我收到以下错误。我的Gemfile中有这个gemgem'msworddoc-extractor'我还需要做什么才能从Word文档中获取内容?如果我可以像对.doc文件一样对.docx文件应用相同的代码,那就太好了。/Users/davea/.rvm/gems/ruby-2.

Ruby Regex 非贪婪匹配 : looking for the closest occurrence of a phrase left to a searched word

假设我有以下字符串:"BENffew123X\r\nBENx432f456X\r\nBEN!233789X\r\nBEN4545789X"我想要一个能捕获“BEN!233789”的正则表达式,它必须非贪婪地查找“BEN”,后跟任何字符(不包括“BEN”一词)并以789X结尾。我尝试了正则表达式:/BEN.+?789X/mi,我得到了"BENffew123X\r\nBENx432f456X\r\nBEN!233789X"作为匹配项。我知道这个正则表达式寻找第一个“BEN”并捕获字符串的开头,但我希望它寻找最接近第一个“789X”的“BEN”。我怎样才能做到这一点?一个想法是反转字符串,我

ruby - 如何用ruby解析word文档?

有人知道我可以在OSX/Linux上使用的库来解析Word文件并将内容输出为HTML吗?我看过win32ole,但据我所知,它仅适用于Windows,尽管我可能错了。有什么建议吗? 最佳答案 Word文档格式(暂时忽略docx)很糟糕,而且一直在变化。恕我直言,这就是为什么很少(阅读:零)Ruby库可以解析它们。我推荐的做法是使用JRuby和一些已建立的Java库来阅读文档格式。Google应该可以帮助您:http://schmidt.devlib.org/java/libraries-word.html.有一个用于读取MIcros

ruby 正则表达式 "contains a word"

在Ruby中,如何编写正则表达式来检查提交的单个单词?假设我有一个接受文本的Web表单。我知道如果我想看看句子--only--是否包含"join"我可以使用ifthe_body=="join"但这只有在整个文本提交都是“加入”时才有效。如何捕捉这样的提交:“我想加入你们的俱乐部?”或者“请加入我”谢谢! 最佳答案 你可以这样做string=~/join/i#/imakesitcaseinsensitive或string.match(/join/i)关于性能评论的一点更新:>>s="iwanttojoinyourclub">>n=50

ruby-on-rails - ruby rails : Converting "SomeWordHere" to "some word here"

我知道你可以这样做:"SomeWordHere".underscore.gsub("_","")得到“这里的一些话”。我认为对于如此简单的事情来说可能有点太多了。是否有更有效的方法(也许是内置方法?)将“SomeWordHere”转换为“此处的某个词”? 最佳答案 方法underscore和humanize是为表、类/包名称等之间的转换而设计的,您最好使用自己的代码进行替换以避免惊喜。查看评论。"SomeWordHere".underscore=>"some_word_here""SomeWordHere".underscore.h

ruby 正则表达式 : replace non-word chars that are not space chars

如何替换所有也不是空格字符(\s)的非单词字符(\W)?这是所需的功能:"the(quick)!brown\nfox".gsub(regex,"#")=>“#quick##brown\nfox” 最佳答案 "the(quick)!brown\nfox".gsub(/[^\w\s]/,"#")通过使正则表达式替换任何不是单词字符或空格字符的内容。 关于ruby正则表达式:replacenon-wordcharsthatarenotspacechars,我们在StackOverflow上找到

ruby - 类型错误 : superclass mismatch for class Word in Ruby

我正在创建一个Word类,但出现错误:TypeError:superclassmismatchforclassWord这是irb代码:irb(main):016:0>classWordirb(main):017:1>defpalindrome?(string)irb(main):018:2>string==string.reverseirb(main):019:2>endirb(main):020:1>end=>nilirb(main):021:0>w=Word.new=>#irb(main):022:0>w.palindrome?("foobar")=>falseirb(main):

ruby-on-rails - 在 Ruby 中创建 Microsoft Word (.docx) 文档

有没有一种简单的方法可以在Ruby应用程序中创建Word文档(.docx)?实际上,在我的例子中,它是一个由Linux服务器提供的Rails应用程序。类似于Prawn的gem但对于DOCX代替PDF会很棒! 最佳答案 如前所述,似乎没有任何库可以在Ruby中操作OpenXML文档,但是OpenXMLDeveloper具有关于OpenXML文档格式的完整文档。如果您想要发送一份为每个用户定制的标准文档(如套用信函)副本,考虑到DOCX是一个包含目录层次结构中各个部分的ZIP文件,这应该相当简单。拥有一个DOCX"template",其

ruby-on-rails - rails : How to make Date strftime aware of the default locale?

我在environment.rb中将我的默认语言环境设置为de(德语)。我还看到了德语的所有错误消息,因此服务器选择了语言环境。但是当我尝试使用strftime打印日期时,如下所示:some_date.strftime('%B,%y')它以英语(January,11)打印,而不是预期的德语(Januar,11)。如何根据默认语言环境打印日期? 最佳答案 使用l(localize的别名)方法代替原始strftime,如下所示:l(date,format:'%B%d,intheyear%Y')参见here获取更多信息。您还可以定义“命名

ruby-on-rails - rails : Should partials be aware of instance variables?

例如,RyanBates的nifty_scaffolding就是这样做的编辑.html.erb'form'%>new.html.erb'form'%>_form.html.erb那种隐藏的状态让我觉得不舒服,所以我通常喜欢这样做编辑.html.erb'form',:locals=>{:object=>@my_object}%>_form.html.erb那么哪个更好:a)让部分访问实例变量或b)传递部分它需要的所有变量?最近我一直选择b),但我确实遇到了一些问题:some_action.html.erb'partial',:locals=>{:son=>a_son}%>_partial