草庐IT

文本处理

全部标签

ruby-on-rails - 如何将字符串插入文本文件

我有一个配置文件,我想在其中添加一个字符串,例如像那样:line1line2line3line4新字符串不应该被追加,而是写在文件中间的某个地方。因此,我在文件中寻找特定位置(或字符串),找到后,我插入新字符串:file=File.open(path,"r+")while(!file.eof?)line=file.readlineif(line.downcase.starts_with?("line1"))file.write("Somenicelittlesentence")endend问题是Ruby用新文本覆盖了那个位置的行,所以结果如下:line1Somenicelittlese

ruby - 类内的路由处理程序

我有一个Sinatra应用程序设置,其中大部分逻辑在各种类中执行,post/get路由实例化这些类并调用它们的方法。我在考虑将post/get路由处理程序放在类本身中是否会是一个更好的结构。无论如何,我想知道这是否可能。例如:classExampledefsay_hello"Hello"endget'/hello'do@message=say_helloendend如果不修改以上内容,Sinatra会说SinatraApplication对象上没有方法say_hello。 最佳答案 你只需要继承Sinatra::Base:requi

ruby - 快速处理大量 CSV 数据的最佳方式

我有大型CSV数据集(超过1000万行)需要处理。我有两个其他文件需要引用输出-它们包含的数据放大了我们对CSV文件中数百万行的了解。目标是输出一个新的CSV文件,其中每条记录都与来自其他文件的附加信息合并。假设大型CSV文件有交易,但客户信息和账单信息记录在另外两个文件中,我们想要输出一个新的CSV,其中每笔交易都链接到客户ID和账户ID等。一位同事有一个用Java编写的功能程序来执行此操作,但速度很慢。原因是数百万行的CSV文件显然要遍历很多很多次。我的问题是——是的,我已经开始了——我应该如何在Ruby中处理这个问题?目标是让它更快(现在18小时以上,CPU事件很少)我可以将这么

Ruby 文本分析

是否有任何Rubygem或用于文本分析的其他工具?词频、模式检测等(最好懂法语) 最佳答案 词频的概括是语言模型,例如uni-grams(=单个单词频率),bi-grams(=单词对的频率),tri-grams(=世界三元组的频率),...,一般来说:n-grams您应该寻找一个现有的语言模型工具包——在这里重新发明轮子不是一个好主意。有一些可用的标准工具包,例如来自CMUSphinx团队,还有HTK。这些工具包通常是用C编写的(为了速度!!因为你必须处理大量的语料库)并生成标准输出格式的ARPAn-gram文件(这些通常是文本格式

ruby - OptionParser 可以跳过未知选项,以便稍后在 Ruby 程序中处理吗?

有什么办法可以启动OptionParser在一个Ruby程序中多次使用,每次都有不同的选项集?例如:$myscript.rb--subsys1opta--subsys2optb在这里,myscript.rb将使用subsys1和subsys2,将它们的选项处理逻辑委托(delegate)给它们,可能按顺序首先处理'a',然后在单独的OptionParser对象中处理'b';每次选择仅与该上下文相关的选项。最后一个阶段可以检查每个部分处理完他们的部分后是否没有留下任何未知的东西。用例是:在一个松散耦合的前端程序中,各种组件都有不同的参数,我不希望“main”知道所有事情,只是将参数/选项

ruby - 为什么排序或宇宙飞船(飞碟)运算符 (<=>) 在 Ruby 中不能处理 bool 值?

在“Isitpossibletosortalistofobjectsdependingoniftheindividualobject'sresponsetoamethod?”中,我发现飞碟对bool值不起作用。考虑:ruby1.8.7:[true,false].sort#=>undefinedmethod`'fortrue:TrueClass(NoMethodError)truefalse#=>undefinedmethod`'fortrue:TrueClass(NoMethodError)ruby1.9.3:[true,false].sort#=>comparisonofTrueCl

ruby - 将异常处理作为 Ruby 中的常用方法

有人能告诉我有没有办法将异常处理作为一种通用方法并在方法中使用它?让我进一步解释一下。例如我有以下方法defadd(num1,num2)beginnum1+num2rescueException=>eraiseeendenddefdivide(num1,num2)beginnum1/num2rescueException=>eraiseeendend如您所见,尽管我的方法只需要一行,但由于异常处理代码,该方法变得更大了。我正在寻找的是一个更slim的解决方案,比如(只是一个想法)defadd(num1,num2)num1+num2unlessraise_exceptionenddefd

ruby - 如何简洁地将文本附加到文件

代替写作File.open("foo.txt","w"){|f|f.write("foo")}我们可以这样写File.write("foo.txt","foo")有没有更简单的方法来写这个?File.open("foo.txt","a"){|f|f.write("foo")} 最佳答案 这已经得到了很深入的回答:canyoucreate/write/appendastringtoafileinasinglelineinRubyFile.write('some-file.txt','hereissometext',File.size(

ruby-on-rails - 在单词边界处将文本换行

1)我想按单词自动换行,使每行不超过56个字符。有没有办法做到这一点,还是我需要自己动手?@comment_text="Loremipsumdolorsitamet,consecteturadipisicingelit,seddoeiusmodtemporincididuntutlaboreetdoloremagnaaliqua."我的看法:将呈现:Loremipsumdolorsitamet,consecteturadipisicingelit,seddoeiusmodtemporincididuntutlaboreetdoloremagnaaliqua.2)我想将文本缩进4个空格,

ruby-on-rails - 有办法处理 `after_save` 和 `after_destroy` "equally"吗?

我正在使用Rails3.1.0,我想知道是否可以“平等地”处理after_save和after_destroy回调。也就是说,我需要为after_save和after_destroy回调运行相同的方法。此时我必须分别处理这些回调,即使它们完成的是同一件事:after_savedo|record|#Makeathingendafter_destroydo|record|#Makethesamethingasinthe'after_save'callbackend那么,有一种方法可以“平等地”处理after_save和after_destroy吗? 最佳答案