我的主要原因是对不同的选择发表意见。我在与视频关联的目录中有文件/缩略图,当我必须获取它们时,我使用 glob() 函数 glob(DIRECTORY./file_name*.jpg);并返回视频的所有 JPG 文件的数组。
glob 函数本身非常快,但我仍然担心使用情况,因为在每个页面上可能有 20 到 50 个视频,所以会有 20 到 50 个 glob 调用,我应该继续使用它还是开始将数据放入数据库以获取从那里列出文件而不是 glob(); ?
如果有更好的选择,请告诉我。
谢谢。
最佳答案
与通常的性能问题一样,结果可能会有很大差异,所以答案是:速度越快,对您的效果就越好。
开始的地方是测量你现在做的事情需要多少时间。完成此操作后,问问自己:速度够快吗?可能是这样,虽然它可能不是最快的做事方式,但它仍然很快,速度不是问题。
处理页面的时间中有多少是花在获取文件 glob 上的? 1%? 10%? 50%?这个百分比越高,就越值得考虑改变你做事的方式。
此外,网站的整体性能如何?如果您将每个页面的加载速度提高一倍,人们会注意到吗?如果不是,那么可能真的不值得进行性能调整,即使您看到了明显的调整位置。
如果您认为自己可以做得更好,请使用您的数据库实现该功能并衡量它是否更快。同样,这样做的结果可能变化很大。例如,如果您的 数据库负载很重,从数据库获取结果的速度可能会慢得多。如果你有一个几乎不被使用的强大的数据库,它可能会非常快。只有测试才能告诉您真相。
我要补充一点,您现在做事的方式看起来更简单且更易于维护,因为它会根据磁盘上的实际文件查找文件名。如果您尝试使用数据库,您将不得不担心将数据库中的文件名列表与文件系统中的文件列表同步。
但是,需要注意的一件事是,当您拥有一个包含大量文件的目录时,许多文件系统的性能会更差。如果遇到这种情况,请考虑将文件拆分到多个子目录中。一种流行的方法是创建名称为 a-z 的目录,然后将所有以“a”开头的文件放在“a”目录中,将所有以“b”开头的文件放在“b”目录中,等等。但是,这可能只是一旦您拥有数以万计的文件就很重要,即便如此,它也取决于特定的文件系统及其运行的硬件。
(根据评论编辑:)
由于您在谈论预先计算结果并将其存储在数据库中,我建议比将内容放入数据库更好的方法是使用像 http://memcached.org/这样的缓存服务器。您可以将其视为一种混合方法:您仍然按照现在的方式做事,但是每次您想要结果时,您首先检查缓存以查看它是否包含该结果;如果是,则使用缓存的结果,否则计算新的 glob。这避免了保持数据库和文件系统同步的问题,因为旧的缓存条目可能会过期并被正确的新条目替换。
关于PHP - 读取目录与从数据库中获取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12216095/
我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
好的,所以我的目标是轻松地将一些数据保存到磁盘以备后用。您如何简单地写入然后读取一个对象?所以如果我有一个简单的类classCattr_accessor:a,:bdefinitialize(a,b)@a,@b=a,bendend所以如果我从中非常快地制作一个objobj=C.new("foo","bar")#justgaveitsomerandomvalues然后我可以把它变成一个kindaidstring=obj.to_s#whichreturns""我终于可以将此字符串打印到文件或其他内容中。我的问题是,我该如何再次将这个id变回一个对象?我知道我可以自己挑选信息并制作一个接受该信
我正在使用active_admin,我在Rails3应用程序的应用程序中有一个目录管理,其中包含模型和页面的声明。时不时地我也有一个类,当那个类有一个常量时,就像这样:classFooBAR="bar"end然后,我在每个必须在我的Rails应用程序中重新加载一些代码的请求中收到此警告:/Users/pupeno/helloworld/app/admin/billing.rb:12:warning:alreadyinitializedconstantBAR知道发生了什么以及如何避免这些警告吗? 最佳答案 在纯Ruby中:classA
有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
我有一个存储主机名的Ruby数组server_names。如果我打印出来,它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点,但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类?输出:ge
我想获取模块中定义的所有常量的值:moduleLettersA='apple'.freezeB='boy'.freezeendconstants给了我常量的名字:Letters.constants(false)#=>[:A,:B]如何获取它们的值的数组,即["apple","boy"]? 最佳答案 为了做到这一点,请使用mapLetters.constants(false).map&Letters.method(:const_get)这将返回["a","b"]第二种方式:Letters.constants(false).map{|c
我安装了ruby版本管理器,并将RVM安装的ruby实现设置为默认值,这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时,它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径?谢谢! 最佳答案 我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣,可以在这里获取:http://github.com/senny/rvm.el
假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目? 最佳答案 一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做,或者如果你需要避免为前N个元素构建中间数组,你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit