我正在尝试将多个邮箱导出到数据库。我当前的脚本将连接 IMAP 并循环播放所有消息。尽管对于较大的邮箱,这将不起作用,并且会减慢甚至停止。
想法是每天运行脚本,将所有不在数据库中的消息“复制”到数据库中。获取大量电子邮件的最佳方式是什么(2 万封邮件分布在大约 40 - 50 个文件夹中)。
最终,这将需要从一台服务器上工作,每天扫描数百甚至数千个帐户(想象一下数据量)。它将邮件(uid 和主题)存储到数据库中,并创建一个将存储在数据服务器上的包(因此它还需要获取附件)。
最佳答案
所以您想通过 IMAP 执行电子邮件备份。有专业的软件工具可以执行此操作。
让我们从简单的事情开始:从收件箱文件夹中为一个特定用户下载一封电子邮件。这需要您 (a) 使用用户的凭据登录,(b) 选择收件箱文件夹,以及 (c) 下载邮件(假设您已经知道它的 UID,即 55)。您在 IMAP 中按如下方式执行此操作(仅请求 - 未显示响应):
01 LOGIN username password
02 SELECT INBOX
03 UID FETCH 55 BODY[]
特定文件夹中的每封邮件都被赋予一个 UID .这是永不更改的邮件的唯一标识符 - 该文件夹中 中的任何其他邮件都不能使用它。新消息的 UID 必须高于之前的消息。这使它成为确定您之前是否已下载邮件的有用工具。
下一步:让我们看看下载 INBOX 文件夹中的所有新邮件。假设您是第一次下载邮件,收件箱当前有 UID 为 54、55 和 57 的邮件。您可以使用如下命令一次性下载这些邮件:
03 UID FETCH 54,55,57 BODY[]
(如果要下载的内容很多,您可能希望分批进行(例如一次 30 次)。)这样做之后,您将存储到目前为止下载的最高 UID。下次,您可以检查是否有更高的 UID,如下所示:
04 UID FETCH 58:* UID
这将(仅)检索具有从 58 开始的 UID 的消息的 UID。如果得到结果,则下载这些结果,并再次存储 UID。等等。
有一个问题。只要文件夹的 UIDVALIDITY 属性(包含在对 SELECT 命令的响应中)不变,消息的 UID 就是有效的。如果由于某种原因发生变化,该文件夹将失效,您需要重新下载该文件夹中的所有邮件。
最后,您希望将其扩展为适用于所有用户的所有文件夹。为了获取特定用户的所有文件夹,您可以使用 IMAP LIST 命令:
05 LIST "" "*"
您需要事先知道用户的凭据并遍历它们。
这是您需要执行的操作背后的 IMAP 理论。用 PHP 实现它留作练习。
关于PHP 获取超过 20000 封 imap 电子邮件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15166280/
有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
我有一个存储主机名的Ruby数组server_names。如果我打印出来,它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点,但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类?输出:ge
我想获取模块中定义的所有常量的值:moduleLettersA='apple'.freezeB='boy'.freezeendconstants给了我常量的名字:Letters.constants(false)#=>[:A,:B]如何获取它们的值的数组,即["apple","boy"]? 最佳答案 为了做到这一点,请使用mapLetters.constants(false).map&Letters.method(:const_get)这将返回["a","b"]第二种方式:Letters.constants(false).map{|c
我安装了ruby版本管理器,并将RVM安装的ruby实现设置为默认值,这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时,它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径?谢谢! 最佳答案 我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣,可以在这里获取:http://github.com/senny/rvm.el
假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目? 最佳答案 一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做,或者如果你需要避免为前N个元素构建中间数组,你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit
我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur
如何在Ruby中获取BasicObject实例的类名?例如,假设我有这个:classMyObjectSystem我怎样才能使这段代码成功?编辑:我发现Object的实例方法class被定义为returnrb_class_real(CLASS_OF(obj));。有什么方法可以从Ruby中使用它? 最佳答案 我花了一些时间研究irb并想出了这个:classBasicObjectdefclassklass=class这将为任何从BasicObject继承的对象提供一个#class您可以调用的方法。编辑评论中要求的进一步解释:假设你有对象
是否可以在应用程序中包含的gem代码中知道应用程序的Rails文件系统根目录?这是gem来源的示例:moduleMyGemdefself.included(base)putsRails.root#returnnilendendActionController::Base.send:include,MyGem谢谢,抱歉我的英语不好 最佳答案 我发现解决类似问题的解决方案是使用railtie初始化程序包含我的模块。所以,在你的/lib/mygem/railtie.rbmoduleMyGemclassRailtie使用此代码,您的模块将在
我有一个应用程序可以读取文件的内容并为其编制索引。我将它们存储在磁盘本身中,但现在我使用的是AmazonS3,因此以下方法不再适用。事情是这样的:defperform(docId)@document=Document.find(docId)if@document.file?#Youshould'tcreateanewversion@document.versionlessdo|doc|@document.file_content=Cloudoc::Extractor.new.extract(@document.file.file)@document.saveendendend@docu
在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList()Obt