草庐IT

java - redis pub sub 和/或列表来实现数据收集器

coder 2023-11-07 原文

我正在开发一个需要按计划从第三方系统收集数据的模块,比如每 5 分钟一次。

启动数据收集的触发器来自 Multi-Tenancy UI。因此,10 个租户可以告诉该模块同时开始收集数据。

我从使用一个简单的 redis 队列开始,所有来自 UI 的启动请求都被发送到队列中,该模块充当工作人员,获取作业并运行它们。

问题是我们需要在 1 分钟内完成一个数据收集周期,如果有 100 个作业,如果我们连续进行,我们将花费一分钟多的时间。数据收集需要按计划进行。所以 UI 说每 5 分钟运行一次数据收集,直到我说停止!

因此,我们添加了另一个可以开始减轻负载的工作器。

我的问题是:如何在不在其中一个工作人员中保持状态(预定线程执行程序)的情况下实现常规计划?

我是不是想太多了,可以用更简单的方法来完成吗?

我现在的设计有一种 cron 作业,每 1 分钟从数据库中读取一次数据收集请求,然后将它们放入工作人员接收请求的队列中。

最佳答案

使用 beanstalkd在这种情况下,可能是比使用 Redis 更好的选择。

Beanstalkd 与 Redis 有很多共同点:易于部署、简单、轻便、快速、默认在内存中、通过简单的文本协议(protocol)进行通信,很多 clients in various languages ...但它专用于任务管理,它不是数据库。您可以动态地添加或删除工作人员,而无需在 beanstalkd 端进行任何配置。

您将作业放入“管”(队列的 beanstalkd 名称),然后工作人员可以保留它们——一次一个。一旦它保留了一个工作,一个 worker 就有完成它的最大时间(称为 TTR — 运行时间),否则该工作将被 beanstalkd 释放,重新放入管中,因此可能由另一个 worker 处理。

作业只是一个字符串;例如,它可以是描述要执行的任务的序列化 Json。

如果我对你的问题的理解是正确的,UI 租户可以创建具有正常优先级的作业来开始数据收集,并将它们放入一个独特的管中。一个或几个 worker 将从这个管中“保留”(获取)一个作业,处理它,删除它以通知 beanstalkd 它已经完成,然后保留另一个作业,等等。

保留删除 -----> [就绪] --------> [保留] --------> *噗*

(此模式的来源:beanstalkd 的协议(protocol)文档)

对于一个没有任何调度器每5分钟重复处理的作业,你可以说每次一个worker消费一个作业,它创建一个新的,并在将它放入时使用beanstalkd的“put with delay”特性 pipe 。因此,只有在延迟到期时(在您的情况下为 5 分钟),工作才会呈现给工作人员。

当 UI 想要取消剩余的作业时,它可以从管中挑选并删除所有作业。或者,如果您希望工作人员删除它们,则 UI 可以将优先级高于数据收集作业的取消作业(将其视为消息)放入管中。您也可以使用另一个电子管,假设您是在另一个线程而不是专门用于数据收集的线程中收听它。

我对你的问题的了解和理解显然是有限的,但你当然可以提炼这些想法来解决你的确切问题。

关于java - redis pub sub 和/或列表来实现数据收集器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39748609/

有关java - redis pub sub 和/或列表来实现数据收集器的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby - RVM 使用列表[0] - 2

    是否有类似“RVMuse1”或“RVMuselist[0]”之类的内容而不是键入整个版本号。在任何时候,我们都会看到一个可能包含5个或更多ruby的列表,我们可以轻松地键入一个数字而不是X.X.X。这也有助于rvmgemset。 最佳答案 这在RVM2.0中是可能的=>https://docs.google.com/document/d/1xW9GeEpLOWPcddDg_hOPvK4oeLxJmU3Q5FiCNT7nTAc/edit?usp=sharing-知道链接的任何人都可以发表评论

  3. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  4. ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2

    我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征,我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现,但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden

  5. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  6. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  7. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  8. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  9. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  10. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

随机推荐