草庐IT

Java 快速数据存储和检索

coder 2024-03-08 原文

我需要将记录存储到持久存储中并按需检索。要求如下:

  1. 极快的检索和插入
  2. 每条记录都有一个唯一的键。此 key 将用于检索记录
  3. 存储的数据应该是持久的,即应该在 JVM 重启时可用
  4. 一个单独的进程会每天一次将过时的记录移动到 RDBMS

大家怎么看?由于延迟问题,我无法使用标准数据库。像 HSQLDB/H2 这样的内存数据库有性能限制。此外,记录是简单的字符串对象,不符合 SQL 条件。我正在考虑某种基于平面文件的解决方案。有任何想法吗?任何开源项目?我敢肯定,以前一定有人解决过这个问题。

最佳答案

有很多不同的工具和方法,但我认为没有一种可以在所有需求中脱颖而出。

对于低延迟,您只能依赖内存中的数据访问 - 磁盘在物理上太慢(SSD 也是如此)。如果单台机器的内存放不下数据,我们必须将数据分发到更多的节点,以累积足够的内存。

为了持久性,毕竟我们必须将数据写入磁盘。假设最优组织 这可以作为后台 Activity 完成,不会影响延迟。 但是为了可靠性(failover,HA等等),磁盘操作不能完全独立于访问方式:我们在修改数据时必须等待磁盘,以确保我们的操作不会消失。 并发也增加了一些复杂性和延迟。

数据模型这里不做限制:大部分方法都支持基于唯一键的访问。

我们必须决定,

  • 如果数据适合一台机器的内存,或者我们必须找到分布式解决方案,
  • 如果并发是一个问题,或者没有并行操作,
  • 如果可靠性非常严格,我们就不能松动修改,或者我们可以接受意外崩溃会导致数据丢失的事实。

解决方案可能是

  • 使用标准 java 库、文件等自行实现的数据结构可能不是最佳解决方案,因为可靠性和低延迟需要巧妙的实现和大量测试,
  • 传统 RDBMS 具有灵活的数据模型、持久的、原子的和隔离的操作、缓存等 - 它们实际上知道得太多,而且大多难以分发。这就是它们速度太慢的原因,如果您无法关闭不需要的功能(通常是这种情况)。
  • NoSQL键值存储 是不错的选择。这些术语非常模糊,涵盖了很多工具。例子是
    • BerkeleyDB 或 Kyoto Cabinet 作为单机持久键值存储(使用 B 树):如果数据集小到足以容纳一台机器的内存,则可以使用。
    • Project Voldemort 作为分布式键值存储:在内部使用 BerkeleyDB java 版本,简单且分布式,
    • 作为分布式键值存储的 ScalienDB:可靠,但写入速度也不会太慢。
    • MemcacheDB、Redis 等具有持久性的缓存数据库,
    • 流行的 NoSQL 系统,如 Cassandra、CouchDB、HBase 等:主要用于大数据。

可以找到 NoSQL 工具列表,例如。 here .

伏地魔的 performance tests报告亚毫秒响应时间,这些可以很容易地实现,但是我们也必须小心硬件(如上面提到的网络属性)。

关于Java 快速数据存储和检索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1572574/

有关Java 快速数据存储和检索的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  3. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  4. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  5. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  6. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  7. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  8. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  9. ruby - Rack:如何将 URL 存储为变量? - 2

    我正在编写一个简单的静态Rack应用程序。查看下面的config.ru代码:useRack::Static,:urls=>["/elements","/img","/pages","/users","/css","/js"],:root=>"archive"map'/'dorunProc.new{|env|[200,{'Content-Type'=>'text/html','Cache-Control'=>'public,max-age=6400'},File.open('archive/splash.html',File::RDONLY)]}endmap'/pages/search.

  10. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

随机推荐