草庐IT

java - 通过批量读取避免 N+One 选择和来自 eclipselink 的无效结果

coder 2024-03-07 原文

我试图减少我的应用程序产生的 n+1 选择次数,该应用程序使用 EclipseLink 作为 ORM,并且在尽可能多的地方我尝试将批量读取提示添加到查询中。在应用程序的很多地方,我并不总是确切地知道我将遍历哪些关系(我的 View 根据用户偏好显示字段)。那时我想运行一个查询来为我的对象填充所有这些关系。

我的梦想是调用类似 ReadAllRelationshipsQuery(Collection,RelationshipName) 的方法并填充所有这些项目,以便以后调用:

Collection.get(0).getMyStuff 将已经被填充并且不会导致数据库查询。我怎样才能做到这一点?我愿意编写任何我需要的代码,但我找不到与 eclipselink 框架一起工作的方法?

Why don't I just batch read all of the possible fields and let them load lazily? What I've found is that the batch value holders that implement batch reads don't behave well with the eclipselink cache. If a batch read value holder isn't "evaluated" and ends up in the eclipse link cache it can become stale and return incorrect data (This behavior was logged as an eclipselink bug but rejected...) edit: I found the link to the bug here: https://bugs.eclipse.org/bugs/show_bug.cgi?id=326197

如何避免对我已经引用的对象进行 N+1 选择?

最佳答案

您可以通过三种基本方法将数据从基于 JPA 的解决方案加载到对象中。它们是:

  1. 通过对象遍历动态加载(例如 myObject.getMyCollection().get())。
  2. 使用 JPA QL(例如 the Oracle JPA tutorial 中描述的 FETCH JOIN)动态预取来加载对象图
  3. 通过设置获取模式加载(Is there a way to change the JPA fetch type on a method?)

这些都各有利弊。

  1. 通过对象横向动态加载将生成更多(高度针对性的查询)。这些查询通常很小(不是大型 SQL 语句,但可能会加载大量数据)并且往往可以很好地与二级缓存一起使用,但您可以获得很多很多小查询。
  2. 使用 JPA QL 预取将为您提供您想要的东西,但前提是您知道自己想要什么。
  3. 将获取模式设置为 EAGER 会自动为您加载大量数据,但根据配置和使用情况,这实际上可能没有太大帮助(或者可能使事情变得更糟),因为您可能会拖入大量数据数据库中的数据到您的应用程序中,这是您没有预料到的。

无论如何,我强烈建议将 p6spy ( http://sourceforge.net/projects/p6spy/) 与任何基于 JPA 的应用程序结合使用,以了解您的调优效果。

不幸的是,JPA 使一些事情变得容易,也使一些事情变得困难——主要是您的使用带来的副作用。例如,您可以通过将获取模式设置为 eager 来解决一个问题,然后创建另一个问题,即 eager 获取获取过多数据。 EclipseLink 确实提供了工具来帮助解决这个问题(EclipseLink Performance Tools)

理论上,如果您愿意,可以使用类似Apache BeanUtils 的东西编写一个通用的JavaBean 属性遍历器。 .通常只需在集合上调用 size() 之类的方法就足以强制加载它(尽管使用集合批量获取大小可能会使事情变得有点复杂)。

要特别注意的一件事是您的 session 范围和您对缓存的使用 (EclipseLink cache)。

从您的帖子中不清楚的是 session 的范围。 session 是一次性事件(例如网页请求)还是长期运行的事件(例如经典客户端/服务器 GUI 应用程序)?

关于java - 通过批量读取避免 N+One 选择和来自 eclipselink 的无效结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5752036/

有关java - 通过批量读取避免 N+One 选择和来自 eclipselink 的无效结果的更多相关文章

  1. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  2. ruby - 通过 rvm 升级 ruby​​gems 的问题 - 2

    尝试通过RVM将RubyGems升级到版本1.8.10并出现此错误:$rvmrubygemslatestRemovingoldRubygemsfiles...Installingrubygems-1.8.10forruby-1.9.2-p180...ERROR:Errorrunning'GEM_PATH="/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/ruby-1.9.2-p180@global:/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/rub

  3. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  4. ruby - 通过 erb 模板输出 ruby​​ 数组 - 2

    我正在使用puppet为ruby​​程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby​​不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

  5. Ruby 写入和读取对象到文件 - 2

    好的,所以我的目标是轻松地将一些数据保存到磁盘以备后用。您如何简单地写入然后读取一个对象?所以如果我有一个简单的类classCattr_accessor:a,:bdefinitialize(a,b)@a,@b=a,bendend所以如果我从中非常快地制作一个objobj=C.new("foo","bar")#justgaveitsomerandomvalues然后我可以把它变成一个kindaidstring=obj.to_s#whichreturns""我终于可以将此字符串打印到文件或其他内容中。我的问题是,我该如何再次将这个id变回一个对象?我知道我可以自己挑选信息并制作一个接受该信

  6. ruby - 通过 ruby​​ 进程共享变量 - 2

    我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是

  7. ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2

    我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止,这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search

  8. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  9. ruby-on-rails - Enumerator.new 如何处理已通过的 block ? - 2

    我在理解Enumerator.new方法的工作原理时遇到了一些困难。假设文档中的示例:fib=Enumerator.newdo|y|a=b=1loopdoy[1,1,2,3,5,8,13,21,34,55]循环中断条件在哪里,它如何知道循环应该迭代多少次(因为它没有任何明确的中断条件并且看起来像无限循环)? 最佳答案 Enumerator使用Fibers在内部。您的示例等效于:require'fiber'fiber=Fiber.newdoa=b=1loopdoFiber.yieldaa,b=b,a+bendend10.times.m

  10. ruby-on-rails - Rails 5 Active Record 记录无效错误 - 2

    我有两个Rails模型,即Invoice和Invoice_details。一个Invoice_details属于Invoice,一个Invoice有多个Invoice_details。我无法使用accepts_nested_attributes_forinInvoice通过Invoice模型保存Invoice_details。我收到以下错误:(0.2ms)BEGIN(0.2ms)ROLLBACKCompleted422UnprocessableEntityin25ms(ActiveRecord:4.0ms)ActiveRecord::RecordInvalid(Validationfa

随机推荐