草庐IT

java - Hibernate、JDBC 和 Java 在大中型结果集上的性能

coder 2023-05-19 原文

问题

我们正在尝试优化我们的数据服务器应用程序。 它通过 mysql 数据库存储股票和报价。 而且我们对获取性能并不满意。

上下文

- database
    - table stock : around 500 lines
    - table quote : 3 000 000 to 10 000 000 lines
    - one-to-many association : one stock owns n quotes
    - fetching around 1000 quotes per request
    - there is an index on (stockId,date) in the quote table
    - no cache, because in production, querys are always different
- Hibernate 3
- mysql 5.5
- Java 6
- JDBC mysql Connector 5.1.13
- c3p0 pooling

测试和结果

协议(protocol)

  • mysql服务器上的执行时间是通过在mysql命令行bin中运行生成的sql查询来获得的。
  • 服务器处于测试环境中:没有其他数据库读取,没有数据库写入
  • 我们为 AAPL 股票获取 857 条报价

案例 1:关联 hibernate

这会用 857 个引号对象填充我们的 stock 对象(在 hibernate.xml 中正确映射的所有内容)

session.enableFilter("after").setParameter("after", 1322910573000L);
Stock stock = (Stock) session.createCriteria(Stock.class).
add(Restrictions.eq("stockId", stockId)).
setFetchMode("quotes", FetchMode.JOIN).uniqueResult();

SQL 生成:

SELECT this_.stockId AS stockId1_1_,
       this_.symbol AS symbol1_1_,
       this_.name AS name1_1_,
       quotes2_.stockId AS stockId1_3_,
       quotes2_.quoteId AS quoteId3_,
       quotes2_.quoteId AS quoteId0_0_,
       quotes2_.value AS value0_0_,
       quotes2_.stockId AS stockId0_0_,
       quotes2_.volume AS volume0_0_,
       quotes2_.quality AS quality0_0_,
       quotes2_.date AS date0_0_,
       quotes2_.createdDate AS createdD7_0_0_,
       quotes2_.fetcher AS fetcher0_0_
FROM stock this_
LEFT OUTER JOIN quote quotes2_ ON this_.stockId=quotes2_.stockId
AND quotes2_.date > 1322910573000
WHERE this_.stockId='AAPL'
ORDER BY quotes2_.date ASC

结果:

  • mysql 服务器上的执行时间:~10 ms
  • Java 中的执行时间:~400ms

案例 2:没有 HQL 的没有关联的 hibernate

为了提高性能,我们使用了只获取报价对象的代码,然后手动将它们添加到股票中(因此我们不会为每一行获取有关股票的重复信息)。我们使用 createSQLQuery 来最小化别名和 HQL 困惑的影响。

String filter = " AND q.date>1322910573000";
filter += " ORDER BY q.date DESC";
Stock stock = new Stock(stockId);
stock.addQuotes((ArrayList<Quote>) session.createSQLQuery("select * from quote q where stockId='" + stockId + "' " + filter).addEntity(Quote.class).list());

SQL 生成:

SELECT *
FROM quote q
WHERE stockId='AAPL'
  AND q.date>1322910573000
ORDER BY q.date ASC

结果:

  • mysql 服务器上的执行时间:~10 ms
  • Java 中的执行时间:~370ms

案例 3:没有 Hibernate 的 JDBC

String filter = " AND q.date>1322910573000";
filter += " ORDER BY q.date DESC";
Stock stock = new Stock(stockId);
Connection conn = SimpleJDBC.getConnection();
Statement stmt = conn.createStatement();
ResultSet rs = stmt.executeQuery("select * from quote q where stockId='" + stockId + "' " + filter);
while(rs.next())
{
    stock.addQuote(new Quote(rs.getInt("volume"), rs.getLong("date"), rs.getFloat("value"), rs.getByte("fetcher")));
}
stmt.close();
conn.close();

结果:

  • mysql 服务器上的执行时间:~10 ms
  • Java 中的执行时间:~100ms

我们的理解

  • JDBC 驱动对所有情况都是通用的
  • JDBC 驱动存在基本的时间成本
  • 使用类似的 sql 查询,Hibernate 比纯 JDBC 代码在对象中转换结果集花费的时间更多
  • Hibernate createCriteria、createSQLQuery 或 createQuery 在时间成本上相似
  • 在生产环境中,我们有大量的并发写入,纯 JDBC 解决方案似乎比 hibernate 的慢(可能是因为我们的 JDBC 解决方案没有被池化)
  • Mysql 方面,服务端似乎表现的很好,时间成本也很可以接受

我们的问题

  • 有没有办法优化 JDBC 驱动的性能?
  • Hibernate 是否会受益于这种优化?
  • 有没有办法在转换结果集时优化 Hibernate 性能?
  • 我们是否因为 Java 基础对象和内存管理而面临一些无法调整的问题?
  • 我们是否遗漏了一点,我们是否愚蠢而这一切都是徒劳的?
  • 我们是法国人吗?是的。

非常欢迎您的帮助。

最佳答案

您能否使用简单查询进行冒烟测试,例如:

SELECT current_timestamp()

SELECT 1 + 1

这将告诉您实际的 JDBC 驱动程序开销是多少。也不清楚这两个测试是否在同一台机器上执行。

Is there a way to optimize the performance of JDBC driver ?

在 Java 中运行相同的查询数千次。 JVM 需要一些时间来预热(类加载,JIT)。另外我假设 SimpleJDBC.getConnection() 使用 C3P0 连接池 - 建立连接的成本非常高,所以前几次执行可能会很慢。

与临时查询或条件查询相比,更喜欢命名查询。

And will Hibernate benefit this optimization ?

Hibernate 是一个非常复杂的框架。如您所见,与原始 JDBC 相比,它消耗了总执行时间的 75%。如果您需要原始 ORM(无延迟加载、脏检查、高级缓存),请考虑 mybatis .或者甚至JdbcTemplateRowMapper抽象。

Is there a way to optimize Hibernate performance when converting result sets ?

不是真的。查看 Chapter 19. Improving performance在 hibernate 文档中。 很多在外面发生了反射+类生成。再说一次,当您想从数据库中挤出每一毫秒时,Hibernate 可能不是最佳解决方案。

但是如果您希望通过广泛的缓存支持来提高整体用户体验,这是一个不错的选择。查看 performance再次文档。它主要谈论缓存。有一级缓存、二级缓存、查询缓存……这就是 Hibernate 可能实际上胜过简单 JDBC 的地方——它可以以你甚至无法想象的方式缓存很多东西。另一方面 - 糟糕的缓存配置会导致设置更慢。

查看:Caching with Hibernate + Spring - some Questions!

Are we facing something not tunable because of Java fundamental object and memory management ?

JVM(尤其是在 server 配置中)非常快。在堆上创建对象的速度与在堆栈上一样快,例如C、垃圾回收做了很大的优化。我不认为运行纯 JDBC 的 Java 版本与更多 native 连接相比会慢得多。这就是为什么我建议对您的基准进行一些改进。

Are we missing a point, are we stupid and all of this is vain ?

如果性能是您最大的问题,我相信 JDBC 是一个不错的选择。 Java 已成功用于大量数据库密集型应用程序。

关于java - Hibernate、JDBC 和 Java 在大中型结果集上的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8573636/

有关java - Hibernate、JDBC 和 Java 在大中型结果集上的性能的更多相关文章

  1. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  2. ruby-on-rails - date_field_tag,如何设置默认日期? [ rails 上的 ruby ] - 2

    我想设置一个默认日期,例如实际日期,我该如何设置?还有如何在组合框中设置默认值顺便问一下,date_field_tag和date_field之间有什么区别? 最佳答案 试试这个:将默认日期作为第二个参数传递。youcorrectlysetthedefaultvalueofcomboboxasshowninyourquestion. 关于ruby-on-rails-date_field_tag,如何设置默认日期?[rails上的ruby],我们在StackOverflow上找到一个类似的问

  3. ruby-on-rails - openshift 上的 rails 控制台 - 2

    我将我的Rails应用程序部署到OpenShift,它运行良好,但我无法在生产服务器上运行“Rails控制台”。它给了我这个错误。我该如何解决这个问题?我尝试更新ruby​​gems,但它也给出了权限被拒绝的错误,我也无法做到。railsc错误:Warning:You'reusingRubygems1.8.24withSpring.UpgradetoatleastRubygems2.1.0andrun`gempristine--all`forbetterstartupperformance./opt/rh/ruby193/root/usr/share/rubygems/rubygems

  4. ruby-on-rails - 相关表上的范围为 "WHERE ... LIKE" - 2

    我正在尝试从Postgresql表(table1)中获取数据,该表由另一个相关表(property)的字段(table2)过滤。在纯SQL中,我会这样编写查询:SELECT*FROMtable1JOINtable2USING(table2_id)WHEREtable2.propertyLIKE'query%'这工作正常:scope:my_scope,->(query){includes(:table2).where("table2.property":query)}但我真正需要的是使用LIKE运算符进行过滤,而不是严格相等。然而,这是行不通的:scope:my_scope,->(que

  5. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  6. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  7. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  8. 报告回顾丨模型进化狂飙,DetectGPT能否识别最新模型生成结果? - 2

    导读语言模型给我们的生产生活带来了极大便利,但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT:判断文本是否为机器生成的工具」中,主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具,它可以帮助我们更好地分辨文章的来源和可信度,对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能,实现和效果等展开。(文末点击“阅读原文”,查看活动回放。)Ericmitchell斯坦福大学计算机系四年级博士生,由ChelseaFinn和Chri

  9. Observability:从零开始创建 Java 微服务并监控它 (二) - 2

    这篇文章是继上一篇文章“Observability:从零开始创建Java微服务并监控它(一)”的续篇。在上一篇文章中,我们讲述了如何创建一个Javaweb应用,并使用Filebeat来收集应用所生成的日志。在今天的文章中,我来详述如何收集应用的指标,使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值,然后一切都回到一个请求。这也意味着这些指标可能不准确,你还想提取最小/

  10. 【Java 面试合集】HashMap中为什么引入红黑树,而不是AVL树呢 - 2

    HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候

随机推荐