草庐IT

java - 即时插入大型数据集

插值大型数据集我有一个包含大约50万条记录的大型数据集,这些记录代表了给定一天内美元/英镑之间的汇率。我有一个应用程序希望能够绘制此数据或一个子集的图形。出于显而易见的原因,我不想在图表上绘制50万个点。我需要的是一个较小的数据集(100点左右),它可以(尽可能)准确地表示给定的数据。有谁知道可以通过任何有趣且高效的方式获取这些数据?干杯,卡尔 最佳答案 有多种统计方法可以将大型数据集缩减为更小、更易于可视化的数据集。从您的问题中不清楚您想要什么汇总统计数据。我只是假设您想了解汇率如何随时间变化,但您可能对汇率超过某个值的频率或其他

java - 大型内部类和私有(private)变量

我遇到过几次的一件事是服务类(如JBoss服务)由于辅助内部类而变得过大。我还没有找到打破类的好方法。这些助手通常是线程。这是一个例子:/**Assetservicekeepstrackofthemetadataaboutassetsthatliveonother*systems.Complicationsincludethefacttheassetshavealifecycleandtheir*physicalrepresentationlivesonothersystemsthathavetobepolledtofind*outiftheAssetisstillthere.*/pu

java - jdbc + 大型 postgresql 查询内存不足

我正在尝试执行一个返回较大结果的postgresql查询:connection.setAutoCommit(false);st=connection.createStatement(ResultSet.CONCUR_READ_ONLY,ResultSet.TYPE_FORWARD_ONLY);st.setFetchSize(100);logMemory();System.out.println("startquery");rs=st.executeQuery(queryString);System.out.println("donequery");logMemory();但这会占用大量

java - 您如何开始设计大型系统?

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion有人向我提到我将成为大型新系统背后的唯一开发人员。除其他事项外,我将设计UI和数据库架构。我确定我会得到一些指导,但我希望能够让他们大吃一惊。在此期间我可以做些什么来准备,当我坐在电脑前看规范时需要记住什么?需要牢记的几件事:我是一名大学生,正在从事第一份真正的编程工作。我将使用Java。我们已经设置了带有自动化测试等的SCM...因此工具不是问题。

基于大型语言模型和向量数据库开发新闻推荐系统

译者|朱先忠审校|重楼近年来,随着诸如ChatGPT、Bard等生成式人工智能工具的发布,大型语言模型(LLM)在机器学习社区引起了全球热议。这些解决方案背后的核心思想之一是计算非结构化数据(如文本和图像)的数字表示,并找出这些表示之间的相似之处。然而,将所有这些概念应用到生产环境中存在其自身的一系列机器学习工程挑战:如何快速生成这些表示?如何将它们存储在适当的数据库中?如何快速计算生产环境的相似性?在这篇文章中,我将介绍两种开源解决方案,目的是解决下面这些问题:句子变换器(https://www.sbert.net/;参考引文1):一种基于文本信息的嵌入生成技术;Qdrant(https:/

java - 在现有的大型 Java 代码库中构建测试套件

我正在开发一个Web应用程序,其现有代码库可能已经存在10年了,有大约1000个类文件和大约100,000行代码。好消息是代码组织良好,业务逻辑与Controller域分离,并且具有高水平的可重用性。坏消息是测试套件(JUnit)还刚刚开始;最多可能有12打测试。代码的组织非常典型,适用于企业Java项目。有一个类似stuts的Controller包,该模型几乎由纯数据对象组成,有一个类似于hibernate的数据库层,主要封装在数据访问对象中,以及一些简单、自包含和逻辑的服务包。构建此测试套件的最终目标是朝着持续集成开发过程迈进。您将如何为此类应用程序构建测试套件?您会使用哪些工具来

java - 实现大型状态机的最佳方式?

基本上我有一个状态机来控制游戏角色的攻击,其时间基于动画长度。例如:我从默认状态开始,如果玩家按下攻击按钮,它就会开始攻击,切换状态并根据攻击长度设置计时器。然而,当我考虑可以取消的充电攻击时,状态机变得更加复杂,攻击可以根据攻击的目标转移到不同的状态,而且每个状态都有独特的方式来处理被攻击的角色。目前我有大量的switch语句。我考虑过多态性,但这需要为每个有很多状态的新类(例如,开始攻击、攻击和完成攻击都需要单独的状态)。switch语句有效,但它非常大,而且不像基于继承的系统那样容易修改。对美观的实现有什么建议吗?编辑:这是使用java。 最佳答案

java - 处理大型 Java 项目中内存泄漏的最佳实践?

在我参与的几乎所有大型Java项目中,我都注意到应用程序的服务质量会随着容器的正常运行时间而降低。这很可能是由于代码中的内存泄漏。解决这个问题的正确方法显然是追溯问题的根本原因,修复代码中的漏洞。解决问题的快速而肮脏的方法是简单地重新启动Tomcat(或您正在使用的任何servlet容器)。这是我的三个问题:假设您选择通过追踪问题的根本原因(内存泄漏)来解决问题,您将如何收集数据以放大问题?假设您选择通过简单地重启容器来加快速度的快速而肮脏的方式,您将如何收集数据以选择最佳重启周期?您是否能够在很长一段时间内部署和运行项目,而无需重新启动servlet容器以恢复活力?还是偶尔的serv

java - Java中大型数据集的基于文件的合并排序

给定无法放入内存的大型数据集,是否有任何库或API可以在Java中执行排序?该实现可能类似于linux实用程序排序。 最佳答案 Java提供了一个通用的排序例程,它可以用作您的问题的更大解决方案的一部分。对太大而无法放入内存的数据进行排序的一种常见方法是:1)读取适合主内存的数据,假设是1Gb2)1Gb的快速排序(这里是您使用集合框架中Java的内置排序的地方)3)将排序后的1Gb作为“chunk-1”写入磁盘4)重复步骤1-3,直到您浏览完所有数据,将每个数据block保存在单独的文件中。因此,如果您的原始数据是9Gb,那么您现在

url - 为什么一些大型网站使用 .html 扩展名?

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭9年前。Improvethisquestion我只是好奇...为什么一些大型网站(高流量、大量数据)在其页面上使用.html扩展名,即使很明显它是由服务器端的php解释的?例如metrolyrics.com/top100.html很明显,它在后端使用了php,但仍然有.html后缀。它对SEO更好吗?还是我对后端的理解有误,正如其扩展所说,这些页面实际上是静态HTML?欢迎大家提出意见。谢谢!:)