当我调用这个方法时,我得到了一个 java outOfMemoryError - 我在一个循环中使用它来按顺序解析许多大文件。我的猜测是 result.toString() 在循环期间没有正确收集垃圾。如果是这样,我该如何解决?
private String matchHelper(String buffer, String regex, String method){
Pattern abbrev_p = Pattern.compile(regex);//norms U.S.A., B.S., PH.D, PH.D.
Matcher abbrev_matcher = abbrev_p.matcher(buffer);
StringBuffer result = new StringBuffer();
while (abbrev_matcher.find()){
abbrev_matcher.appendReplacement(result, abbrevHelper(abbrev_matcher));
}
abbrev_matcher.appendTail(result);
String tempResult = result.toString(); //ERROR OCCURS HERE
return tempResult;
}
最佳答案
这样写,文件中的每个字符大约需要 6 字节的内存。
每个字符是两个字节。您拥有原始输入、替代输出(在缓冲区中),并且在内存不足时请求第三份副本。
如果文件以类似 ASCII 或 ISO-8859-1(单字节字符编码)的方式编码,这意味着它在内存中的大小将是在磁盘中的六倍。
您可以为进程分配更多内存,但更好的解决方案可能是“流式”处理输入——读取、扫描和写入数据,而不是一次将所有数据加载到内存中。
关于java outOfMemoryError 与 stringbuilder,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2431040/
我正在用Java循环遍历结果集;出于测试目的,它返回大约30行,每行17列(所有字符串数据)。我正在使用StringBuilder从结果中手动构建一个XML字符串,并且循环完成这些迭代实际上需要大约36秒。注意:我意识到这不是从数据库中获取XML的最佳方式,甚至不是从结果集中获取XML的最佳方式-但无论如何这都让我对缓慢的性能感到好奇。更新:根据目前的回复,我必须解决以下问题:运行查询的时间不到一秒,我在代码的每个部分前后都执行了System.currentTimeMillis()以缩小范围。36秒完全在下面的代码中。ResultSetMetaDatarsmeta=rset.getMe
我有一个包含XML文件内容的StringBuilder。在XML文件中有一个名为的根标签。并包含多个标签。我想通过XML进行解析以读取s中的标签值,但不确定该怎么做。我必须为此使用一些C#XML数据类型吗?提前致谢 最佳答案 StringBuildersb=newStringBuilder(xml);TextReadertextReader=newStringReader(sb.ToString());XDocumentxmlDocument=XDocument.Load(textReader);varnodeValueList=f
我编写了一个控制台应用程序来从Web服务器获取一些信息,将其转换为XML并保存。我手动创建了XML(使用StringBuilder附加字符串)。由于XML可能非常大,就内存而言,使用StringBuilder或XMLDocument类等更好吗?准确地说,我的问题是,如果XML类似于10mb文本,使用StringBuilder.append("")或System.XML命名空间是否具有内存效率?我认为更有效的方法是使用StringBuilder,但在每次迭代后将XML保存到HD上的文件并清除stringbuilder对象。任何意见?提前致谢。:) 最佳答案
我正在尝试从提供Xml内容的自定义HttpHandler中尽可能多地发挥性能。我想知道哪个对性能更好。使用XmlTextWriter类或临时StringBuilder操作,例如:StringBuildersb=newStringBuilder("");sb.AppendFormat("{0}",SOMEVALUE);有没有人有第一手经验? 最佳答案 正如Josh所说,这是一个微优化,如果您还没有证明它的必要性,您甚至不应该考虑它。它也确实不难测试:staticvoidMain(string[]arguments){constinti
我正在构建一个压力测试客户端,它使用客户端可以召集的尽可能多的线程来攻击服务器并分析响应。我经常发现自己受到垃圾收集(和/或缺乏垃圾收集)的限制,在大多数情况下,它归结为我实例化的字符串,只是为了将它们传递给Regex或Xml解析例程。如果反编译Regex类,您会看到在内部,它使用StringBuilder来做几乎所有事情,但您不能传递给它一个字符串生成器;它有助于在开始使用之前深入研究私有(private)方法,因此扩展方法也不会解决它。如果您想从System.Xml.Linq中的解析器中获取对象图,您会遇到类似的情况。这不是迂腐的提前过度优化的情况。我看过Regexreplacem
我有一个现有的StringBuilder对象,代码向它附加了一些值和一个分隔符。我想修改代码以添加逻辑,在附加文本之前,它将检查它是否已存在于StringBuilder中。如果没有,它只会追加文本,否则将被忽略。这样做的最佳方法是什么?我需要将对象更改为string类型吗?我需要不会影响性能的最佳方法。publicstaticstringBuildUniqueIDList(contextRequestContext){stringrtnvalue=string.Empty;try{StringBuilderstrUIDList=newStringBuilder(100);for(int
我很想知道我是否可以创建一个优化版本的StringBuilder(尝试稍微加快它的速度,因为它目前是我的一个应用程序的瓶颈)。对我来说不幸的是,它似乎利用了我无法使用(或者看起来如此)的“神奇”系统调用。反编译System.Text.StringBuilder的源代码后,我注意到它使用了以下内部(因此无法调用)系统调用:[SecurityCritical][MethodImpl(MethodImplOptions.InternalCall)]internalstaticstringFastAllocateString(intlength);还有这个未记录的属性被大量使用:[ForceT
我有返回字符串的异步方法(来自网络)。asyncTaskGetMyDataAsync(intdataId);我有:Task[]tasks=newTask[max];for(inti=0;i如何将每个任务的结果附加到StringBuilder?我想知道怎么做A)按照任务创建的顺序B)为了完成任务我该怎么做? 最佳答案 A)InorderoftaskcreationTask[]tasks=newTask()[max];for(inti=0;iB)InorderthattasksfinishTask[]tasks=newTask()[ma
我在C#中连接大量byte[]数组。如果我对字符串执行此操作,我会使用StringBuilder——是否有适用于byte[]数组中的二进制数据的等效类? 最佳答案 我不认为有一个完全等价的东西,但你可以用BinaryWriter来完成它:http://msdn2.microsoft.com/en-us/library/system.io.binarywriter.aspxMemoryStreamm=newMemoryStream();BinaryWriterwriter=newBinaryWriter(m);writer.Write
我在StringBuilder对象中存储了一个密码。我正在寻找一种方法来删除内存中的密码。以下任何一种方法都可以实现这一点:遍历StringBuilder字符并分配'\0'。是如果我已经分配,这保证使用相同的内存最初有足够的内存吗?我可以使用任何非托管API,例如ZeroMemory()或SecureZeroMemory()使用StringBuilder?有代码示例吗?编辑:使用SecureString不是我的选择,因为我正在调用CredUIPromptForCredentials()来获取凭据。 最佳答案 简单的答案是,您提出