java - 如何在Java中实现对映射到内存的文件的并发读取？

coder 2024-03-17 原文

我有很多线程并发读取同一个文件(总共100M左右)，只有一个线程更新文件。我想将文件映射到内存中以减少文件 I/O。这在 Java 中如何实现？

我基本上考虑过以下2种方法:

用字节数组存储文件，多线程读取时每次创建ByteArrayInputStream读取缓冲区。
用NIO获取一个文件 channel ，同步 channel 从MappedByteBuffer中读取，实现多线程读取。

我不确定这些方法是否有效。如果有更好的解决方案，请帮忙提示。

最佳答案

使用 NIO，每个线程创建自己的映射并读取自己的私有(private)缓冲区中的数据。保持私有(private)缓冲区大小最佳。操作系统以页面为单位读取其文件缓存中的文件，并将页面读入专用缓冲区。如果多个线程读取相同的区域，则将从文件缓存中的相同页面读取数据，从而节省一些文件 i/o 周期。下面是一个小图来说明这一点。希望它有助于更好地理解。

引用上图，下面做一些解释。文件的一个区域映射到内存。创建映射只是一个逻辑标记，表示您要从文件的特定部分读取。创建映射后，映射区域就可以读取了。当您开始阅读时，操作系统会将文件数据提取到文件缓存中的页面中。该区域可以映射到一个或多个页面。现在，您将页面读入您自己的私有(private)缓冲区(一次多页以进行优化)。其他线程可能正在读取与第一个线程相同的区域，因此它也将相同的页面读入其私有(private)缓冲区。请注意，这次读取发生在没有页面错误的文件缓存中。处理完您的私有(private)缓冲区后，您请求进一步阅读。请注意，您一次将一部分映射读入您的专用缓冲区。您的文件可能是 100MB，您将 10MB 的部分映射到内存；你可能有 40KB 的私有(private)缓冲区，你首先从 10MB 中读取 40KB。然后请求下一个 40KB 等等。操作系统检查您要读取的数据是否已提取到缓存中。如果不是，则会发生页面错误，操作系统将请求的数据提取到页面中。如果多个线程请求读取同一区域，则可以再次共享此数据。您可以很好地使用文件缓存本身进行读取，而不是创建自己的私有(private)缓冲区。但是，如果跨多个区域多次同时读取文件，这可能会导致多个页面错误。因此，在这种情况下，最好有一个最佳大小的私有(private)缓冲区。

关于java - 如何在Java中实现对映射到内存的文件的并发读取？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10579808/

何在 java 私有 section private file-io concurrency nio

有关java - 如何在Java中实现对映射到内存的文件的并发读取？的更多相关文章

ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2
我有一个Ruby程序，它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重，我想提高压缩级别，因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗？是否有另一个允许指定压缩级别的Ruby库？最佳答案这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
ruby - 其他文件中的 Rake 任务 - 2
我试图在一个项目中使用rake，如果我把所有东西都放到Rakefile中，它会很大并且很难读取/找到东西，所以我试着将每个命名空间放在lib/rake中它自己的文件中，我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题，但没有任务。我现在只有一个.rake文件作为测试，名为“servers.rake”，它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
ruby - 如何在 Ruby 中顺序创建 PI - 2
出于纯粹的兴趣，我很好奇如何按顺序创建PI，而不是在过程结果之后生成数字，而是让数字在过程本身生成时显示。如果是这种情况，那么数字可以自行产生，我可以对以前看到的数字实现垃圾收集，从而创建一个无限系列。结果只是在Pi系列之后每秒生成一个数字。这是我通过互联网筛选的结果:这是流行的计算机友好算法，类机器算法:defarccot(x,unity)xpow=unity/xn=1sign=1sum=0loopdoterm=xpow/nbreakifterm==0sum+=sign*(xpow/n)xpow/=x*xn+=2sign=-signendsumenddefcalc_pi(digits
ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2
我的目标是转换表单输入，例如“100兆字节”或“1GB”，并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前，我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效，但前提是输入是倍数(“gigabytes”，而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以，功能正常，
ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2
作为我的Rails应用程序的一部分，我编写了一个小导入程序，它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是，与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存，我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关，因为当我删除对LDAP内容的调用时，内存使用情况会很好地稳定下来。此外，不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray，它们都是LDAP库的一部分。当我运行导入时，内存使用量最终达到超过1GB的峰值。如果问题存在，我需要找到一些方法来更正我的代
ruby-on-rails - Rails 3 中的多个路由文件 - 2
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情？最佳答案在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中，使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件，我们在StackOverflow上找到一个类似的问题
ruby - 在 Ruby 中实现 `call_user_func_array` - 2
我怎样才能完成http://php.net/manual/en/function.call-user-func-array.php在ruby中？所以我可以这样做:classAppdeffoo(a,b)putsa+benddefbarargs=[1,2]App.send(:foo,args)#doesn'tworkApp.send(:foo,args[0],args[1])#doeswork,butdoesnotscaleendend 最佳答案尝试分解数组App.send(:foo,*args)
ruby - 将差异补丁应用于字符串/文件 - 2
对于具有离线功能的智能手机应用程序，我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2
我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚
ruby - 如何在 buildr 项目中使用 Ruby 代码？ - 2
如何在buildr项目中使用Ruby？我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序，我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/)，但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻，因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby

java - 如何在Java中实现对映射到内存的文件的并发读取？

有关java - 如何在Java中实现对映射到内存的文件的并发读取？的更多相关文章

随机推荐