我编写了一个程序来计算文本中的行数、单词数和字符数:它使用线程来执行此操作。有时效果很好,但其他时候效果不佳。最终发生的是指向所计数的单词和字符数的变量有时会不足,有时不会。
在我看来,线程有时在它们可以计算出它们想要的所有单词或字符之前就结束了。是因为当 while (true) 循环中断时这些线程超出了范围吗?
我在下面包含了我的问题的线程部分的代码:
private void countText() {
try {
reader = new BufferedReader(new FileReader("this.txt"));
while (true) {
final String line = reader.readLine();
if(line == null) {break;}
lines++;
new Thread(new Runnable() {public void run() {chars += characterCounter(line);}}).start();
new Thread(new Runnable() {public void run() {words += wordCounter(line);}}).start();
println(line);
}
} catch(IOException ex) {return;}
}
(子问题:这是我第一次询问某事并发布代码。我不想使用 StackOverflow 代替谷歌和维基百科,我担心这不是一个合适的问题?我试过了使问题更笼统,这样我就不仅仅是在寻求有关我的代码的帮助......但是,是否有另一个网站可能更适合此类问题?)
最佳答案
不同的线程设计将使查找和解决此类问题变得更加容易,并且更有效地进行讨价还价。这是一个较长的回复,但总结是“如果您在 Java 中执行线程,请尽快查看 java.util.concurrent)”。
我猜您正在对这段代码进行多线程处理以学习线程而不是加快单词计数,但这是一种非常低效的线程使用方式。您正在每行 创建两个线程 - 一个千行文件有两千个线程。创建一个线程(在现代 JVM 中)使用操作系统资源并且通常相当昂贵。当两个(更不用说两千个)线程必须访问共享资源(例如您的 chars 和 words 计数器)时,由此产生的内存争用也会损害性能。
使计数器变量同步为Chris Kimpton suggests或 Atomic 作为 WMR suggests可能会修复代码,但它也会使争用的效果变得更糟。我很确定它会比单线程算法慢。
我建议只使用一个长生命周期线程来处理 chars,一个线程处理 words,每个线程都有一个工作队列,您可以随时向其提交作业添加新号码。这样只有一个线程写入每个变量,如果您对设计进行更改,谁负责什么会更加明显。它还会更快,因为没有内存争用,并且您不会在紧密循环中创建数百个线程。
同样重要的是,一旦您读取了文件中的所有行,在您实际打印出计数器的值之前等待所有线程完成,否则您将丢失更新来自尚未完成的线程。使用您当前的设计,您必须建立一个您创建的线程的大列表,并在最后运行它以检查它们是否都已死。使用队列和工作线程设计,您可以告诉每个线程清空其队列,然后等待直到它完成。
Java(从 1.5 开始)使这种设计非常容易实现:查看 java.util.concurrent.Executors.newSingleThreadExecutor .它还使得以后添加更多并发性变得容易(假设适当的锁定等),因为您可以切换到线程池而不是单个线程。
关于java - 线程何时超出范围?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/289804/
我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/
请帮助我理解范围运算符...和..之间的区别,作为Ruby中使用的“触发器”。这是PragmaticProgrammersguidetoRuby中的一个示例:a=(11..20).collect{|i|(i%4==0)..(i%3==0)?i:nil}返回:[nil,12,nil,nil,nil,16,17,18,nil,20]还有:a=(11..20).collect{|i|(i%4==0)...(i%3==0)?i:nil}返回:[nil,12,13,14,15,16,17,18,nil,20] 最佳答案 触发器(又名f/f)是
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
我正在尝试从Postgresql表(table1)中获取数据,该表由另一个相关表(property)的字段(table2)过滤。在纯SQL中,我会这样编写查询:SELECT*FROMtable1JOINtable2USING(table2_id)WHEREtable2.propertyLIKE'query%'这工作正常:scope:my_scope,->(query){includes(:table2).where("table2.property":query)}但我真正需要的是使用LIKE运算符进行过滤,而不是严格相等。然而,这是行不通的:scope:my_scope,->(que
我刚刚被困在这个问题上一段时间了。以这个基地为例:moduleTopclassTestendmoduleFooendend稍后,我可以通过这样做在Foo中定义扩展Test的类:moduleTopmoduleFooclassSomeTest但是,如果我尝试通过使用::指定模块来最小化缩进:moduleTop::FooclassFailure这失败了:NameError:uninitializedconstantTop::Foo::Test这是一个错误,还是仅仅是Ruby解析变量名的方式的逻辑结果? 最佳答案 Isthisabug,or
假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目? 最佳答案 一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做,或者如果你需要避免为前N个元素构建中间数组,你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit
我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www
我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我
什么是ruby的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
这篇文章是继上一篇文章“Observability:从零开始创建Java微服务并监控它(一)”的续篇。在上一篇文章中,我们讲述了如何创建一个Javaweb应用,并使用Filebeat来收集应用所生成的日志。在今天的文章中,我来详述如何收集应用的指标,使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值,然后一切都回到一个请求。这也意味着这些指标可能不准确,你还想提取最小/