我最近开始阅读有关基准测试的内容并为 Android(用 Java)编写它们。我知道预热、垃圾收集器和编译器优化等问题,但不知道我遇到的问题是否可能是由这些问题引起的。
在我的基准测试应用程序中,我创建了一个包含 10,000 个浮点变量的数组并使用随机值对其进行初始化。 运行基准代码时:
private void runMinorBenchmarkFloat (float[] array) {
float sum = 0;
long startTime;
long endTime;
/* Fast warm-up */
startTime = System.nanoTime();
for(int i=0; i<SMALL_LOOP_ITERATION_COUNT; i++)
for(int j=0; j<TAB_SIZE; j++)
sum += array[j];
endTime = System.nanoTime() - startTime;
postMessage("Warm-up for FLOAT finished in: " + endTime/1000000 + "ms.\n");
/* Main benchmark loop */
startTime = System.nanoTime();
for(int i=0; i<BIG_LOOP_ITERATION_COUNT; i++)
{
sum = 0;
for(int j=0; j<TAB_SIZE; j++)
sum += array[j];
}
endTime = System.nanoTime() - startTime;
postMessage("Benchmark for FLOAT finished in: " + endTime/1000000 + "ms.\n");
postMessage("Final value: " + sum + "\n\n");
}
在我的手机上,预热时间大约为 2 秒,“真正”循环时间为 20 秒。
现在,当我再添加两个浮点变量(sum2 和 sum3 - 从未在方法内部使用过)时:
private void runMinorBenchmarkFloat (float[] array) {
float sum = 0, sum2 = 0, sum3 = 0; // <------- the only code change here!!!
long startTime;
long endTime;
/* Fast warm-up */
startTime = System.nanoTime();
for(int i=0; i<SMALL_LOOP_ITERATION_COUNT; i++)
for(int j=0; j<TAB_SIZE; j++)
sum += array[j];
endTime = System.nanoTime() - startTime;
postMessage("Warm-up for FLOAT finished in: " + endTime/1000000 + "ms.\n");
/* Main benchmark loop */
startTime = System.nanoTime();
for(int i=0; i<BIG_LOOP_ITERATION_COUNT; i++)
{
sum = 0;
for(int j=0; j<TAB_SIZE; j++)
sum += array[j];
}
endTime = System.nanoTime() - startTime;
postMessage("Benchmark for FLOAT finished in: " + endTime/1000000 + "ms.\n");
postMessage("Final value: " + sum + "\n\n");
}
执行时间从预热的 2 秒跳到 5 秒,真正循环的执行时间从 20 秒跳到 50 秒。
常量:
SMALL_LOOP_ITERATION_COUNT = 100,000
BIG_LOOP_ITERATION_COUNT = 1,000,000
你认为这种差异可能是由对齐问题引起的吗(只是松散的想法)?
提前感谢您的回答。
编辑:
似乎这个错误并没有出现在每台设备上。我可以在三星 Galaxy S5 上重现它。 该计划的主要目标是做一点基准。我做了四个几乎相同的函数(runMinorBenchmark____,其中 _ 是:int、short、float、double),它们仅在变量“sum”类型上有所不同。在主要基准函数中,我调用了这些函数。因为发生了上述错误,所以我决定将这些功能合并为一个大功能。 现在......运行测试时我有这样的时间: 1. 37640 毫秒。 (对于整数) 2. 46728 毫秒。 (简称) 3. 60589 毫秒。 (用于 float ) 4. 34467 毫秒。 (双)
我知道由于类型转换,short 意味着更慢。我还认为 float 在将其转换为 double 时应该更慢(也许 FPU 每次都将类型转换为 double(?))。但是当我将 sumFloat 的变量类型从 float 更改为 double 时,float 的时间与 double 时间相同。 我还在另一台设备上做了这个“基准测试”,它似乎没有受到这种奇怪行为的影响,而且每次测试的时间几乎相同:~45000 毫秒。 (确实没有明显的差异)。
Dalvik 虚拟机错误(?)
最佳答案
我不相信这是你麻烦的原因。编译器肯定只是把那些未使用的变量扔掉了吗?您确定输入数组、常量或 TAB_SIZE 没有变化吗?
如果您仍然确定,请通过运行类似的程序并将输出粘贴到此处来证明这一点:
public void proveIt() {
float[] inputArray = new float[10000];
for (int i = 0; i < 10000; i++) {
inputArray[i] = 1;
}
postMessage("Without declaration:");
runMinorBenchmarkFloatA(inputArray);
postMessage("With declaration:");
runMinorBenchmarkFloatB(inputArray);
postMessage("And again just to make sure...");
postMessage("Without declaration:");
runMinorBenchmarkFloatA(inputArray);
postMessage("With declaration:");
runMinorBenchmarkFloatB(inputArray);
}
long TAB_SIZE = 10000;
long SMALL_LOOP_ITERATION_COUNT = 100000;
long BIG_LOOP_ITERATION_COUNT = 1000000;
private void runMinorBenchmarkFloatA(float[] array) {
float sum = 0;
long startTime;
long endTime;
/* Fast warm-up */
startTime = System.nanoTime();
for (int i = 0; i < SMALL_LOOP_ITERATION_COUNT; i++)
for (int j = 0; j < TAB_SIZE; j++)
sum += array[j];
endTime = System.nanoTime() - startTime;
postMessage("Warm-up for FLOAT finished in: " + endTime
/ 1000000 + "ms.\n");
/* Main benchmark loop */
startTime = System.nanoTime();
for (int i = 0; i < BIG_LOOP_ITERATION_COUNT; i++) {
sum = 0;
for (int j = 0; j < TAB_SIZE; j++)
sum += array[j];
}
endTime = System.nanoTime() - startTime;
postMessage("Benchmark for FLOAT finished in: " + endTime
/ 1000000 + "ms.\n");
postMessage("Final value: " + sum + "\n\n");
}
private void runMinorBenchmarkFloatB(float[] array) {
float sum = 0, sum2 = 0, sum3 = 0;
long startTime;
long endTime;
/* Fast warm-up */
startTime = System.nanoTime();
for (int i = 0; i < SMALL_LOOP_ITERATION_COUNT; i++)
for (int j = 0; j < TAB_SIZE; j++)
sum += array[j];
endTime = System.nanoTime() - startTime;
postMessage("Warm-up for FLOAT finished in: " + endTime
/ 1000000 + "ms.\n");
/* Main benchmark loop */
startTime = System.nanoTime();
for (int i = 0; i < BIG_LOOP_ITERATION_COUNT; i++) {
sum = 0;
for (int j = 0; j < TAB_SIZE; j++)
sum += array[j];
}
endTime = System.nanoTime() - startTime;
postMessage("Benchmark for FLOAT finished in: " + endTime
/ 1000000 + "ms.\n");
postMessage("Final value: " + sum + "\n\n");
}
关于java - 为什么添加局部变量会导致方法延迟?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25863888/
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
当我使用Bundler时,是否需要在我的Gemfile中将其列为依赖项?毕竟,我的代码中有些地方需要它。例如,当我进行Bundler设置时:require"bundler/setup" 最佳答案 没有。您可以尝试,但首先您必须用鞋带将自己抬离地面。 关于ruby-我需要将Bundler本身添加到Gemfile中吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4758609/
我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
我有一个ModularSinatra应用程序,我正在尝试将Bootstrap添加到应用程序中。get'/bootstrap/application.css'doless:"bootstrap/bootstrap"end我在views/bootstrap中有所有less文件,包括bootstrap.less。我收到这个错误:Less::ParseErrorat/bootstrap/application.css'reset.less'wasn'tfound.Bootstrap.less的第一行是://CSSReset@import"reset.less";我尝试了所有不同的路径格式,但它
我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用? 最佳答案 我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击
我正在使用Sequel构建一个愿望list系统。我有一个wishlists和itemstable和一个items_wishlists连接表(该名称是续集选择的名称)。items_wishlists表还有一个用于facebookid的额外列(因此我可以存储opengraph操作),这是一个NOTNULL列。我还有Wishlist和Item具有续集many_to_many关联的模型已建立。Wishlist类也有:selectmany_to_many关联的选项设置为select:[:items.*,:items_wishlists__facebook_action_id].有没有一种方法可以
我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是