我正在使用opengl es 2开发一个android应用程序。我遇到的问题是,glClear()函数处理时间太长,以至于游戏在帧延迟时显得很紧张。
使用计时探针运行程序的输出显示,虽然从Atlas设置所有顶点和图像只需不到1毫秒,glClear()需要10到20毫秒。事实上,清除通常占用总渲染时间的95%。
我的代码基于常见教程,而Render函数是:
private void Render(float[] m, short[] indices) {
Log.d("time", "--START RENDER--");
// get handle to vertex shader's vPosition member
int mPositionHandle = GLES20.glGetAttribLocation(riGraphicTools.sp_Image, "vPosition");
// Enable generic vertex attribute array
GLES20.glEnableVertexAttribArray(mPositionHandle);
// Prepare the triangle coordinate data
GLES20.glVertexAttribPointer(mPositionHandle, 3,
GLES20.GL_FLOAT, true,
0, vertexBuffer);
// Get handle to texture coordinates location
int mTexCoordLoc = GLES20.glGetAttribLocation(riGraphicTools.sp_Image, "a_texCoord" );
// Enable generic vertex attribute array
GLES20.glEnableVertexAttribArray ( mTexCoordLoc );
// Prepare the texturecoordinates
GLES20.glVertexAttribPointer ( mTexCoordLoc, 2, GLES20.GL_FLOAT,
false,
0, uvBuffer);
// Get handle to shape's transformation matrix
int mtrxhandle = GLES20.glGetUniformLocation(riGraphicTools.sp_Image, "uMVPMatrix");
// Apply the projection and view transformation
GLES20.glUniformMatrix4fv(mtrxhandle, 1, false, m, 0);
// Get handle to textures locations
int mSamplerLoc = GLES20.glGetUniformLocation (riGraphicTools.sp_Image, "s_texture" );
// Set the sampler texture unit to 0, where we have saved the texture.
GLES20.glUniform1i ( mSamplerLoc, 0);
long clearTime = System.nanoTime();
GLES20.glClear(GLES20.GL_COLOR_BUFFER_BIT);
Log.d("time", "Clear time is " + (System.nanoTime() - clearTime));
// Draw the triangles
GLES20.glDrawElements(GLES20.GL_TRIANGLES, indices.length,
GLES20.GL_UNSIGNED_SHORT, drawListBuffer);
// Disable vertex array
GLES20.glDisableVertexAttribArray(mPositionHandle);
GLES20.glDisableVertexAttribArray(mTexCoordLoc);
Log.d("time", "--END RENDER--");
}
/drawable-nodpi和glFlush()函数。glFinish(),则必须自动调用它。这是因为总的渲染时间仍然和调用时一样长,并且屏幕上没有前一帧的残余。只有第一次调用glClear()才是耗时的。如果再次调用,则后续调用仅为1或2毫秒。glClear()),并使用GLES20.GL_DEPTH_BUFFER_BIT。晴朗的时间仍然很长。最佳答案
你不是在衡量你认为自己是什么。测量opengl api调用的运行时间基本上是没有意义的。
不同步性
要理解的关键方面是opengl是一个将工作传递给gpu的api。最简单的心理模型(这在很大程度上与现实相对应)是,当您进行opengl api调用时,您将稍后提交给gpu的工作排队。例如,如果您进行glDraw*()调用,请想象该调用正在生成一个工作项,该工作项将排队,稍后将提交给gpu执行。
换句话说,api是高度异步的。通过调用api请求的工作在调用返回时尚未完成。在大多数情况下,它甚至还没有提交给gpu执行。它只是排队,稍后会提交,大多数情况下不在您的控制范围内。
这种通用方法的一个结果是,进行glClear()调用所需的时间与清除帧缓冲区所需的时间几乎没有关系。
同步
既然我们已经建立了opengl api是如何异步的,接下来要理解的概念是,一定程度的同步是必要的。
让我们看看总吞吐量受gpu限制的工作负载(要么受gpu性能限制,要么因为显示刷新限制了帧速率)。如果我们保持整个系统完全异步,并且cpu可以比gpu处理命令的速度更快地生成gpu命令,那么我们将逐渐增加排队的工作量。这是不可取的,原因如下:
在极端情况下,排队工作的数量将增长到无限大,我们将耗尽存储排队的gpu命令所需的内存。
在需要对用户输入做出响应的应用程序(如游戏)中,用户输入和呈现之间的延迟会增加。
为了避免这种情况,驱动程序使用限制机制来防止cpu走得太远。具体如何处理这个问题的细节可能相当复杂。但作为一个简单的模型,它可能有点像当cpu比gpu完成的渲染提前1-2帧时阻塞cpu。理想情况下,您总是希望某些工作排队,这样GPU就不会在图形有限的应用程序中空闲,但是您希望将排队的工作量尽可能小,以最小化内存使用和延迟。
测量的意义
在解释了所有这些背景信息后,您的测量结果应该不那么令人惊讶了。到目前为止,最有可能的情况是,您的glClear()调用触发了同步,而您测量的时间是gpu足够赶上的时间,直到提交更多工作才有意义。
请注意,这并不意味着所有以前提交的工作都需要完成。让我们看一个有点假设,但足够实际的序列来说明可能发生的情况:
假设您进行glClear()调用,形成渲染帧n的开始。
此时,framen - 3显示,gpu正忙于处理framen - 2的渲染命令。
司机决定你真的不应该得到超过2帧。因此,它会阻塞glClear()调用,直到gpu完成framen - 2的渲染命令。
它还可能决定它需要等待直到在显示器上显示framen - 2,这意味着等待下一个波束同步。
现在framen - 2显示在屏幕上,先前包含framen - 3的缓冲区不再使用。它现在可以用于framen,这意味着可以提交frameglClear()的n命令。
请注意,虽然您的glClear()调用在这个场景中进行了各种等待(您将其作为api调用所用时间的一部分进行测量),但这些时间都没有用于实际清除帧的帧缓冲区。您可能只是坐在某种信号量(或类似的同步机制)上,等待gpu完成先前提交的工作。
结论
考虑到你的测量毕竟没有直接的帮助,你能从中学到什么?可惜不是很多。
如果您确实观察到帧速率不符合您的目标,例如,因为您观察到口吃,或者更好的是因为您在某个时间段内测量了帧速率,那么您唯一确定的是您的渲染速度太慢。深入研究性能分析的细节对于这种格式来说是一个非常大的主题。只是让你大致了解一下你可以采取的步骤:
测量/分析您的CPU使用情况,以验证您是否真正受到GPU限制。
使用GPU供应商提供的GPU分析工具。
简化渲染,或跳过部分渲染,并查看性能如何更改。例如,如果简化几何图形,速度会更快吗?可能会受到顶点处理的限制。如果减小帧缓冲区大小,速度会更快吗?或者简化片段着色器?你可能受到碎片处理的限制。
关于android - glClear()需要太长时间 - Android OpenGL ES 2,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29551516/
当我使用Bundler时,是否需要在我的Gemfile中将其列为依赖项?毕竟,我的代码中有些地方需要它。例如,当我进行Bundler设置时:require"bundler/setup" 最佳答案 没有。您可以尝试,但首先您必须用鞋带将自己抬离地面。 关于ruby-我需要将Bundler本身添加到Gemfile中吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4758609/
我注意到像bundler这样的项目在每个specfile中执行requirespec_helper我还注意到rspec使用选项--require,它允许您在引导rspec时要求一个文件。您还可以将其添加到.rspec文件中,因此只要您运行不带参数的rspec就会添加它。使用上述方法有什么缺点可以解释为什么像bundler这样的项目选择在每个规范文件中都需要spec_helper吗? 最佳答案 我不在Bundler上工作,所以我不能直接谈论他们的做法。并非所有项目都checkin.rspec文件。原因是这个文件,通常按照当前的惯例,只
我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby,并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
这个问题在这里已经有了答案:Railsformattingdate(4个答案)关闭4年前。我想格式化Time.Now函数以显示YYYY-MM-DDHH:MM:SS而不是:“2018-03-0909:47:19+0000”该函数需要放在时间中.现在功能。require‘roo’require‘roo-xls’require‘byebug’file_name=ARGV.first||“Template.xlsx”excel_file=Roo::Spreadsheet.open(“./#{file_name}“,extension::xlsx)xml=Nokogiri::XML::Build
我正在尝试解析一个CSV文件并使用SQL命令自动为其创建一个表。CSV中的第一行给出了列标题。但我需要推断每个列的类型。Ruby中是否有任何函数可以找到每个字段中内容的类型。例如,CSV行:"12012","Test","1233.22","12:21:22","10/10/2009"应该产生像这样的类型['integer','string','float','time','date']谢谢! 最佳答案 require'time'defto_something(str)if(num=Integer(str)rescueFloat(s
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Rubysyntaxquestion:Rational(a,b)andRational.new!(a,b)我正在阅读ruby镐书,我对创建有理数的语法感到困惑。Rational(3,4)*Rational(1,2)产生=>3/8为什么Rational不需要new方法(我还注意到例如我可以在没有new方法的情况下创建字符串)?
最近因为项目需要,需要将Android手机系统自带的某个系统软件反编译并更改里面某个资源,并重新打包,签名生成新的自定义的apk,下面我来介绍一下我的实现过程。APK修改,分为以下几步:反编译解包,修改,重打包,修改签名等步骤。安卓apk修改准备工作1.系统配置好JavaJDK环境变量2.需要root权限的手机(针对系统自带apk,其他软件免root)3.Auto-Sign签名工具4.apktool工具安卓apk修改开始反编译本文拿Android系统里面的Settings.apk做demo,具体如何将apk获取出来在此就不过多介绍了,直接进入主题:按键win+R输入cmd,打开命令窗口,并将路
我正在尝试查询我的Rails数据库(Postgres)中的购买表,我想查询时间范围。例如,我想知道在所有日期的下午2点到3点之间进行了多少次购买。此表中有一个created_at列,但我不知道如何在不搜索特定日期的情况下完成此操作。我试过:Purchases.where("created_atBETWEEN?and?",Time.now-1.hour,Time.now)但这最终只会搜索今天与那些时间的日期。 最佳答案 您需要使用PostgreSQL'sdate_part/extractfunction从created_at中提取小时
因为我现在正在做一些时间测量,我想知道是否可以在不使用Benchmark类或命令行实用程序time的情况下测量用户时间或系统时间。使用Time类只显示挂钟时间,而不显示系统和用户时间,但是我正在寻找具有相同灵active的解决方案,例如time=TimeUtility.now#somecodeuser,system,real=TimeUtility.now-time原因是我有点不喜欢Benchmark,因为它不能只返回数字(编辑:我错了-它可以。请参阅下面的答案。)。当然,我可以解析输出,但感觉不对。*NIX系统的time实用程序也应该可以解决我的问题,但我想知道是否已经在Ruby中实