开发了一个导入接口,测试过程中发现导入压缩包24M时,耗时50多秒。觉得这个时间太长了,可能存在问题,于是开始了漫长的排查之旅。
通过Chrome DevTools 查看接口请求信息,发现接口时间主要消耗在发送数据(Request sent)和等待服务器响应(Waiting for server respnse)两部分。
Request sent:平均在31s
Waiting for server respnse:平均18s

Request sent时间属于正常偏慢,因为发送数据受网络上行带宽限制,暂时也没办法做太大的优化。
Waiting for server respnse时间有很大的问题,因为接口中只做了简单的操作,复杂的数据处理都是异步执行的,所以问题应该在服务端。
怀疑是接口请求问题后,就使用arthas trace 查看接口详细耗时。
docker exec -it xxx java -jar /arthas/arthas-boot.jar
[INFO] arthas-boot version: 3.5.1
[INFO] Found existing java process, please choose one and input the serial number of the process, eg : 1. Then hit ENTER.
* [1]: 10 org.springframework.boot.loader.JarLauncher
[INFO] arthas home: /opt/arthas
[INFO] Try to attach process 10
[INFO] Attach process 10 success.
[INFO] arthas-client connect 127.0.0.1 3658
,---. ,------. ,--------.,--. ,--. ,---. ,---.
/ O \ | .--. ''--. .--'| '--' | / O \ ' .-'
| .-. || '--'.' | | | .--. || .-. |`. `-.
| | | || |\ \ | | | | | || | | |.-' |
`--' `--'`--' '--' `--' `--' `--'`--' `--'`-----'
wiki https://arthas.aliyun.com/doc
tutorials https://arthas.aliyun.com/doc/arthas-tutorials.html
version 3.5.1
main_class
pid 10
time 2022-11-23 19:07:06
[arthas@10]$ trace xxx.XXXController test -n 5 --skipJDKMethod false
Press Q or Ctrl+C to abort.
Affect(class count: 2 , method count: 2) cost in 601 ms, listenerId: 1
`---ts=2022-11-24 13:44:28;thread_name=http-nio-9001-exec-17;id=bd;is_daemon=true;priority=5;TCCL=org.xxx.xxxClassLoader@300aa927
`---[211.492528ms] xxx.XXXController$$EnhancerBySpringCGLIB$$103cd3e4:test()
`---[166.654272ms] org.xxx.MethodInterceptor:intercept() #57
`---[102.043649ms] com.xxx.XXXController:test()
+---[101.125313ms] com.xxx.XXXService:importUser() #359
`---[0.754306ms] com.xxx.XXXBuilder:success() #57
根据arthas trace日志显示,接口耗时在200ms左右,这才是符合预期的时间。没有找到具体问题,只能代码走查一遍。接口逻辑其实很清晰,先校验文件格式大小,然后创建异步任务(插入一条数据),最后执行异步任务。因为有异步任务,所以整个接口耗时应该最多几百毫秒,初步判断arthas trace的结果正确合理。
既然接口实现没有问题,那就往上游排查,查看网关是否存在问题。查看网关接口请求和返回时间和刚才arthas trace时间相差无几,排除了网关的问题。
网关没问题只能在往上排查问题,测试了另一个环境B发现是相对正常的,Waiting for server respnse 时间在600ms左右。

对比讨论了下两个环境的差异,发现有问题的环境A相比正常的环境B多了一层SLB负载均衡,怀疑可能是这个问题。网上查了相关资料,也没有显示SLB有出现过这种情况。
于是让运维先关闭SLB负载均衡验证一下情况,修改SLB配置后需要一小会才能生效,结果显示关掉SLB接口请求时间还是有问题, 因此也不是SLB的问题,于是只是剩下Nginx了。
排查了一下午没有结果,然后就先去吃饭休息,踢踢桌面足球放松一下。
放松回来后,开始排查了Nginx配置,尝试重启ng,修改buffer大小都无济于事。扫到ng配置的时候发现ng做了一次负载均衡,而且服务器地址配置的是公网ip,猜测可能是这个问题,死马当成活马医,随便试试看。修改为内网地址,然后重启ng后验证发现正常了。就这样正常了。花了大半天时间,总算解决了。后来复盘讨论猜测,应该是ng接收到文件后,通过负载均衡走公网ip转了一圈回来导致Waiting for server respnse 耗时过长。
一不小心就有坑。
THE END.
电脑启动出现显示器黑屏是一个相当常见的问题。如果您遇到了这个问题,不要惊慌,因为它有很多可能的原因,可以采取一些简单的措施来解决它。在本文中,小编将介绍下面4种常见的电脑启动后显示器黑屏的原因,排查这些原因,快速解决! 演示机型:联想Ideapad700-15ISK-ISE系统版本:Windows10一、显示器问题如果出现电脑启动后显示器黑屏的情况。那么首先您需要检查一下显示器是否正常工作。您可以通过更换另一个显示器或将当前显示器连接到另一台计算机来检查显示器是否存在问题。如果问题仍然存在,那么您可以排除显示器故障的可能性。 二、显卡问题如果您的电脑配备了独立显卡,那么显卡故障也可能是导致电脑
在MacOS更新之前,它一直运行良好。我重新安装了RVM、rails、ruby等等。到目前为止没有任何效果。在我的Mac终端中,我可以生成一个é,但是在控制台中,我可以生成字符,使用alt+character,然后当我键入字符分配给的字母,它会删除该字符。在我的~/.rvmrc中:exportruby_configure_flags="--with-readline-dir=/usr/local/Cellar/readline/6.2.4"有什么想法吗?到目前为止,我已经明确地让它工作了,包括readline-rb。我猜我的全局要求不工作。gem'rb-readline','~>0.4
我只想在我的Rails项目中的某个地方以HTMLView将其打印出来,以及其他一些有用的信息。类似于“当前运行时间=4d11h54m2s”或“自2013年8月23日起运行”。令人惊讶的是,在任何地方都找不到有关此的任何信息。也许有一种通用的Rack方法可以做到这一点。 最佳答案 这其实很容易做到。创建一个文件,config/initializers/uptime.rb,包含:YourApplication::BOOTED_AT=Time.now这只是将当前时间与那个时间进行比较的情况,您可以使用time_ago_in_wordsra
在为一些与JRuby中的临时文件交互的代码运行单元测试时,我有时会得到以下信息:Exception:java.lang.ThreadDeaththrownfromtheUncaughtExceptionHandlerinthread"Thread-6395"它似乎没有引起任何问题,但这是怎么回事,我如何确定它发生在哪里?我尝试打开-d,但这并没有给我异常的堆栈跟踪。 最佳答案 FWIW:这可能与http://jira.codehaus.org/browse/JRUBY-7074有关.我偶尔会在不使用反引号但调用系统的JRuby程序中
我正在尝试安装geoutm使用geminstallgeoutm。Github存储库没有问题页面,所以我尝试自己解决问题然后提交拉取请求。这是问题:$geminstallgeoutmFetching:geoutm-1.0.1.gem(100%)Successfullyinstalledgeoutm-1.0.1ERROR:Whileexecutinggem...(TypeError)noimplicitconversionofArrayintoString它说“已成功安装”,但尝试要求gem失败。详细安装并没有多大用处:$geminstallgeoutm--verboseHEADhttps
Klocwork专为企业DevOps和DevSecOps而构建,是首选的静态分析和SAST工具,用于保持高开发速度,同时还强制实施安全性和质量的持续合规性。在这里,我们分享了开发人员选择Klocwork的五大原因。为什么安全性对软件开发至关重要?安全性对于软件开发至关重要,因为黑客和网络犯罪分子一直在寻找将漏洞转化为利益的方法。强大的软件安全防御的一个关键部分是使用安全编码标准,这些标准是用于防止安全漏洞的规则和准则。如果使用得当,安全编码标准可以检测、预防和消除可能危及安全性的漏洞。行业标准工具(特别是SAST工具)可以有效地实施标准,以帮助确保您的软件免受安全漏洞的侵害。开发人员使用Klo
在Rails控制台中,我正在创建一条记录,然后输入@record.save,我得到的结果是false,但我不明白为什么?RailsC有没有办法输出保存失败的原因?谢谢 最佳答案 通过errors实例方法访问错误。示例:ruby-1.8.7-p334:001>c=Company.new=>#ruby-1.8.7-p334:002>c.save=>falseruby-1.8.7-p334:003>c.errors=>#["can'tbeblank"]}> 关于ruby-on-rails-Ra
我有一个在Heroku上运行的RubyonRails应用程序。我不断在日志中收到这些消息:2015-05-05T16:11:14Zapp[postgres.27102]:[AQUA]connectionreceived:host=xx.xxx.xx.26port=602782015-05-05T16:11:14Zapp[postgres.27102]:[AQUA]connectionauthorized:user=postgresdatabase=somedb2015-05-05T16:11:14Zapp[postgres.27103]:[AQUA]connectionreceived
在Rails3.1中使用Assets管道时,它会创建一个默认的application.js://=requirejquery//=requirejquery_ujs//=require_tree.但我什么时候需要包含我所有的javascript?在大多数情况下,我们对不同的Controller/View使用不同的javascripts? 最佳答案 require_tree.将导致您有一个文件(在本例中为application.js)保存文件夹中的所有脚本。事实上,浏览器只会从您的Web服务器中提取该文件一次(除非您执行Ctrl+R刷
当我执行bundleexecrake-T(或bundleexecrake)时,我收到弃用警告:Andrews-Air:nabuagrimm$bundleexecrake--trace-T[DEPRECATION]`last_comment`isdeprecated.Pleaseuse`last_description`instead.[DEPRECATION]`last_comment`isdeprecated.Pleaseuse`last_description`instead.[DEPRECATION]`last_comment`isdeprecated.Pleaseuse`las