草庐IT

应对五大 Kubernetes 调试挑战

科技狠活与软件技术 2023-03-30 原文
错误是不可避免的,通常是由于错误或疏忽而发生的。了解五个 Kubernetes 调试挑战以及如何解决它们。

Kubernetes 等云原生技术使公司能够快速构建软件并轻松扩展。然而,由于构建面向服务的架构(微服务)和运行底层Kubernetes基础设施的复杂性增加,调试这些基于 Kubernetes 的应用程序可能非常具有挑战性。

错误是不可避免的,通常是由于软件开发过程中的错误或疏忽而发生的。因此,为了让企业跟上应用程序交付的步伐并让最终用户满意,开发人员需要一种高效且有效的调试方式。这涉及查找、分析和修复这些错误。

本文重点介绍了五个 Kubernetes 调试挑战以及如何解决它们。

1.由于构建和重新部署容器导致开发循环缓慢

当开发团队采用像 Kubernetes 这样的云原生技术时,他们的开发人员体验会发生显着改变,因为他们现在需要在内部开发循环中执行额外的步骤。他们不再像以前在整体环境中那样编写代码并立即看到代码更改的结果,而是必须管理外部依赖项、构建容器并实施编排配置(例如 Kubernetes YAML)才能看到影响他们的代码更改。

有几种方法可以解决这个 Kubernetes 调试挑战:

  • 第一个是让您在本地开发服务并专注于单元测试而不是端到端测试,但是当服务/Web 应用程序具有身份验证要求和对数据库的依赖性时,这会很痛苦。
  • 解决这个问题的另一种方法是使用一个名为 DevSpace 的工具,它将自动执行您的构建和部署步骤,从而使其更快。
  • 最后,您还可以利用名为 Telepresence 的 CNCF 工具将本地开发环境连接到远程 Kubernetes 集群,从而可以访问远程 Kubernetes 集群中的这些外部依赖项,并针对本地正在开发的服务进行即时测试反馈回路。

2.分布式应用程序的端到端流程缺乏可见性

使用 Kubernetes 时的另一个调试挑战是全面了解应用程序的端到端流程,因为服务通常太多了。如果没有完全可见性,就很难识别和修复错误。

理想情况下,您应该能够获得跨服务可见性,了解什么在调用什么、什么在超时等。要解决这个问题,您需要利用能够使可观察性和跟踪更加无缝的工具。例如,工具 OpenTelemetry、Jaeger 和 Grafana Tempo 可以帮助您获取重现错误所需的信息。这里的目标是获取尽可能多的信息,当您这样做时,您将能够实时修复错误并最终提高应用程序的整体性能。

3.无法将调试器附加到代码

开发人员需要的最重要的事情之一是能够将调试器附加到他们的代码,而使用 Kubernetes 并不能使这变得容易。是的,打印/日志语句之类的东西可以工作,但它们远不及能够将调试器放在某物上并单步执行代码,特别是如果它是用户不熟悉的新代码库。

解决此 Kubernetes 调试问题的两种可能方法是:

  • 在本地开发并找到模拟或启动本地依赖项实例的方法。
  • 确保代码是可单元测试的,并专注于这些代码,因为它们更容易编写测试,也更容易调试。

4.使用本地更改执行集成测试的复杂设置

云原生应用程序通常由各种微服务组成。通常情况下,这些微服务相互依赖地工作并相互通信以处理更大的业务请求。

例如,社交媒体应用程序的时间线服务可能需要与用户配置文件服务对话以确定用户的关注者,同时可能需要与身份验证服务对话以确定用户的身份验证状态。由于微服务之间发生的这种多向的、服务到服务的通信,在部署任何更改之前对微服务执行集成测试至关重要,因为单独的单元测试并不总能保证目标中应用程序的行为环境。

在此上下文中执行集成测试自然涉及运行多个服务并连接到(可能是远程的)中间件和数据存储。这需要带来多重挑战的技术和工具。这些挑战包括资源有限以及生产和非生产环境之间的数据不一致;管理不同环境的不同配置;以及与管理服务版本控制、发布和部署周期相关的困难。

5.重现仅在生产/暂存中发生的问题

有时,重现在本地生产或暂存中发生的错误可能非常复杂。此时,您的模拟或现有值是不够的。

你会想,我怎样才能真正重现这个问题?我怎样才能更快地找到问题的根源?好吧,在面对 K8s 调试挑战时,一个名为 Telepresence 的开源工具通常是我的首选——该工具允许您访问远程依赖项,就像它们在本地运行一样,并将流量从远程服务重新路由到本地服务。

这意味着您可以实时调试它们,重现这些问题,并更快地将修复推送到您首选的版本控制和CI/CD管道。

结论

大多数组织坚持认为任何重要的软件交付都要经过多次迭代测试,但重要的是要记住错误是不可避免的。能够有效地调试应用程序是识别、理解和修复错误的最佳技术之一。Kubernetes 等容器技术为软件开发人员带来了许多好处,但也带来了应用程序调试挑战。幸运的是,有多种方法可以轻松应对这些挑战。

有关应对五大 Kubernetes 调试挑战的更多相关文章

  1. ruby-on-rails - 无法让 rspec、spork 和调试器正常运行 - 2

    GivenIamadumbprogrammerandIamusingrspecandIamusingsporkandIwanttodebug...mmm...let'ssaaay,aspecforPhone.那么,我应该把“require'ruby-debug'”行放在哪里,以便在phone_spec.rb的特定点停止处理?(我所要求的只是一个大而粗的箭头,即使是一个有挑战性的程序员也能看到:-3)我已经尝试了很多位置,除非我没有正确测试它们,否则会发生一些奇怪的事情:在spec_helper.rb中的以下位置:require'rubygems'require'spork'

  2. ruby - JetBrains RubyMine 3.2.4 调试器不工作 - 2

    使用Ruby1.9.2运行IDE提示说需要gemruby​​-debug-base19x并提供安装它。但是,在尝试安装它时会显示消息Failedtoinstallgems.Followinggemswerenotinstalled:C:/ProgramFiles(x86)/JetBrains/RubyMine3.2.4/rb/gems/ruby-debug-base19x-0.11.30.pre2.gem:Errorinstallingruby-debug-base19x-0.11.30.pre2.gem:The'linecache19'nativegemrequiresinstall

  3. ruby-on-rails - 如何调试 cucumber 测试? - 2

    我有:When/^(?:|I)follow"([^"]*)"(?:within"([^"]*)")?$/do|link,selector|with_scope(selector)doclick_link(link)endend我打电话的地方:Background:GivenIamanexistingadminuserWhenIfollow"CLIENTS"我的HTML是这样的:CLIENTS我一直收到这个错误:.F-.F--U-----U(::)failedsteps(::)nolinkwithtitle,idortext'CLIENTS'found(Capybara::Element

  4. Hive SQL 五大经典面试题 - 2

    目录第1题连续问题分析:解法:第2题分组问题分析:解法:第3题间隔连续问题分析:解法:第4题打折日期交叉问题分析:解法:第5题同时在线问题分析:解法:第1题连续问题如下数据为蚂蚁森林中用户领取的减少碳排放量iddtlowcarbon10012021-12-1212310022021-12-124510012021-12-134310012021-12-134510012021-12-132310022021-12-144510012021-12-1423010022021-12-154510012021-12-1523.......找出连续3天及以上减少碳排放量在100以上的用户分析:遇到这类

  5. ruby - Ruby 是否有类似于 Perl 的 "perl -d"的逐步调试器? - 2

    Ruby是否有逐步调试器,类似于Perl的“perl-d”? 最佳答案 ruby-debug(对于ruby1.8),debugger(对于ruby1.9),byebug(对于ruby​​2.0)以及trepanning系列都有一个-x或--trace选项。在调试器内部,命令setlinetrace将打开或关闭线路跟踪。这是themanualforruby-debug原来的答案已经修改,因为数据噪声文章的链接,唉,不再有效了。还添加了ruby​​-debug的后继者 关于ruby-Ruby

  6. Simulink方法总结和避坑指南(一)——Simulink入门与基本调试方法 - 2

    文章目录一、项目场景二、基本模块原理与调试方法分析——信源部分:三、信号处理部分和显示部分:四、基本的通信链路搭建:四、特殊模块:interpretedMATLABfunction:五、总结和坑点提醒一、项目场景  最近一个任务是使用simulink搭建一个MIMO串扰消除的链路,并用实际收到的数据进行测试,在搭建的过程中也遇到了不少的问题(当然这比vivado里面的debug好不知道多少倍)。准备趁着这个机会,先以一个很基本的通信链路对simulink基础和相关的debug方法进行总结。  在本篇中,主要记录simulink的基本原理和基本的SISO通信传输链路(QPSK方式),计划在下篇记

  7. ruby-on-rails - 使用 Pow 作为服务器在 RubyMine 中调试 - Ruby 2.1.1 + Rails 4 - 2

    我已经开始使用RubyMine6。我正在处理Rails4、Ruby2.1.1项目。我无法找到如何使用Pow作为服务器调试到RubyMine。你能给我指明正确的方向吗? 最佳答案 我能够使用远程调试从RubyMine进行调试。我正在使用RubyMine6、Rails3、Ruby2.1.1。首先创建一个.powenv文件并添加:exportRUBY_DEBUG_PORT=1234exportPOW_WORKERS=1将以下gem添加到您的Gemfile:gem'ruby-debug-ide'gem'debase'创建一个新的初始化器st

  8. ruby-on-rails - 放置调试语句 - 2

    当我编写代码时,我非常频繁地使用“puts”语句进行调试。它允许我查看服务器中发生的情况。在调试代码的时候,不知道是什么原因,我把这些“puts”语句去掉了。这是个好主意还是我应该保留它们以使我的服务器日志更加清晰? 最佳答案 您应该使用记录器而不是puts。使用这种语句:Rails.logger.debug"DEBUG:#{self.inspect}#{caller(0).first}"ifRails.logger.debug?如果您想(几乎)实时查看调试,只需在另一个终端窗口中使用tail命令:tail-Flog/develop

  9. ruby-on-rails - Rails 在记录 200 OK 后在做什么? (调试响应时间慢) - 2

    我试图在我的RubyonRails应用程序中调试一个极其缓慢的请求调用。我已设法根据自己的喜好优化Controller方法,Rails的日志告诉我它已在XX毫秒内完成操作(Completed200OKin5049ms(Views:34.9ms|ActiveRecord:76.3ms)).但是,在加载页面时,在浏览器中实际呈现任何内容之前打印此消息很长;最多约15秒的等待时间。Rackmini-profiler证实了这一点,告诉我GET操作(不计算完成Controller操作所花费的时间)花费了14秒左右。(分析器还确认Controller操作的执行时间约为5秒)。我可以接受Contro

  10. ruby:如何在调试时进入任意函数 - 2

    假设我在调试时停在了点上:defget_databyebug=>@cache||=calculate_dataend而@cache有值,所以step函数calculate_data不会被执行。但是我需要在这个确切的运行时点检查calculate_data内部发生了什么。我可以只执行calculate_data并在控制台输出中查看其结果,但是我可以从调试控制台执行函数并同时进入它?(使用byebug或其他一些调试工具)。目标-是在任意时间检查calculate_data逻辑,特别是当get_data调用时@cache已填充。 最佳答案

随机推荐