草庐IT

windows - 在 go 中提供 samba 文件的矛盾性能

coder 2023-07-01 原文

我在 go 中编写了一个程序,它充当 samba 共享的简单 HTTP 接口(interface):用户向 http://proxy.example.com/?path=\\repository\foo\bar.txt 发出 get 请求。和 \\repository\foo\bar.txt通过 http.ServeFile(或多或少)提供。

然而,表现却很糟糕。我运行了一些基准测试,结果让我很难过。对于上下文,图中有三台机器:samba 服务器(文件所在的位置)、代理服务器(go 程序运行的地方)和最终用户的机器(我最终希望文件获取的地方)。 samba 服务器和代理服务器位于同一位置,最终用户相距很远。

使用 Windows 副本从 samba 机器直接复制到用户机器的运行速度约为 1.5MB/s。这对我来说已经足够了,也是我在代理服务中的目标。

不幸的是curl 'http://proxy.example.com/?path=\\repository\foo\bar.txt' > bar.txt来自用户机器的时钟大约为 150KB/s。

那么,让我们看看 samba 服务器和代理服务器之间是否存在连接问题。从 samba 服务器到代理服务器的副本看起来正在……大约 15MB/s。

嗯,也许这是一件好事?我将编写一个 go 程序来衡量传输速度。

src, _ := os.Open("\\\\repository\\foo\\bar.txt")
start := time.Now()
written, _ := io.Copy(ioutil.Discard, src)
elapsed := time.Since(start)
bytesPerSecond := written/int64(elapsed/time.Second)

党,15MB/s。

好吧,好吧,也许 go 代码中还有其他东西导致了这个问题。远程到代理服务器,启动IE,进入http://proxy.example.com/?path=\\repository\foo\bar.txt , 15MB/秒。

好的,所以我的代码显然运行良好,它必须是代理服务器和最终用户之间的连接。我来复制 bar.txt到代理服务器并在 url 中使用其本地路径,\mycoolfiles\bar.txt .呵呵,1.5MB/s。

为了让事情变得更奇怪,我碰巧有 C:\mycoolfiles设置为名为 \\alexscoolfiles 的网络共享, 和 http://proxy.example.com/?path=\\alexscoolfiles\bar.txt时钟在,dun dun dun,150KB/s。

为了证实这个疯狂,我将 go 程序改为分两步运行:
  • 将文件从共享复制到本地硬盘
  • http.SendFile 从那里

  • 瞧,在文件以 15MB/s 的速度传输时稍作停顿后,下载以稳定的 1.5MB/s 开始。

    所以,share->proxy 是 15MB/s,proxy->user 是 1.5MB/s,但是 share->proxy->user 是……150KB/s?比应该的慢十倍?除非你和代理在同一台机器上,否则它应该和它应该一样快?更进一步,即使访问的是完全相同的文件,只要一个是 UNC 路径而另一个只是本地路径,这个问题就存在吗?

    什么?

    请帮忙,我只是不知道。

    编辑:所以我的预感是(正如评论的那样)它与 TCP 有关。有问题的代码已被隔离到几乎只有 io.Copy。
  • 我知道当读取器是 samba 文件,而写入器是 ioutil.Discard 时,我会获得最大吞吐量。
  • 我知道当读取器是本地文件而写入器是 http.Response 时,无论使用响应的客户端的带宽和 RRT 是多少,我都会获得最大吞吐量。
  • 我知道当读取器是一个 samba 文件时,写入器是一个 http.Response,并且连接是本地的,我得到了最大的吞吐量。
  • 我知道当读取器是 samba 文件时,写入器是 http.Response,并且连接不是本地的,我的吞吐量很差(~1/10)。

  • 查看 io.Copy,似乎唯一可能导致问题的是读取 samba 文件和写入响应的时间之间的相互作用;足够快的写入器使读取 samba 文件达到最大吞吐量,足够快的读取器使 http.Response.Write 达到最大吞吐量,但将它们结合起来会使一切变得糟糕。

    非常有帮助的是......实际发生了什么,更重要的是,我如何才能让这个问题消失。

    最佳答案

    在试图准确地追踪我可以在何处以及在什么情况下重现该问题之后,我终于将其归结为一行:如果我注释掉 io.Copy 使用 ReadFrom 的位置(当前 io/io.go,第 358 行),我将获得最大吞吐量.

    检查 ReadFrom 的实现位置( net/http/server.go ,第 381 行):

    // ReadFrom is here to optimize copying from an *os.File regular file
    // to a *net.TCPConn with sendfile.
    

    我真的没有深入挖掘的意愿,但我猜这叫 net/sendfile_windows.go ,它调用 TransmitFile 系统调用,在它和我们的各种服务器配置之间的某个地方发生了一些不好的事情。

    解决方案是从 http.ServeFile 复制并粘贴我需要的东西,然后在将它传递给 io.Copy 之前将 ResponseWriter 转换为 io.Writer(或其他):
    type writerOnly struct {
        io.Writer
    }
    
    //...
    io.Copy(writerOnly{w}, f)
    //...
    

    关于windows - 在 go 中提供 samba 文件的矛盾性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29358125/

    有关windows - 在 go 中提供 samba 文件的矛盾性能的更多相关文章

    1. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

      我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

    2. ruby - 其他文件中的 Rake 任务 - 2

      我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

    3. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

      我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

    4. ruby - 在 Ruby 程序执行时阻止 Windows 7 PC 进入休眠状态 - 2

      我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0

    5. ruby-on-rails - Rails 3 中的多个路由文件 - 2

      Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

    6. ruby - 将差异补丁应用于字符串/文件 - 2

      对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl

    7. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

      我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

    8. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

      使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

    9. Ruby 写入和读取对象到文件 - 2

      好的,所以我的目标是轻松地将一些数据保存到磁盘以备后用。您如何简单地写入然后读取一个对象?所以如果我有一个简单的类classCattr_accessor:a,:bdefinitialize(a,b)@a,@b=a,bendend所以如果我从中非常快地制作一个objobj=C.new("foo","bar")#justgaveitsomerandomvalues然后我可以把它变成一个kindaidstring=obj.to_s#whichreturns""我终于可以将此字符串打印到文件或其他内容中。我的问题是,我该如何再次将这个id变回一个对象?我知道我可以自己挑选信息并制作一个接受该信

    10. ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2

      我正在编写一个小脚本来定位aws存储桶中的特定文件,并创建一个临时验证的url以发送给同事。(理想情况下,这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针,它似乎不符合这个标准,但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A

    随机推荐