草庐IT

c# - 在 C# 中调用 _wtof_l 比从 C++ 本地调用它更快

coder 2024-02-19 原文

我正在用 C# 编写一些高性能代码,我想将我的实现与原生 C++ 代码进行比较,因为我经常调用 msvcrt 函数。令我惊讶的是,C# 版本的代码似乎比它的 native 版本 (!) 更快。有人可以解释这种行为吗?

C#版本:

using System.Diagnostics;
using System.Security;
using System.Runtime.InteropServices;

class Program
{
    [DllImport("msvcrt.dll", EntryPoint = "_wtof_l", CallingConvention = CallingConvention.Cdecl)]
    [SuppressUnmanagedCodeSecurity]
    private extern unsafe static double _wtof_l(char* str, IntPtr locale);

    [DllImport("msvcrt.dll", EntryPoint = "_create_locale", CallingConvention = CallingConvention.Cdecl)]
    private extern static IntPtr CreateLocale(int category, string locale);
    private const int LC_NUMERIC = 4;

    static unsafe void Main(string[] args)
    {
        var locale = CreateLocale(LC_NUMERIC, "C");
        fixed (char* test = "1.2")
        {
            int x = 10;
            while (x-- > 0)
            {
                var sw = Stopwatch.StartNew();

                double sum = 0;
                for (int i = 0; i < 10_000_000; i++)
                {
                    sum += _wtof_l(test, locale);
                }

                Console.WriteLine(sum + " " + sw.ElapsedMilliseconds);
            }
        }

        Console.ReadLine();
    }
}

C++ 版本:

#include <locale.h>
#include <stdio.h>  
#include <chrono>
#include <string>
#include <iostream>

int main()
{

    auto test = L"1.2";
    _locale_t locale = _create_locale(LC_NUMERIC, "C");

    int x = 10;
    while (x--)
    {
        auto start = std::chrono::high_resolution_clock::now();

        double sum = 0;
        for (int i = 0; i < 10000000; i++)
        {
            sum += _wtof_l(test, locale);
        }

        auto end = std::chrono::high_resolution_clock::now();
        std::chrono::duration<double> diff = end - start;

        std::cout << sum << " " << diff.count() << std::endl;

    }

    std::getline(std::cin, std::string());

    return 0;
}

这两个应用程序都是在 x86 版本上使用 VS2017 编译的,并且都在关闭 VisualStudio 的情况下运行了多次。以下是我机器上的结果。如您所见,C# 版本的速度提高了大约 30%:

有人可以解释这种令人困惑的行为吗?我的猜测是: 在默认 Win32 C++ ConsoleApplication 项目中未启用某些优化,或者 C++ 运行时在 C++ 应用程序中执行一些初始化代码,这会减慢对 _wtof_l 的调用。

最佳答案

我打了 0 分,这样我就不用等那么久了。中值:

C#  x86: 520 msec
C#  x64: 395 msec 
C++ x86: 408 msec
C++ x64: 273 msec

我会买的。请注意 64 位版本的 C# 程序如何打败 32 位 C++ 程序。这就是一种解释。

但您看到的更大差异很可能是因为您没有比较相同的 wtof() 实现。您的 C++ 程序使用 VS 安装附带的程序(通常是 msvcrxxx.dll),而不是 msvcrt.dll。 VS2015 中有一个非常大的重写。我从 Win10 Anniversary 测量了 VS2017 rtm,msvcrt.dll 的 CRT。

我经常看到的更大的图片结论:pinvoke marshaller 不烂,64 位代码不烂,托管代码往往是 80% 的 native 代码。还有 YMMV。

关于c# - 在 C# 中调用 _wtof_l 比从 C++ 本地调用它更快,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46625214/

有关c# - 在 C# 中调用 _wtof_l 比从 C++ 本地调用它更快的更多相关文章

  1. ruby - 使用 C 扩展开发 ruby​​gem 时,如何使用 Rspec 在本地进行测试? - 2

    我正在编写一个包含C扩展的gem。通常当我写一个gem时,我会遵循TDD的过程,我会写一个失败的规范,然后处理代码直到它通过,等等......在“ext/mygem/mygem.c”中我的C扩展和在gemspec的“扩展”中配置的有效extconf.rb,如何运行我的规范并仍然加载我的C扩展?当我更改C代码时,我需要采取哪些步骤来重新编译代码?这可能是个愚蠢的问题,但是从我的gem的开发源代码树中输入“bundleinstall”不会构建任何native扩展。当我手动运行rubyext/mygem/extconf.rb时,我确实得到了一个Makefile(在整个项目的根目录中),然后当

  2. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  3. 使用 ACL 调用 upload_file 时出现 Ruby S3 "Access Denied"错误 - 2

    我正在尝试编写一个将文件上传到AWS并公开该文件的Ruby脚本。我做了以下事情:s3=Aws::S3::Resource.new(credentials:Aws::Credentials.new(KEY,SECRET),region:'us-west-2')obj=s3.bucket('stg-db').object('key')obj.upload_file(filename)这似乎工作正常,除了该文件不是公开可用的,而且我无法获得它的公共(public)URL。但是当我登录到S3时,我可以正常查看我的文件。为了使其公开可用,我将最后一行更改为obj.upload_file(file

  4. ruby - 是否可以覆盖 gemfile 进行本地开发? - 2

    我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI

  5. c# - 如何在 ruby​​ 中调用 C# dll? - 2

    如何在ruby​​中调用C#dll? 最佳答案 我能想到几种可能性:为您的DLL编写(或找人编写)一个COM包装器,如果它还没有,则使用Ruby的WIN32OLE库来调用它;看看RubyCLR,其中一位作者是JohnLam,他继续在Microsoft从事IronRuby方面的工作。(估计不会再维护了,可能不支持.Net2.0以上的版本);正如其他地方已经提到的,看看使用IronRuby,如果这是您的技术选择。有一个主题是here.请注意,最后一篇文章实际上来自JohnLam(看起来像是2009年3月),他似乎很自在地断言RubyCL

  6. C# 到 Ruby sha1 base64 编码 - 2

    我正在尝试在Ruby中复制Convert.ToBase64String()行为。这是我的C#代码:varsha1=newSHA1CryptoServiceProvider();varpasswordBytes=Encoding.UTF8.GetBytes("password");varpasswordHash=sha1.ComputeHash(passwordBytes);returnConvert.ToBase64String(passwordHash);//returns"W6ph5Mm5Pz8GgiULbPgzG37mj9g="当我在Ruby中尝试同样的事情时,我得到了相同sha

  7. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  8. ruby - 调用其他方法的 TDD 方法的正确方法 - 2

    我需要一些关于TDD概念的帮助。假设我有以下代码defexecute(command)casecommandwhen"c"create_new_characterwhen"i"display_inventoryendenddefcreate_new_character#dostufftocreatenewcharacterenddefdisplay_inventory#dostufftodisplayinventoryend现在我不确定要为什么编写单元测试。如果我为execute方法编写单元测试,那不是几乎涵盖了我对create_new_character和display_invent

  9. 【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2

    在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList​()Obt

  10. ruby - 使用 `+=` 和 `send` 方法 - 2

    如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:

随机推荐