c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为

coder 2023-05-31 原文

我一直试图弄清楚如何在不调用未定义行为的情况下从 C++17 访问映射缓冲区。对于这个例子，我将使用 Vulkan 的 vkMapMemory 返回的缓冲区。 .

所以，根据 N4659 (最终的 C++17 工作草案)，第 [intro.object] 节(强调):

The constructs in a C++ program create, destroy, refer to, access, and manipulate objects. An object is created by a definition (6.1), by a new-expression (8.3.4), when implicitly changing the active member of a union (12.3), or when a temporary object is created (7.4, 15.2).

显然，这些是创建 C++ 对象的唯一有效方法。因此，假设我们得到一个 void* 指针，指向主机可见(和一致)设备内存的映射区域(当然，假设所有必需的参数都有有效值并且调用成功，并且返回的内存块足够大并且正确对齐):

void* ptr{};
vkMapMemory(device, memory, offset, size, flags, &ptr);
assert(ptr != nullptr);

现在，我希望以 float 数组的形式访问此内存。显而易见的事情是 static_cast 指针并继续我的快乐方式如下:

volatile float* float_array = static_cast<volatile float*>(ptr);

(包含volatile，因为它被映射为相干内存，因此GPU可以在任何时候写入)。但是，float 数组在该内存位置技术上并不存在，至少在引用摘录的意义上不存在，因此通过这样的指针访问内存会是未定义的行为。因此，根据我的理解，我有两个选择:

1。 `memcpy` 数据

应该总是可以使用本地缓冲区，将其转换为 std::byte* 和 memcpy representation 到映射区域。 GPU 将按照着色器中的指示解释它(在这种情况下，作为 32 位 float 的数组)，从而解决了问题。但是，这需要额外的内存和额外的拷贝，所以我宁愿避免这种情况。

2。放置-`new`数组

似乎 [new.delete.placement] 部分不对如何获得放置地址施加任何限制(它不必是 safely-derived pointer，无论实现的指针安全性如何)。因此，应该可以通过placement-new 创建一个有效的 float 组，如下所示:

volatile float* float_array = new (ptr) volatile float[sizeInFloats];

指针 float_array 现在应该可以安全访问(在数组的范围内，或过去一次)。

所以，我的问题如下:

简单的 static_cast 确实是未定义的行为吗？
此展示位置-新 用法是否已明确定义？
此技术是否适用于类似情况，例如 accessing memory-mapped hardware ?

作为旁注，我从来没有通过简单地转换返回的指针遇到问题，我只是想弄清楚这样做的正确方法是什么，根据标准的字母。

最佳答案

简答

根据标准，涉及硬件映射内存的所有内容都是未定义的行为，因为抽象机器不存在该概念。您应该引用您的实现手册。

长答案

尽管硬件映射内存在标准中是未定义的行为，但我们可以想象任何理智的实现都提供了一些遵守通用规则。一些构造比其他构造更多未定义行为(无论这意味着什么)。

Is the simple static_cast indeed undefined behavior?
volatile float* float_array = static_cast<volatile float*>(ptr);

是的，this is undefined behavior并且已经在 StackOverflow 上讨论过很多次。

Is this placement-new usage well-defined?
volatile float* float_array = new (ptr) volatile float[N];

不，尽管这看起来定义明确，这取决于实现。碰巧，operator ::new[]允许保留一些开销 ^1, ² ，除非您检查您的工具链文档，否则您无法知道多少。因此，::new (dst) T[N]需要大于或等于 N*sizeof T 的未知内存量和任何 dst您分配的可能太小，涉及缓冲区溢出。

How to proceed, then?

一种解决方案是手动构建一系列 float :

auto p = static_cast<volatile float*>(ptr);
for (std::size_t n = 0 ; n < N; ++n) {
    ::new (p+n) volatile float;
}

或者等效地，依赖于标准库:

#include <memory>
auto p = static_cast<volatile float*>(ptr);
std::uninitialized_default_construct(p, p+N);

这个结构是连续的 N未初始化 volatile float ptr 指向的内存中的对象.这意味着您必须在阅读它们之前对其进行初始化；读取未初始化的对象是未定义的行为。

Is this technique applicable to similar situations, such as accessing memory-mapped hardware?

不，再次这确实是实现定义的。我们只能假设您的实现做出了合理的选择，但您应该检查其文档的内容。

关于c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53340727/

amp 未定 code strong float c++language-lawyer c++17 volatile mapped-memory

有关c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为的更多相关文章

ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby - 如何在 Ruby 中顺序创建 PI - 2
出于纯粹的兴趣，我很好奇如何按顺序创建PI，而不是在过程结果之后生成数字，而是让数字在过程本身生成时显示。如果是这种情况，那么数字可以自行产生，我可以对以前看到的数字实现垃圾收集，从而创建一个无限系列。结果只是在Pi系列之后每秒生成一个数字。这是我通过互联网筛选的结果:这是流行的计算机友好算法，类机器算法:defarccot(x,unity)xpow=unity/xn=1sign=1sum=0loopdoterm=xpow/nbreakifterm==0sum+=sign*(xpow/n)xpow/=x*xn+=2sign=-signendsumenddefcalc_pi(digits
ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2
作为我的Rails应用程序的一部分，我编写了一个小导入程序，它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是，与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存，我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关，因为当我删除对LDAP内容的调用时，内存使用情况会很好地稳定下来。此外，不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray，它们都是LDAP库的一部分。当我运行导入时，内存使用量最终达到超过1GB的峰值。如果问题存在，我需要找到一些方法来更正我的代
ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2
我正在尝试设置一个puppet节点，但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter，它工作正常，但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件，它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
ruby - 如何在 buildr 项目中使用 Ruby 代码？ - 2
如何在buildr项目中使用Ruby？我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序，我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/)，但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻，因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 难道Lua没有和Ruby的method_missing相媲美的东西吗？ - 2
我好像记得Lua有类似Ruby的method_missing的东西。还是我记错了？最佳答案表的metatable的__index和__newindex可以用于与Ruby的method_missing相同的效果。关于ruby-难道Lua没有和Ruby的method_missing相媲美的东西吗？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/7732154/
ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他，以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时，出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
ruby-on-rails - 如何在 ruby 中使用两个参数异步运行 exe？ - 2
exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby中使用两个参数异步运行exe吗？我已经尝试过ruby命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe，无需等待进程完成是否有任何rubygems会支持我的问题？最佳答案您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除
ruby-on-rails - 在混合/模块中覆盖模型的属性访问器 - 2
我有一个包含模块的模型。我想在模块中覆盖模型的访问器方法。例如:classBlah这显然行不通。有什么想法可以实现吗？最佳答案您的代码看起来是正确的。我们正在毫无困难地使用这个确切的模式。如果我没记错的话，Rails使用#method_missing作为属性setter，因此您的模块将优先，阻止ActiveRecord的setter。如果您正在使用ActiveSupport::Concern(参见thisblogpost)，那么您的实例方法需要进入一个特殊的模块:classBlah

c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为

1。 memcpy 数据

2。放置-new数组

简答

长答案

有关c++ - 如何在 C++ 中正确访问映射内存而没有未定义的行为的更多相关文章

随机推荐

1。 `memcpy` 数据

2。放置-`new`数组