假设我有一个无符号字符数组,代表一堆 POD 对象(例如,从套接字读取或通过 mmap 读取)。它们代表哪些类型以及在什么位置是在运行时确定的,但我们假设每个类型都已经正确对齐。
将这些字节“转换”为相应的 POD 类型的最佳方法是什么?
解决方案应该符合 c++ 标准(假设 >= c++11),或者至少保证可以使用 g++ >= 4.9、clang++ >= 3.5 和 MSVC >= 2015U3。编辑:在 linux、windows 上,在 x86/x64 或 32/64 位 arm 上运行。
理想情况下,我想做这样的事情:
uint8_t buffer[100]; //filled e.g. from network
switch(buffer[0]) {
case 0: process(*reinterpret_cast<Pod1*>(&buffer[4]); break;
case 1: process(*reinterpret_cast<Pod2*>(&buffer[8+buffer[1]*4]); break;
//...
}
或
switch(buffer[0]) {
case 0: {
auto* ptr = new(&buffer[4]) Pod1;
process(*ptr);
}break;
case 1: {
auto* ptr = new(&buffer[8+buffer[1]*4]) Pod2;
process(*ptr);
}break;
//...
}
两者似乎都有效,但两者都是 c++1) 中的 AFAIK 未定义行为。 并且只是为了完整性:我知道“通常”的解决方案是将这些东西复制到适当的局部变量中:
Pod1 tmp;
std::copy_n(&buffer[4],sizeof(tmp), reinterpret_cast<uint8_t*>(&tmp));
process(tmp);
在某些情况下,在其他情况下它可能没有开销,在某些情况下它甚至可能更快,但除了性能之外,我不再可以,例如修改数据,老实说:知道我在内存中的适当位置有正确的位,但我就是不能使用它们,这让我很恼火。
我想出的一个有点疯狂的解决方案是:
template<class T>
T* inplace_cast(uint8_t* data) {
//checks omitted for brevity
T tmp;
std::memmove((uint8_t*)&tmp, data, sizeof(tmp));
auto ptr = new(data) T;
std::memmove(ptr, (uint8_t*)&tmp, sizeof(tmp));
return ptr;
}
g++ 和 clang++ 似乎能够优化掉那些拷贝,但我认为这会给优化器带来很大负担,并可能导致其他优化失败,不适用于 const uint8_t* (虽然我不想实际修改它)而且看起来很糟糕(不要认为你会得到过去的代码审查)。
1) 第一个是 UB,因为它破坏了严格的别名,第二个可能是 UB ( discussed here ),因为标准只是说生成的对象没有初始化并且具有不确定的值(而不是保证底层内存不受影响)。我相信第一个等效的 c 代码定义良好,因此编译器可能会允许它与 c 头文件兼容,但我不确定。
最佳答案
最正确的方法是创建所需 POD 类的(临时)变量,并使用 memcpy() 将数据从缓冲区复制到该变量中:
switch(buffer[0]) {
case 0: {
Pod1 var;
std::memcpy(&var, &buffer[4], sizeof var);
process(var);
break;
}
case 1: {
Pod2 var;
std::memcpy(&var, &buffer[8 + buffer[1] * 4], sizeof var);
process(var);
break;
}
//...
}
这样做的主要原因是对齐问题:缓冲区中的数据可能未针对您使用的 POD 类型正确对齐。制作拷贝消除了这个问题。即使网络缓冲区不再可用,它也允许您继续使用该变量。
只有当您绝对确定数据正确对齐时,您才能使用您提供的第一个解决方案。
(如果你从网络读取数据,你应该首先检查数据是否有效,并且你不会在缓冲区之外读取数据。例如 &buffer[8 + buffer[1 ] * 4],您应该检查该地址的开头加上 Pod2 的大小不超过缓冲区长度。幸运的是,您使用的是 uint8_t,否则您还必须检查 buffer[1] 是否为负数。)
关于c++ - 将字节数组转换为 POD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41016334/
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
我的代码目前看起来像这样numbers=[1,2,3,4,5]defpop_threepop=[]3.times{pop有没有办法在一行中完成pop_three方法中的内容?我基本上想做类似numbers.slice(0,3)的事情,但要删除切片中的数组项。嗯...嗯,我想我刚刚意识到我可以试试slice! 最佳答案 是numbers.pop(3)或者numbers.shift(3)如果你想要另一边。 关于ruby-多次弹出/移动ruby数组,我们在StackOverflow上找到一
我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]
这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
我正在使用puppet为ruby程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
我有一个这样的哈希数组:[{:foo=>2,:date=>Sat,01Sep2014},{:foo2=>2,:date=>Sat,02Sep2014},{:foo3=>3,:date=>Sat,01Sep2014},{:foo4=>4,:date=>Sat,03Sep2014},{:foo5=>5,:date=>Sat,02Sep2014}]如果:date相同,我想合并哈希值。我对上面数组的期望是:[{:foo=>2,:foo3=>3,:date=>Sat,01Sep2014},{:foo2=>2,:foo5=>5:date=>Sat,02Sep2014},{:foo4=>4,:dat