特尔_草庐IT

c++ - 英特尔 C++ 编译器作为微软的替代品？

这里有人使用IntelC++编译器而不是Microsoft的Visualc++编译器吗？我很想听听您在集成、性能和构建时间方面的经验。最佳答案英特尔编译器是可用的最先进的C++编译器之一，与MicrosoftVisualC++编译器相比，它具有许多优点，但还有一个主要缺点。优点包括:非常好的SIMD支持，据我所知，它是对SIMD指令支持最好的编译器。支持自动并行化(多核优化)和手动(通过OpenMP)，两者都做得很好。支持CPU调度，这非常重要，因为它允许编译器在程序运行时针对处理器优化指令。据我所知，这是唯一可用的C++编译器

英特 amp C++section c++visual-studio ide compiler-construction

linux - 与 AT&T 相比，英特尔汇编语法的局限性

就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter寻求指导。关闭10年前。对我来说，英特尔语法更容易阅读。如果我只专注于英特尔语法的汇编森林，我会错过任何东西吗？我有什么理由想切换到AT&T(除了能够阅读其他人的AT&T程序集之外)？我的第一个线索是gdb默认使用AT&T。如果这很重要，我只关注任何关系汇编和语法可能对Linux/BSD和C语言有影响。最佳答案确实没

英特局限性 section stackoverflow linux assembly x86 att intel-syntax

c++ - 有使用英特尔线程构建模块的经验吗？

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭4年前。Improvethisquestion英特尔的ThreadingBuildingBlocks(TBB)开源库看起来真的很有趣。即使有一个O'ReillyBook关于这个主题，我没有听说很多人使用它。我有兴趣将它用于Unix(Mac、Linux等)环境中的一些多级并行应用程序(MPI+线程)。对于它的值(value)，我对高性能计算/数值方法类应用很感兴趣。有没有人有过TBB的经验？它运作良好吗？它是否相当可移植(包括GCC和其

英特 amp section noreferrer stackoverflow c++multithreading intel tbb

c++ - 有使用英特尔线程构建模块的经验吗？

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭4年前。Improvethisquestion英特尔的ThreadingBuildingBlocks(TBB)开源库看起来真的很有趣。即使有一个O'ReillyBook关于这个主题，我没有听说很多人使用它。我有兴趣将它用于Unix(Mac、Linux等)环境中的一些多级并行应用程序(MPI+线程)。对于它的值(value)，我对高性能计算/数值方法类应用很感兴趣。有没有人有过TBB的经验？它运作良好吗？它是否相当可移植(包括GCC和其

英特 amp section noreferrer stackoverflow c++multithreading intel tbb

io - 使用英特尔 Fortran 编译器避免列表导向输出中的换行符

我注意到Fortran中的列表导向输出write(*,*)的结果是依赖于编译器的。确实，用代码:programonereal(8),dimension(5)::r1doi=1,5r1(i)=sqrt(i*10.0)enddowrite(*,*)(r1(i),i=1,5)endprogramoneintel编译器ifort给出标准输出，被换行符打破:3.162277698516854.472136020660405.477225303649906.324555397033697.07106781005859而gfortran给出了等效的一行结果:3.16227766016837954.4

英特换行符 section code io formatting fortran

c++ - 为什么英特尔的 icc 的 malloc 比 new 慢 7 倍？

我在分配float组时对malloc与new进行了基准测试。我的理解是malloc执行的操作是new执行的操作的子集——malloc只是分配，但new分配和构造，尽管我不确定这对于原语是否有意义。使用gcc的基准测试结果给出了预期的行为。malloc()更快。甚至有一些问题与这个问题相反。使用iccmalloc可以比new慢7倍。怎么可能？!接下来的一切只是基准测试过程的细节。对于基准测试，我使用了最近描述的协议(protocol)byIntel.这是我的结果。使用GNU的gcc分配4000个float的数组时经过的时钟周期:newmemoryallocation,cycles1216

英特 amp malloc code 34 c++performance memory-management icc

c++ - 为什么英特尔的 icc 的 malloc 比 new 慢 7 倍？

我在分配float组时对malloc与new进行了基准测试。我的理解是malloc执行的操作是new执行的操作的子集——malloc只是分配，但new分配和构造，尽管我不确定这对于原语是否有意义。使用gcc的基准测试结果给出了预期的行为。malloc()更快。甚至有一些问题与这个问题相反。使用iccmalloc可以比new慢7倍。怎么可能？!接下来的一切只是基准测试过程的细节。对于基准测试，我使用了最近描述的协议(protocol)byIntel.这是我的结果。使用GNU的gcc分配4000个float的数组时经过的时钟周期:newmemoryallocation,cycles1216

英特 amp malloc code 34 c++performance memory-management icc

c++ - 英特尔 TBB 的可扩展分配器如何工作？

tbb::scalable_allocator是什么意思？在英特尔线程构建模块中实际上做了什么？它肯定是有效的。我刚刚使用它通过更改单个std::vector将应用程序的执行时间减少了25%(并且看到在4核系统上CPU利用率从~200%增加到350%)至std::vector>.另一方面，在另一个应用程序中，我看到它使已经很大的内存消耗翻了一番，并将东西发送到交换城市。英特尔自己的文档并没有提供很多内容(例如，本FAQ末尾的一小部分)。在我自己深入研究它的代码之前，谁能告诉我它使用了什么技巧？更新:刚刚第一次使用TBB3.0，并且看到了从可扩展分配器中获得的最佳加速。换单vector到

英特 amp section code c++multithreading stl malloc tbb

c++ - 英特尔 TBB 的可扩展分配器如何工作？

tbb::scalable_allocator是什么意思？在英特尔线程构建模块中实际上做了什么？它肯定是有效的。我刚刚使用它通过更改单个std::vector将应用程序的执行时间减少了25%(并且看到在4核系统上CPU利用率从~200%增加到350%)至std::vector>.另一方面，在另一个应用程序中，我看到它使已经很大的内存消耗翻了一番，并将东西发送到交换城市。英特尔自己的文档并没有提供很多内容(例如，本FAQ末尾的一小部分)。在我自己深入研究它的代码之前，谁能告诉我它使用了什么技巧？更新:刚刚第一次使用TBB3.0，并且看到了从可扩展分配器中获得的最佳加速。换单vector到

英特 amp section code c++multithreading stl malloc tbb

c++ - 英特尔 TBB 和微软 PPL 有什么区别？

我打算开始“玩”跨平台项目的基于任务的并行性。我想使用英特尔线程构建模块。我从Windows和VisualStudio开始。由于我目前只想制作原型(prototype)，我正在考虑仅在Windows上“玩”，然后有足够的知识在所有兼容平台上使用该库。我了解到，自VS2010以来，Microsoft提供了一个类似的库，即并行处理库，它具有(几乎)与IntelTBB相同的接口(interface)。一些消息来源(包括TBB的团队博客)建议他们一起构建它并且它是同一个库。但它并不是很明确，因为它经常暗示两个库之间存在细微差别。那么，如果有的话，这些区别是什么？我应该直接从最后一个稳定的ITB

英特 amp section code TBB c++parallel-processing comparison ppl