运行任何英特尔AVX函数后,数学函数需要更多周期

前端之家收集整理的这篇文章主要介绍了运行任何英特尔AVX函数后,数学函数需要更多周期前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

参见英文答案 > Using AVX instructions disables exp() optimization?                                    1个
我注意到运行任何英特尔AVX功能后,数学函数(如ceil,round,…)需要更多的cpu周期.

请参阅以下示例:

#include dio.h>
#include 

编译:gcc -Wall -lm -mavx foo.c

输出是:

round res 31999997总周期224725952 CPI 22

round res 31999997 total cycles 1900864520 CPI 190

请指教.

最佳答案
反汇编生成代码.

我的猜测是会有额外的寄存器保存/恢复,或类似的东西.

原文链接:/linux/440859.html

猜你在找的Linux相关文章