热门标签 | HotTags
当前位置:  开发笔记 > IOS > 正文

英特尔的asm文档中的“未定义”是什么意思?FST对C0,C2,C3的影响

如何解决《英特尔的asm文档中的“未定义”是什么意思?FST对C0,C2,C3的影响》经验,为你挑选了1个好方法。

英特尔®64和IA-32体系结构软件开发人员手册(第2卷)表示,对于FST / FSTP FPU指令F 受影响的标志

如果发生堆栈下溢,则C1设置为0。指示是否生成浮点不精确异常(#P)的舍入方向:0?不综述 1个 围捕。

C0,C2,C3未定义。

简单的测试(几乎没有任何价值)告诉我,C0,C2,C3不会受到影响:

#include 
#include 

#include 
#include 

int main()
{
    double x = -1.0;
    std::uint16_t a = 0, b = 0;
    asm volatile ("fld %[x] ; ftst ; fnstsw %%ax ; mov %%ax, %[a] ; fstp %%st ; fnstsw %%ax ; mov %%ax, %[b] ;"
       : [a]"=m"(a), [b]"=m"(b)
       : [x]"t"(x)
       : "cc", "memory");
    std::cout <(a) <(b) <

“未定义”是什么意思?FSTP可以更改值,还是仅更改它们的值?



1> Peter Cordes..:

如果是这样,它将说“未修改”或“不受影响”。

“未定义”表示该值可以是任何值,并且在CPU微体系结构之间可能有所不同。某些CPU可能会保留旧值,某些CPU可能会清除或设置这些位,或者某些微体系结构状态会泄漏到每次运行指令时可能不同的位中。或者可以根据是否为NaN或Inf来设置它们。

但是,英特尔没有记录任何有关将发生哪种行为的任何记录。最重要的是,保持其选择的开放性使其在将来的CPU中可能会有所不同,因此,如果要编写安全的,面向未来的代码,则测试当前CPU的功能将毫无用处。

(尽管英特尔很可能会继续做目前所做的事情。但是一些重新设计可能会有所不同。)当然,其他厂商可能也会有所不同。值得检查AMD的x86手册,看看他们是否说出CPU的功能。


(产生一个未定义的不是像C未定义的行为。它不会破坏你的程序的其余部分。C2将读为0或1,而不是把它放到它甚至可能没有运行任何指令再次改变一些奇怪的状态记录为影响C2。)


当输入= 0的目标寄存器值为“ undefined”时,asm文档中“ undefined”的另一种用法用于bsfbsr指令(并且ZF设置为1)。

实际上,在这种情况下,英特尔硬件不会更改目标。(所以有点像cmov您可以在运行之前将input = 0的结果放入输出中的情况bsf)。实际上 AMD确实在其AMD手册记录了这种行为,并且大概是Intel关心的某些软件取决于这种行为。因此,英特尔极不可能更改它,而IDK为什么他们不只是记录它,以便我们可以利用它。 lzcnt并且tzcnt已经存在于BMI1中,并且输入= 0行为明确。

这种未经修改的dst行为会带来实际的性能损失:这意味着指令需要输入依赖项,否则它将成为只写目标。这会创建错误的依赖关系,从而防止exec混乱。(更糟糕的是,在Skylake之前的CPU上,lzcnt并且tzcnt具有相同的错误输出依赖项popcnt。Skylake之后的至少两个uarch仍然具有这种错误输出依赖项 。)


推荐阅读
  • 在计算机技术的学习道路上,51CTO学院以其专业性和专注度给我留下了深刻印象。从2012年接触计算机到2014年开始系统学习网络技术和安全领域,51CTO学院始终是我信赖的学习平台。 ... [详细]
  • 距离11月的软考还有不到五个月的时间,考试将于11月5日至6日举行。许多朋友对软考的具体情况还不太了解:它是什么?有何用途?本文将为你详细解答。 ... [详细]
  • 优化联通光猫DNS服务器设置
    本文详细介绍了如何为联通光猫配置DNS服务器地址,以提高网络解析效率和访问体验。通过智能线路解析功能,域名解析可以根据访问者的IP来源和类型进行差异化处理,从而实现更优的网络性能。 ... [详细]
  • 本文详细分析了JSP(JavaServer Pages)技术的主要优点和缺点,帮助开发者更好地理解其适用场景及潜在挑战。JSP作为一种服务器端技术,广泛应用于Web开发中。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • Valve 发布 Steam Deck 的新版 Windows 驱动程序
    Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序,旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 本文总结了汇编语言中第五至第八章的关键知识点,涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容,帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]
  • 本文介绍了如何使用jQuery根据元素的类型(如复选框)和标签名(如段落)来获取DOM对象。这有助于更高效地操作网页中的特定元素。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 优化版Windows 10 LTSC 21H2企业版:适用于低内存设备
    此版本为经过优化的Windows 10 LTSC 21H2企业版,特别适合低内存配置的计算机。它基于官方版本进行了精简和性能优化,确保在资源有限的情况下依然能够稳定运行。 ... [详细]
author-avatar
yyyyyyyyyyyyy燁
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有