__int128对齐段故障与gcc-OSSE优化

作者：马璐720 | 来源：互联网 | 2022-12-03 17:45

如何解决《__int128对齐段故障与gcc-OSSE优化》经验，为你挑选了1个好方法。

我__int128用作struct的成员.它可以找到-O0(没有优化).

但是,如果启用了优化(-O1),则会因段故障而崩溃.

它在指令处崩溃movdqa,需要将var对齐16,而地址的分配malloc()仅由8对齐.

我尝试禁用SSE优化-mno-sse,但无法编译:

/usr/include/x86_64-linux-gnu/bits/stdlib-float.h:27:1: error: SSE register return with SSE disabled

所以,我能做些什么,如果我想使用__int128和-O1两者兼而有之？

在此先感谢吴

顺便说一下,如果__int128仅在堆栈上使用(不在堆上),似乎没问题.

====编辑====

对不起,我没说实话.

其实我没用过malloc().我使用了一个内存池lib,它返回8对齐的地址.我说malloc()只是为了让事情变得简单.

经过测试,我已经知道它malloc()与16对齐.并且__int128成员也在结构中对齐16.

所以问题是我的内存池lib.

非常感谢.

1> Peter Cordes..：

对于X86-64系统V,alignof(maxalign_t) == 16所以malloc总是返回16字节对齐的指针.听起来你的分配器坏了,如果用的话也会违反ABI long double.(将其作为答案重新发布,因为事实证明这是答案).

返回的内存malloc保证能够保存任何标准类型,因此这意味着如果大小足够大,则足够对齐.

这不能是32位代码,因为gcc不支持__int12832位目标.(32位glibc malloc仅保证8字节对齐.)

通常,如果违反类型的对齐要求,则允许编译器生成出错的代码.在x86上,通常只会使用未对齐的内存,直到编译器使用对齐所需的SIMD指令.即使是错误对齐的自动向量化uint16_t*也可能出错(为什么对mmap的内存进行未对齐访问有时会在AMD64上出现段错误？),所以不要认为窄类型总是安全的.使用memcpy,如果你需要表达C.不对齐的负载

显然alignof(__int128)是16.所以他们没有重复i386 System V中的怪异,即使是8字节对象也只保证4字节对齐,而struct-packing规则意味着编译器不能给它们自然对齐.

这是一件好事,因为它使用SSE进行复制变得高效,并且意味着_Atomic __int128不需要任何额外的特殊处理来避免lock cmpxchg16b缓慢的高速缓存行分裂.

推荐阅读

shell
【技术分享】一个 ELF 蠕虫分析

【技术分享】一个 ELF 蠕虫分析 ... [详细]

蜡笔小新 2023-10-17 16:12:28
main
linux进阶50——无锁CAS

1.概念比较并交换(compareandswap，CAS)，是原⼦操作的⼀种，可⽤于在多线程编程中实现不被打断的数据交换操作࿰ ... [详细]

蜡笔小新 2023-12-09 10:10:40
get
深入浅出Linux设备驱动编程的重要性与方法

本文介绍了深入浅出Linux设备驱动编程的重要性，以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子，展示了模块的编译和加载过程，并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]

蜡笔小新 2023-12-12 15:28:09
text
qemu模拟arm并调试汇编的方法和注意事项

原文地址http://balau82.wordpress.com/2010/02/28/hello-world-for-bare-metal-arm-using-qemu/最开始时 ... [详细]

蜡笔小新 2023-10-17 19:43:26
main
VS用c语言连接mysql,c语言连接mysql完整演示

#include#includeintmain(){MYSQL*conn;创建一个指向mysql数据类型的指针connmysql_init(NULL);mysql的初始化if(!c ... [详细]

蜡笔小新 2023-10-16 13:56:56
main
Linux环境变量函数getenv、putenv、setenv和unsetenv详解

本文详细解释了Linux中的环境变量函数getenv、putenv、setenv和unsetenv的用法和功能。通过使用这些函数，可以获取、设置和删除环境变量的值。同时给出了相应的函数原型、参数说明和返回值。通过示例代码演示了如何使用getenv函数获取环境变量的值，并打印出来。 ... [详细]

蜡笔小新 2023-12-13 12:01:03
python
Android源码深入理解JNI技术的概述和应用

本文介绍了Android源码中的JNI技术，包括概述和应用。JNI是Java Native Interface的缩写，是一种技术，可以实现Java程序调用Native语言写的函数，以及Native程序调用Java层的函数。在Android平台上，JNI充当了连接Java世界和Native世界的桥梁。本文通过分析Android源码中的相关文件和位置，深入探讨了JNI技术在Android开发中的重要性和应用场景。 ... [详细]

蜡笔小新 2023-12-13 10:00:57
python
CentOS 7部署KVM虚拟化环境之一架构介绍

本文介绍了CentOS 7部署KVM虚拟化环境的架构，详细解释了虚拟化技术的概念和原理，包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]

蜡笔小新 2023-12-12 21:38:57
main
李逍遥寻找仙药的迷阵之旅

本文讲述了少年李逍遥为了救治婶婶的病情，前往仙灵岛寻找仙药的故事。他需要穿越一个由M×N个方格组成的迷阵，有些方格内有怪物，有些方格是安全的。李逍遥需要避开有怪物的方格，并经过最少的方格，找到仙药。在寻找的过程中，他还会遇到神秘人物。本文提供了一个迷阵样例及李逍遥找到仙药的路线。 ... [详细]

蜡笔小新 2023-12-12 13:59:33
main
深入理解Java虚拟机的并发编程与性能优化

本文主要介绍了Java内存模型与线程的相关概念，探讨了并发编程在服务端应用中的重要性。同时，介绍了Java语言和虚拟机提供的工具，帮助开发人员处理并发方面的问题，提高程序的并发能力和性能优化。文章指出，充分利用计算机处理器的能力和协调线程之间的并发操作是提高服务端程序性能的关键。 ... [详细]

蜡笔小新 2023-12-09 19:52:01
main
centos查看系统版本,linux安装centos

三、查看Linux版本查看系统版本信息的命令:lsb_release-a[root@localhost~]#lsb_release-aLSBVersion::co ... [详细]

蜡笔小新 2023-10-17 17:48:44
object
关于linux：如何建立一个\’./configure

Howtobuilda./configure&&make&&makeins ... [详细]

蜡笔小新 2023-10-17 11:03:38
main
linux 字符串数组初始化,C++字符数组初始化方法的分析

发现了一个字符数组初始化的误区，而这个往往能导致比较严重的性能问题，分析介绍如下：往往我们在初始化一个字符数组，大概有如下几 ... [详细]

蜡笔小新 2023-10-16 20:46:26
python
python可以调用c编写的api吗_python 怎么调用c语言接口

展开全部ctypes:可直接调用c语言动态链接库。使用步骤：1编译好自己的动态连接库2利用ctypes载入动态连接库3用ctype调用C函数636f707962 ... [详细]

蜡笔小新 2023-10-16 18:31:54
python
Linux进程控制块PCBtask_struct结构体结构及作用详解

本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用，包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]

蜡笔小新 2023-12-13 21:31:18

马璐720

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章