当前位置: 开发笔记 > 后端 > 正文

HowdoIstopGCCfromoptimizingthisbyte-for-bytecopyintoamemcpycall?

作者：sdfdsafgafsdf | 来源：互联网 | 2022-10-15 19:13

如何解决《HowdoIstopGCCfromoptimizingthisbyte-for-bytecopyintoamemcpycall?》经验，为你挑选了1个好方法。

I have this code for memcpy as part of my implementation of the standard C library which copies memory from src to dest one byte at a time:

void *memcpy(void *restrict dest, const void *restrict src, size_t len)
{
    char *dp = (char *restrict)dest;
    const char *sp = (const char *restrict)src;

    while( len-- )
    {
        *dp++ = *sp++;
    }

    return dest;
}

With gcc -O2, the code generated is reasonable:

memcpy:
.LFB0:
        movq    %rdi, %rax
        testq   %rdx, %rdx
        je      .L2
        xorl    %ecx, %ecx
.L3:
        movzbl  (%rsi,%rcx), %r8d
        movb    %r8b, (%rax,%rcx)
        addq    $1, %rcx
        cmpq    %rdx, %rcx
        jne     .L3
.L2:
        ret
.LFE0:

但是，在处gcc -O3，GCC将此天真的逐字节副本优化为memcpy调用：

memcpy:
.LFB0:
        testq   %rdx, %rdx
        je      .L7
        subq    $8, %rsp
        call    memcpy
        addq    $8, %rsp
        ret
.L7:
        movq    %rdi, %rax
        ret
.LFE0:

这将不起作用（memcpy无条件调用自身），并且会导致段错误。

我尝试过传递-fno-builtin-memcpy和-fno-loop-optimizations，并且发生相同的事情。

我正在使用GCC版本8.3.0：

Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/local/libexec/gcc/x86_64-cros-linux-gnu/8.3.0/lto-wrapper
Target: x86_64-cros-linux-gnu
Configured with: ../configure --prefix=/usr/local --libdir=/usr/local/lib64 --build=x86_64-cros-linux-gnu --host=x86_64-cros-linux-gnu --target=x86_64-cros-linux-gnu --enable-checking=release --disable-multilib --enable-threads=posix --disable-bootstrap --disable-werror --disable-libmpx --enable-static --enable-shared --program-suffix=-8.3.0 --with-arch-64=x86-64
Thread model: posix
gcc version 8.3.0 (GCC)

如何禁用使副本转换为memcpy呼叫的优化？

1> Antti Haapal..：

在这里似乎一件事就足够了：不用使用-fno-builtin-memcpyuse -fno-builtin来编译single的翻译单元memcpy！

另一种选择是通过-fno-tree-loop-distribute-patterns; 尽管这可能很脆弱，因为它禁止编译器先重新组织循环代码，然后再用对mem*函数的调用来替换其中的一部分。

或者，由于您不能依赖C库中的任何内容，-ffreestanding因此可以按顺序使用。

推荐阅读

server
Netty拆包粘包问题解决 —— 特殊结束符

本文介绍了解决Netty拆包粘包问题的一种方法——使用特殊结束符。在通讯过程中，客户端和服务器协商定义一个特殊的分隔符号，只要没有发送分隔符号，就代表一条数据没有结束。文章还提供了服务端的示例代码。 ... [详细]

蜡笔小新 2023-12-14 18:02:45
server
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
port
Centos7搭建ELK（Elasticsearch、Logstash、Kibana）教程及注意事项

本文介绍了在Centos7上搭建ELK（Elasticsearch、Logstash、Kibana）的详细步骤，包括下载安装包、安装Elasticsearch、创建用户、修改配置文件等。同时提供了使用华为镜像站下载安装包的方法，并强调了保证版本一致的重要性。 ... [详细]

蜡笔小新 2023-12-10 16:27:21
port
Linux环境变量$PATH的作用及使用方法

本文介绍了Linux环境变量$PATH的作用及使用方法。$PATH是一个由多个目录组成的变量，用冒号分隔。当执行一个指令时，系统会按照$PATH定义的目录顺序搜索同名的可执行文件，如果有多个同名指令，则先找到的会被执行。通过设置$PATH变量，可以在任何地方执行指令，无需输入绝对路径。 ... [详细]

蜡笔小新 2023-12-10 15:26:56
server
PHP组合工具以及开发所需的工具

本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件，包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境，包括推荐的AppServ等版本。 ... [详细]

蜡笔小新 2023-12-09 17:36:44
server
宋宝华：用systemd-nspawn运行最轻量级容器

systemd-nspawn可以创建最轻量级的容器（ns的意思就是namespace），本文的实验平台是Ubuntu16.04，x86_64机器。本文的目的是：在Ubuntu中用syst ... [详细]

蜡笔小新 2023-10-17 14:49:15
server
linux 字符串数组初始化,C++字符数组初始化方法的分析

发现了一个字符数组初始化的误区，而这个往往能导致比较严重的性能问题，分析介绍如下：往往我们在初始化一个字符数组，大概有如下几 ... [详细]

蜡笔小新 2023-10-16 20:46:26
server
dump备份不影响数据库正常运行,mysqldump数据库备份

本文目录一览：1、\mysybase.dump对数据库正常使用有影响吗 ... [详细]

蜡笔小新 2023-09-25 08:09:01
static
xmake0

xmake-ftmpxxx.luaxmake--filexxx.lua最简单:--添加名为demo的目标到工程target(demo)--设置目标程序类型为二进制,一般为 ... [详细]

蜡笔小新 2023-09-24 08:32:23
server
linux dump备份

我是这么写的， ... [详细]

蜡笔小新 2023-09-24 04:47:29
缓存
linux下vim换行,Vim不会接受换行

我有一个vim默认安装在Linux上，在一个系统上有vt52终端仿真器和unicode功能。Vim不会接受换行一切都工作正常，直到今天，当 ... [详细]

蜡笔小新 2023-09-24 03:23:37
static
并发系列之CAS与原子操作

并发系列之CAS与原子操作1、CAS的概念2、Java实现CAS的原理-Unsafe类3、原子操作-AtomicInteger类源码简析4、CAS实现原子操作的三大问题4.1、AB ... [详细]

蜡笔小新 2023-09-23 19:48:49
static
纠正网上的错误：自定义一个类叫java.lang.System/String的方法

本文纠正了网上关于自定义一个类叫java.lang.System/String的错误答案，并详细解释了为什么这种方法是错误的。作者指出，虽然双亲委托机制确实可以阻止自定义的System类被加载，但通过自定义一个特殊的类加载器，可以绕过双亲委托机制，达到自定义System类的目的。作者呼吁读者对网上的内容持怀疑态度，并带着问题来阅读文章。 ... [详细]

蜡笔小新 2023-12-11 16:54:20
static
【珍藏】2019年最新Vue相干佳构开源项目库汇总

媒介本文的前身是源自github上的项目awesome-github-vue,但由于该项目上次更新时候为2017年6月12日，许多内容早已逾期或是许多近期优异组件未被收录，所以小肆 ... [详细]

蜡笔小新 2023-10-17 14:33:46
static
ipad可以开发python_这15个应用,程序员用iPad照样可以编程!

1、DashAPI文档Dash是一个API文档浏览器，使用户可以使用离线功能即时搜索无数API。程序员使用Dash可访问iOS，MacOS， ... [详细]

蜡笔小新 2023-10-17 10:15:42

sdfdsafgafsdf

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章