嵌入式Linux系统性能提升的关键切入点与优化策略

作者：高玉成 | 来源：互联网 | 2024-11-07 11:14

在嵌入式Linux系统中，性能低下通常由CPU、内存和I/O三个关键因素引起。为了有效提升系统性能，首先需要识别并定位性能瓶颈。通过综合分析这些瓶颈，可以采取针对性的优化措施，如调整内核参数、优化算法和改进数据结构等，从而显著提高系统的整体性能。

   系统软件性能低下的问题&＃xff0c;主要与三种因数有关&＃xff1a;CPU、内存、IO。
   如何优化系统的性能&＃xff1f;
   第一步&＃xff0c;找出系统性能的瓶颈。
&＃xff08;1&＃xff09;程序的运算量很大&＃xff0c;CPU过于繁忙&＃xff0c;CPU是瓶颈。
    可以通过top命令观察CPU的利用率情况。
&＃xff08;2&＃xff09;过多或过于频繁的读写文件、内存等I/O操作&＃xff0c;CPU更多的是处于等待&＃xff0c;(存储设备、网络设备、异步IO)等I/O操作是性能瓶颈。
&＃xff08;3&＃xff09;内存不够。物理内存不够时会使用交换内存, 使用交换内存会带来磁盘IO和CPU的开销增加.交换空间是专门用于临时存储内存的一块磁盘空间&＃xff0c;通常在页面调度和交换进程数据时使用.调页算法是将内存中最近不常使用的页面换到磁盘上&＃xff0c;把常使用的页面&＃xff08;活动页面&＃xff09;保留在内存中供进程使用。当程序运行需要的内存大于物理内存时&＃xff0c;linux系统采用了调页机制&＃xff0c;即系统copy一些内存中的页面到磁盘上&＃xff0c;腾出来空间供进程使用。
大多数系统可以忍受偶尔的调页&＃xff0c;但是频繁的调页会使系统性能急剧下降。

(4) 带宽。如网络带宽、系统总线带宽等

&＃xff08;5&＃xff09;文件系统性能(大文件优化、小文件优化、写优化、读优化、网络文件系统)。

(6) 多线程性能

一些经验&＃xff1a;

1. 小文件读写的性能瓶颈是磁盘的寻址&＃xff08;随机读写性能更差&＃xff09;&＃xff0c;评估的标准是tps

2. 大文件读写的性能瓶颈是带宽&＃xff0c;评估的标准是持续的读写速度

3. Linux可以利用空闲内存作文件系统访问的cache&＃xff0c;因此系统内存越大存储系统的性能也越好

第二步&＃xff0c;着手进行优化

1.堆内存和数据段内存的优化&＃xff1a;

malloc一般会实现一个内存堆来管理这些内存,malloc分配的内存都会以若干chunk的方式放到内存堆中。每次用户调用malloc动态分配内存的时候&＃xff0c;malloc会先到内存堆里进行查找&＃xff0c;如果内存堆里没有合适的空闲chunk&＃xff0c;再利用brk/malloc系统调用分配一大块内存&＃xff0c;然后把新分配的大块内存放到内存堆中&＃xff0c;并生成一块合适的chunk块返回给用户。

当用户用free释放chunk的时候&＃xff0c;可能并不立即使用系统调用释放内存&＃xff0c;而是将释放的chunk作为空闲chunk加入内存堆中&＃xff0c;和其他的空闲chunk合并&＃xff0c;便于下次分配的时候再次使用。

一般说来&＃xff0c;释放的chunk如果标记为mmap申请的&＃xff0c;则使用munmap释放。如果是brk申请的&＃xff0c;进一步判断堆顶之下的空闲chunk是否大于128KB&＃xff0c;如果是&＃xff0c;则使用brk()释放。如果小于128KB&＃xff0c;仍由内存堆维护。这样对brk()的使用就会有个问题&＃xff0c;当brk()释放的内存块在堆顶之下&＃xff0c;且内存块到堆顶之间还有未释放的内存。那么这块内存的释放将不会成功&＃xff0c;从而形成内存空洞。

glibc管理的内存唯一释放的条件是堆顶存在128k&＃xff08;M_TRIM_THRESHOLD&＃xff09;或以上的空闲区时才会释放.这样就会形成内存空洞。

内存空洞&＃xff1a;当存在内存空洞时&＃xff0c;它会从空洞中分配&＃xff0c;并不会导致内存使用的增加&＃xff1b;

内存泄露&＃xff1a;当libc收到内存分配请求时&＃xff0c;只能占用更多内存。

针对大块内存的申请和释放不会导致内存空洞的形成。

堆内存的优化&＃xff1a;

&＃xff08;1&＃xff09;glibc管理的内存绝大多数情况下不会释放。
因此编程时如果是小内存分配要尽快使用&＃xff0c;尽快用完&＃xff0c;尽快释放&＃xff08;变成空闲chunk&＃xff09;&＃xff0c;不要停留&＃xff0c;否则一直摞着&＃xff0c;线性地址后面的就形成了空洞。

&＃xff08;2&＃xff09;如果是想内存总在控制中&＃xff0c;可以分配大内存&＃xff0c;自行管理释放和分配。不用的时候可以释放地很干净
&＃xff08;3&＃xff09;不要分配很小的内存比如几个字节&＃xff0c;因为一次malloc至少分配16个字节&＃xff0c;如果每次分配都很小&＃xff0c;就太亏了。
所以尽量减少小块内存的申请&＃xff0c;避免内存浪费。

&＃xff08;4&＃xff09;降低M_MMAP_THRESHOLD&＃xff0c;可以让更多的分配走mmap&＃xff0c;避免brk的种种问题&＃xff0c;特别是64位机器的情况下。
&＃xff08;5&＃xff09;降低M_TRIM_THRESOLD,让堆顶的空闲内存更容易释放。

以上&＃xff08;4&＃xff09;&＃xff08;5&＃xff09;都不可避免会增加系统调用的机会&＃xff0c;使用中需要慎重。

数据段内存的优化&＃xff1a;

&＃xff08;1&＃xff09;将只读的全局变量&＃xff0c;加上const,从而使其转移到代码段&＃xff1b;

&＃xff08;2&＃xff09;去除不必要的全局变量&＃xff1b;

&＃xff08;3&＃xff09;减少全局变量的尺寸&＃xff1b;

可以通过nm,查找到所有在数据段的符号&＃xff0c;从而想办法修改它。

动态库的使用&＃xff1a;

&＃xff08;1&＃xff09;静态加载&＃xff1a;无法按需动态卸载动态库

&＃xff08;2&＃xff09;dlopen&＃xff1a;可按需卸载动态库&＃xff0c;从而节省了内存&＃xff0c;但程序在启动时&＃xff0c;需要查找定位代码&＃xff0c;从而会降低性能。

代码优化的一些经验&＃xff1a;

&＃xff08;1&＃xff09;运算处理优化&＃xff1a;简化数学表达式、用移位运算代替乘除运算、乘法运算比除运算快、使用增量和减量运算符等&＃xff1b;

&＃xff08;2&＃xff09;算法优化&＃xff1a;根据发生频率对switch语句进行排列、将大的switch语句简化为嵌套switch语句等、用指针取代数组、使用宏函数取代函数。

&＃xfeff;&＃xfeff;

推荐阅读

ip
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
timestamp
深入解析JVM垃圾收集器

本文基于《深入理解Java虚拟机：JVM高级特性与最佳实践》第二版，详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景，帮助读者更好地理解和优化JVM内存管理。 ... [详细]

蜡笔小新 2024-12-28 13:35:19
default
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
function
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
function
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
default
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
default
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
default
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
default
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
post
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
java
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
include
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
include
深入理解KMP算法中的next数组：北大OJ 2406题解

本文详细探讨了KMP算法中next数组的构建及其应用，重点分析了未改良和改良后的next数组在字符串匹配中的作用。通过具体实例和代码实现，帮助读者更好地理解KMP算法的核心原理。 ... [详细]

蜡笔小新 2024-12-28 11:30:01
post
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
post
Deepin系统下MySQL 5.7安装指南

本文详细记录了在基于Debian的Deepin 20操作系统上安装MySQL 5.7的具体步骤，包括软件包的选择、依赖项的处理及远程访问权限的配置。 ... [详细]

蜡笔小新 2024-12-28 10:48:41

高玉成

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章