当前位置: 开发笔记 > 编程语言 > 正文

记一次JAVA程序的性能调优

作者：mobiledu2502938577 | 来源：互联网 | 2023-09-12 14:11

背景笔者最近一个阶段做一个大数据方面的项目。和其他大数据项目使用Spark，ES不同，这个项目使用存文件的方式。写文件时把用户所需要的数据全部准备好，典型的以磁盘空间换用户查询时间的方式。大概流程如下

背景

笔者最近一个阶段做一个大数据方面的项目。和其他大数据项目使用Spark，ES不同，这个项目使用存文件的方式。

写文件时把用户所需要的数据全部准备好，典型的以磁盘空间换用户查询时间的方式。

大概流程如下：数据进来-->原始数据落磁盘-->小时数据汇总成各种数据报表-->天数据汇总成各种数据报表-->月数据汇总成各种报表。

原始数据量为170亿每天，最终生成各种报表后大概为200G每天，并且要做到数据具有实时性。

一些经验

1. 写代码的时候不用考虑性能问题。当前的环境是机器便宜，人贵，为了速度，时间，上线，先出东西再说。

2. 使用监控工具，比如Munin,看性能瓶颈在什么地方，是内存，CPU还是IO。

CPU的情况，需要找出热点地区，推荐使用VisualVM, 看CPU最长的线程，函数，找出来，看是否代码有问题，计算是否有优化空间，如果没有只有加硬件一个方法。
内存情况，笔者为了减少IO情况，刚开始的时候，为了减少写磁盘的次数，把100个甚至1000个原始数据文件放在内存中，然后集中写，但这样再遇到其他线程同时执行写磁盘操作的时候，往往造成outofmemory error 。所以，需要根据数据量来估计内存大小。
尽量集中写，对于同一个文件，尽量集中写，而不是多次写。
磁盘情况。内存的buffer对磁盘IO非常重要，如果java进程挤占太多系统内存，导致buffer比较小，这会造成写磁盘非常非常的慢。buffer为操作系统对写文件操作buffer的空间，如果这个空间变小，会造成每一次写磁盘都直接跟比较慢的磁盘打交道。

内存图中绿色部分为应用程序所用，蓝色部分为buffer。 CPU图中，蓝色部分为用户所用，紫色部分为IO等待的CPU消耗时间。两边对比，可看出，当内存buffer比较小的时候，CPU IO等待时间非常大，这直接造成CPU的浪费，和数据的积压。所有java的xms参数不能把系统内存吃的太多。

推荐阅读

text
编程语言是从哪蹦出来的——大型伦理寻根现场

Hello，我是Alex007，一个热爱计算机编程和硬件设计的小白，为啥是007呢？因为叫Alex的人太多了，再加上每天007的生活，Alex007就诞生了。聊一聊编程到底是啥，怎 ... [详细]

蜡笔小新 2024-09-30 11:12:40
input
Spark各组件功能简单理解（quick start）

各个组件confspark-env.sh配置spark的环境变量confspark-default.conf配置spark应用默认的配置项和spark-env.sh有重合之处，可在 ... [详细]

蜡笔小新 2024-09-29 10:05:20
text
flash代码_正点原子【STM32F407探索者】第三十九章 FLASH 模拟 EEPROM 实验

1)资料下载:点击资料即可下载2)对正点原子Linux感兴趣的同学可以加群讨论：9354467413）关注正点原子公众号，获取最新资料更新 ... [详细]

蜡笔小新 2024-09-30 15:58:28
text
统计一个文件calcCharNum.txt（见附件）中字母‘A‘和‘a‘出现的总次数

importjava.io.BufferedReader;importjava.io.File;importjava.io.FileReader;importjava.io. ... [详细]

蜡笔小新 2024-09-30 13:46:51
input
java播放mp3格式音乐_java播放mp3格式音频文件

下载完成之后解压提取jl1.0.0.1.jar这里写图片描述将jl1.0.0.1.jar拷贝到项目中，并添加到Library这里写图片描述4.源代码Tip:由于工程名 ... [详细]

蜡笔小新 2024-09-29 17:28:42
shell
【linux】课前准备及计算机入门

文章目录前言必知必会的软件服务器分类机架式服务器塔式服务器刀片式服务器三者的区别虚拟服务器（云服务器）服务器的硬件组成服务器常见的品牌前言本文是循序渐进学linux的第一课，为 ... [详细]

蜡笔小新 2024-09-28 19:21:51
shell
《ASP.NET MVC 4 实战》 1.3 ASP.NET MVC 3/4的新特性

本节书摘来自异步社区《ASP.NETMVC4实战》一书中的第1章，第1.3节，作者：【美】JeffreyPalermo,【美】JimmyB ... [详细]

蜡笔小新 2024-09-27 12:32:28
audio
百度_音频转文字

手机49kbps转换比特率256Kpbs{‘corpus_no’:‘7045177033217452815’,‘err_msg’:‘success.’,‘err_no’:0,‘re ... [详细]

蜡笔小新 2024-09-26 17:35:21
audio
【JVM技术专题】深入分析CG管理和原理查缺补漏「番外篇」

前提概要本文主要针对HotspotVM中“CMSParNew”组合的一些使用场景进行总结。自Sun发布Java语言以来，开始使用GC技术来进行内存自动管理࿰ ... [详细]

蜡笔小新 2024-09-26 17:30:39
input
启动tomcat时,报错:IOException while loading persisted sessions: java.io.EOFException解决方法

window.onload=function(){varinput=document.getElementById(inputinput.onblur= ... [详细]

蜡笔小新 2024-09-26 11:20:05
config
PHP Warning: Module ‘modulename’ already loaded in问题解决办法【PHP】

后端开发|php教程PHP,Warning,Module,modulename,already,loaded后端开发-php教程出现标题这样的错误大概是：充值网站源码,虚拟机下运行 ... [详细]

蜡笔小新 2024-09-25 14:59:37
text
《Asp.Net 2.0 揭秘》（四）

*MIME：百度百科,就是通知浏览器是什么多媒体类型的类型。*ASP.NET:执行用户，2k3中是NETWORKSERVICE,其它系统是ASPNET帐 ... [详细]

蜡笔小新 2024-09-25 11:47:52
uri
IntelliJ IDEA 卡成球了？

在和同事的一次讨论中发现，对IntelliJIDEA内存采用不同的设置方案，会对IDE的速度和响应能力产生不同的影响。Don’tbeaScroogeandgiveyourIDEso ... [详细]

蜡笔小新 2024-09-24 19:37:16
md5
猪猪猫.CNWINXPSP2电脑城装机12DVD[豪华版]

直接下载地址http:bt.jujumao.cn点击下载种子下载信息[点击浏览该文件:2007-12-19猪猪猫.cn-winxpsp2电脑城装机12豪华版.torrent]| ... [详细]

蜡笔小新 2024-09-28 05:02:01
node.js
Node.js[3] Buffer

JavaScript语言自身只有字符串数据类型，没有二进制数据类型。但在处理像TCP流或文件流时，必须使用到二进制数据。因此在Node.js中&#x ... [详细]

蜡笔小新 2024-09-26 18:44:26

mobiledu2502938577

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章