热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

线上服务异常的定位、处理与优化的探索–第一章概述

一.1. 课题背景 项目在实施、交付、运维过程中难免出现过各种各样的线上服务异常发生。线上服务不同于本地,本地调试千好万好上线也运行难免出现问题。如:CPU爆满、起飞、生产环境

一.1. 课题背景

 

项目在实施、交付、运维过程中难免出现过各种各样的线上服务异常发生。线上服务不同于本地,本地调试千好万好上线也运行难免出现问题。如:CPU爆满、起飞、生产环境突然卡顿、宕机、部分功能出现性能抖动、应用资源消耗过大等。

这些问题不仅严重影响生产环境的稳定性,也影响着客户对我们产品的信任与最终质量评价。使用合适的技术进行服务异常的快速排查、诊断、定位、优化,以及使用合理的运维与监控技术将极大的提高技术人员的生产力,更好的赢得客户对我们的评价、信任。同时,高质量的技术保障也将成为影响着项目最终是否快速、成功交付的一项重要指标。


一.2. 课题意义

 

作为技术顾问,我们在不断积累各个项目的经验和学习产品的过程中,也进行着技术的积累。逐渐形成和总结出一套的关于线上服务异常的快速定位、诊断、排查的思路与方法。对以后项目中出现各种各样的线上服务异常,提供一套快速排查和处理的思路与方案,尽量减少排查问题的成本。


一.3. 课题内容

 

课题针对常见的线上服务问题做简单描述,并给出排查和分析的相关技术详细使用讲解,以及几处实际案例的具体处理方式与演示。最后引入自动化运维、监控工具的介绍与具体使用方式。


一.4. 课题团队

 xxxx


一.5. 参考文献

 



















































文献或工具


作用


地址


JConsole


内存、线程、堆栈分析


JDK/BIN内置


VisualVM


线程、内存、CPU、GC监控工具


MAT


基于Eclipse内存泄露分析工具


www.eclipse.org/mat


JProfiler


内存、CPU、线程、性能采集剖析工具


www.ej-technologies.com


Arthas


Alibaba开源的Java诊断工具


https://arthas.gitee.io


Zabbix


基于Web的开源的系统监控与运维工具


www.zabbix.com


深入理解Java虚拟机


周志明,机械工业出版社


Think in Java


Bruce Eckel,机械工业出版社


栈缺省值


https://docs.oracle.com/en/java/javase/11/tools/java.html#GUID-3B1CE181-CD30-4178-9602-230B800D4FAE



一.6. 课题局限

 

课题内容与演示系统均基于JAVA编程语言所开发的项目。其中,第六章《监控与自动运维》适用于目前公司所有产品、项目。全文使用linux环境,用以模拟正式生产环境,同时使用XXX项目作为真实项目演示。



推荐阅读
  • 全面解析运维监控:白盒与黑盒监控及四大黄金指标
    本文深入探讨了白盒和黑盒监控的概念,以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法,结合四个黄金指标的解读,帮助读者更好地理解和实施有效的监控策略。 ... [详细]
  • 本文详细介绍了Grand Central Dispatch (GCD) 的核心概念和使用方法,探讨了任务队列、同步与异步执行以及常见的死锁问题。通过具体示例和代码片段,帮助开发者更好地理解和应用GCD进行多线程开发。 ... [详细]
  • 本文详细探讨了如何通过分析单个或多个线程在瓶颈情况下的表现,来了解处理器资源的消耗。无论是单进程还是多进程环境,监控关键指标如线程数量、占用时间及调度优先级等,有助于揭示潜在的性能问题。 ... [详细]
  • 离线安装Grafana Cloudera Manager插件并监控CDH集群
    本文详细介绍如何离线安装Cloudera Manager (CM) 插件,并通过Grafana监控CDH集群的健康状况和资源使用情况。该插件利用CM提供的API接口进行数据获取和展示。 ... [详细]
  • ElasticSearch 集群监控与优化
    本文详细介绍了如何有效地监控 ElasticSearch 集群,涵盖了关键性能指标、集群健康状况、统计信息以及内存和垃圾回收的监控方法。 ... [详细]
  • vivo Y5s配备了联发科Helio P65八核处理器,这款处理器采用12纳米工艺制造,具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外,它还集成了先进的图像处理单元和语音唤醒功能,为用户提供卓越的性能体验。 ... [详细]
  • 访问一个网页的全过程
    准备:DHCPUDPIP和以太网启动主机,用一根以太网电缆连接到学校的以太网交换机,交换机又与学校的路由器相连.学校的这台路由器与一个ISP链接,此ISP(Intern ... [详细]
  • 对于许多初学者而言,遇到总线错误(bus error)或段错误(segmentation fault/core dump)是极其令人困扰的。本文详细探讨了这两种错误的成因、表现形式及解决方法,并提供了实用的调试技巧。 ... [详细]
  • 了解计算机的序列号和主板型号对于多种用途至关重要。本文将详细介绍如何使用命令提示符和第三方工具,在Windows 10系统中轻松获取这些关键硬件信息。 ... [详细]
  • 深入理解Java多线程并发处理:基础与实践
    本文探讨了Java中的多线程并发处理机制,从基本概念到实际应用,帮助读者全面理解并掌握多线程编程技巧。通过实例解析和理论阐述,确保初学者也能轻松入门。 ... [详细]
  • 深入理解进程与线程:创建子进程和子线程的区别
    本文详细探讨了进程与线程的概念,解释了它们在资源分配和程序执行中的不同角色。通过对比进程和线程的创建方式及其特点,帮助读者更好地理解两者之间的差异。 ... [详细]
  • 本文详细介绍了Java中实现异步调用的多种方式,包括线程创建、Future接口、CompletableFuture类以及Spring框架的@Async注解。通过代码示例和深入解析,帮助读者理解并掌握这些技术。 ... [详细]
  • 本文详细介绍如何使用 Apache Spark 执行基本任务,包括启动 Spark Shell、运行示例程序以及编写简单的 WordCount 程序。同时提供了参数配置的注意事项和优化建议。 ... [详细]
  • 深入剖析JVM垃圾回收机制
    本文详细探讨了Java虚拟机(JVM)中的垃圾回收机制,包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容,开发人员可以更好地优化内存管理和程序性能。 ... [详细]
  • 精选多款高效实用软件及工具推荐
    本文介绍并推荐多款高效实用的软件和工具,涵盖系统优化、网络加速、多媒体处理等多个领域,并提供安全可靠的下载途径。 ... [详细]
author-avatar
我从不在乎O心痛
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有