当前位置: 首页 > news >正文

微网站建设套餐园林绿化东莞网站建设

微网站建设套餐,园林绿化东莞网站建设,关键词优化怎样做,服装网站建设的规划本文是性能问题分析排查思路的展开内容之一,主要分为日志1期,机器4期、环境2期共7篇系列文章,本期是第一篇,讲日志的分析方法和经验。 系列文章传送门: 一图梳理性能问题分析排查思路-总体概述(0&#xff…

本文是性能问题分析排查思路的展开内容之一,主要分为日志1期,机器4期、环境2期共7篇系列文章,本期是第一篇,讲日志的分析方法和经验。

系列文章传送门:
一图梳理性能问题分析排查思路-总体概述(0)

一般分析步骤

大数据领域,日志的范畴很广泛,主要思路如下:

  1. 收集相关日志

    • 任务日志:对于运行在YARN等分布式计算框架上的任务,首先要获取任务执行过程中的标准输出(stdout)和标准错误(stderr)日志,这些日志可能包含了任务启动、运行、失败的具体信息,包括错误栈、资源分配状况、任务进度等。

    关键在于找到第一现场,最后的错误往往是由更早的错误引发的!

    • 服务日志:针对具体的大数据服务组件,如HDFS NameNode、DataNode、YARN ResourceManager、NodeManager、Kafka Broker、HBase RegionServer等,收集其运行时的日志文件,这些日志记录了服务内部状态变化、请求处理情况、异常事件等重要信息。

错误不一定发生在每一个节点上,如不能定位到节点,分布式的服务需要关注每一个节点的信息。

  • 上下游服务日志:如果问题涉及到多个服务之间的交互,例如数据流经Elasticsearch、Flink、Kafka等中间件,也需要查看这些上游和下游服务的相关日志,以便确定数据传输是否正常、是否存在接口调用失败或超时等问题。

这招很管用!

  1. 筛选关键信息

    • 使用grep、awk等命令行工具或日志管理平台进行关键词过滤和搜索,快速定位到包含错误信息或异常堆栈的部分。
    • 查看日志中与时间戳相关的条目,找到问题发生的时间窗口内的日志记录(以便回溯对应时间段的硬件资源状态)。
  2. 关联分析

    • 将不同来源的日志按时间顺序排列,观察同一时间段内各服务的状态和交互情况。
    • 分析错误前后的上下文信息,寻找可能导致问题的触发因素,如资源耗尽、并发冲突、配置错误等。
  3. 深度解析

    • 对于复杂的系统错误或性能瓶颈,可能需要深入理解日志中所反映出的系统内部机制,比如内存溢出、磁盘空间不足、网络延迟高等问题(这在机器相关章节展开)。
    • 如果是代码级别的错误,通过错误栈跟踪查找引发问题的具体代码行,结合源码进一步分析(在环境章节展开讲)。
  4. 重现与调试

    • 在条件允许的情况下,尝试复现问题并开启额外的日志级别(debug或trace级别),以获取更详细的运行时信息。
    • 如果有必要,可以通过远程调试或者增加临时日志输出来追踪特定变量的变化或流程控制路径。

    不能重现的问题往往是没有找到根因!

常见的错误类型

HDFS与YARN类

组件错误关键词解释说明
Hadoopnamenode.SafeModeException安全模式下无法操作
HadoopConnectException: Call From datanode-hostDataNode连接失败
YARNConnectException:Failed to connect to serverResourceManager无法启动或连接失败
YARNFailed to launch container … ExitCode xx is -104容器初始化失败
YARNFileAlreadyExistsException输出目录已存在等
HadoopRemoteException: StandbyException …HA模式下Active NameNode变更
HadoopUnknownHostException: namenode-hostNameNode服务未响应或不可达
Hadoopsasl.SaslException: GSS initiate failedKerberos认证失败
YARNOutOfMemoryError: Java heap spaceMap或Reduce任务内存溢出
HadoopIOException: Failed to handshake with NNDataNode与NameNode之间通信失败

Hive和HBase类

组件错误关键词解释说明
HiveFAILED: MetaException(message:Got元数据比如表或分区创建、删除、更新等操作失败
HiveFAILED: ParseException line x:xxSQL语句解析错误,如语法不符合规范
HiveSemanticException [Error 10001]: Line xxSQL语句虽符合语法,但在执行计划生成阶段出现语义错误
HiveHiveExecutionException Error while processing在查询执行过程中发生的异常
Hive.FileNotFoundException: File does not exist与HDFS相关的读写错误,如文件不存在、权限不足
HiveDAG submission failed due toTez作为执行引擎时,由于资源不足等导致失败
Hivehive.serde2.SerDeException:在序列化或反序列化数据时遇到的问题
HBaseZooKeeperConnectionException: HBase is unable to connectZK连接异常
HBaseIllegalArgumentException: KeyValue size too largeRowKey过大错误
HBaseLease expired on client… for table …RegionServer租约过期错误

Spark类

组件错误关键词解释
SparkOutOfMemoryError: Java heap space内存溢出
SparkNoClassDefFoundError, ClassNotFoundException依赖库缺失或版本冲突
SparkSocketTimeoutException: Read timed out网络通信错误
SparkFetchFailedException: Connection fromSpark Shuffle错误
Sparksql.AnalysisException:Table or view not found表或视图不存在,或者SQL语句语法有误
SparkYarnAllocationException向YARN资源管理器申请资源失败

日志处理的常用命令

基础类:cat + grep关键字,less、more、tail

统计类:wc统计行数、字符数

管道类:awk配合grep

tail -n 1000 /var/log/hadoop/xxxx.log | grep "Error" | awk '{print $1, $4}' > errors.txt

工具类:split将很大的日志文件切分成小文件,zip或tar压缩!

http://www.yayakq.cn/news/282574/

相关文章:

  • 凡科网建站怎么样网络建站
  • UE4做购物网站台州网站建设方案托管
  • 珠海营销网站建设如何申请空间
  • 建设网站技术方案移动端网站开发标题设置
  • 部队网站建设方案引流推广平台有哪些
  • 怎么让自己的网站被百度收录柘城网站建设
  • 网站开发都需要什么软件免费推广平台网站
  • 重庆平台网站建设找哪家外贸公司如何接单
  • 滨海网站建设公司商业网站策划书模板范文
  • 专业网站开发哪里找保定网站搜索排名
  • 微信app网站建设微网站开发
  • 网站平台建设项目检查汇报材料c 是用来做网站的吗
  • 注册新公司网上核名网站上海做网站报价
  • 纯html5网站静态网站特点
  • 企业营销型网站seo推广做网站与全网营销搜索推广排名优化
  • 河南建设工程质量监督局网站阿勒泰建设局网站
  • 页面无法设置wordpress南宁seo优化公司
  • 做美食网站视频下载深圳注册公司怎么注册
  • 杭州大型网站建设枫林seo
  • 部门网站建设内容方案自己创建个人免费网站
  • 大丰区城乡和住房建设局网站盘锦网站开发公司
  • qt做网站服务器挖矿网站怎么做
  • 做国外营销型网站微商城微网站开发
  • 热卖平台网站怎么做网站开发的职业目标
  • 滁州市建设局网站西安最新出行政策
  • 参与网站网站建设做网站的标题图片
  • 做软件常用的网站有哪些软件有哪些wordpress 模板添加图片
  • 网站多久会被百度收录wordpress广告代码是什么
  • 毕业答辩问题怎么做的这个网站网站用图怎么做文件小质量高
  • 备案 网站下线深圳西丽网站建设公司