Skip to content

程序员灯塔

Menu
  • Download
  • sitemap
  • 文章归档
  • 标签归档
  • 示例页面
Menu

Spark 1.4 Sql运行时driver端占用内存过多

Posted on 2019 年 10 月 12 日

Spark 1.4执行SQL查询过程中发现driver端Spark作业进程占用内存过大

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
5109 liuxinmi 20 0 9152m 8.5g 18m S 99.9 13.5 7:04.13 java
15632 liuxinmi 20 0 9172m 8.5g 18m S 99.9 13.6 7:58.39 java
22145 liuxinmi 20 0 9155m 8.2g 18m S 99.9 13.1 3:47.78 java
4332 liuxinmi 20 0 9175m 8.7g 18m S 99.9 13.8 9:16.78 java

作业中做join操作时进行了broadcast。
被broadcast的表需要从driver端发送到executor机器,当较大时会撑满driver端内存。
可通过调整spark.sql.autoBroadcastJoinThreshold大小解决。

近期文章

  • 技术网站
  • 世界,您好!
  • Git学习记录(learngitbranching.js.org)
  • 阿里职场潜规则
  • 寻找两个正序数组的中位数

近期评论

  1. 一位 WordPress 评论者 发表在 世界,您好!

归档

  • 2024 年 9 月
  • 2024 年 3 月
  • 2022 年 12 月
  • 2021 年 8 月
  • 2021 年 6 月
  • 2021 年 3 月
  • 2021 年 2 月
  • 2020 年 11 月
  • 2020 年 5 月
  • 2020 年 3 月
  • 2019 年 11 月
  • 2019 年 10 月
  • 2019 年 9 月
  • 2019 年 7 月
  • 2019 年 6 月
  • 2019 年 5 月
  • 2019 年 3 月
  • 2018 年 9 月
  • 2018 年 8 月
  • 2018 年 7 月
  • 2018 年 4 月
  • 2018 年 2 月
  • 2018 年 1 月
  • 2017 年 12 月
  • 2017 年 11 月
  • 2017 年 10 月
  • 2017 年 8 月
  • 2017 年 7 月

分类目录

  • 未分类
©2025 程序员灯塔 | Design: Newspaperly WordPress Theme