Sql由SQLContext处理,HQL由HiveContext…
Spark作业中Partition数目的划分是由什么决定的?
如果是读取hdfs的文件,一般来说,partition的数量等于…
spark 解决排序任务慢的小技巧
对query按PV排序的时候, 特别慢, 原因是query往往很…
Spark 1.4 on Yarn的计算资源参数配置同Spark 1.2区别
Spark 1.4 on Yarn的计算资源参数配置同Spark…
Spark 1.4 Sql运行时driver端占用内存过多
Spark 1.4执行SQL查询过程中发现driver端Spar…
spark运行中 Task运行报exceeds spark.akka.frameSize
报错信息如下: org.apache.spark.SparkEx…
spark mapreduce 报IOException: No space left on device
spark和mapreduce如果运行时报如下错误: java….
spark写HDFS文件,在UI上显示完成但后台会hang住一段时间
执行类似 xxx.write.format(“par…
spark作业运行报org.apache.spark.shuffle.FetchFailedException
spark在运行过程中出现task fail 报如下错误: or…
spark Sql语句很长时Driver端出现栈溢出 java.lang.StackOverflowError
执行类似如下形式的Sql: select user_id fro…