作者: wangting
spark-streaming中用spark-sql(insert into table)方式落地文件,group by 落地影响文件个数
程序描述: sparkstreaming读取kafka文件,把需…
hdfs 安全模式的理解
安全模式是hadoop的一种保护机制,用于保证集群中的数据块的安…
Hadoop-2.X HA模式下的FSImage和EditsLog合并过程
一、什么是FSImage和EditsLog 我们知道HDFS是一…
spark 启动参数小记
num-executors 参数说明:该参数用于设置Spark作…
ZooKeeper和CAP理论及一致性原则
一、CAP理论概述 分布式领域中存在CAP理论,且该理论已被证明…
zookeeper的应用场景
众所周知通常分布式架构都是中心化的设计,就是一个主控机连接多个处…
zookeeper 选举机制
zookeeper集群 配置多个实例共同构成一个集群对外提供服务…
zookeeper- 安装小记
三台机器: 10.210.208.48 10.210.208.4…
hive mapjoin
MapJoin是Hive的一种优化操作,其适用于小表JOIN大表…