SPARKFeature:Spark支持GBK文件读取功能 Feature:Spark支持GBK文件读取功能 需求分析 Spark默认的Text输入格式处理同Hadoop相同,均默认以UTF-8编码处理。 如果源本件本身是其他格式编码的,如GBK,在Spark处理后读出就会是乱码。 例如一张有关餐馆信息的数据可能是: 4504812|聚品面馆 5623102|金米粒抓饭 5623112|湘下茶饭 ……继续阅读 » wangting 4年前 (2019-11-01) 1292浏览 3个赞