• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

标签:sparksql

开发技术

大数据简介,技术体系分类整理

大数据简介,技术体系分类整理
本文源码:GitHub·点这里 || GitEE·点这里大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术则主要用来解决海量数据的存储和分析。 ……继续阅读 »

开发技术 2周前 (09-14) 14浏览 0个赞

开发技术

Apache Hudi + AWS S3 + Athena实战

Apache Hudi + AWS S3 + Athena实战
Apache Hudi在阿里巴巴集团、EMIS Health,LinkNovate,Tathastu.AI,腾讯,Uber内使用,并且由Amazon AWS EMR和Google云平台支持,最近Amazon Athena支持了在Amazon S3上查询Apache Hudi数据集的能力,本博客将测试Athena查询S3上Hudi格式数据集。 ……继续阅读 »

开发技术 2个月前 (08-03) 55浏览 0个赞

开发技术

大数据技术栈,主要有哪些

大数据技术栈,主要有哪些
往大数据方向发展需要学哪些技术?网上一搜真是指不胜屈。对于小白来说,实在是一头雾水,到底哪些是当下流行的?哪些是必须要先学会的?流行?主次搞不清。为了解决这些疑惑,羚羊专门花了些时间,  挨个技术去研究对比归类,大概总结出以下的技术点: ……继续阅读 »

开发技术 4个月前 (06-15) 100浏览 0个赞