大数据学习之路
这个系列记录了自己在大数据方向的学习历程,大致包含几个方面,第一部分是linux和高并发基础知识;第二部分是Hadoop体系相关内容,包括hdfs、MapReduce、hive、hbase和ZK等多个知识模块;第三部分是Spark体系相关知识,包括scala、spark-core、spark-sql、spark-stream和storm等知识模块;第四部分是Flink实时计算相关,包括了Flink基础、Flink SQL和Flink CDC等相关知识。
阅读更多今天跟大家分享的内容是maxcompute的优化内容,希望能够起到抛砖引玉的作用。我将从三个方面开展这次的主题分享,第一个部分是max和hive的对比;第二部分是调优方法论,主要是想总结一下我们从代码提交到执行结束,都有哪些位置可能会出现问题,一般情况下又是怎么解决的;最后是结合具体案例,对长尾问题的一些思考。
阅读更多