Apache Spark基本架构和工作原理介绍
本周感谢Stephen Zhao给我们带来了《Apache Spark基本架构和工作原理的介绍》,相关的总结如下:
- Stephen使用的Slides。
- 一篇很详细的Spark基本原理和架构的介绍文章。
- 一篇关于Hadoop和Spark比较的文章。
- 一本很不错的关于Spark各个方面介绍的电子书。
- 关于Spark中GraphX介绍的文章。
- O Reilly的《learning Spark》.
- 讲座中Paul提到那张架构图。
- StackOverflow 上关于map vs. mapValues的讨论。
- 一个介绍Spark中job,stage,task关系的视频。
- DataFrames DataSets和RDD之间的对比。
再次感谢大家的参与,也希望大家有好的资源能联系我更新这篇文章。谢谢大家。
下周话题安排和往期话题回顾敬请参见《系统设计开荒小分队话题讨论简介》
2 Responses
[…] 基于Spark/Scala的大数据处理介绍(Stephen Zhao) […]
[…] 【扩展】我们之前关于Spark介绍的总结:Apache Spark基本架构和工作原理介绍 […]