个人信息
北京 - 北京市 这位同学很懒,木有签名的说~
成长数据
spark streaming源码解读之job动态生成和深度思考
贯通Spark Streaming JobScheduler内幕实现和深入思考
Spark Streaming源码解读之数据清理内幕彻底解密
Hive扩展功能(四)--HiveServer2服务
Hive扩展功能(五)--HiveServer2服务高可用
Hive扩展功能(六)--HPL/SQL(可使用存储过程)
spark RDD 编程
深入理解Spark 2.1 Core (十):Shuffle Map 端的原理与源码分析
深入理解Spark 2.1 Core (十一):Shuffle Reduce 端的原理与源码分析
Spark Multi Tenancy系列 - 3 项目简介
Spark Multi Tenancy系列 - 4 异常处理:初始化HiveSessionState失败
Spark MLlib机器学习开发指南(3)--Pipelines
[spark] 内存管理 MemoryManager 解析
远程通过jupyter(ipython) notebook调用服务器环境运行Spark(pyspark+scala方式)
[spark streaming] DStream 和 DStreamGraph 解析
Spark源码编译
Spark版本升级二三事
Spark SQL中的Encoder
Spark Streaming 数据接收优化
Spark Streaming Direct Approach (No Receivers) 分析