1.hadoop
MapReduce运行原理详解
http://blog.csdn.net/u011007180/article/details/52434382
MapReduce 框架 Yarn 详解
https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/
NameNode 高可用 (High Availability) 实现解析
https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-name-node/
理解Hadoop YARN架构
https://blog.csdn.net/bingduanlbd/article/details/51880019
2.zk
Zookeeper的功能以及工作原理
https://www.cnblogs.com/felixzh/p/5869212.html
3.hive
hive 源码解析之代码整体结构
https://www.xuebuyuan.com/2181081.html
Hive性能优化上的一些总结
https://blog.csdn.net/mrlevo520/article/details/76339075
4.hbase
HBase 官方文档中文版
http://abloz.com/hbase/book.html
HBase 常用Shell命令
https://www.cnblogs.com/nexiyi/p/hbase_shell.html
- 定位一条记录所属region
- 查看一个region的数据量
- 查看一个Cell的所有版本
https://blog.csdn.net/javajxz008/article/details/51913533
HBase写入的各种方式总结汇总
https://blog.csdn.net/shudaqi2010/article/details/88653796
5.spark
DataFrame操作
https://www.cnblogs.com/nucdy/p/6541564.html
SparkSQL操作Hive Table
https://blog.csdn.net/zhao897426182/article/details/78435234/
park/spark-sql处理schema数据
https://www.cnblogs.com/kangoroo/p/6891540.html
Spark数据倾斜治理
http://www.jasongj.com/spark/skew/
Dataset中Actions、function、transformations
https://blog.csdn.net/legotime/article/details/52562796
Dataset中structField、structType、schame
https://blog.csdn.net/legotime/article/details/52643243
Spark 共享变量:广播变量、累加器
https://blog.csdn.net/wangpei1949/article/details/83335273
DataFrame新增一列的四种方法
https://www.cnblogs.com/itboys/p/9762808.html
Spark SQL将数据写入Mysql表的一些坑
https://blog.csdn.net/dai451954706/article/details/52840011/
Spark 动态资源分配(Dynamic Resource Allocation) 解析
http://www.imooc.com/article/267186
6.flink
Flink架构、原理与部署测试
https://blog.csdn.net/jdoouddm7i/article/details/62039337
广播流 Broadcast State用例
https://cloud.tencent.com/developer/article/1378332
Flink中的状态管理
云栖社区: https://yq.aliyun.com/articles/225623#
https://ci.apache.org/projects/flink/flink-docs-release-1.6/dev/stream/state/state.html
WaterMark 水位
简书:https://www.jianshu.com/p/9db56f81fa2a
Flink 中 timeWindow 滚动窗口边界和数据延迟问题调研
https://blog.csdn.net/xsdxs/article/details/82415450
flink-SQL解析JSON格式数据
http://www.mamicode.com/info-detail-2644620.html
Flink UDF实例
https://www.jianshu.com/p/5dc2cab91c78
source function
https://cloud.tencent.com/developer/article/1366981
Flink 网络流控和反压剖析
https://yq.aliyun.com/articles/725982/
7.杂项
elasticsearch 常见查询及聚合的JAVA API
https://blog.csdn.net/majun_guang/article/details/81103623
为什么不建议在 HBase 中使用过多的列族
https://blog.csdn.net/bingdianone/article/details/86062506
logstash过滤器插件filter详解及实例
https://www.cnblogs.com/FengGeBlog/p/10305318.html
共同学习,写下你的评论
评论加载中...
作者其他优质文章