为了账号安全,请及时绑定邮箱和手机立即绑定

大数据知识整理

标签:
大数据

1.hadoop

NameNode 高可用 (High Availability) 实现解析
https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-name-node/


2.zk

Zookeeper的功能以及工作原理
https://www.cnblogs.com/felixzh/p/5869212.html


3.hive

hive 源码解析之代码整体结构
https://www.xuebuyuan.com/2181081.html


4.hbase

HBase 官方文档中文版
http://abloz.com/hbase/book.html

HBase写入的各种方式总结汇总
https://blog.csdn.net/shudaqi2010/article/details/88653796


5.spark

park/spark-sql处理schema数据
https://www.cnblogs.com/kangoroo/p/6891540.html

Spark数据倾斜治理
http://www.jasongj.com/spark/skew/

Dataset中Actions、function、transformations
https://blog.csdn.net/legotime/article/details/52562796

Dataset中structField、structType、schame
https://blog.csdn.net/legotime/article/details/52643243

Spark 共享变量:广播变量、累加器
https://blog.csdn.net/wangpei1949/article/details/83335273

DataFrame新增一列的四种方法
https://www.cnblogs.com/itboys/p/9762808.html

Spark SQL将数据写入Mysql表的一些坑
https://blog.csdn.net/dai451954706/article/details/52840011/

Spark 动态资源分配(Dynamic Resource Allocation) 解析
http://www.imooc.com/article/267186


6.flink

Flink 中 timeWindow 滚动窗口边界和数据延迟问题调研
https://blog.csdn.net/xsdxs/article/details/82415450

flink-SQL解析JSON格式数据
http://www.mamicode.com/info-detail-2644620.html

Flink 网络流控和反压剖析
https://yq.aliyun.com/articles/725982/


7.杂项

elasticsearch 常见查询及聚合的JAVA API
https://blog.csdn.net/majun_guang/article/details/81103623

为什么不建议在 HBase 中使用过多的列族
https://blog.csdn.net/bingdianone/article/details/86062506

logstash过滤器插件filter详解及实例
https://www.cnblogs.com/FengGeBlog/p/10305318.html


点击查看更多内容
1人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消