为了账号安全,请及时绑定邮箱和手机立即绑定

求解统计系统设计的一些技术方案和实现

求解统计系统设计的一些技术方案和实现

慕桂英3389331 2019-04-13 08:45:21
从数据源到数据呈现说说目前的情况吧,数据源:1、mysql2、日志文件呈现:1、csv文件导出或者发送邮件2、提供接口数据给web呈现图标当前涉及的一些技术点:从日志文件读取数据主要是shell+awk,从mysql主要是php读取数据存储到文件,之后通过php或者shell来进行一些运算或者统计处理,相应数据入库或者发送邮件提供给需求方。目前项目积累了大量的脚本,和一些临时性的解决办法(零散脚本),而且随着数据的增长,mysql这部分效率也越来越慢,复杂的脚本已经变得越来越难维护。这些脚本有一些是需要的时候手工跑一次,还有很多是定时跑,如果继续下去已经快不可控了。寻求一套从数据入口到数据呈现的解决方案,或者是各位有经验的同学分享分享。日志文件存储在hadoop上一部分,目前没有写mapreduce直接去处理这部分。->3Q
查看完整描述

2 回答

?
守着星空守着你

TA贡献1799条经验 获得超8个赞

0、方案取决于你的目标和团队实力。自建方案的复杂度和你的期望成正比,和数据量成正比。
1、你可以研究一下Splunk或者Logstash+ES+Kibana这两个方案,相信会有惊喜。
2、如果还想更深入,可以了解一下SIEM。
3、DirtyAndQuick是一种选择;Flexable是另一种选择。
                            
查看完整回答
反对 回复 2019-04-13
?
慕虎7371278

TA贡献1802条经验 获得超4个赞

源数据整理好格式,定好Schema,用Hive统计,用Oozie定时跑作业,结果放在约定好的地方,用Web呈现。
基本上都是这么个套路。
                            
查看完整回答
反对 回复 2019-04-13
  • 2 回答
  • 0 关注
  • 355 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信