最基本的sql + python + (R or spss )
最基本的sql会就行,什么join啊什么的都不用管,能select * from xxx limit n啥的就足够了。做到能批量把要用到的原始数据下载下来
python5分钟就能上手写,1周就能熟练的处理各种原始数据到你想要输入给下一步的软件的格式上。
然后用R或者spss来画图或者做跑各种高大上的统计模型
然后根据不同的业务自己去想挖掘的方法,什么回归啊,什么SVM,什么决策树啊,这些东西都是工具,不是目的
至于如何有好的挖掘的idea,似乎没有好书推荐,在工作中学吧。