为了账号安全,请及时绑定邮箱和手机立即绑定

数据分析概述

1、数据分析师的特点

①好奇:从数据中能够获取哪些信息,哪些想法

②谨慎:不急着公布结论,多维数据验证

    “没有完美的数据,没有完美的方法”

③责任:个人、企业、社会

2、避免对数据可视化的误解

“把图做得复杂、更大数据、弄个大新闻,什么软件可以做图、找到别人没有发现的秘密”

3、图表的四大类

比较、分布、构成、联系

——《exel图表之道》

webp

使用图表的目的不外乎这四种

4、数据工作流程

webp

数据工作流程

5、数据可视化的方式

下列列出了一些图表需求及对应的工具,普通数据工作可能excel就能够解决,不过如果向数据发展,还是应该多接触几种工具的使用,至少每种类型的图表要熟悉一种工具。

图中列了很多可视化图表的方式,不过我觉得吧,日常的工作报表excel足够了,在此基础上进一步做到自动化报表,可以考虑python+pandas/seaborn的组合,几乎可以应对所有的数据处理层面的问题。

webp

图表可视化

6、数据研究的套路

webp

数据工作的套路

数据工作流是一个很虚但是非常重要非常重要非常重要的概念,厘清自家业务的数据流是很一件很重要的基础工作

webp

数据工作流

7、利用机器学习进行数据处理的一些介绍

webp

常用python库

webp

缺失值处理


webp

特征工程


webp

特征选择


webp

训练流程



webp

训练流程

评估方法:

    分类:准确率、召回率、精确度

    回归:均方差

webp

评价方法-留出

webp

评价方法-交叉验证



作者:Rockelbel
链接:https://www.jianshu.com/p/c02cb5fe55af


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
JAVA开发工程师
手记
粉丝
205
获赞与收藏
1008

关注作者,订阅最新文章

阅读免费教程

  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消