简介:数据诊断是数据挖掘和机器学习的第一步,然而却被很多人忽略掉了。如果对数据本身不了解的话,容易受到严谨的业务人的挑战,同时,如果缺少了数据诊断的步骤,会增加后面数据预处理的难度,从而影响最终模型的效果。因此,本课程教授大家如何制作一个高效的,复用性高的,让人更好地理解数据本身的数据诊断工具。
第2章 数据诊断整体介绍
数据获取和数据读取,统计指标的介绍与简单示例
第3章 数据诊断工具制作
工具制作-依赖包的介绍,工具制作-缺失值和方差,工具制作-特殊描述值,工具制作-基本描述统计值,工具制作-功能整合