-
数据分析流程查看全部
-
数据分析流程查看全部
-
with(data.frame.plot(wind.temp))查看全部
-
三大绘图系统 基本绘图系统 lattice绘图系统 ggplot2绘图系统查看全部
-
稳健统计量:分位数 均值、方差是非稳健统计量查看全部
-
两个数值变量 两个分类变量 一个分类变量和一个数值变量查看全部
-
稳健统计量受极端值影响较少,如中位数,四分位距等。非稳健统计量如均值、方差等。 四分位距=四分之三分位点-四分之一分位点。极端值判断,四分之一分位点-1.5倍四分位距,四分之三分位点+1.5倍四分位距。查看全部
-
多练多问查看全部
-
数值变量和分类变量 可以选用哪些图来表示查看全部
-
数值变量和分类变量 可以选用哪些图来表示查看全部
-
一个分类变量和一个数值变量的关系我们可以用并排箱图来表示 这里的x轴代表的是每个的月份y轴代表的是温度 从这个图中我们看可以看出每一个月份的均值和极端值 并且可以很容易的看出七月份的温度是最高的 总体是呈现一个先升高后降低的状态查看全部
-
两个分类变量的关系还可以用马赛克图来表示 同样他的比率是百分之百 然后我们可以看到y轴就是它所占的百分比 而x轴我们发现它的宽度是不一样的 应该是表示的中高收入占所有收入的百分之多少 它可以反映两种的百分比查看全部
-
两个分类变量的关系我们可以用分段条形图和相对频率分段条形图来表示 下面这两幅图代表的是同一个情况就是低中高收入人群对于存钱是否困难的一个调查 四个颜色分别表示非常困难 有点困难 不是很困难 一点都不困难 四个选项 他们俩的区别可以很明显的看出来这是y轴一个是绝对值一个是所占的本列的频率 通常来说我们比较关注右边这个图也就是相对频率分段条形图 因为他的y轴全部都是百分之百 里面可以很清晰的看出每一个选项了本列的百分之多少 我们比较关注的就是比率查看全部
-
两个分类变量的关系可以用关联表和相对频率表来表示 图中那个方框就是关联表然后她是表示幸存与否跟年龄的人数 而相对频率表我们是按列来看的 比如说下面的那两行的数字一共有四个 表示在儿童里面幸存的占了百分之百 而没有幸存的占了百分之零 在成人里面幸存的占了62%没有幸存的占了38% 所以我们可以得出结论就是幸存与否与年龄是有关系的 而这个关系不一定是因果关系 而只能说他们两个是相互依存的查看全部
-
一个分类变量的可视化可以用频率表或者条形图来表示查看全部
举报
0/150
提交
取消