-
基本绘图系统
查看全部 -
数值变量和分类变量的可视化
查看全部 -
两个分类变量的关系:分段条形图、相对频率分段条形图(纵坐标是百分比)、马赛克图
一个分类变量、一个数值变量的关系:并排箱图
查看全部 -
一个分类变量的可视化:频率表、条形图
两个分类变量的关系:关联表、相对频率表(按列来看,用百分比计数)
查看全部 -
两个数值变量的关系:散点图(注意方向、形状、强度、极端值)
方向说明两个变量是否为正(负)相关,形状说明是否为线性关系,点散说明两个变量的相关系数低(即强度小)
查看全部 -
数据 1)集中趋势的测量:均值,中位数,众数;2)分散趋势的测量:值域,方差,标准差,四分位距
稳健统计量受极端值影响小(如中位数和四分位差,而均值、标准差、值域则不是)
一个(数值)变量的可视化:柱状图(横坐标代表观测值,纵坐标代表频率)、点图、箱图(中位数、分位点、极端值)
四分位距(IQR):75%分位点数据与25%分位点数据差的绝对值
Q1表示25%分位点,Q3表示75%分位点,箱图中的最左(右)侧线可以帮助我们界定是否为极端值,一般来说箱图是竖着放的
查看全部 -
变量的类型:1)数值变量(定量分析);2)分类变量(定性分析,不可运算)
变量间的关系:不同类型的变量,他们之间关系的呈现需要用到不同的可视化方法和统计分析方法
查看全部 -
ggplot2中的绘图函数
查看全部 -
不同的层
数据——属性——几何课题层(点、线~)——面(画图面板多少行多少列)——统计层——坐标系——主题(和数据无关的风格设计
查看全部 -
虚线以内的不是极端值
查看全部 -
数据科学家
查看全部 -
我要这张截图
查看全部 -
par 全局参数 每次运行都是固定的,如果要改一个运行的par就要在该运行的代码前重新设置par
par(”bg“)默认白色
par(”col“)默认黑色
par(”mfrow“)行
par(”mfcol“)列
注:行和列是图的分布,一行2列,就是两个图左右并排。
par(”march“)到上下左右的距离(margin)
查看全部 -
分析性作图的六大原则
查看全部 -
library(ggplot2)
查看全部
举报