我有一些关于年龄与年龄的多元数据。年龄范围为20至40,间隔为2(20,22,24 .... 40),对于每条数据记录,年龄和美容等级均为1-5。当我对这些数据进行箱形图绘制(X轴上的年龄,Y轴上的美容等级)时,每个框的晶须外都绘制了一些离群值。我想从数据框本身中删除这些离群值,但不确定R如何计算其箱形图的离群值。以下是我的数据的示例
3 回答
慕斯709654
TA贡献1840条经验 获得超5个赞
boxplot函数返回用于进行绘图的值(实际上是由bxp()完成:
bstats <- boxplot(count ~ spray, data = InsectSprays, col = "lightgray")
#need to "waste" this plot
bstats$out <- NULL
bstats$group <- NULL
bxp(bstats) # this will plot without any outlier points
我故意不回答具体问题,因为我认为删除“异常值”是统计错误。我认为不将它们绘制在箱线图中是可以接受的做法,但是仅由于它们超出了一些标准偏差或一定数量的四分位数宽度而将其删除是对观测记录的系统性和不科学的处理。
- 3 回答
- 0 关注
- 1531 浏览
添加回答
举报
0/150
提交
取消