-
原来数据可视化就是探索性分析中的一个重要部分查看全部
-
R-可视化-注意事项 DO-6steps查看全部
-
R-可视化-注意事项 DO NOT查看全部
-
R-可视化-注意事项 报告书写要信息层级化。查看全部
-
不用月份的点用不同颜色表示 实例 type=n subset %in%查看全部
-
plot hist boxplot with title函数查看全部
-
r语言的基本绘图系统分为三大块 基本绘图系统 lattice绘图系统 ggplot2绘图系统查看全部
-
异常值界定查看全部
-
#Lattice绘图系统 #xyplot/bwplot/histgram/stripplot/dotplot/splom/levelplot/contourplot #格式:xyplot(y ~ x|f * g, data) #panel,用来控制每个面板内的绘图 #lattice和Base的重要区别 #Base绘图函数直接在图形设备上绘图 #Lattice绘图函数返回trellis类对象 # 打印函数真正执行了在设备上绘图 # 命令执行时, trellis类对象会被自动打印.查看全部
-
#全局参数 par("bg")#背景颜色 par("col")#颜色 par("mar")#(bottom,left,right, right) par("mfrow") par("mfcol") par(mfrow = c(1,2)) hist(airquality$Temp) hist(airquality$Wind) par(mfrow = c(1,1)) boxplot(airquality$Temp)查看全部
-
hist(airquality$Wind,xlab="wind") boxplot(airquality$Wind,xlab="wind",ylab="speed(mph)") plot(airquality$Wind,airquality$Temp) with(airquality,plot(Wind,Temp,main="Wind and Temp in NYC")) title(main="Wind and Temp in NYC") with(airquality,plot(Wind,Temp, main="Wind and Temp in NYC", type = "n")) with(subset(airquality,Month==9), points(Wind,Temp,col = "red")) with(subset(airquality,Month==5), points(Wind,Temp,col = "blue")) with(subset(airquality,Month==8), points(Wind,Temp,col = "black")) with(subset(airquality,Month %in% c(6,7,8)), points(Wind,Temp,col = "black")) fit <- lm(Temp ~ Wind,airquality) abline(fit,lwd=2)查看全部
-
#基本绘图系统 #绘图函数:plot/hist/boxplot/ points/lines/text/title/axis #调用函数会启用一个图形设备(如果没有正在运行的图形设备)并在设备上绘图 # 基本绘图系统+屏幕设备 plot() #-plot(x,y,....) #重要参数:xlab/ylab/lwd/lty/pch/col par() #-通常用语设置全局参数(作用于R中所有的plot绘图) # bg/mar/las/mfrow/mfcol查看全部
-
#R三大绘图系统 #1.基本绘图系统 #1)艺术家的调色板:绘图始于空白帆布 #需要事先计划;支管地实时反映绘图个分析数据的逻辑 #2)两部=图+修饰/添加=执行一系列函数 #3)适于绘制2D图形 #2.Lattice绘图系统 #1)特别适用于变量之间的交互:在变量Z不同水平,变量Y如何随着变量X变化 #2)绘图=使用一次函数调用 #3.ggplot2 #1)The Grammar of Graphics # 图:动词,名词,形容词等. # 数据映射到几何客体的美学属性 #2)基本绘图系统+Lattice绘图系统 # 自动处理标题/文字说明/空间等,但也允许通过添加注释进行修改.查看全部
-
数值变量就是可以进行加减乘除的,其中分为离散型变量跟连续变量 比如说一二三四五六七八九十 分类变量又分为有序变量跟无序变量 其中无序变量比如说苹果桃子梨他们就不能进行比较 也不能进行哦加减乘除 然后有序变量就比如说大一大二大三 他们虽然不能进行加减乘除 但是我们就知道大二的比大一的多上了一年学 他们是其中是有一些逻辑关系的查看全部
-
学术界比较多假设驱动:先定义研究的问题,然后用数据来验证你研究的问题 而在工业界数据驱动比较多:数据驱动就是你刚开始不知道你要研究什么问题,通过一大堆数据分析的结果来得出一些结论,。而这些结论他们有可能是相互矛盾的,也有可能你什么都得不到,如果在相互矛盾的一大堆结论中你选择了一些结论的话,那么你就犯了一个错误,就是你有可能只选择了对你有利的那些结论而你忽视了那些对你不利的结论,所以你得出的结果就是不可靠的。 在现实在实际情况下,我们一般是假设驱动和数据驱动结合的情况比较多。 挑战结果的意思是:不论你最后得出的结论是多么符合你之前的预期,或者是你多么认为你的这个数据分析的过程是没有错的,但是这时候你还是要对你自己的结果保留一个怀疑的态度,要思考还有没有没有考虑到的问题或者是有可能你还是会犯了一些错误。查看全部
举报
0/150
提交
取消