-
如果是要看两个变量之间的关系的话 我们可以用散点图 散点图主要看四个方面 方向 形状 强度和极端值 从第二副图和第三副图可以看出他的方向是向上的和向下的 而形状了第一幅图是一个椭圆形 然后第二副第三副是直线的 第四幅图是抛物线的形状 可以知道他们是有线性关系还是非线性关系 强度就是看他们之间的相关系数 第一副图我们可以看出相关系数很低的 234副图的相关系数就很高 第二副图的上面有一个异常值也就是他的极端值 我们在做数据分析的时候要特别观察那个极端值对我们的整体分析是不是会有影响查看全部
-
不是为了分析问题而进行分析,而是为了解决一定的问题或者为某些决策提供一定的依据。查看全部
-
箱图一般是竖着放的 竖着放就可以看到它左边的y轴上面的数值查看全部
-
箱图是最适合来检验极端值的图 q1是25%分位点 q3是75%分位点查看全部
-
图上是一个左偏分布一个正态分布一个右偏分布和一个点图 点图和柱状图的区别是点图就是一个一个点来清晰的表示出每个数字出现的频率 比如说在这幅图中最左边有四个点 那么最左边的那四个数字每个数字只出现了一次频率 如果这种情况下我用柱状图来表示的话 即便是我画出了一个比较均匀的四根相同高度的柱子 我也不敢清晰的说肯定的这个就是他们出现了同样的频率 所以我们在使用点图跟柱状图的时候就可以根据自己的需求看看自己到底需要哪一种图形查看全部
-
rstudio里面的x的均值方差众数中位数和summary的计算查看全部
-
数值变量就是可以进行加减乘除的,其中分为离散型变量跟连续变量 比如说一二三四五六七八九十 分类变量又分为有序变量跟无序变量 其中无序变量比如说苹果桃子梨他们就不能进行比较 也不能进行哦加减乘除 然后有序变量就比如说大一大二大三 他们虽然不能进行加减乘除 但是我们就知道大二的比大一的多上了一年学 他们是其中是有一些逻辑关系的查看全部
-
关系小节查看全部
-
分散趋势查看全部
-
我在CSDN上做了笔记。查看全部
-
学术界比较多假设驱动:先定义研究的问题,然后用数据来验证你研究的问题 而在工业界数据驱动比较多:数据驱动就是你刚开始不知道你要研究什么问题,通过一大堆数据分析的结果来得出一些结论,。而这些结论他们有可能是相互矛盾的,也有可能你什么都得不到,如果在相互矛盾的一大堆结论中你选择了一些结论的话,那么你就犯了一个错误,就是你有可能只选择了对你有利的那些结论而你忽视了那些对你不利的结论,所以你得出的结果就是不可靠的。 在现实在实际情况下,我们一般是假设驱动和数据驱动结合的情况比较多。 挑战结果的意思是:不论你最后得出的结论是多么符合你之前的预期,或者是你多么认为你的这个数据分析的过程是没有错的,但是这时候你还是要对你自己的结果保留一个怀疑的态度,要思考还有没有没有考虑到的问题或者是有可能你还是会犯了一些错误。查看全部
-
刚刚给查看全部
-
本章小结查看全部
-
数据分析流程查看全部
-
par()的参数查看全部
举报
0/150
提交
取消