机器学习监督学习与无监督学习。机器学习的本质是一个函数。机器学习使用训练好的算法或者函数对历史数据进行处理,得出我们想要的结果。根据结果的不同,我们把机器学习分成以下几类
如果不在打标记的情况下得出的结果我们称之为无监督学习,如聚类和关联规则
如果提前进行打标记处理,那么就是监督学习。根据打标记的数据是离散的还是连续的,我们又进一步分为分类(结果是有限、离散的)和回归(结果是连续的)。数据挖掘和机器学习的一般步骤是数据预处理→数据建模→结果验证,这个工具包具体要结合自己的论文和实习进行整理。
如果不在打标记的情况下得出的结果我们称之为无监督学习,如聚类和关联规则
如果提前进行打标记处理,那么就是监督学习。根据打标记的数据是离散的还是连续的,我们又进一步分为分类(结果是有限、离散的)和回归(结果是连续的)。数据挖掘和机器学习的一般步骤是数据预处理→数据建模→结果验证,这个工具包具体要结合自己的论文和实习进行整理。
2017-08-28
Scikit-learn 是基于Python的数据挖掘建模和机器学习(监督学习和无监督学习)的工具包
他可以方便的实现分类、回归、聚类、降维常用的操作。具体详见官网http://scikit-learn.org/stable/#
他可以方便的实现分类、回归、聚类、降维常用的操作。具体详见官网http://scikit-learn.org/stable/#
2017-08-28
剩余的代码
#文件操作
df6=pd.read_csv("文件路径")
print("CSV:",df6)
df7=pd.read_excel("文件路径")
print("Excel:",df7)
#文件操作
df6=pd.read_csv("文件路径")
print("CSV:",df6)
df7=pd.read_excel("文件路径")
print("Excel:",df7)
2017-08-28
#pandas时间、绘图、文件操作
#Time Series时间序列,获取秒
t_exam=pd.date_range("20170301",periods=10,freq="S")
print(t_exam)
#图表
ts=pd.Series(np.random.randn(1000),index=pd.date_range("20170301",periods=1000))
#print(ts)
ts=ts.cumsum()
from pylab import *
ts.plot()
show()
#Time Series时间序列,获取秒
t_exam=pd.date_range("20170301",periods=10,freq="S")
print(t_exam)
#图表
ts=pd.Series(np.random.randn(1000),index=pd.date_range("20170301",periods=1000))
#print(ts)
ts=ts.cumsum()
from pylab import *
ts.plot()
show()
2017-08-28
Anaconda:https://www.continuum.io/downloads
Pycharm(Window):迅雷直接复制下载 https://download.jetbrains.8686c.com/python/pycharm-community-2017.2.2.exe
Pycharm(Window):迅雷直接复制下载 https://download.jetbrains.8686c.com/python/pycharm-community-2017.2.2.exe
2017-08-26