为了账号安全,请及时绑定邮箱和手机立即绑定

手把脚教你实现第一个在线预测系统No.21

标签:
机器学习

本来呢,最近看了人类简史,想写一篇偏见相关的,思路还没整理好不好放出来,先写个技术的吧。最近真是忙成狗,搬职场,找房子租,参加各种各样的会议,还有开发任务,做屁屁踢,接下来架构的规划,知识储备。

可是毕竟我也不想跳票的嘛。T_T

说实话。

时间还是蛮充裕的,啊哈哈哈哈哈哈!!!!!!!

今天就用比较主流的架构,来简单实现这个在线预测系统,来完全打消小伙伴们对机器学习的恐惧感,它不难,但是我从没说过它很简单。

整套代码核心的代码不超过10行,相信我,就算你完全不会任何数学,也不会对开发造成任何的影响。

当然我之前说过,想要往深了做,要有扎实的数学和英语基础。为什么??因为AI这个技术还是个小BB,还没长大,还要用各种各样的论文来喂它茁壮长大,要是看不懂别人的论文或者无法复现,那咋跟进最新技术进展??

架构是django+scikit-learn,这个在我上一篇已经提到过了,这是最最最简单的实现方式,不服来辩。

敲黑板!!!课前要准备好这些,开发环境环境为ubuntu14.04,不会安装的,问度娘或者谷哥去。

python2.7,pip,django,scikit-learn,pandas,numpy,Pycharm,。

好,随便找个目录,哐哐哐输入下面这样django初始化项目的脚本。

django-admin startproject ph_ml_core

好了,项目初始化完了。目录结构长啥样的呢?

https://img1.sycdn.imooc.com//5e1709020001441f03120227.jpg

看起来特么好多啊,那既然说了很简单了,其实绝大部分我们都不需要去改动。那,有哪些是我们自己要去写的呢?

Advertising.csv是数据文件,QualifiedModel.py是我们核心的业务逻辑代码,view.py是我们的视图,urls.py是django的路由+控制器。

第一步先给我们的系统加一个路径叫predict的玩意,这个就是暴露给http请求的接口,至于咋实现或者啥意思,就是个正则表达式有兴趣的小伙伴自己去看。

urlpatterns = [

    url(r'^admin/', admin.site.urls),

    url(r'^predict/$', predict),

]

第二步就是写视图了,这个比较掺杂,大致意思就是调用一个模型进行评分,核心的就这一句score = qual.predict()。

没错调模型就是这么简单。

def predict(request):

    # 获得请求数据,并转成字典格式。

    rowData = eval(request.GET['a'])

    # 获得已经训练好的模型

    qual = QualifiedModel()

    # 直接对新进件的数据进行评分

    score = qual.predict(np.array([[rowData['TV'],rowData['Radio'],rowData['Newspaper']]]))

    # 组装返回数据

    result = {}

    result['score'] = score[0]

    return HttpResponse(json.dumps(result),content_type='application/json')

第三步,训练模型,就在上一步我们调用了模型,那模型怎么来的呢?肯定是通过我们的训练数据来的。这里使用Lasso,什么是Lasso我这里就不介绍了有必要的话我后面起个文章单独说,现在先自行问度娘去,一个线性模型。

哈什么?你对模型不熟,不会对模型调参?没问题,sklearn都帮咱实现好了,直使用交叉验证,连调参都不用了。交叉验证是什么,就是给它一大堆参数组合,然后我不管,我就要那个训练结果最佳的。

    def initModel(self):

        #获取数据

        data = pd.read_csv(os.path.join(os.path.abspath(os.path.dirname(__file__)),'Advertising.csv'))

        #取得特征值

        x = data[['TV','Radio','Newspaper']]

        #取得结果值

        y = data['Sales']

        #通过交叉验证训练得到最佳模型

         model = Lasso()

        alpha_can = np.logspace(-3, 2, 10)

        np.set_printoptions(suppress=True)

        lassoModel = GridSearchCV(model,param_grid={'alpha':alpha_can},cv=5)

        lassoModel.fit(x_train,y_train)

第四步,调用试试看吖。

http://127.0.0.1:8000/predict/?a={"TV": 65, "Newspaper": 15, "Radio": 30}

返回:{"score": 11.328439830355411}

http://127.0.0.1:8000/predict/?a={"V": 29, "Newspaper": 15, "Radio": 30}

返回:{"score": 9.6539587774368592}

到这里,我们所有的功能都已经实现完了。是不是非常简单?其实我们很多时候害怕一个东西是因为这个东西不熟悉,就像我之前说的,做做做,做起来,慢慢你就不怕了。

在这里我要说一个事实,智商是不可逾越的,这句话还真有可能是正确的。让一个智商普通的人去突破物理学的界限,这显然,不太可能会实现,只能说P(突破物理界限|已知是一个智商普通的人)很低,我这里说的智商是思维能力,并不是指什么什么智商测试的结果。但是也是很明显的,很多人都是日复一日做着一样的事情,被各种各样的会议,各种各样的繁琐的事情,禁锢了自己的思维,也禁锢了自己的潜力,都没到开始拼智商的时候好吗??

到现在还有人说开发工程师是一个要求很高的职业,其实这个职业的要求真心不算高,任何一个经过系统培训的小白,都能按照老师教的结果哐哐哐写出一些"业务逻辑",但要是止步于此不去做任何的思考,不理解为什么是这样做,那你的上限也就这样了。

凡事问三层,"为什么这样就有这样的效果呢"?可能会有不同的结果。

但是呢,在你跟别人讨论或者请教的时候,自己还是要先有料,自己做足各种各样的研究,准备好各种各样的资料,再去开始请教,可能会比较。不然我就会说一句乔布斯回答别人经常说的话---"it is complicated",没错,那我只能告诉你,这很复杂。

当然付费的一般就不存在这个问题,比如老师啊,培训师啊,各种网红的收费栏目啊,就不存在这个问题。为什么呢,因为你做了其他的努力去赚取这个付费的款项,也算是做足准备了吖。

好了,后台回复   第一只   ,获取这次的小玩具,大家一起愉快地玩耍吧。要是分享给其他小伙伴我会很开心的。


点击查看更多内容
1人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消