如果大家看过了之前的文章,
写给那些准备入坑机器学习、计算机视觉、深度学习等相关领域的人,包括:读研、转行等不同人群,同行勿喷
应该是决定开始走紧这坑了。而且最近大家问得也比较多,也是比较关心的问题,如果从一个零基础的行业小白,走进这个坑?我从自身的角度,结合自己目前的认知来进行一些分析、介绍,也许不适用于太多的人,但总会对一些人有帮助吧。好了,不比比了,直接上干货。
首先,我们解释一下我是×××专业,我能不能学?什么人能学?
1)有可能你不是计算机专业的,没关系,但是你要具备一定的数学基础,本科学得忘干净了也没关系,可以在学会来,反正当初考试也就用了几天时间。
2)计算机专业的,具备编程基础,只是没做过领域研究,这都不算行业小白了,已经算半个行业人士了。
3)通信、电气、自动化专业的,没问题,只要能学数学和英语,都没问题
4)其他工科类的,还是数学!英语!能学就行!
5)文科类的,如果真的想学,反正我学英语的同学,考上北大计算机,在做知识图谱,都是可能的!!
综上,只要具备学习能力+肯学的+有时间学得,基本都能可以入行,当然,越年轻越好,由于本人还不过30岁,30以后的想转行的,建议还是不要咨询我了。。真的没有这个生活经历。只能说,有梦想是好的,加油!
2)什么是行业大牛?
吴恩达,李飞飞这样的我就不提了,看几个大牛的主页,你就知道了。
看到那几个不显眼的CVPR、PAMI了吗???2018年的,就这么多了??现在几号??2018年4月17日??这就这么多了????
看到这里,在想想自己,还有什么资格吹牛。。。赶紧去看论文,码代码去了!!
3)入门CV、机器学习、深度学习等行业你需要什么基础
这个。。。我在写给那些准备入坑机器学习、计算机视觉、深度学习等相关领域的人,包括:读研、转行等不同人群,同行勿喷,又提过,在提一遍:
首先你需要掌握几种编程语言:python首选,然后是c/c++,然后是matlab,因为对于很多计算机视觉的任务,python和matlab写的源码会比较多,而工程实施有需要c/c++。所以这几门语言是必不可少的;
入门课程:
首先是线性代数,看麻省理工的,你会发现和我们本科学得线性代数好像不太一样,这个讲解的更加容易理解!!不再是挺在做计算题的层次,是真的有用!!麻省理工公开课:线性代数_全35集_网易公开课
斯坦福机器学习:斯坦福大学公开课 :机器学习课程,这个就不强调了,NG的课程,一般这个行业的都会学习下吧!
张志华老师的统计机器学习,机器学习导论:http://ocw.sjtu.edu.cn/G2S/OCW/cn/TeacherDetail.htm?id=471,这个课程涉及到更加深入的统计机器学习理论,看完以后你会对概率论有更深入的了解!!
周志华老师的西瓜书,这个对于机器学习整体的介绍还是比较基础的!!这本书,记得找工作时候,每次面试前都会看一遍!!
进阶课程:这两本是字典一样的存在,每次写文章的时候都会翻一翻,把自己的理论拔高升级下,很难,至今很多没看懂。。!
矩阵论
凸优化理论
关于深度学习的东西,我主要是通过调试模型,熟悉的caffe,对于tensorflow则是通过keras了解和针对不同计算机视觉的任务,跑向应的模型,一点点熟悉的,后面我会针对这些东西更加详细的给大家介绍怎么用,目前比较好的书,我也不好推荐,自己主要是看一些博客了解的。
你还需要读英文文献!!!关注顶会议,顶级期刊的文章:我是最计算机视觉的,关注的CVPR、ICCV、ECCV、IJCAI、AAAI、ICML等,期刊的主要是TPAMI、TMM、TCSVCT、TIP等等,另外,不得不提的就是arxiv,这里会有很多最新的工作,好多大牛在发表前都会丢在这个上面,每天刷一刷,作为你的日常!!
最后就是追踪一些学术大牛!多看看他们的主页,看看他们满屏幕的顶会和顶刊的文章,一方面能下载到源码,另一方面,激励下自己,看看自己和大牛的差距,很多文章就是他们的学生的一作,了解了解自己和同龄人的差距!
4)我要怎么选方向?
在前面说了太多的基础的东西,你可能已经具备了相应的武器,还需要用这些武器去做一些事情,产生一些成果,这样才能激励大家继续学下去(大概什么伟人说过吧),因此,你需要选一个方向,去实践,收获,在实践,在收获。。那怎么选呢?
我自己做CV的,虽然做过一些NLP,但是CV的最熟悉,就以此为例:
首先cv主要处理的是图片信号,给你一副图片,你要考虑一副图片你能做什么事情,会有那些任务,从原始图片开始,包括了低分辨率和高分辨率下。包括了各种条件下采集到的图片有可能会有遮挡,有可能会有很强的光照,有可能会有很暗的光照等等,针对不同的场景,你需要做不同的处理,这时候就有了图像降噪,超分辨率重构,图像质量恢复还原等等,再结合具体的任务,比如人脸,行人,车辆,医学图像,服装,工业界的裂纹,很多算法会尝试解决在这个恶劣条件下的识别,分类,检测的任务。
解决这些任务一般有几个过程,预处理阶段---》特征工程,表示学习----》决策分析
图像降噪这些就是预处理阶段
人脸识别的任务,更多的看中表示学习,特征工程阶段
目标跟踪问题则关注特征工程+决策分析阶段,尤其多目标跟踪问题,数据关联、决策分析十分重要;
特征工程又包括了全局的、局部的和关键点的、
还有根据采集到的图像数据,又可以分成二维和三维的问题
对于二维图像任务,包括了:图像生成、还原、恢复、降噪、检测、识别、分类、聚类、描述、方法分别涉及到深度学习、优化理论(表示学习、度量学习)等等
处理的对象可以包括人脸、行人、车、服装、自然场景、医学影像、工业裂纹等等
对于三维图像问题包括了深度估计、障碍物检测、三维重建等等
深度学习的话、需要调网络、设计loss、设计层、提高网络的性能和可解释性
优化算法则包括了稀疏表示、稀疏,低秩,优化模型求解,当然,一般优化问题求解都有相应的套路,比如ADMM、拉格朗日等等
首先,你要先了解下上面这些都是什么东西??然后,再想想自己喜欢哪个阶段的任务!最后在看看论文,看看目前的比赛,结合导师的项目和已经有的开源数据集,再去定最终的研究方向!
最后,你还需要一个GTX1080!!!老板穷或者自己穷,就放弃深度学习,和我以前一样做优化吧!!哈哈哈
5)如何阅读论文,并对某一个方向进行深入的了解和调研!
关于如何阅读论文我还是有很多话要讲的。一定要阅读英文文献!一定要阅读顶级会议和期刊的文献!顶级会议和期刊是什么意思?看中科院分区表,http://www.ccf.org.cn/xspj/gyml/。SCI1区2区,会议A类的,这些论文应该就够看了,其他的水刊,就算了吧。。
另外,也可以关注下arxiv上的一些最新的进展,只是上面的论文通常没有经过同行评议,质量参差不齐,需要自己把关了。
在刚开始入门的时候,可以找1-2篇博士论文看一下,了解下基本的概念,然后,直接找相关领域review的文章,然后瞄准顶会文章,然后是顶刊文章。这些论文都扫一遍,基本上相关领域算是比较熟悉了,然后就是coding了。。。。
·················································
欢迎关注课程:
Python3+TensorFlow 打造人脸识别智能小程序(新课限时优惠)
共同学习,写下你的评论
评论加载中...
作者其他优质文章