完全放弃了DSP,来学CUDA,这个基本就是按照毕业设计来做了,所以应该会做很久,应该会写一系列博客,主要是和图像相关的,首先来看CUDA配置,这里主要说的是win10配置。我本来原先编译opencv的时候就用的是VS2015,所以这里也不装新的了,NVIDIA的驱动和CUDA我也是装过的,所以只说下大概的思路,其实这个和配置opencv的时候特别像。
1.安装VS2015
这个安装的时候只要注意把VC++选上就可以了,默认的选项是不加VC++的。另外不要安装更新,联网更新很慢。
2. 安装NVIDIA驱动。
这个也很简单,windows的更简单,只需要去官网下载自己对应的版本来装就可以了。
3. 安装cuda toolkit
下载地址,当时为了适配tensorflow安装的是8.0版本,现在已经出到9.2了,选择合适自己的就好。
windows版本的exe文件安装还是比较简单的,全部选择默认路径安装就可以了。然后下面是配置:
配置环境变量,在安装完成之后已经有默认配置了
CUDA_PATH
和CUDA_PATH_V8_0
两个环境变量了,然后把剩下的几个也添加进去。如下图。
配置VS2015。
任意新建一个空项目,然后配置属性管理器:
这里我是用CUDA的sample是的项目来做演示,然后配置64位的属性:
VC++目录->包含目录中添加include路径:
VC++目录->库目录中添加lib路径:
连接器->输入->附加依赖项添加lib文件名:
这要是这里标红的这几个库,其实可以到库目录里看见这些lib文件,远不止这几个,复制起来还是挺麻烦的,所以其实可以把所有的lib都添加到这里,我看别人写的配置里只写了这几个也姑且先写这几个吧。
这样就可以了。
4. 编译samples测试。
可以在C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0
文件夹里找到samples,这是一个VS解决方案,里面有好多个项目,分了8个文件夹,各个文件夹下面有好几个项目。选择对应的VS版本的sln
打开。可以在VS里看到项目,我这里一共是155个项目,可以右键生成解决方案来编译所有的例程,还是比较慢的(i5 7500+1060的显卡大概下来十几分钟,大可不必全部编译),也可以点击某个项目来单独编译,然后将此项目设置为启动项目(右键单击有这个选项),单独运行即可。
选择了image里的boxfilter来测试了一下,大概能跑到70fps的帧率,这就是一个卷积操作,暂时还没有和opencv里的做对比,我感觉这个速度应该只能说一般,不过无论如何环境就算搭建好了,后面的学习慢慢来吧。
作者:和蔼的zhxing
链接:https://www.jianshu.com/p/0e0f89c76ad1
共同学习,写下你的评论
评论加载中...
作者其他优质文章