在Ubuntu 14.04上配置CUDA+Caffe+cuDNN+Anaconda+DIGITS

环境:Ubuntu 16.04 64bit

参考很多文章,以这篇为主:http://www.linuxidc.com/Linux/2016-11/136768.htm

Nvidia GeForce GTX 1070 (驱动Nvidia-Linux-x86_64-367.57)

这篇算是自己对caffe学习的一个总结系列的开头。首先因为caffe的依赖项比较多,配置起来也比较麻烦。这篇算是比较详尽地把caffe的各种相关配置说清楚。转载请注明出处。

安装:CUDA 8.0.44

推荐Ubuntu
14.04版本,因为digits的支持比较好。显卡支不支持GPU加速要搞清楚啊,不支持就全用CPU算吧,别浪费时间折腾cuda了。

cuDNN 5.1

大家基本要按照官方教程上面来。但是官方教程有的坑没有点出来的,本文也一并列上了。

显卡驱动安装:Ubuntu 16.04 Nvidia
显卡驱动安装
 见 http://www.linuxidc.com/Linux/2016-12/138907.htm

一、显卡的安装

CUDA是NVIDIA的编程语言平台,想使用GPU就必须要使用cuda。

禁用nouveau驱动,nouveau是ubuntu自带的对nivida的开源驱动,对安装nvidia的官方驱动会有问题,所以先将其禁用。

cuDNN是GPU加速计算深层神经网络的库。

按Ctrl+Alt+F1 进入tty1控制台,输入

下载CUDA

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

去官网https://developer.nvidia.com/cuda-downloads下载CUDA。

在里面写上

我选择的是:

blacklist nouveau

Operating System : Linux

options nouveau modeset=0

Architecture : x86_64

按esc 输入:wq 保存退出

Distribution : Ubuntu

ps:vim编辑器很好用啊,还不会的小伙伴要抓紧时间学啊。

Version : 16.04

执行

Installer Type : runfile(local)

lspci | grep nouveau

deb里似乎带了旧显卡驱动,安装完后还要重新装显卡驱动,有些麻烦。就用runfile。

查询pci总线中是否还有nouveau,grep后面接正则表达式过滤。

安装cuda

什么都没有说明禁用成功。

我安装的时候运行完,显示安装cuda_toolkit的时候库libGLU.so和libXmu.so缺失。或许可以尝试先安装:

重启后登录时,可能会循环出现填写登录密码,不能进入系统的情况,按Ctrl+Alt+F1,登录,

apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev

卸载显卡方法:

(见Missing recommended library: libGLU.so)

 sudo apt-get remove –purge nvidia*

我是先装Nvidia驱动的,第一次装cuda的时候总是报Warning : Incomplete
installation …然后提示没有驱动。我感觉可能是显卡驱动那边有问题,于是

安装显卡驱动:

sudo update-initramfs -u

$ sudo add-apt-repository ppa:xorg-edgers/ppa

重启。

$ sudo apt-get update

sudo modprobe nvidia

$ sudo apt-get install nvidia-352

然后安装Cuda。

执行sudo start lightdm 输入密码能看到桌面就ok啦

具体参考:this installation did not install the CUDA driver

ps:显卡驱动挂掉之后很可能你就看不到系统界面了,启动之后显示器一团漆黑,其实系统是在运行的。我的做法是先提前装好了SSH服务,碰到这种情况就通过另一台电脑SSH登陆进去安装驱动。

安装:

二、CUDA安装

sudo sh ./cuda_8.0.44_linux.run

CUDA官网下载。其实应该先下载好的,如果没来得及用图形界面下载,用wget,
curl什么的下载也一样。
据说331的驱动有坑啊,大家不要用那个驱动。下面安装一些依赖项/

(可通过sudo sh ./cuda_8.0.44_linux.run
–help查看一些参数命令,安装某一部分或是卸载的参数都可以看到,可能有些情况安装要带–override参数)

sudo service lightdm stop

一大堆条款什么的,愿意看就看吧,不想看直接回车按到底。

sudo apt-get install g++

输入accept接受条款。

sudo apt-get install git

接下来只有nvidia驱动那里不要装,因为我之前已经装过了显卡驱动。其他都选是或者默认就可以。

sudo apt-get install freeglut3-dev

流程:

首先在官网上下载安装文件(链接前文已经提供):

输入n。不装nvidia驱动。

我下载的是deb本地安装文件,下载完成后,按照文档提示的命令安装:

输入y。安装cuda toolkit

sudo dpkg -i cuda-repo-ubuntu1404-7-5-local_7.5-18_amd64.deb

回车。 使用默认安装路径/usr/local/cuda-8.0

sudo apt-get update

输入y。安装指向/usr/local/cuda的链接

sudo apt-get install cuda

输入y。安装Samples。

下载了下方的Installation Guide for Linux,里面有关于环境变量的设置方法:

回车。 使用Samples默认安装路径/home/username

如果有,则说明安装成功。没有可以按照下面方法卸载:

环境变量设置

sudo /usr/local/cuda-7.5/bin/uninstall_cuda_7.5.plsudo
/usr/bin/nvidia-uninstall

sudo vim ~/.bashrc

最后,配置环境变量,我们直接放在系统配置文件profile里面,先打开profile文件

在末尾添加

sudo vi /etc/profile

export CUDA_HOME=/usr/local/cuda-8.0

在最后面加入两行代码:

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

export PATH=/usr/local/cuda-7.5/bin:$PATH

export PATH=/usr/local/cuda-8.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH

保存退出。

执行 source /etc/profile 使环境变量生效

然后刷新。

至此cuda安装完毕

source ~/.bashrc

三、CUDNN安装

动态链接库设置

CUDNN是给CUDA加速的。cuDNN是GPU加速计算深层神经网络的库。cudnn官网下载。貌似下载要先注册,审核通过还要几天时间。下载好之后解压。

创建文件:

执行如下命令:

sudo vim /etc/ld.so.conf.d/cuda.conf

sudo tar xvf cudnn-7.0-linux-x64-v4.0-prod.tgz && cd cuda/include &&
sudo cp *.h /usr/local/include/ && cd ../lib64 && sudo cp lib*
/usr/local/lib/ && cd /usr/local/lib && sudo chmod +r libcudnn.so.4.0.7
&& sudo ln -sf libcudnn.so.4.0.7 libcudnn.so.4 && sudo ln -sf
libcudnn.so.4 libcudnn.so && sudo ldconfig

写入:/usr/local/cuda/lib64

这样CUDNN就安装完毕了,是不是很简单啊。

保存之后使其立即生效:

四、Anaconda的安装

sudo ldconfig -v

  到https://www.continuum.io/downloads
下载anaconda,推荐使用linux版的python
2.7版本,因为tensorflow中的有些东西不支持python3.5(如cPickle)。

检查

下载成功后,在终端执行(2.7版本):

(1)Cuda版本

# bash Anaconda2-4.1.1-Linux-x86_64.sh

nvcc –version

或者3.5 版本:

我这里提示nvcc没安装。之前说装toolkit时缺两个库,我装上后重装了cuda还是这样,执行cuda.run
–silent –toolkit还是没用。最后只能sudo apt-get install 
nvidia-cuda-toolkit下一个G了,不知道为什么。

# bash Anaconda3-4.1.1-Linux-x86_64.sh

sudo apt-get install  nvidia-cuda-toolkit

在安装的过程中,会问你安装路径,直接回车默认就可以了。有个地方问你是否将anaconda安装路径加入到环境变量(.bashrc)中,这个一定要输入yes

nvcc –version

安装成功后,会有当前用户根目录下生成一个anaconda2的文件夹,里面就是安装好的内容。在终端可以输入

(2)Sample测试

conda info 来查询安装信息

cd /usr/local/cuda/samples

输入conda list 可以查询你现在安装了哪些库,常用的python, numpy,
scipy名列其中。如果你还有什么包没有安装上,可以运行

sudo chown -R <username>:<usergroup> .

conda install *** 
来进行安装(***代表包名称),如果某个包版本不是最新的,运行 conda
update *** 就可以了。

cd 1_Utilities/deviceQuery

五、caffe的安装

make .

首先先安装opencv,推荐2.4的版本。opencv1.x是纯C语言编写的,2.x
c和c++的包都有,opencv3是只用c++写的。为了别人写的代码也能正常运行,还是推荐装2.x。

./deviceQuery

opencv2.4安装很简单了,下载下来解压,然后进入目录make, sudo make
install就搞定了。

输出一些关于cuda及显卡的信息则正常。make时可能会因gcc、g++版本过高引发问题,但我没遇到,解决方法可见底部我的参考。

caffe官方下载 基本按照官方安装指南就可以了,l另外一个方法就是命令行下载

获取cuDNN

下载caffe:

去官网https://developer.nvidia.com/rdp/cudnn-download下载cuDNN,要注册NVIDIA账号。

sudo git clone https://github.com/BVLC/caffe.git

我选择的是cuDNN v5.1 -> cuDNN v5.1 Library for Linux

如果你没安装Git,请阅读博客:Ubuntu Git安装与使用。

安装cuDNN

然后编译caffe:先安装依赖:

下载cuDNN后解压

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev
libopencv-dev libhdf5-serial-dev protobuf-compiler 

cd cuda/include

$ sudo apt-get install –no-install-recommends libboost-all-dev

发表评论

电子邮件地址不会被公开。 必填项已用*标注