Ubuntu18.04重装Nvidia驱动,cuda和cudnn,多用户使用anaconda

 

最近手残升级了nvidia显卡驱动,导致cuda与驱动冲动,没办法只能重装了。 配置信息:
系统:Ubuntu18.04;显卡:Nvidia 2080Ti;驱动:Nvidia Driver 440.44;cuda:10.2;cudnn:7.6.5

img

查看cuda 版本 cat /usr/local/cuda/version.txt

查看cudnn 版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

image-20200108100752066

重装显卡驱动

禁用nouveau驱动

sudo vim /etc/modprobe.d/blacklist.conf 在文本最后添加:

blacklist nouveau
options nouveau modeset=0

然后执行:sudo update-initramfs -u

重启机器后,执行以下命令,如果没有屏幕输出,说明禁用nouveau成功:

lsmod | grep nouveau

下载驱动

官网下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn ,根据自己显卡的情况下载对应版本的显卡驱动。下载得到一个.run安装包,之后会用到。

卸载旧驱动

重启后,使用快捷键进入文本模式,然后输入用户名密码就可:Ctrl-Alt+F1

执行以下命令禁用X-Window服务,否则无法安装显卡驱动:sudo service lightdm stop

执行以下命令卸载原有显卡驱动:注意匹配自己下载的驱动版本

sudo apt-get remove --purge nvidia*
sudo apt-get autoremove
sudo chmod +x NVIDIA-Linux-x86_64-4**.**.run
sudo ./NVIDIA-Linux-x86_64-4**.**.run --uninstall

安装新驱动

保险期间,再重启一遍。直接执行驱动文件即可安装新驱动,一直默认即可:

sudo ./NVIDIA-Linux-x86_64-410.93.run

执行以下命令启动X-Window服务

sudo service lightdm start

最后执行重启命令,重启系统即可:

reboot

重装CUDA

因为重装后的驱动和原来CUDA版本还是不一样(如果之前安装了CUDA,可以用nvcc -V试试,不行的话还是重装吧​🙂​)

卸载CUDA执行的是CUDA自带的卸载脚本,读者要根据自己的cuda版本找到卸载脚本:

sudo /usr/local/cuda-10.0/bin/uninstall_cuda_10.0.pl 卸载之后,还有一些残留的文件夹,之前安装的是CUDA 8.0。可以一并删除:

sudo rm -rf /usr/local/cuda-10.0/

安装CUDA

下载安装

在官网:CUDA下载页面,下载符合自己系统版本的CUDA。

下载完成之后,给文件赋予执行权限:

chmod +x cuda_*****_linux.run

执行安装包,开始安装:

./cuda_****_linux.run

CUDA10.2安装时会显示这样一个画面👇,不安装驱动了,注意把Driver去掉,否则会导致重复安装驱动

配置环境变量

export CUDA_HOME=/usr/local/cuda-10.2
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}

安装CUDNN

CUDNN的下载官网:https://developer.nvidia.com/rdp/cudnn-download ,点击Download开始选择和CUDA10.2匹配的下载版本,选择cuDNN Library for Linux

对它进行解压,命令如下:

tar -zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz

解压之后可以得到以下文件:

cuda/include/cudnn.h cuda/NVIDIA_SLA_cuDNN_Support.txt cuda/lib64/libcudnn.so cuda/lib64/libcudnn.so.7 cuda/lib64/libcudnn.so.7.4.2 cuda/lib64/libcudnn_static.a

使用以下两条命令复制这些文件到CUDA目录下:

cp cuda/lib64/* /usr/local/cuda-10.0/lib64/
cp cuda/include/* /usr/local/cuda-10.0/include/

拷贝完成之后,可以使用以下命令查看CUDNN的版本信息:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装Anaconda3

先去官方地址下载好对应的安装包Ubuntu - anaconda 下载地址

然后直接安装anaconda :bash ~/Downloads/Anaconda3-5.2.0-Linux-x86_64.sh

安装过程中看到

Welcome to Anaconda3 5.2.0 In order to continue the installation process, please review the license agreement. (为了继续安装过程,请审核许可证。协议。) Please, press ENTER to continue

直接按enter查看协议,然后一直enter下去,

然后看到

Do you accept the license terms? [yes no](你接受许可证条款吗?)

直接输入yes 然后按enter,进入下一步

接下来会提示安装地址:

Anaconda3 will now be installed into this location: /home/user/anaconda3

Press ENTER to confirm the location Press CTRL-C to abort the installation Or specify a different location below

建议默认即可, 按enter继续下一步,注意这里按ctrl + c 直接会终止安装。 接下来先等待安装即可。 看到

Thank you for installing Anaconda3!

表示安装成功。

添加环境变量

anaconda会自动将环境变量添加到PATH里面,如果后面你发现输出conda 提示没有该命令,那么你需要source ~/.bashrc 这样就是更新环境变量,就可以正常使用了。 如果发现这样还是没用,那么需要收到添加环境变量 sudo vim ~/.basrc 文件,在最后面加上 export PATH=/home/user/anaconda3/bin:$PATH

保存退出后:source ~/.bashrc 再次输入conda list测试看看,应该就是没有问题啦!

多用户使用conda

注意我在user用户下安装配置的conda,怎么在其他用户里使用conda呢?直接使用会报错没有conda命令

做如下配置:

su another_user
sudo vim ~/.basrc

最后一行加上conda安装位置的环境变量:export PATH=/home/user/anaconda3/bin:$PATH

保存退出后:source ~/.bashrc

如果使用conda activate命令显示没有初始化这样的错误,运行下面代码:

source ~/anaconda3/etc/profile.d/conda.sh
conda activate my_env