写这篇文章时,只是单纯的想装最新的,但是后来装tensorflow时整个傻掉了。

所以:

如果你是因为要安装Tensorflow所以需要cuda和cudnn,

请先参考我的这篇文章:https://blog.csdn.net/Raink_LH/article/details/110880271

只使用pytorch的话,用最新版cuda+cudnn亲测是支持的。

Ubuntu(20)安装Nvidia 驱动+CUDA + cuDNN

目录

1、安装驱动

1.1 可视化安装

1.2 命令行安装

2、安装CUDA

2.1确定可安装的版本

2.2 准备与验证

2.3 下载

2.4 验证CUDA

3、安装cuDNN

3.1 针对Linux安装

3.2 针对Ubuntu安装


1、安装驱动

1.1 可视化安装

对于Ubuntu20.10,可以通过可视化界面直接安装,非常方便:

方法是通过“软件和更新”

在其中的“附加驱动”标签下直接选择,并选择“应用更改”即可。

1.2 命令行安装

对于ubuntu18.04及更早的版本,只用使用终端命令行安装

首先查看首支持的版本:

ubuntu-drivers devices

例如结果如下

然后选择合适的版本,进行安装,

按照推荐的自动安装:

sudo ubuntu-drivers autoinstall 

安装自己想安装的版本:

sudo apt install nvidia-driver-455 

 

至于从官网下载手动安装,个人不推荐,坑太多了。

2、安装CUDA

2.1确定可安装的版本

使用

nvidia-smi

可以查看驱动是否正常安装,如下则说明驱动正常,并能看到支持的CUDA版本。

 

CUDA的安装请参考官方的的指导手册:Nvidia CUDA安装手册

2.2 准备与验证

确保系统是受支持的Linux版本。确认系统已经安装了gcc,及gcc版本。

2.3 下载

选择合适的版本:https://developer.nvidia.com/cuda-toolkit-archive

推荐使用runfile(local)的方式安装

wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run

按照其指令,第一行可以在其他电脑(windows)上使用下载工具(迅雷)进行下载。

按第二行运行后如下图,选择继续

输入“accept”继续

这里用空格去掉Driver驱动,因为可能这个包里的驱动和已经安装的驱动有版本差异,直接装会报错。

所以这里选择 不安装驱动。

上下选择到“Install”,回车后安装。

2.4 验证CUDA

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

3、安装cuDNN

参考:https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html

下载cuDNN:https://developer.nvidia.com/rdp/cudnn-download

个人推荐直接下载Linux版本的,也按照Linux去安装。

好处是安装简单,只是文件的拷贝,就算装错了,单独要卸载,也只需删除已经安装的文件即可。

缺点就是官方提供的验证方式无法执行。

3.1 针对Linux安装

首先通过任意方式,下载cudnn-x.x-linux-x64-v8.x.x.x.tgz

(使用自己下载的相应版本文件名,替换这里的x.x之类的)

解压,会解压到同级目录下的“cuda”目录下

tar -xzvf cudnn-x.x-linux-x64-v8.x.x.x.tgz

拷贝相应文件到制定目录:

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

添加一定的权限

sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

3.2 针对Ubuntu安装

3.2.1 安装

针对Ubuntu安装较为麻烦。

需要安装运行时、开发工具、示例程序三个,别且要按顺序安装

安装方式都一样,使用

sudo dpkg -i libcudnnX_xxxxx.deb

需要说明的是,如果在安装中出现如下错误:

/sbin/ldconfig.real: /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcudnn.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcudnn_adv_train.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8 is not a symbolic link

……
……

根据所列出的错误路径,打开文件夹,可以看到名字相似的文件,例如

注意名称,有些是8.0.1,有些是7.x的。

那么使用如下指令进行修正(只列出一个,其他的类似方式修改以下文件名):

sudo ln -sf /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcudnn_adv_train.so.8.0.5 /usr/local/cuda-11.0/targets/x86_64-linux/lib/libcudnn_adv_train.so.8

……
……

3.2.2 验证

按照如上所说,安装完三个deb包(samples也安装了)。

按照官方提供的方法进行验证:

cp -r /usr/src/cudnn_samples_v8/ $HOME
cd  $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN

看运行结果是否为“Test passed!”

如下图即安装成功。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐