深度学习环境配置

2021/12/12 备忘 共 1411 字,约 5 分钟

实验室新到了GeForce RTX 3060,新环境配置我也试了一次。因为显卡是售后装的,我就不说了。我的系统是win10,想要安装的深度学习框架是PyTorch,电脑上已经装了Anaconda和Python 3.9。接下来的步骤:

安装显卡驱动

到官网:https://www.nvidia.cn/geforce/drivers/安装显卡驱动,看好型号搜索驱动程序,找了半天没有看到做深度学习应该装哪种,我就装的Game Ready驱动程序。

驱动安装好以后,可以桌面右键查看Nvidia控制面板,或者设备管理器-显示控制器下看到GeForce,刚装好显卡没有在显示控制器下看到是没问题的,因为刚装好的显卡由于驱动程序不正确显示的名字也不对。

安装CUDA

接下来可以打开shell,运行命令nvidia-smi可以看到显卡的情况,这个时候可以看到适配的CUDA版本,据我观察这个版本应该和安装的驱动版本有关,驱动版本越新对应的CUDA版本越新。然后就要去CUDA官网下载对应的CUDA版本。

image-20211208173159203

安装成功后打开shell,执行命令nvcc -V可以看到CUDA版本:

image-20211208162334617

我在安装PyTorch的过程中看到有安装依赖也就是CUDA,这一步是不是可以不做呢?我没试过,我觉得可以试一下。

安装PyTorch

我采用的是conda安装,打开Anaconda Prompt,将官网上的命令粘贴到上面,选择对应的版本:

image-20211208173408027

这一步如果成功,可以试一下执行以下命令,如果正确执行代表安装完毕:

微信截图_20211208161938

如果不成功,就比较折腾了,第一种报错,就是CondaHTTPError:

image-20211208162128415

网上的各种解决方法都是添加清华源,我试过但是没有用。于是我还是把conda channel调回了默认值:conda config --remove-key channels,可以确认一下是不是default:

image-20211208161831637

接下来,我在这个网页上:https://forum.qiime2.org/t/condahttperror-http-000-connection-failed/3317/3看到一个解决方法,将ssl_verify设为False:conda config --set ssl_verify no。通过这个设置,不再报CondaHTTPError,而是开始报另一种错误(崩溃…)ProxyError:

image-20211208172822549

出现这个问题后,我又找了很多解决方案,感谢这个方法:https://www.bilibili.com/read/cv9012396,设置后立马就成功了。

上面的试错过程我不太清楚哪一步是最关键的一步,就先把过程放到这里,以免遇到相同情况。

另外我在Windows电脑上遇到的以上这些情况也有可能跟VPN有关,建议做这些操作时把VPN关掉,检查一下网络设置是否打开了代理,如果打开了一定要关掉。

安装CuDNN

安装参考:cuda安装教程+cudnn 安装教程

本来我是没有安装CuDNN的,因为在之后运行YOLO时发现有报错:RuntimeError: Unable to find a valid cuDNN algorithm to run convolution。通过check这篇文章我才发现我没安装cuDNN,所以用文字记录这些安装过程是非常重要的。看来cuDNN也是一定要安装的。

官网下载地址

查看你的CUDA版本选择对应的cuDNN版本下载,下载需要注册nvidia会员。下载后将解压后的文件夹下的文件拷贝到cuda安装目录对应文件夹下。

文档信息

Search

    Table of Contents