加入收藏 | 设为首页 | 会员中心 | 我要投稿 拼字网 - 核心网 (https://www.hexinwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 搭建环境 > Linux > 正文

为了使用学校GPU集群而离线安装Python和pytorch

发布时间:2022-12-09 14:04:02 所属栏目:Linux 来源:未知
导读: 参考:
学校GPU集群为无网环境,所以要离线安装
1.下载python 源文件
2.解压到~下的某个目录---make编译源文件-----make install指定安装到哪------vim ~/.bash_profile 设置环境变量 sourc

参考:

学校GPU集群为无网环境,所以要离线安装

1.下载python 源文件

2.解压到~下的某个目录---make编译源文件-----make install指定安装到哪------vim ~/.bash_profile 设置环境变量 source ~/bash_profile 使之生效 。此时运行python3就OK了()

3.然后同理 下载setuptools pip3压缩文件,解压------进入目录------

python3 setup.py build

python3 setup.py install

4.最后下载pytorch .whl torchvision .whl ------- pip3 install .whl

1.编译安装python3

从python3网站下载了python3源码压缩包,解压并编译了python3,make编译后,make install到了~/usr/local/python3目录下。

下载了setuptools和pip3的.whl文件。python setup .whl 安装了这两个依赖。这样python/bin目录下九有pip3了。

设置了~/.bash_profile环境变量,将python3/bin目录放进去了。这样就可以找到pip3 python3了。然后用source .bash_profile使其生效就ok了。

为了能在计算节点方便的使用自己的python3(在计算节点输入python3会自动调用计算节点安装的python3)所以使用ln指令创建了一个python3/bin下的python3解释器的快捷方式。这样登陆计算节点 ./python3 train.py就可以方便的使用了。

2.安装pytorch

python3安装之后,要在其上安装pytorch ,去pytorch官网下载了pytorch和torchvision的.whl文件。pip3 install .whl装就ok。途中可能需要一些额外的依赖项,比如numpy six pillow,去pypi下载,安装就ok。

计算节点使用方法干货:

qsub -cwd -V -pe mpi 24

#使用当前工作路径

#带入用户所有环境变量

#占用24核,防止别人任务抢资源

./python3 testCuda.py

ctrl+d #提交

qstat -f //查询各节点状态

qstat

ssh compute-0-0.cluster-gpu //登陆计算节点 可以直接登陆计算节点执行 但管理员不建议

nvidia-smi //查看显存使用情况

watch -n 10 nvidia-smi //周期性地输出显卡使用情况

感想:

计算节点就是给算力,资源 程序 还是你的,但是CPU GPU通过这个集群操作系统分配,就像我们用自己的电脑 操作系统负责分配给进程线程时间片一样集群linux,集群操作系统负责分配计算资源 只不过计算资源可以来自多个节点。 如果我们直接登陆计算节点的话 就不需要提交作业给集群操作系统 集群操作系统也就没法合理的安排分配 所以管理员建议通过作业系统提交作业 而不是直接登陆计算节点执行。

(编辑:拼字网 - 核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!