使用LSF运行python代码

集群中有2台主机,master(无GPU)和user-g4a60(GPU主机),直接运行python main.py程序将在CPU中运行。

如下步骤可以运行你的程序:
在你的文件目录下新建一个 lsf.sh 文件,正文写入:

#!/bin/sh                     
#BSUB -q normal         
#BSUB -o %J.out
#BSUB -e %J.err
#BSUB -n 1   
#BSUB -J JOBNAME        
#BSUB  -R span[ptile=1]     
#BSUB -m "user-g4a60"          
#BSUB  -gpu  num=1           
                           
python main.py   

其中 python main.py 是你运行程序的命令,然后:
source activate 你的conda环境
开启环境,用
bsub <lsf.sh向集群提交运算任务。
即可运行程序,终端会给你一个任务序号,输出文件就是序号.out序号.err

其他命令:

bjobs -W       #查看你的任务运行状况
bhosts -gpu    #查看集群GPU使用情况。
bqueues        # 队列
bjobs -p 1001  # 1001 信息

本文链接:

http://qxge.cn/archives/3/