Computação Distribuída com TORQUE Resource Manager - Parte 2
A intenção deste artigo, é fornecer uma visão geral para submissão e controle de trabalhos na estrutura do PBS/TORQUE.
[ Hits: 14.864 ]
Por: Juno Kim em 21/10/2013 | Blog: http://www.kim.eti.br
Diretiva Interpretador Shell Interpretador PBS # Comentário Comentário #PBS Comentário Diretiva #PBS Comentário ComentárioA tabela a seguir, apresenta um resumo de algumas diretivas comumente usadas no PBS TORQUE. Para mais informações, por favor, consulte o manual TORQUE.
------------------------------------------------------------------------------ Diretiva Exemplo Descrição N #PBS N testjob Nome do JOB usado no PBS TORQUE M #PBS M user@domain Envia um e-mail de notificação m #PBS m e Envia um e-mail quando termina o JOB e #PBS e Cria um arquivo de erro o #PBS o ~/out Redireciona a saída para $HOME/out q #PBS q all.q Especifica a fila exemplo: all.q d #PBS d /home/testuser Determina o diretório de trabalho l #PBS l walltime=00:30:00 resource request, i.e. 30 minutes run time l #PBS l nodes=2:ppn=2 request two CPUs on two nodes each --------------------------------------------------------------------------------
Queue Memory CPU Time Walltime Node Run Que Lm State ------------ ------ -------- -------- ---- --- --- -- ----- default -- -- -- -- 0 0 -- E R special -- -- -- -- 0 0 -- E R --- --- 0 0Em seguida, envie o seu trabalho, por exemplo, diretamente para a fila "special". Após o envio bem-sucedido, PBS TORQUE responde à identificação do trabalho com o JOB ID.
95.masterPara exibir o status do(s) trabalho(s) executado(s), use o comando qstat. Note, enquanto qstat mostra todas as tarefas atualmente submetidas ao cluster.
Job id Name User Time Use S Queue ----------------- ------------- ----------- ---- --- - ----- 95.master testjob.sh testuser 0 R special# qstat -u testuser
testuser: Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time ------------ -------- -------- ----------- ------ ----- --- ------ ----- - ----- 93.master testuse batch test2.sh 16452 1 -- -- 01:00 C 01:41 95.master testuse special testjob.sh 17564 1 -- -- 01:00 C 00:01
jobname.e#{JOBID} jobname.o#{JOBID}Os arquivos de saída, em resumo, contém a saída de suas aplicações, mas quando existe algum erro, é importante analisar o mesmo.
Computação Distribuída com TORQUE Resource Manager
Configurando o proftpd com autenticação de usuário pelo passwd
Apresentação visual do Basic Linux
Gerando arquivos PDF em modo texto
Redmine no openSUSE - Gerenciamento de projetos e bugs (issue tracking)
Nenhum comentário foi encontrado.
Enviar mensagem ao usuário trabalhando com as opções do php.ini
Meu Fork do Plugin de Integração do CVS para o KDevelop
Compartilhando a tela do Computador no Celular via Deskreen
Como Configurar um Túnel SSH Reverso para Acessar Sua Máquina Local a Partir de uma Máquina Remota
Configuração para desligamento automatizado de Computadores em um Ambiente Comercial
Compartilhamento de Rede com samba em modo Público/Anônimo de forma simples, rápido e fácil
Cups: Mapear/listar todas as impressoras de outro Servidor CUPS de forma rápida e fácil
Criando uma VPC na AWS via CLI
Tem como instalar o gerenciador AMD Adrenalin no Ubuntu 24.04? (15)
Tenho dois Link's ( IP VÁLIDOS ), estou tentando fazer o failover... (0)
Pendrive não formata de jeito nenhum (4)