Computação Distribuída com TORQUE Resource Manager
O TORQUE Resource Manager fornece controle sobre trabalhos de grupo e recursos de computação distribuída. É um produto Open Source avançado, baseado no projeto original PBS e incorpora o melhor da comunidade e do desenvolvimento profissional. Ele está atualmente em uso em dezenas de milhares de aplicações governamentais, acadêmicas e sites comerciais em todo o mundo.
[ Hits: 23.200 ]
Por: Juno Kim em 28/08/2013 | Blog: http://www.kim.eti.br
server:kmn Quere Memory CPU Time Walltime Node Run Que Lm State ----- ------ -------- -------- ---- --- --- -- ----- batch -- -- -- -- 0 0 -- ER --- --- 0 0Verificando uma configuração adicional:
# # Create queues and set their attributes # # # Create and define queue batch # create queue batch set queue batch queue_type = Execution set queue batch resources_default.nodes = 1 set queue batch resources_default.walltime = 01:00:00 set queue batch enabled = True set queue batch started = True # # Set server attributes. # set server scheduling = True set server acl_hosts = kmn set server managers = user1@kmn set server operators = user1@kmn set server default_queue = batch set server log_events = 511 set server mail_from = adm set server scheduler_iteration = 600 set server node_check_rate = 150 set server tcp_timeout = 300 set server job_stat_rate = 45 set server poll_jobs = True set server mom_job_sync = True set server keep_completed = 300 set server next_job_number = 0Verificando se todos os nós estão corretamente configurados e livres:
node001 state=free np=2 properties=bigmem,fast,ia64,smp ntype=cluster status=rectime=1328810402,varattr=,jobs=, state=free,netload=6814326158,gres=,loadave=0.21,ncpus=6, physmem=8193724kb, availmem=13922548kb,totmem=16581304kb,idletime=3, nusers=3,nsessions=18,sessions=1876 1120 1912 1926 1937 1951 2019 2057 28399 2126 2140 2323 5419 17948 19356 27726 22254 29569,uname=Linux kmn 2.6.38-11-generic #48-Ubuntu SMP Fri Jul 29 19:02:55 UTC 2011 x86_64,opsys=linux mom_service_port = 15002 mom_manager_port = 15003 gpus = 0Enviando trabalhos para a fila "NUNCA FAÇA ISSO COMO ROOT":
Job id Name User Time Use S Queue ------ ----- ---- -------- -- ----- 0.kmn STDIN knielson 0 Q batch
Configurando o proftpd com autenticação de usuário pelo passwd
Computação Distribuída com TORQUE Resource Manager - Parte 2
Impressora JPG no Linux compartilhada para Windows
Subversion (SVN) com autenticação pelo LDAP
Weta Digital + Linux = Avatar - Um case de sucesso
Instalando o Macromedia Flash MX no Debian
Compartilhando a tela do Computador no Celular via Deskreen
Como Configurar um Túnel SSH Reverso para Acessar Sua Máquina Local a Partir de uma Máquina Remota
Configuração para desligamento automatizado de Computadores em um Ambiente Comercial
Como renomear arquivos de letras maiúsculas para minúsculas
Imprimindo no formato livreto no Linux
Vim - incrementando números em substituição
Efeito "livro" em arquivos PDF
Como resolver o erro no CUPS: Unable to get list of printer drivers
Instalação Uefi com o instalador clássico do Mageia (0)
É cada coisa que me aparece! - não é só 3% (2)
SysAdmin ou DevOps: Qual curso inicial pra essa área? (1)
Alguma pessoa pode me ajudar com drriver Core i3 7020u (Debian 12)? (2)
[Python] Automação de scan de vulnerabilidades
[Python] Script para analise de superficie de ataque
[Shell Script] Novo script para redimensionar, rotacionar, converter e espelhar arquivos de imagem
[Shell Script] Iniciador de DOOM (DSDA-DOOM, Doom Retro ou Woof!)
[Shell Script] Script para adicionar bordas às imagens de uma pasta