Computação Distribuída com TORQUE Resource Manager
O TORQUE Resource Manager fornece controle sobre trabalhos de grupo e recursos de computação distribuída. É um produto Open Source avançado, baseado no projeto original PBS e incorpora o melhor da comunidade e do desenvolvimento profissional. Ele está atualmente em uso em dezenas de milhares de aplicações governamentais, acadêmicas e sites comerciais em todo o mundo.
[ Hits: 23.668 ]
Por: Juno Kim em 28/08/2013 | Blog: http://www.kim.eti.br
server:kmn Quere Memory CPU Time Walltime Node Run Que Lm State ----- ------ -------- -------- ---- --- --- -- ----- batch -- -- -- -- 0 0 -- ER --- --- 0 0Verificando uma configuração adicional:
# # Create queues and set their attributes # # # Create and define queue batch # create queue batch set queue batch queue_type = Execution set queue batch resources_default.nodes = 1 set queue batch resources_default.walltime = 01:00:00 set queue batch enabled = True set queue batch started = True # # Set server attributes. # set server scheduling = True set server acl_hosts = kmn set server managers = user1@kmn set server operators = user1@kmn set server default_queue = batch set server log_events = 511 set server mail_from = adm set server scheduler_iteration = 600 set server node_check_rate = 150 set server tcp_timeout = 300 set server job_stat_rate = 45 set server poll_jobs = True set server mom_job_sync = True set server keep_completed = 300 set server next_job_number = 0Verificando se todos os nós estão corretamente configurados e livres:
node001 state=free np=2 properties=bigmem,fast,ia64,smp ntype=cluster status=rectime=1328810402,varattr=,jobs=, state=free,netload=6814326158,gres=,loadave=0.21,ncpus=6, physmem=8193724kb, availmem=13922548kb,totmem=16581304kb,idletime=3, nusers=3,nsessions=18,sessions=1876 1120 1912 1926 1937 1951 2019 2057 28399 2126 2140 2323 5419 17948 19356 27726 22254 29569,uname=Linux kmn 2.6.38-11-generic #48-Ubuntu SMP Fri Jul 29 19:02:55 UTC 2011 x86_64,opsys=linux mom_service_port = 15002 mom_manager_port = 15003 gpus = 0Enviando trabalhos para a fila "NUNCA FAÇA ISSO COMO ROOT":
Job id Name User Time Use S Queue ------ ----- ---- -------- -- ----- 0.kmn STDIN knielson 0 Q batch
Computação Distribuída com TORQUE Resource Manager - Parte 2
Configurando o proftpd com autenticação de usuário pelo passwd
Servidor Messenger Openfire passo-a-passo no Linux
Linux Thinstation para estações antigas
Instalando um novo tema no Acer Aspire One
Incrementando os efeitos do Ubuntu
Instalação do Cacti baseado em uma distribuição própria - CactiEZ
Como transformar um áudio em vídeo com efeito de forma de onda (wave form)
Como aprovar Pull Requests em seu repositório Github via linha de comando
Como gerar um podcast a partir de um livro em PDF
Organizando seus PDF com o Zotero
Erro no realm join [Resolvido]
Um programa para baixar vídeos: Parabolic
Como Definir o Painel Principal em Múltiplos Monitores no Linux Mint
Sempre que vou baixar algum pacote acontece o erro dpkg (7)
como instalo panfrost-dri e o driver panfrost fork , ou panfrost (12)