Erro no boot redhat 5.5 [RESOLVIDO]

1. Erro no boot redhat 5.5 [RESOLVIDO]

Alan
allancarlost

(usa Debian)

Enviado em 21/10/2015 - 15:12h

Olá amigos do VoL... Meu primeiro post e já logo de cara peguei um BO no servidor de um cliente. Como não sou nervoso (ainda) no linux fica muito difícil achar o problema. Então se puderem me auxiliar ficarei imensamente grato!

Possuímos um server rodando redhat 5.5 e depois de alguns dias logo quando ele reseta aparece alguns Warnings. Gostaria de saber qual o procedimento para analise de meus discos, se estão em RAID ou não.

Segui uns tutoriais e não consegui avançar. não consigo instalar nem o lsblk .. da erro.

Eis o erro no boot:

ERROR: isw: Could not find disk/dev/hda in the metadata
ERROR: isw: Could not find disk/dev/hdc in the metadata
no raid disks and with names: "isw_eaedefiai_SYSTEM
failed to start () /dev/mapper/isw_eaegdefiai_SYSTEM
Reading all physical volumes. PV f4ZqEB36CFvn0a6JIhpFPU: using hda2
Found volume group "VolGroup00" using metadata type lvm2
Found duplicate PV f4ZqEB36CFvn0a6JIhpFPU: using hda2
2 logical volume(s) in volume group "VolGroup" now active

Alguém poderia me dar uma força ????
Muito Obrigado


  


2. MELHOR RESPOSTA

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 23/10/2015 - 17:41h

Cara, como ta o backup dessa maquina? Ele bootou? Se eu fosse você faria um backup urgente do que quer que seja que esteja rodando aí. Depois formataria a maquina e voltaria o backup. Qual a idade desses discos?

O primeiro erro ta falando que o syslogd ficou bloqueada por mais de 120 segundos mas no stack da pra ver que tem a ver com o filesystem, por isso a preocupação! Parece que ele parou enquanto tentava acessar o disco, eu não quero botar pânico, mas se você tem não tem um backup tenta fazer um imediatamente.

Pelo que eu entendi existia um raid nessa maquina:

no raid disks and with name ...


Porem alguma coisa aconteceu e ele começou a usar os nomes dos dispositivos /dev/hdX em vez do /dev/md*, por isso a mensagem de PV duplicado, o hda e hdc eram um raid1. O erro da primeira foto é preocupante, depois que tiver feito um backup sugiro que use a ferramenta smartctl pra ver a vida util do disco.

smartctl -A --health /dev/hda
smartctl -A --health /dev/hdc


Se não souber qual pacote prove o smartctl pode usar (se eu não me engano)

yum whatprovides /usr/bin/smartctl

e ele vai falar qual pacote deve instalar, mas o mais importante agora seria fazer o bakcup mesmo.

O smartctl --health vai te dar um status da vida util do disco, se ele não for PASSED é extremamente recomendavel trocar de disco, olha um exemplo de saida da minha maquina:

[geckos@csi24 ~]$ sudo smartctl -A --health /dev/sda
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-4.2.3-1-ARCH] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED <------------ TEM QUE SER PASSED

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 145636617
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 099 099 020 Old_age Always - 1095
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 237242040
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15749
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 099 099 020 Old_age Always - 1095
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 065 049 045 Old_age Always - 35 (Min/Max 25/36)
194 Temperature_Celsius 0x0022 035 051 000 Old_age Always - 35 (0 16 0 0 0)
195 Hardware_ECC_Recovered 0x001a 036 022 000 Old_age Always - 145636617
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 18751 (92 96 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 3326154597
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1825318824


Quanto a esses valores, eles são estados do disco, eu nao sei cada um de cor mas no manual e na net não deve ser dificil achar as definições. Qualquer coisa estamos aí!

Att, e boa sorte :)

3. Output

Patrick Reis de Souza
Little Rabbit

(usa Red Hat)

Enviado em 21/10/2015 - 16:54h

Allan, pelo que eu entendi lendo o LOG,

Ele não conseguiu localizar os indicadores das partições hda e hdc. E lá na parte de baixo ele diz que encontrou um grupo usando o indicador lvm2 e uma Duplicidade usando hda2.

Você consegue mostrar a saída desses comandos??

vgdisplay -v

fdisk -l


Grande abraço.


4. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 21/10/2015 - 16:56h


Warnings?

A maquina está bootando pelo menos?

pode postar a saida do comando:

vgdisplay -v


Att,


5. Re: Erro no boot redhat 5.5

Alan
allancarlost

(usa Debian)

Enviado em 21/10/2015 - 17:15h

Little Rabbit escreveu:

Allan, pelo que eu entendi lendo o LOG,

Ele não conseguiu localizar os indicadores das partições hda e hdc. E lá na parte de baixo ele diz que encontrou um grupo usando o indicador lvm2 e uma Duplicidade usando hda2.

Você consegue mostrar a saída desses comandos??

vgdisplay -v

fdisk -l


Grande abraço.



Obrigado pessoal segue o FDISK -L

[root@srvlinux ~]# fdisk -l

Disk /dev/hda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cilindros of 16065 * 512 = 8225280 bytes

Dispositivo Boot Start End Blocks Id System
/dev/hda1 * 1 13 104391 83 Linux
/dev/hda2 14 60800 488271577+ 8e Linux LVM

Disk /dev/hdc: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cilindros of 16065 * 512 = 8225280 bytes

Dispositivo Boot Start End Blocks Id System
/dev/hdc1 * 1 13 104391 83 Linux
/dev/hdc2 14 60800 488271577+ 8e Linux LVM

Disk /dev/hdd: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cilindros of 16065 * 512 = 8225280 bytes

Dispositivo Boot Start End Blocks Id System
/dev/hdd1 1 60801 488384001 fd Detecção automática de RAID Linux

DESCONSIDERE ESSE DISPOSITIVO /DEV/HDD1 pois outro técnico achou q era problema de disco e add outro porém criou errado..

Segue também o VGDISPLAY -V

[root@srvlinux ~]# vgdisplay -v
Finding all volume groups
Found duplicate PV f4ZqEB36CFvnOa6JIhpPFUSVJDGDB536: using /dev/hdc2 not /dev/hda2
Finding volume group "VolGroup00"
--- Volume group ---
VG Name VolGroup00
System ID
Format lvm2
Metadata Areas 1
Metadata Sequence No 3
VG Access read/write
VG Status resizable
MAX LV 0
Cur LV 2
Open LV 2
Max PV 0
Cur PV 1
Act PV 1
VG Size 465,62 GB
PE Size 32,00 MB
Total PE 14900
Alloc PE / Size 14900 / 465,62 GB
Free PE / Size 0 / 0
VG UUID 1JqFU8-0HwO-WCs6-hzxx-Rcco-hk5u-S0FvPn

--- Logical volume ---
LV Name /dev/VolGroup00/LogVol00
VG Name VolGroup00
LV UUID BWZeJe-E4gc-ygMs-6c9N-fsw2-xEoL-0Z5fE2
LV Write Access read/write
LV Status available
# open 1
LV Size 459,81 GB
Current LE 14714
Segments 1
Allocation inherit
Read ahead sectors auto
- currently set to 256
Block device 253:0

--- Logical volume ---
LV Name /dev/VolGroup00/LogVol01
VG Name VolGroup00
LV UUID UpzDh5-WS08-SeHK-56rX-e5i0-deox-moeAgl
LV Write Access read/write
LV Status available
# open 1
LV Size 5,81 GB
Current LE 186
Segments 1
Allocation inherit
Read ahead sectors auto
- currently set to 256
Block device 253:1

--- Physical volumes ---
PV Name /dev/hdc2
PV UUID f4ZqEB-36CF-vnOa-6JIh-pPFU-SVJD-GDB536
PV Status allocatable
Total PE / Free PE 14900 / 0

Ele esta funcionando "normalmente". Porém todo final de dia através de um script para backup de BD ele mata os processos, realiza a cópia depois reseta para restartar os serviços de volta. O negocio é que esta um pouco mais lento (não sei se é coincidência). E o medo de estar com problemas de disco


Mais uma vez obrigado


6. Re: Erro no boot redhat 5.5

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 21/10/2015 - 17:54h

Pra mim parece que hda e hdc são o mesmo disco. Você tem dois discos de 500GB ou 1 só? Você ta usando algum tipo de multipath?


7. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Alan
allancarlost

(usa Debian)

Enviado em 21/10/2015 - 18:20h

Então danielhilst existe 03 discos ... hda e hdc que estão rodando a algum tempo. O hdd é recente porém está em desuso.
Quanto ao Multipath acredito ter um sim pois é realizado o bkp de 03 formas: via FTP e uma Storage iCloud (através de um IP na Lan).

Acredito que fora isso não exista mais nada. Existe algum comando que me mostre esse tipo de informação???

Dei um df-h

df -h
Sist. Arq. Tam Usad Disp Uso% Montado em
/dev/mapper/VolGroup00-LogVol00
446G 209G 214G 50% /
/dev/hda1 99M 13M 82M 14% /boot
tmpfs 3,9G 0 3,9G 0% /dev/shm
//192.168.0.5/linxlog
1,9T 616G 1,3T 34% /dados/dealer/slog/bkp_log


8. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 21/10/2015 - 19:55h

Multipath é usado com storage, mas pelo que entendi são dois discos físicos que vc tem. Pelo que vi numa busca rapida na net vi que da pra remover o warning com uma linha no lvm.conf, diretiva filter... Mas o ideal é entender o que ta pegando..

São dois discos fisicos ou tem algum storage?


9. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Alan
allancarlost

(usa Debian)

Enviado em 21/10/2015 - 23:43h

Tenho dois discos fisicos.... Nao tem storage. Somente o mecanismo via rede (storage icloud domestica). Mas desconsidere.

Posso entao procurar pelo lvm.conf na diretiva filter e mexer la ???

Outra coisa é como posso saber sobre a integridade desses discos Daniel???

Melhor deixa eu resolver esse problema da msg depois venho tirar outras duvidas. Respondi o q tu estava perguntando ???


10. Re: Erro no boot redhat 5.5

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 22/10/2015 - 09:52h

Respondeu,

Durante a criação de um PV o software do LVM cria uma identificação unica (UUID), pelo que entendi ele gerou a mesma UUID pra dois discos distintos o que é bem estranho e não deveria acontecer.

Pode postar a saida dos comandos:

multipath -l
pvdisplay -m


Você pode sim usar a diretiva filter e filtrar o disco que não está sendo usado: http://linux.die.net/man/5/lvm.conf
Mas eu sou contra suprimir warnings ...

//192.168.0.5/linxlog --> Esse é seu Storage iCloud?


11. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Alan
allancarlost

(usa Debian)

Enviado em 22/10/2015 - 12:35h

Segue

multipath -l

Não mostra nada




[root@srvlinux dados]# pvdisplay -m
Found duplicate PV f4ZqEB36CFvnOa6JIhpPFUSVJDGDB536: using /dev/hdc2 not /dev/hda2
--- Physical volume ---
PV Name /dev/hdc2
VG Name VolGroup00
PV Size 465,65 GB / not usable 27,71 MB
Allocatable yes (but full)
PE Size (KByte) 32768
Total PE 14900
Free PE 0
Allocated PE 14900
PV UUID f4ZqEB-36CF-vnOa-6JIh-pPFU-SVJD-GDB536

--- Physical Segments ---
Physical extent 0 to 14713:
Logical volume /dev/VolGroup00/LogVol00
Logical extents 0 to 14713
Physical extent 14714 to 14899:
Logical volume /dev/VolGroup00/LogVol01
Logical extents 0 to 185



Realmente mudar as configurações de filtro não é uma boa ideia. Li o material do link que tu me passou.
Como não trabalhei com os servidores da empresa. Estou fazendo uma captura de informações e vi que //192.168.0.5/* é um compartilhamento criado num servidor microsoft de "backup".

Verifiquei esse tal Storage nesse IP e vi que não havia nada. Parece brincadeira mas é verdade. Como a Storage queimou, acredito que colocaram um server windows para a mesma função com o mesmo IP (192.168.0.5).

Já estou adiantando as coisas e iremos colocar um server novo no local. Porém necessito muito resolver esse problema pois se num backup após o resete ele não voltar .. ele vai f@%$#@¨% comigo srsrs

Obrigado pela sua ajuda cara .. brigado mesmo


12. Re: Erro no boot redhat 5.5 [RESOLVIDO]

Daniel Hilst Selli
danielhilst

(usa Arch Linux)

Enviado em 22/10/2015 - 14:28h

Já que o multipath não retornou nada, tenta esse aqui então: dmstats list

Ele vai listar os device maps. Acho que o LVM deveria estar usando o /dev/mapper/.. ou algo do tipo em vez de /dev/hdX

Att,



01 02



Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts