konto usunięte
Temat: PDL Permanent Device Loss???
Ostatnio przenosilem jednego klienta na nowego SANa.4 hosty poszly ladnie, ale jeden ma jakis problem.
Jako ze to byl ESX to od razu "wymienilem" ESXi4.1. Po zainstalowaniu nie moglem dodac LUNow z SANa. Przez to cale skanowanie HBA i VMFS az sie biedaczek z clusta rozlaczal.
Wiec na mu na to reboot. Jak sie w koncu uruchomil po godzinie, wiedzialem ze cos jest nie tak.
Ustawilem wiec
#esxcfg-advcfg -s 1 /Scsi/CRTimeoutDuringBoot
Powiedzmy ze host bootuje sie mniej wiecej ok. Jednak dalej problem z LUNami jest.
Przeinstalowalem dziada tez chyba ze 4 razy i nawet sprawdzialem spowrotem na ESX czy to samo sie dzieje. Wiec wykluczylem wade instalacji.
Patrze dalej do loga i widze jakies dziwactwa z failed odnosne jednego LUNa.
Wylaczylem wiec LUN na SAN, zeby nie udostepnial go temu hostowi i zrobilem maskowanie dodatkowo na hoscie na calym targecie 5.
#esxcli corestorege claimrule add -r 666 -t location -A vmhba1 -C 0 -T 5 -P MASK_PATH && esxcli corestorage claimrule load...
Po reboocie widze, ze to samo sie dzieje z kolejnym. Wiec dalem sobie spokoj z szukaniem winy w LUNach.
Zaczalem szukac dalej w logach i znalazlem to
Bledy, tego to od zawalenia mam
NMP: nmp_CompleteCommandForPath: Command 0x28 (0x41027f38c540) to NMP evice "eui.numerek" failed on physical path "vmhba3...."
ScsiDeviceIO: 1672: Command 0x28 to device "eui.numerek" failed X:0x2 P:0x0 Possible sense data: 0x0 0x0 0x0
WARINNG: NMP: nmp_DeviceRequestFastDeviceProbe: NMP device "eui.numerek" state in doubt; requested fast state update...
http://kb.vmware.com/kb/2004684
http://kb.vmware.com/kb/289902
http://kb.vmware.com/kb/1003433
http://kb.vmware.com/kb/1030381
Czyli wychodzi na to ze cos padlo w hoscie. HBA? Kable hmm to juz nie czesc hosta raczej. Tylko co innego, skoro dwa HBA swieca tak samo i widza wszystki LUNy jako active. Wymienie pewnie najpiew cable na OM3, cholera wie co sie dzieje.
Spotkaliscie sie z czyms takim?
Pozdr
EDIT:
Czytam, czytam i konca nie widac
narazie doszedlem do takiego samego bledu jak u mnie
This status is returned when the HBA driver is unable to issue a command to the device. This status can occur due to dropped FCP frames in the environment.Rafal S. edytował(a) ten post dnia 27.09.11 o godzinie 15:23