Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Witam,

Dostało mi się do złożenia prosty serwerek mający za zadanie utrzymać kilka VM. Ze względu na fundusze padło na i72600k + Asus Sabetooth p67 + raid Adaptec 6405 z 4 dyskami SATA.
Wszytko poprawnie ruszyło, zainstalowałem esxi 5 z racji kompatybilności z raidem system postał parę godzin i zaczął się sypać przy obciążeniu dysków. Log VMkernela wysypuje

Obrazek


w momencie zawieszenia się maszyny pojawia się wpis :

 warning linscsi scsilinuxabortcommands failed 


Testowałem różne wielkości cache na raidzie, oraz róźne konfiguracje VM, prędzej czy później błąd się pojawia.
Może ktoś spotkał się z takim problemem. Czas nagli.Zdybał Konrad edytował(a) ten post dnia 17.01.12 o godzinie 07:57

konto usunięte

Temat: ESXI 5 SCSILinuxAbortCommnads

Ten Adaptec moze i jest kompatybilny, ale wymaga innego zestawu driverow, niz te z ISO.
Probowales je?Rafal S. edytował(a) ten post dnia 17.01.12 o godzinie 08:20
Michał Ł.

Michał Ł. Doświadczenie jest
czymś, co zdobywasz
wtedy, gdy
przesta...

Temat: ESXI 5 SCSILinuxAbortCommnads

To co napisał Rafał + firmware kontrolera - jeżeli aktualny zrób nadpisanie jeżeli nie to upgrade.

Michał
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

dzięki za zainteresowanie ,

Jedynę stery jakie łyka to

adaptec esxi drivers

Przy innych wywala mi błędy, zresztą te są stosunkowo nowe z 12 grudnia.

Próbowałem nawet zainstalować wcześniejsze wersje Esxi i ciągle mam błąd
Unable to load module /usr/lib/vmware/vmkmod/vmfs3
co chyba powiązane jest z niekompatybilnością sprzętu. pozbyłem się praktycznie wszystkiego niepotrzebnego z kompa ( raid, ssd,lan) i błąd nie znikł .

zapomniałem wspomnieć wcześnie że zintegrowany lan był niekompatybilny i dołożyłem sieciówkę Microneta (wykrywa poprawnie).

//edit

4.1 , 4.1u2 już poprawnie jej nie wykrywa ;/Zdybał Konrad edytował(a) ten post dnia 17.01.12 o godzinie 21:15

konto usunięte

Temat: ESXI 5 SCSILinuxAbortCommnads

Tak to juz jest jak sie chce wirtualizowac "kawalek produkcji" na komputerze domowym.
Bledami to jeszcze posypie w przyszlosci :)Rafal S. edytował(a) ten post dnia 17.01.12 o godzinie 14:28
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Jakbyś chwile spędził na zapoznanie się z problemem na pewno znalazł byś informacje, że na firmowych serwerach problem też występuje. I tak dzięki za dobre chęci.

konto usunięte

Temat: ESXI 5 SCSILinuxAbortCommnads

Ja bym tutaj nie porownywal problemow HBA, czy driverow kontrolera RAID w serwerach (ktore notabene maja support) do twojego desktopoweg problemu. Inna liga!

A z problemem i owszem zapoznalem sie dosc dokladnie.
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Michał Ł.:
To co napisał Rafał + firmware kontrolera - jeżeli aktualny zrób nadpisanie jeżeli nie to upgrade.

Michał

zrobiony,

Na stronie producenta dostępne są sterowniki do raida pod tym linkiem ,:

http://www.adaptec.com/en-us/speed/raid/aac/linux/aacr...

natomiast Vmware posiada inne drivery do tego modelu

http://downloads.vmware.com/d/info/datacenter_cloud_in...

Zakładka drivers & tools pod nazwa zawierającą PMC Sierra jednakże te nie chcą się zainstalować...Zdybał Konrad edytował(a) ten post dnia 18.01.12 o godzinie 08:25
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Rafal S.:
Ten Adaptec moze i jest kompatybilny, ale wymaga innego zestawu driverow, niz te z ISO.
Probowales je?


bez dodatkowych driverów z strony producenta w ogóle nie wykrywa kontrolera.

/edit

błąd jest identyczny jak opisany tutaj jednak "mój" nie zasługuje na status "This message can be safely ignored."

/edit

tu log kernela
http://wklej.to/gyr0k
Może to w pomoże. Zdybał Konrad edytował(a) ten post dnia 19.01.12 o godzinie 12:40
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

crash wywołuje error


Obrazek


esxcli storage core path list


usb.vmhba32-usb.0:0-mpx.vmhba32:C0:T0:L0
UID: usb.vmhba32-usb.0:0-mpx.vmhba32:C0:T0:L0
Runtime Name: vmhba32:C0:T0:L0
Device: mpx.vmhba32:C0:T0:L0
Device Display Name: Local USB Direct-Access (mpx.vmhba32:C0:T0:L0)
Adapter: vmhba32
Channel: 0
Target: 0
LUN: 0
Plugin: NMP
State: active
Transport: usb
Adapter Identifier: usb.vmhba32
Target Identifier: usb.0:0
Adapter Transport Details: Unavailable or path is unclaimed
Target Transport Details: Unavailable or path is unclaimed

pscsi.vmhba1-pscsi.0:0-mpx.vmhba1:C0:T0:L0
UID: pscsi.vmhba1-pscsi.0:0-mpx.vmhba1:C0:T0:L0
Runtime Name: vmhba1:C0:T0:L0
Device: mpx.vmhba1:C0:T0:L0
Device Display Name: Local Adaptec Disk (mpx.vmhba1:C0:T0:L0)
Adapter: vmhba1
Channel: 0
Target: 0
LUN: 0
Plugin: NMP
State: active
Transport: parallel
Adapter Identifier: pscsi.vmhba1
Target Identifier: pscsi.0:0
Adapter Transport Details: Unavailable or path is unclaimed
Target Transport Details: Unavailable or path is unclaimed


esxcli storage core path list -d mpx.vmhba1:C0:T0:L0


pscsi.vmhba1-pscsi.0:0-mpx.vmhba1:C0:T0:L0
UID: pscsi.vmhba1-pscsi.0:0-mpx.vmhba1:C0:T0:L0
Runtime Name: vmhba1:C0:T0:L0
Device: mpx.vmhba1:C0:T0:L0
Device Display Name: Local Adaptec Disk (mpx.vmhba1:C0:T0:L0)
Adapter: vmhba1
Channel: 0
Target: 0
LUN: 0
Plugin: NMP
State: active
Transport: parallel
Adapter Identifier: pscsi.vmhba1
Target Identifier: pscsi.0:0
Adapter Transport Details: Unavailable or path is unclaimed
Target Transport Details: Unavailable or path is unclaimed


//edit
udało mi się zainstalować sterowniki ze strony producenta ale poprawy nie ma.

// czy wybór na tym poziomie może mieć jakiś wpływ na błąd ?


Obrazek
Zdybał Konrad edytował(a) ten post dnia 19.01.12 o godzinie 14:26
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Jestem coraz bliżej rozwiązania problemu, podejrzewam iż jeden z dysków sypie błędami. Problem w tym, że nie wiem który. W jakiś sposób i jakim softem można przetestować poprawność danych w ramach Raid 5 ? Włącznie z testem zapisu, bo przy tym zawsze się wysypuje system.

Temat: ESXI 5 SCSILinuxAbortCommnads

Zazwyczaj kontrolery mają programy do zarządzania i trzeba włączyć opcję weryfikację RAID. Z drugiej strony raid5 jest odporny (a przynajmniej powinien być) na uszkodzenie jednego dysku.
Zdybał Konrad

Zdybał Konrad Student,
Politechnika
Krakowska im.
Tadeusza Kościuszki

Temat: ESXI 5 SCSILinuxAbortCommnads

Problem po długich testach wydaje się być wyjaśniony. Przyczyną awaii są dyski. Nie przyszło mi do głowy iż może zajść niekompatybilność między kontrolerem raid a dyskiem twardym.
Adaptec 6405 nie wspiera dysków ST2000DL003, ma to związek z czasami dostępu. Kontroler po pewnym czasie oczekiwania na rozkaz odczytu generuje błąd niedostępności urządzenia.

Zmieniłem czasy timeout dla maszyn wirtualnych( nie wiem czy ma to jakiekolwiek znaczenie dla hosta). Czy można coś jeszcze zrobić, aby poprawić stabilność ? Czy rezygnacja z raid 5 na rzecz raid 1 może rozwiązać problem ?
Z czasem dyski zostaną wymienione ale nie mogę sobie na to pozwolić na ten moment.

Następna dyskusja:

esxi i kontroler pci radi 0...




Wyślij zaproszenie do