Leszek Jędrzejewski

Leszek Jędrzejewski specjalista d/s
technicznych

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Witam!
Szukam rozwiązania problemu błędów 24 oraz 83/84 podczas procedury backup. Błąd 24 pojawia się sporadycznie tylko dla niektórych zadań (kilka na ok. 2000 dziennie) wyłącznie dla zadań z serwerów MS Windows. W zasadzie wytłumaczenie błędu w systemie nie pasuje do mojej sytuacji lub nie przynosi efektu. Próbowałem zmienić ustawienia kart sieciowych jak w opisie: https://www-secure.symantec.com/connect/blogs/socket-wr... ale bez rezultatu.

Poważniejszym problemem jest dla mnie błąd 84 skojarzony czasem z błędem 83. Błąd 84 to błąd zapisu na media pojawiający się u mnie po północy w oknie backupu dziennego trwającego od w godzinach 0-6. To samo zadanie wywołane ręcznie wykonuje się prawidłowo. Przypuszczam, że ma to związek z kolejką zadań jaka rośnie tuż po północy i/lub z funkcjonalnością PureDisk (garbage collection?). Problem powstał ok. 10 dni temu po omyłkowym zamknięciu aplikacji netbackup - prawdopodobnie w czasie trwania aktywnych zadań. Jeśli ktoś ma podobne doświadczenia lub sugestie poprawy stanu to chętnie wymienie uwagi.
Leszek.


Załączam systemową wiadomość na temat błędu 84:

2011-03-28 01:43:56 - requesting resource Dedup001
2011-03-28 01:43:56 - requesting resource llimbackup001.NBU_CLIENT.MAXJOBS.MLIMDB006
2011-03-28 01:43:56 - requesting resource llimbackup001.NBU_POLICY.MAXJOBS.db_MSSQL_Logs
2011-03-28 01:43:56 - granted resource llimbackup001.NBU_CLIENT.MAXJOBS.MLIMDB006
2011-03-28 01:43:56 - granted resource llimbackup001.NBU_POLICY.MAXJOBS.db_MSSQL_Logs
2011-03-28 01:43:56 - granted resource MediaID=@aaaab;DiskVolume=PureDiskVolume;DiskPool=backup001;Path=PureDiskVolume;StorageServer=llimbackup001;MediaServer=llimbackup001
2011-03-28 01:43:56 - granted resource Dedup001
2011-03-28 01:43:56 - estimated 0 Kbytes needed
2011-03-28 01:43:57 - started process bpbrm (19589)
2011-03-28 01:43:58 - connecting
2011-03-28 01:44:07 - connected; connect time: 00:00:09
2011-03-28 01:44:17 - Critical bptm(pid=19650) image open failed: error 2060012: call should be repeated
2011-03-28 01:44:18 - end writing
media write error(84)
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Jaki to NB, Puredisk i jaka konfiguracja ?

tutaj jest opis dla takiego samego bledu ale trzeba by zweryfikowac pozostale logi:
http://www.symantec.com/business/support/index?page=co...
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

A tak z ciekawosci jeszcze zapytam .. Jaki poziom deduplikacji udalo sie osiagnac na PD ?

konto usunięte

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Leszek,
Ja też miałem ten sam problem.
Moim zdaniem masz rację z garbage collection.
Ze tego co zaobserwowałem błędy zbiegają się z zadaniami maintenance PD.
Ja podzieliłem zadania backupu pomiędzy Deduplication Poolami. Rozłożyłem zadania pomiędzy Media serwerami. I tak sporadycznie błędy występują.
W tym dokummencie masz wyjaśniowe przyczynę występowania błędów:
Symantec Tech Note 338123

Widziałem sporo założonych Case-ów w Symantecu na ten temat. I wielu wypadkach nie były jeszcze rozwiązane.

Pzdr.
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

a moze przestawic garbage collection na jakas godzine kiedy nie leca backupy ?
Leszek Jędrzejewski

Leszek Jędrzejewski specjalista d/s
technicznych

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Witam i dziękuję za pomoc. Podane linki są mi znane bo walczyłem z problemem od ponad tygodnia. Jak pisałem, sprawa zaczęła się kiedy wskutek nieznanego mi błędu w oprogramowaniu lub zarządzaniu (mój błąd podczas wznowienia kilku niewykonanych zadań?) system wygenerował ok. 20000 zadań backupu w ciągu kilku minut i trzeba było zrestartować serwer (proces) ntbackup aby odzyskać władzę nad konsolą. Od tamtej pory pojawiły się błędy 83 i 84. Mniej więcej tydzień temu serwer (fizyczny) z oprogramowaniem ntbackup był restartowany. Przez ten tydzień miałem mniejszą (kilkanaście) lub większą (kilkadziesiąt) ilość błędów 83/84 każdego dnia rano. Błędy pojawiały się zwykle pomiędzy północą a drugą w nocy oraz sporadycznie ok. 12 godzin później, w ciągu dnia aż do dziś, kiedy to nie pojawił się żaden nowy błąd a stare wygasają i mam obecnie w statystyce tylko 2 błędy z wczoraj. Przypuszczam, że ma to związek z operacjami na PD: codziennego sprawdzania transakcji (chyba dwukrotnie na dobę) oraz orphaned garbage collection (raz w tygodniu) opisanymi w:
http://www.symantec.com/business/support/index?page=co...
Sprawa jest dość niejednoznaczna bo błędy dotyczyły tylko backupów baz danych a i to różnych serwerów w różnych dniach. Zgłosiłem kilka dni temu case do Symantec-a i na razie czekam jeszcze na reakcję :-( Na forum Symantec-a dostałem dość ogólne wskazówki.
Niestety, nie mam dostępu do konfiguracji puredisc-a, nie mam nawet cli, tylko podstawowe polecenia klasy crcontrol i dsstat. Nie wiem zatem jak mógłbym przestawić parametry PD. Mam nadzieję, że poprawa jest trwała co się pewnie okaże jutro rano ;-).
A jeśli chodzi o poziom deduplikacji to średnia długookresowa wynosi ok. 21% a w porywach dziennych do 40%.
L.J.

konto usunięte

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Marek Kędzierski:
a moze przestawic garbage collection na jakas godzine kiedy nie leca backupy ?

Niestety:
Because maintenance processing does not block any other deduplication process, rescheduling should not be necessary. Users cannot change the maintenance process schedules. However, if you must reschedule these processes, contact your Symantec support representative.
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Wlasnie konfiguruje srodowisko PD (6.6.1.2) i jest tu opcja zmiany schedule'a dla garbage collection.

konto usunięte

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Przypuszczam że kolega korzysta z PD zaimplementowanego w NB.
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

mam mieszane odczucia jesli chodzi o taka konfiguracje ;)
Leszek Jędrzejewski

Leszek Jędrzejewski specjalista d/s
technicznych

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Po ok. 2 tygodniach od pojawienia się błędów 83/84, błędy te ustały całkowicie i wydaje mi się, że nastąpiło to samoistnie :-). Po prostu z dnia na dzień było ich coraz mniej i od kilku dni nie ma ich wcale. Z jednej strony to dobrze a z drugiej strony wolałbym wiedzieć co się dzieje w systemie bo drobne zmiany jakie wprowadziłem do konfiguracji nie wydają się mieć istotnego związku ze sprawą :-(
L.J.
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

jesli chodzi o wykonywanie backupow i czyszczenie bazy jednoczesnie to jest to dopiero mozliwe od purediska 6.6.1.2.
mozna by tez kontrolnie dla testu puscic sobie weryfikacje image'y w catalogu nb, tak zeby sprawdzic czy na pewno to co tam lecialo w czasie bledow 84 na pewno da sie odtworzyc ;)Marek Kędzierski edytował(a) ten post dnia 06.04.11 o godzinie 20:34
Leszek Jędrzejewski

Leszek Jędrzejewski specjalista d/s
technicznych

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

Ostatecznie wszystkie błędy w systemie ustąpiły. Wydaje się, że nastąpiło to z dwóch powodów. Pierwszy to czas jaki upłynął od momentu lawinowego uruchomienia zadań backup-u połączony z fizycznym restartem serwera. Druga przyczyna tkwi chyba w systemie ntbackup ale ma dość subtelny charakter. Wyjaśnienie wymaga pewnego wprowadzenia. Błędy 83/84 dotyczyły backupów z systemu WS Windows a dokładniej backupów baz MSSQL uruchamianych na tych serwerach. Dla porządku przypomnę, że w procesie backup-u bazy danych serwer backup jest inicjatorem uruchomienia skryptu na backup-owanym hoście i to skrypt przejmuje inicjatywę odpowiedniej obsługi bazy i wysłania danych na serwer. Polityka backupu przewidywała dla niego okno 00:00-06:00. Podczas analizy logów okazało się jednak, że system rusza z backup-em o 23:59:59 a więc sekundę przed oficjalnym rozpoczęciem backup-u. Nie śledziłem, skąd pochodzi rozbieżność jedno sekundowa w każdym razie backup, który miał się rozpocząć o godzinie 00:00 w dniu x startował w ostatniej sekundzie dnia x-1. Nie było tego problemu jeśli backup działał w ciągu dnia!. Po zmianie okna z 00:00-06:00 na 01:00-07:00 wszystko ustąpiło :-). Reasumując, prawdopodobnie jest błąd w oprogramowaniu działającym dla backup-ów MSSQL na granicy zmiany daty lub w systemie mamy zbyt dużą różnicę czasu (aż 1 sek!) pomiędzy serwerami MSSQL a serwerem backup-u.
Przy okazji koryguję podane wcześniej dane dotyczące deduplikacji. Wynosi ona oczywiście nie 20 lub 40% ale 20 lub 40 razy (średnia z ostatnich dni to ok. 35 razy).
Przy okazji ustąpienia błędów 83/84 zaniknęły również błędy 24. Nie widzę bezpośredniego związku ale koincydencja w czasie jest symptomatyczna.
Marek Kędzierski

Marek Kędzierski Technical Account
Manager, Technology
Space S.A.

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

A to jest PureDisk oddzielnie czy Media Server Deduplication Pool ?
Leszek Jędrzejewski

Leszek Jędrzejewski specjalista d/s
technicznych

Temat: NetBackup błedy 83, 84 oraz 24 podczas backup-u

PureDisk jest "wbudowany" w NetBackup więc to Media Server Deduplication Pool.
L.J.

Następna dyskusja:

Kontrakt - Backup Administr...




Wyślij zaproszenie do