Soluţie NAS pentru acasă

E mai ieftin cu offline backups pentru ce e foarte important și valoros.

Tocmai am verificat direct pe site la Seagate dacă seria discului mai e în garanție, și zice că nu e. Va fi interesant; la vânzare apărea 36 luni garanție din momentul vânzării. Poate că vânzătorul trebuia să înregistreze la Seagate și momentul vânzării? Nu știu. Cert e că miahi are dreptate cu înlocuirea cu produse refurbished:

Replacement Product Notice

- Your original product will NOT be returned to you.
- Replacement products are factory-repaired products.
- Replacement products carry the greater of: original warranty balance or 90 days.
- Delivery is during normal business hours to the address you provide.
- All data and software on your returned product(s) will be lost.
- Replacement products arrive low-level formatted.
- Any required data recovery service must be completed BEFORE requesting an RMA from Seagate.

Între timp aș putea să refac matricea folosind un alt disc de 2TB demontat din DVR.
 
Cred că Neo zicea de refurbished la Seagate, eu am avut noroc de un singur Seagate cu bad sectors într-un sistem de la ai mei, un 7200.7 de vreo 10 ani (ultimul HDD IDE pe care-l mai aveam în grijă). Am recuperat datele de pe el prin CrashPlan gratis (desktop-ul lor e backed up la mine pe NAS).

Și la WD la RMA am primit refurbished + etichete mai ciudate (pe unul scria factory refurbished, pe altul nu scria, dar nici nu semăna cu eticheta originală, o fi fost OEM la origini), se pare că se practică.

Offline backups sunt mai ieftine, dar trebuie să le și faci. Adică să conectezi discul, pornești whatever backup software, aștepți să termine, deconectezi. Eu am și un astfel de disc, dar uit să fac backup-urile cu lunile.
 
Eu am schimbat de doua ori la Seagate. Odata un HDD (care deja era) Seagate repaired drive. Si am primit alt repaired drive, aceeasi capacitate.
Alta data am trimis unul de 1.5TB si am primit un 2TB nou nout.
In viata e bine sa incerci :biggrin:

Iar legat de back-up offline.. mi-a venit o idee, de pe vremea cand faceam backup la Nokia: sa pun reminder la 4 saptamani sa fac treaba asta.
Joi la 22:30, de exemplu :smile:
 
Am in service un Seagate 320 GB refurbished de cand capacitatea asta era mainstream si merge perfect in continuare; asta in conditiile in care a mers probabil 200 de zile din 365 si a fost pornit-oprit de cel putin 6-8 ori pe zi, in fiecare zi lucratoare. Deja sunt convins ca nu o sa moara niciodata. :smile:

Asta nu inseamna ca toate refurbishatele sunt usa de biserica. Din statisticile la care am eu acces se pare ca au rata de RMA putin mai mare ca HDD-urile noi.
 
Eu n-as mai cumpara Seagate avand in vedere rata lor de failure, si uitandu-ma si la politica aia de garantie....pas.

Le-au stricat de cand au cumparat Maxtor si alte astfel de firme slabe, alea vechi rezista, astea noi probabil nu tin mai mult de 5 ani.
 
Pe la sfârșitul lui septembrie, a-nceput și serverul meu să-mi trimită mailuri amenințătoare:
Code:
The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 8 Currently unreadable (pending) sectors
După două săptămâni, n-a mai trimis. Fără să-i fac nimic. Discul e tot un Seagate:
Code:
=== START OF INFORMATION SECTION ===
Model Family:  Seagate Barracuda Green (Adv. Format)
Device Model:  ST2000DL003-9VT166
Firmware Version: CC32
User Capacity:  2,000,398,934,016 bytes [2.00 TB]
Sector Size:  512 bytes logical/physical
Acum arată așa:
Code:
ID# ATTRIBUTE_NAME  FLAG  VALUE WORST THRESH TYPE  UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate  0x000f  116  099  006  Pre-fail  Always  -  104717376
  3 Spin_Up_Time  0x0003  092  092  000  Pre-fail  Always  -  0
  4 Start_Stop_Count  0x0032  100  100  020  Old_age  Always  -  62
  5 Reallocated_Sector_Ct  0x0033  100  100  036  Pre-fail  Always  -  0
  7 Seek_Error_Rate  0x000f  076  061  030  Pre-fail  Always  -  49290533
  9 Power_On_Hours  0x0032  071  071  000  Old_age  Always  -  25753
 10 Spin_Retry_Count  0x0013  100  100  097  Pre-fail  Always  -  0
 12 Power_Cycle_Count  0x0032  100  100  020  Old_age  Always  -  62
183 Runtime_Bad_Block  0x0032  100  100  000  Old_age  Always  -  0
184 End-to-End_Error  0x0032  100  100  099  Old_age  Always  -  0
187 Reported_Uncorrect  0x0032  094  094  000  Old_age  Always  -  6
188 Command_Timeout  0x0032  100  097  000  Old_age  Always  -  5
189 High_Fly_Writes  0x003a  099  099  000  Old_age  Always  -  1
190 Airflow_Temperature_Cel 0x0022  058  044  045  Old_age  Always  In_the_past 42 (0 50 50 37)
191 G-Sense_Error_Rate  0x0032  100  100  000  Old_age  Always  -  0
192 Power-Off_Retract_Count 0x0032  100  100  000  Old_age  Always  -  27
193 Load_Cycle_Count  0x0032  100  100  000  Old_age  Always  -  63
194 Temperature_Celsius  0x0022  042  056  000  Old_age  Always  -  42 (0 21 0 0)
195 Hardware_ECC_Recovered  0x001a  020  004  000  Old_age  Always  -  104717376
197 Current_Pending_Sector  0x0012  100  100  000  Old_age  Always  -  0
198 Offline_Uncorrectable  0x0010  100  100  000  Old_age  Offline  -  0
199 UDMA_CRC_Error_Count  0x003e  200  200  000  Old_age  Always  -  0
240 Head_Flying_Hours  0x0000  100  253  000  Old_age  Offline  -  104140072051869
241 Total_LBAs_Written  0x0000  100  253  000  Old_age  Offline  -  245112402
242 Total_LBAs_Read  0x0000  100  253  000  Old_age  Offline  -  580335449
197 și 198 aveau valoarea 8, acum sunt 0. Mă pregăteam și eu să iau un Toshiba de 2TB, dar mai stau.

Dacă e cineva curios de erori:
Code:
ATA Error Count: 6 (device log contains only the most recent five errors)
  CR = Command Register [HEX]
  FR = Features Register [HEX]
  SC = Sector Count Register [HEX]
  SN = Sector Number Register [HEX]
  CL = Cylinder Low Register [HEX]
  CH = Cylinder High Register [HEX]
  DH = Device/Head Register [HEX]
  DC = Device Command Register [HEX]
  ER = Error register [HEX]
  ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 6 occurred at disk power-on lifetime: 25507 hours (1062 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC  Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00  15d+23:26:38.421  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00  15d+23:26:38.420  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00  15d+23:26:38.420  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00  15d+23:26:38.420  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00  15d+23:26:38.419  READ NATIVE MAX ADDRESS EXT

Error 5 occurred at disk power-on lifetime: 25507 hours (1062 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC  Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00  15d+23:26:35.017  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00  15d+23:26:35.016  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00  15d+23:26:35.016  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00  15d+23:26:35.016  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00  15d+23:26:35.015  READ NATIVE MAX ADDRESS EXT

Error 4 occurred at disk power-on lifetime: 25507 hours (1062 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC  Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00  15d+23:26:31.683  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00  15d+23:26:31.683  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00  15d+23:26:31.682  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00  15d+23:26:31.682  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00  15d+23:26:31.682  READ NATIVE MAX ADDRESS EXT

Error 3 occurred at disk power-on lifetime: 25507 hours (1062 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC  Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00  15d+23:26:28.340  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00  15d+23:26:28.339  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00  15d+23:26:28.339  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00  15d+23:26:28.339  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00  15d+23:26:28.338  READ NATIVE MAX ADDRESS EXT

Error 2 occurred at disk power-on lifetime: 25507 hours (1062 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC  Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00  15d+23:26:24.946  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00  15d+23:26:24.945  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00  15d+23:26:24.945  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00  15d+23:26:24.945  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00  15d+23:26:24.945  READ NATIVE MAX ADDRESS EXT
Și logul cu ultimele teste:
Code:
Num  Test_Description  Status  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline  Completed without error  00%  25747  -
# 2  Short offline  Completed without error  00%  25723  -
# 3  Short offline  Completed without error  00%  25699  -
# 4  Short offline  Completed without error  00%  25675  -
# 5  Extended offline  Completed without error  00%  25657  -
# 6  Short offline  Completed without error  00%  25627  -
# 7  Short offline  Completed without error  00%  25603  -
# 8  Short offline  Completed without error  00%  25579  -
# 9  Short offline  Completed without error  00%  25555  -
#10  Short offline  Completed without error  00%  25531  -
#11  Short offline  Completed without error  00%  25508  -
#12  Extended offline  Completed: read failure  90%  25486  2667054120
#13  Short offline  Completed without error  00%  25459  -
#14  Short offline  Completed without error  00%  25435  -
#15  Short offline  Completed without error  00%  25411  -
#16  Short offline  Completed without error  00%  25387  -
#17  Short offline  Completed without error  00%  25363  -
#18  Short offline  Completed without error  00%  25339  -
#19  Extended offline  Completed: read failure  90%  25318  2667054120
#20  Short offline  Completed without error  00%  25291  -
#21  Short offline  Completed without error  00%  25267  -
2 of 2 failed self-tests are outdated by newer successful extended offline self-test # 5
 
Discul defect s-a dus în service. Între timp am exorcizat un disc Seagate (masochist, știu :biggrin:) Green din DVR, că oricum toate filmările timp de 10 luni de zile abia ajunseseră la 200 GB și l-am băgat în NAS după ce am făcut o curățenie temeinică de praf. Cu interfața web-based n-am făcut nimic. Matricea era offline și nu voia să pornească; după o serie de comenzi am reușit să o pornesc în mod degraded. Cu asta a apărut și în interfața web, de unde i-am putut da Recover și să aleg noul hot spare conectat. Acum își face recovery cu vreo 60 MB/s, e la 3,6% și estimează că mai are încă vreo 445 minute. Procesorul, un Athlon X2 low power, stă încărcat peste 70%.
 
N-ai înțeles. Nu contează când se produc, ci faptul că, pe durata operațiunii de recovery, Pământul îmi ține umbră la orice fel de furtună solară. Ce se întâmplă dup-aia, nu ar trebui să fie atât de sensibil ca la riscul de corupere în timpul sincronizării. De altfel, a terminat puțin înainte de ora 8.
 
N-arată rău, dar tocmai ce colegii mei de la infrastructură înlocuiesc niște baterii vechi de 4 ani pe SAN-urile HP ale unui client; simptom: pierderi de date random (și nu la oprirea curentului, ci pur și simplu pierderi de date). Iar o baterie nouă costă cât controller-ul tău, n-am idee dacă există 3rd party, fiind ceva destul de specializat.
 
Cand un NAS e pe UPS nu sunt prea mare fan al controllerelor cu baterie, e singura chestie care se poate duce naibii in timp si mai costa si o gramada. Daca e un server la birou expresia folosita e "this is the cost of running the business", dar acasa e doar un cost, fara business. Asa ca acum o luna am schimbat iarasi (a n-a oara) bateriile dintr-un APC vechi de 15 ani.
 
Bateria la HP Smart Array P410 nu e doar pentru riscul de a pierde date când se ia curentul. Fără memorie suplimentară și baterie, controllerul funcționează doar cu RAID 0, 1 și 1+0, și memoria o accesează pe 40 biți. Cu baterie pot folosi RAID 5 și 5+0, cu baterie și memorie suplimentară pot avea și o creștere de performanță (memoria lucrează pe 72 biți) și o serie de operațiuni suplimentare cu matrici fără downtime, iar dacă iau și Smart Array Advanced Pack License obțin și RAID 6 și 6+0 și încă un set avansat de funcții.

Deocamdată discurile au costat de câteva ori mai mult decât controllerul ăsta. Dacă vreau să fie eficient financiar atunci rămân la RAID 5 ceea ce impune baterie ca să se activeze funcția, iar dacă vreau să și obțin ceva performanță atunci pun și memoria suplimentară. Nu are sens să optez pentru Flash backup (FBBC) în loc de memorie RAM mai multă, oricum ar trebui să miște simțitor mai bine decât un RAID software.
 
La un controller SAS cu 8 porturi 6Gbps nu mi-as face deloc probleme de performanta cu 3-4 discuri SATA. Memoria in plus vine doar cu baterie pentru ca riscurile cresc serios, 512 MB inseamna 2-5 secunde de scriere, caz in care cei 256 MB originali fara baterie ar fi tot prea mult in caz de probleme.

Dar faptul ca modurile RAID se activeaza doar cumparand RAM si baterie pentru $$$ e porcaria care nu imi place, iar faptul ca FreeNAS merge mai bine cu RAID software ma face sa prefer un controller SAS LSI fara RAID si sensibil mai ieftin. Dar sunt offtopic si visez :smile:
 
A venit hard discul defect de la garanție sub forma unui brand new replacement. Sweet :smile:

A venit și controllerul RAID hardware; e mult mai mic decât mă așteptam! Păcat că n-am nici timp să mă joc cu el, nici cabluri SFF-8087->SATA. Bateria e fabricată în iunie 2013.
 
  • Like
Reactions: Neo
Back
Top