ссылки по теме:
http://3nity.ru/viewtopic.php?f=24&t=12433
Ситуация
Стоит RAID10+, Утилита SAM, Почтовый сервер.
Пришло письма от утилиты SAM деградация рейда в 22 часа, диск не отвечает на запросы, начало перестройки, затем приходит в 0 часов два письма: рэйд перестроен и рэйд нормально функционирует.
утром утилита показывает картинку:
Это значит 1 диск перестал работать, и программа показала Failed диск, это задействовало процесс деградации массива в более низкий уровень 10, теперь массив работает только на 4х дисках.
Возможные причины возникновения:
в 21 час была нагрузка на диски при записи бэкапа на рэйд с внешнего системного диска SATA, бэкап получился размером в 1 Гб. Тот самый диск на котором было замечено торможение системы при копировании с диска на массив.
Возможно и сбоил сам контроллер, включенный WriteBack кэш на рэйде способствует сбоям контроллера.
Люди с опытом пишут:
Я как и вы задался вопросом сохранности данных на домашнем NAS. Изначально был выбран Intel Matrix RAID-5, однако напрягали иногда случающиеся ребилды. Кроме того я узнал, что у RAID-5 есть изъян - т.н. "write hole". Если внезапно пропадет питание или система повиснет, и при этом что-то записывалось на массив, может произойти частичная потеря этих данных. В "умных" контроллерах это решается бэкап батареей.
После этого я пришел к решению, на котором NAS работает уже полтора года - RAID-Z на ZFS. Работает либо в родной Solaris либо на FreeBSD, у меня как раз последняя. Если встречает ошибки чтения/записи, сразу сыпет варнинги на консоль. Нет привязки в конкретным портам контроллера, массив легко портируется на другую ОС с поддержкой ZFS. Постоянно идет проверка чётности, даже если винт делает ремап, не теряется ни байта данных. Только ставьте 64-битную ОС (ей не нужен тюнинг для работы с ZFS) и побольше памяти, ZFS её очень кушает
продолжение следует…
Комментарии
Отправить комментарий