Если заглянуть внутрь жесткого диска, можно увидеть немало интересного. Если же заглядывать туда регулярно в течение десяти лет и скрупулёзно записывать полезную информацию, в результате может получиться интересная статья. Илья Зайдель предлагает вашему вниманию ряд фактов о причинах выхода HDD из строя и способах поддерживать их в хорошей форме
В первых моих статьях мы весьма подробно рассмотрели твердотельные накопители — флешки, карты памяти и SSD. В массовый обиход этот тип накопителей вошел недавно, всего 5-6 лет назад, и многие пользователи еще, к счастью, не столкнувшиеся с их поломками, довольно смутно представляют себе слабые места и меры предосторожности. Это, кстати, показали и отклики на статьи.
Но наиболее распространенными, незаменимыми и заслуженными накопителями являются, конечно же, жесткие диски (они же HDD, они же винчестеры). Вот уже более двадцати лет — примерно с 1988 года, когда было развернуто массовое производство HDD, ни один ПК не обходится без этого компонента. Увы, самого ненадежного из всех. Хуже винчестера в этом плане разве что дискеты, но они, к счастью, практически вышли из употребления. Вряд ли найдется сколько-нибудь опытный пользователь, не пострадавший от сбоев или отказов HDD. Поэтому ремонт и восстановление данных с этого типа носителей — устоявшееся и уважаемое занятие.
Я начал заниматься жесткими дисками в далеком уже 2002 году. Тогда массово «летели» диски Fujitsu пресловутой MPG-серии: из-за неудачного, излишне активного флюса, разъедающего процессор на плате, они отказывали почти поголовно. Коллапс наступал через 6-9 месяцев работы. Ремонтники, первыми освоившие технологию «прожарки» плат и правки модулей служебной зоны (типовые расценки $15-25 за диск), были тогда на коне. Пациентов им несли пачками, и за лето можно было заработать на машину, а за год — на квартиру (это не байки, знаю таких людей лично).
Я пошел по их стопам: освоил ремонтную технологию, купил комплекс PC-3000, работающий еще на шине ISA и под DOS, дал несколько объявлений в печати и по Сети, оповестил знакомых — и дело пошло. «Фуджики» оказались неплохой учебной базой, да еще и доход давали. Основной контингент — студенты, научные работники, медики, музыканты и журналисты.
Регулярно, раз в 2-3 недели, звонили озабоченные мужчины с одним и тем же вопросом: «Литые диски чините?» Я отвечал: «Чиню, но только размером до 5 дюймов». Все HDD имеют корпус — «банку» алюминиевого литья, и в то время еще встречались накопители Quantum BigFoot пятидюймового форм-фактора. Недоумение собеседника (что это за диски, для игрушечных машинок, что ли?) быстро рассеивалось…
Диски того поколения давно уже сошли со сцены. Новые времена — новые песни. Выросшая в сотню раз емкость (с 10-20 Гбайт до 2-3 Тбайт), новые конструктивные решения, интерфейсы и области применения HDD дали ремонтникам большой опыт и, как водится, поставили немало проблем. Приведу свои заметки о некоторых из них.
Слева направо: диски 1993, 2002, 2007 и 2010 г.в. Электронная плата постоянно сокращалась в размерах, а число деталей на ней уменьшалось. Все это — во имя экономии: при жестокой конкуренции по-другому не выжить. Увы, но к концу 2011 года число производителей HDD, похоже, сократится до минимума
Ремонтник и шлейфы SATA
Начнем не с самих дисков, а с того, что к ним подключается. Регулярно, примерно раз в месяц натыкаюсь на бракованные шлейфы у дисков с интерфейсом Serial ATA. Это приводит к ошибкам передачи данных, зависаниям компьютера и невозможности загрузиться. После замены шлейфов на новые фирменные все пропадает. Несколько лет назад, когда собирал материал по обращению с винчестерами, такого не наблюдалось, и я отметил надежность шлейфа SATA, противопоставив его параллельной «гребенке».
Увы, с тех пор качество шлейфов, которые вкладываются в коробки с материнскими платами (ими сборщики ПК обычно и пользуются), заметно упало: кто-то в очередной раз решил сэкономить. Китайцев рисом не корми — дай где-нибудь упростить технологию и снизить на полушку себестоимость изделий. Норовят удешевлять те компоненты, которые сразу не проверишь, — состав припоя или флюса, сечение проводов, покрытие контактов. Вот в последнем, видно и накосячили: в шлейфе контакты заглублены и практически не видны, ничего не стоит поставить латунные ламельки, избежав положенного по стандарту золочения. Через полгода латунь, понятное дело, окисляется (соединение не газоплотное) и контакт нарушается. Данные при передаче портятся со всеми вытекающими последствиями.
На самом диске сэкономить сложнее: контактная гребенка там на виду и все компьютерщики знают, как выглядит золоченый контакт (ровный, чуть матовый блеск). Да и контроль на заводах серьезный. Вот и навалились на шлейфы, благо на их «брендовость» мало кто обращает внимание. Внешне все шлейфы трудноразличимы, аксессуар массовый и копеечный, мысль о браке в голову не приходит.
Теперь об этом придется помнить: электроника — наука о контактах. Грамотный компьютерщик всегда должен иметь новый фирменный шлейф (а лучше несколько, разной длины) в запасе. При непонятных «глюках» накопителя, возникающих на пустом месте, первым делом надо поменять шлейф.
«Косяки» возможны не только с контактами, но и с проводами. Коллеги поделились наблюдением: сняв изоляцию у неработающего шлейфа SATA, они обнаружили, что заземляющий проводник окислился и отошел от экрана витой пары (их в кабеле две, каждая со своим экраном). Это резко снижало помехозащищенность и приводило к ошибкам передачи. После очистки и перепайки все исправилось. Хотя, конечно, если есть возможность, кабель лучше просто заменить.
Есть и другая проблема — уже не «китайская», а связанная со сменой стандартов. Шлейфы SATA ранних выпусков (2003-2006 годы) держались на контактных вилках одним трением. Разработчики посчитали, что это недостаточно надежно (сохранялась угроза случайных расстыковок), отчего вторая версия шлейфов (начиная с 2007 года) получила на обоих концах пружинные защелки. Казалось бы, прекрасно — еще одна причина отказов устранена. Но не все так просто.На многих дисках предыдущего поколения, в том числе и активно используемых (2008 г.в.), разъем SATA не имеет выступа под защелку, отчего шлейфы новой версии садятся на него слабо и не фиксируются — защелка не срабатывает. Сползти наконечник может от чего угодно — хоть от вибрации дисковой корзины, хоть от упругости свернутого в спираль шлейфа. Понятно, что это резко снижает надежность подключения и потому недопустимо. Здесь подойдет только «старый» шлейф без защелок с его тугой посадкой (вариант фиксации соединения термоклеем — на жаргоне «соплями» — я не рассматриваю, хотя у сборщиков он довольно популярен). Кстати, ремонтники в своих стендах используют шлейфы именно первой версии, как наиболее универсальные (да и возиться с защелками порой времени нет).
Припоминается случай, когда от подобных проблем «полетел» клиентский компьютер. Комплектный желтый шлейф от материнской платы (естественно, с защелками) слабо прижимался к ответной планке диска, отчего на нем стали расти софт-бэды (сектор записывается с неверной контрольной суммой и при чтении дает ошибку UNC, хотя сами данные правильные). Дефекты, как назло, пришлись на реестр, и Windows перестала загружаться с выдачей BSOD — синего «экрана смерти».
Я развернул «полевой госпиталь», вычитал все софт-бэды длинным чтением и записал обратно. Все заработало, диск как новый. Желтый шлейф, конечно, пришлось заменить другим — красным и без защелок. Винчестерам без плотного контакта в линиях интерфейса никуда. Электронщики называют такой контакт «сухим» и очень ценят: там нет переходных процессов и, следовательно, сигнал практически не деградирует.
Советую при сборке или ремонте компьютера проверять все шлейфы — они должны садиться на вилки разъемов достаточно туго, с заметным усилием. Я провожу стыковку 2-3 раза с каждого конца, чтобы стереть случайные загрязнения и оксидную пленку с ламелей (кто знает, золочение там, нитрид титана или вовсе голая латунь — китайцы такие шутки любят). Отсюда необходимость иметь в запасе надежные шлейфы разных версий и длин (20-30-50-80-100 см).
Наилучшим всегда будет шлейф минимальной длины. Недаром фирменные рабочие станции (HP, Dell) обычно собраны на заказных, очень коротких SATA-шлейфах, бывало, что и 15-сантиметровых. Кстати, по стандарту внутренний разъем SATA должен выдерживать всего 50 циклов стыковки-расстыковки, так что коммутационный ресурс у него сравнительно небольшой (внешний разъем eSATA — другое дело, его стойкость целых 10 тысяч циклов).
Кроме длины, плоские шлейфы SATA различаются еще и по толщине. Она колеблется от 5 до 10 мм, что связано с сечением токопроводящих жил (от 30AWG до 26AWG — маркировка калибра обычно присутствует на кабеле), а также с плотностью экранирующей оплетки (ее занижение — любимый трюк китайцев, экономящих медь всеми способами). Разумеется, стоит всегда использовать наиболее толстый кабель — это повышает уровень сигнала и снижает наводки от помех. На тонком длинном шлейфе иной диск может и не опознаться либо будет работать с перебоями — виной тому малая нагрузочная способность интерфейсных микросхем.
Шлейфы SATA, прилагаемые к материнским платам, нередко имеют угловой разъем на одном из концов. Подключённый к диску, он снижает вероятность случайной расстыковки, экономит место в системном блоке и облагораживает монтаж. Однако угловой разъем не любит кривых рук: если его случайно дернуть, можно сломать контактную планку на диске, а это — негарантийный случай и непростой ремонт.
Опознать некачественный шлейф можно по SMART. Ненадежный контакт порождает ошибки передачи, отчего растет атрибут #199 UltraDMA CRC Error Count. Также стоит обратить внимание на атрибуты #5, #197, #198 — их рост нередко свидетельствует о деградации самого диска (подробнее об атрибутах SMART см. ниже. — прим. редакции).
Ремонтник и шлейфы PATA
Область применения параллельного интерфейса постоянно сужается, но до отмирания ему еще далеко. Например, винчестеры PATA 2,5″ выпускаются до сих пор — ведь в старый ноутбук контроллер SATA не поставишь. Да и DVD-приводов PATA еще полно. Так что с 80-жильными шлейфами работать приходится нередко. Вот случай из недавней практики.
Позвонил постоянный клиент — не загружается система, пишет что-то про «invalid disk», срочно нужна помощь. По моей инвентарной базе, в этом компьютере стоит старенький диск PATA от Hitachi, серии DLAT. Они довольно просты и чинятся даже на выезде. Тем более, договор продлевать пора…
Приехал. Смотрю — диск в BIOS опознается, но с искажениями в названии модели. Естественно, и загрузка не идет. Это характерно для потери разряда в передаваемом по PATA слове. Виноват обычно поврежденный шлейф либо сломанный (погнутый, вдавленный) штырек в контактной гребенке на диске. Последнее случается при небрежной сборке, когда колодку вставляют в разъем с перекосом или вообще вверх ногами (нашим молодцам-сборщикам все нипочем — даже несовпадение ключа и прорези в оправе).
В системный блок года два никто не лазил, так что штырьки исключаются. Значит, проблема со шлейфом: порвался один из проводников либо ослабла посадка разъемов на кабель (там банальные ножевые контакты, прорезающие изоляцию, если «хорошо» дернуть шлейф, то они могут и отойти). Поменял шлейф на новый (всегда надо иметь с собой) — все заработало. Ремонт не требуется, все счастливы. Но как мог шлейф PATA самопроизвольно испортиться? Все компьютеры в конторе от одной фирмы, собраны однотипно. Шлейф сложен конвертиком и туго зафиксирован нейлоновой стяжкой. Так вот, эта стяжка от времени (а может, и от жары) задубела, жесткость повысилась. Стремясь восстановить естественную для себя круглую форму, стяжка и продавила крайние проводки шлейфа. Элементарно, Ватсон.
Вывод: в сборке компьютера нет мелочей, если вы хотите долгой беспроблемной работы. В частности, шлейфы PATA лучше всего фиксировать мягкой упаковочной проволокой в пластиковой изоляции. Альтернатив ей не вижу: про стяжку уже сказано (к тому же она неразборная, придется перекусывать, если что, а это тоже риск повредить шлейф — были случаи), резинки быстро сохнут и рассыпаются, скотч отклеивается. В фирменных компьютерах (например, HP) применяются специальные плоские прижимы с защелкой, но в продаже я их не встречал.
Шлейф PATA по стандарту должен иметь длину 18 дюймов, или 46 см (все другие варианты, от 15 до 90 см — самодеятельность производителей, не гарантирующая качества). Для большинства системных блоков такая длина избыточна, и излишки стоит собирать в гармошку, сгибая шлейф под углом 90° или 180°. Проследите, чтобы он не задевал вентиляторы и не мешал общей циркуляции воздуха. Это немаловажный аспект охлаждения системного блока: на каждой материнской плате есть греющиеся компоненты без индивидуального обдува, такие как модули памяти и некоторые контроллеры, и «экранирование» шлейфом не идет им на пользу.
Ну и последнее о выходящем из употребления кабеле: избегайте его резких перегибов, не допускайте вмятин, а также натяжений вблизи разъёмов. Проводники в шлейфе PATA очень тонкие и легко рвутся при небрежном обращении. Зачастую дефект внешне незаметен (эластичная изоляция скрывает разрыв), а поведение диска может быть весьма разнообразно. Это продемонстрировал и описанный выше казус. В подобных случаях первое, что следует сделать, — заменить шлейф. Запасной новый шлейф всегда надо иметь под рукой, благо он стоит несколько рублей.
Пять разумных действий с диском SATA
Ваш любимый жесткий диск внезапно начал вести себя странно, тормозить или зависать? При этом не было ударов, перегрева, питание качественное, да и показания SMART в норме? Посмотрим, что может сделать грамотный и аккуратный пользователь, прежде чем бежать в гарантийку или к ремонтнику?
1. Заменить шлейф SATA новым, желательно фирменным и толстым. Проводники должны быть калибра AWG26 — это обычно написано на оплетке, ширина такого кабеля 8-10 мм. Шлейфы AWG30 шириной 5-6 мм НЕ подойдут. Если есть выбор по длине — взять самый короткий (как правило, хватает 20-30 см, хотя в продаже чаще бывают 50 см). Подключить шлейф к другому порту на материнской плате или внешнем контроллере SATA. После этого параметр SMART #199 (С7) UltraDMA CRC Error Count не должен расти!
2. Очистить разъем SATA на самом диске (7 плоских контактов, из них две пары сигнальных и три контакта земли — более длинных) от грязи и окислов. Пользоваться изопропиловым безводным спиртом и салфеткой из микрофибры. То же сделать с соседним разъемом питания (15 контактов).
3. Открутить плату электроники с диска (может потребоваться отвертка-звездочка Torx T9 или T6 в новых моделях), найти посеребренные контактные площадки на обратной стороне платы. Их две: 14-20 контактов для данных, 3-4 контакта — шпиндельный двигатель. Все площадки должны быть светлыми, если потемнели (рыжие, коричневые, темно-серые) — мягким ластиком стереть окислы до блеска, протереть салфеткой со спиртом. Аккуратно прикрутить плату к диску. Момент затяжки винтов небольшой, до 30 Н*см (держать отвертку тремя пальцами). Иначе края шлица сомнутся, что впоследствии может заметить гарантийный отдел — «признаки ремонта неуполномоченными лицами», и привет.
Данная проблема встречается даже у новых, только что купленных дисков. Окислению контактов на плате способствуют перепады температуры и влажности при длительной транспортировке, в основном по морю. Сказывается и хранение на плохо отапливаемых складах эконом-класса, и загрязненный воздух в наших городах (особенно вредны сернистые выхлопы от плохого бензина и угольный дым).
Я время от времени продаю лишние диски на «Молотке» и прочих барахолках, и предпродажная подготовка, помимо тщательных тестов, включает в себя описанную выше процедуру. В одном из 15-20 случаев находятся особо въедливые покупатели: разглядев по винтам, что плата снималась, они считают, что им подсунули «осетрину второй свежести», и требуют возврата денег. Что ж, покупатель всегда прав.
4. Если зависания остались или компьютер перезагружается — проверить северный и южный мосты на материнской плате. Возможно, что-то перегревается, тогда нужно улучшить охлаждение (поменять термопасту под радиатором, усилить обдув и т.п.). Конечно, следует проверить и блок питания на стабильность напряжений под нагрузкой. Поменять ветку питания, подходящую к проблемному диску, выбрав при этом разъем, ближайший к БП. Отключить всех остальных потребителей с этой ветки. Увеличить в BIOS задержку старта диска до 3-4 сек — это сгладит всплеск нагрузки на блок питания и поможет выровнять напряжение, особенно по линии 12 В.
5. Если проблема осталась (в частности, в журнале событий ОС появляются записи типа «обнаружена ошибка контроллера»), то дальнейшие действия — обновить драйвера SATA-контроллера и прошить BIOS на последнюю версию. На чипсетах nForce может помочь отключение очереди команд NCQ, для этого надо снять галочку с Enable Command Queuing в свойствах SATA-контроллера на канале, к которому подключен проблемный диск.
Технология S.M.A.R.T. родилась в далеком 1995 году, так что возраст у нее почтенный. Предполагалось, что атрибуты SMART (давайте для простоты писать аббревиатуру без точек), формируемые микропрограммой жесткого диска, позволят программно оценивать состояние накопителя, а также дадут механизм для предсказания выхода его из строя. Последнее в те времена было достаточно актуально: срок жизни дисков в серверах, например, исчислялся годом-полутора, и знать, когда готовить замену, было нелишним.
Со временем многое поменялось: что-то отмерло, какие-то стороны развились сильнее (например, контроль механики диска). Первоначальный набор из десятка простейших атрибутов усложнился и разросся в несколько раз, порой менялся их смысл, многие производители ввели собственные атрибуты с не всегда ясным функционалом. Появилась масса программ для анализа SMART (как правило, невысокого качества, но с эффектным интерфейсом, да еще и за деньги) и т.п.
Так что не мешает описать современное состояние SMART. Начнем с критически важных атрибутов, ухудшение которых почти всегда свидетельствует о проблемах с накопителем. Именно их первым делом смотрят ремонтники при диагностике HDD.
#01 Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных ДО выдачи в интерфейс; на пугающе огромные цифры можно не обращать внимания.
#03 Spin-Up Time — время раскрутки пакета пластин из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т.п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
#05 Reallocated Sectors Count — число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор переназначенным и переносит данные в резервную область. Вот почему на современных HDD нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, на жаргоне — ремап. Поле Raw Value атрибута содержит общее количество переназначенных секторов. Чем оно больше, тем хуже состояние поверхности диска.
#07 Seek Error Rate — частота ошибок при позиционировании блока магнитных головок (БМГ). Рост этого атрибута свидетельствует о низком качестве поверхности или о поврежденной механике накопителя. Также может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
#10 Spin-Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута растет, то велика вероятность проблем с механикой.
#196 Reallocation Event Count — число операций переназначения. В поле Raw Value атрибута хранится общее число попыток переноса информации со сбойных секторов в резервную область диска (она, как правило, не слишком велика — несколько тысяч секторов). Учитываются как успешные, так и неудачные операции.
#197 Current Pending Sector Count — текущее число нестабильных секторов. Здесь хранится число секторов, являющихся кандидатами на замену. Они не были еще определены как плохие, но считывание с них происходит с затруднениями (например, не с первого раза). Если «подозрительный» сектор будет в дальнейшем считываться успешно, то он исключается из числа кандидатов. В случае же повторных ошибочных чтений накопитель попытается восстановить его и выполнить ремап.
#198 Uncorrectable Sector Count — число секторов, при чтении которых возникают неисправимые (внутренними средствами) ошибки. Рост этого атрибута указывает на серьезные дефекты поверхности или на
проблемы с механикой накопителя.
#220 Disk Shift — сдвиг пакета пластин относительно оси шпинделя. В основном возникает из-за сильного удара или падения диска. Единица измерения неизвестна, но при сильном росте атрибута диск не жилец.
Также следует принимать во внимание и информационные атрибуты, способные много чего поведать об «истории» диска.
#02 Throughput Performance — средняя производительность диска. Если значение атрибута уменьшается, то велика вероятность, что у накопителя есть проблемы.
#04 Start/Stop Count — число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счетчик включения режима энергосбережения.
#08 Seek Time Performance — средняя производительность операции позиционирования головок. Снижение значения этого атрибута свидетельствует о неполадках в механике привода головок (в первую очередь о замедленном позиционировании).
#09 Power-On Hours (POH) — время, проведённое во включенном состоянии. Показывает общее время работы диска, единица измерения зависит от модели (не только 1 час, но и 30 мин, и даже 1 минута).
#11 Recalibration Retries — число повторов рекалибровки в случае, если первая попытка была неудачной. Рост этого атрибута указывает на проблемы с механикой диска.
#12 Device Power Cycle Count — число полных циклов включения-выключения диска.
#13 Soft Read Error Rate — частота появления «программных» ошибок при чтении данных. Сюда можно отнести ошибки программного обеспечения, драйверов, файловой системы, неверную разметку диска — в общем, почти все, что не относится к аппаратной части.
#190 Airflow Temperature — температура воздуха внутри корпуса HDD. Для дисков Seagate атрибут выдается в нормировке 100º минус температура (тем самым критический нагрев соответствует значению 45), а модели Western Digital используют нормировку 125º минус температура.
#191 G-sense error rate — число ошибок, возникших из-за внешних нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.
#192 Power-off retract count — число зафиксированных повторов включения/выключения питания накопителя.
#193 Load/Unload Cycle Count — число циклов перемещения БМГ в специальную парковочную зону/в рабочее положение.
#194 HDA temperature — температура механической части диска, в просторечии банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критично.
#195 Hardware ECC Recovered — число ошибок, скорректированных аппаратной частью диска. Сюда входят ошибки чтения, ошибки позиционирования, ошибки передачи по внешнему интерфейсу. На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.
#199 UltraDMA (Ultra ATA) CRC Error Count — число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т.п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
#200 Write Error Rate/ Multi-Zone Error Rate — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение атрибута, тем хуже состояние поверхности и механики накопителя.
Как видим, большинство «интересных» атрибутов отражает функционирование механики накопителя. Технология SMART действительно позволяет предсказывать выход диска из строя в результате механических неисправностей, что, по статистике, составляет около 60% всех отказов. Полезен и мониторинг температур: перегрев головок резко ускоряет их деградацию, так что превышение опасного порога (45-55º в зависимости от модели) — сигнал срочно улучшить охлаждение диска.
Вместе с тем не следует переоценивать возможности SMART. Современные диски нередко «дохнут» на фоне отличных атрибутов, что связано с тонкими процессами дефект-менеджмента в условиях высокой плотности записи и не всегда, мягко говоря, качественных компонентов (разнобой в отдаче головок сегодня — обычное дело). Тем более SMART не способен предсказать последствия таких «форс-мажоров», как скачок напряжения, перегрев платы электроники или повреждение накопителя от удара.
Практически у всех атрибутов наибольший интерес представляет поле Raw Value: «сырые» значения наиболее информативны. Их нормировка (степень приближения к абстрактному порогу) часто ничего не дает и только запутывает дело. Поэтому и программы, полагающиеся на эти проценты, нельзя считать вполне надежными. Типичный случай для них — ложные тревоги. Программа сообщает, что новый, недавно установленный накопитель того и гляди «склеит ласты». А все дело в том, что в начале эксплуатации некоторые атрибуты SMART быстро меняются и примитивная экстраполяция приводит к пугающим пользователя прогнозам.
Я советую бесплатную программу HDDScan — она корректно понимает все атрибуты, в том числе и новые, правильно разбирает температурные показатели. Отчет выводится в виде аккуратной xml-таблицы с цветовой индикацией, которую можно сохранить или распечатать.
Крайне полезна у HDDScan возможность считывать SMART у внешних накопителей, столь распространенных сегодня. Практически ни одна другая программа этого не умеет, ведь на пути данных стоит контроллер, преобразующий интерфейс PATA/SATA в USB или FireWire. Автор целенаправленно работал в этом направлении, и ему удалось охватить широкий спектр контроллеров. Не забыты и диски с интерфейсом SCSI, до сих пор широко применяемые в серверах (атрибуты у них особые — например, выводится общее число записанных или считанных байтов за всю жизнь накопителя).
Функционал HDDScan полностью отвечает потребностям ремонтника. Когда первичную диагностику принесенного внешнего диска можно провести, не разбирая корпус, — это удобно, экономит время, а порой и сохраняет гарантию.
Барьеры HDD
Механика давно стала ахиллесовой пятой HDD, и даже не столько из-за чувствительности к ударам и вибрации (это еще можно компенсировать), сколько из-за медлительности. Самые быстрые «дерганья» блоком магнитных головок (2-3 мс у лучших серверных моделей) в тысячи раз уступают скоростям электроники.
И принципиально ничего тут не улучшишь. Поднимать скорость вращения пакета дисков некуда, 15000 об./мин уже предел. Японцы несколько лет назад подступались к 20000 об./мин (вполне гироскопная скорость), но в итоге отказались — не выдерживают материалы, конструкция получается слишком дорогая и для массового производства слабо пригодная. В малых же сериях винчестеры выйдут золотыми, такие никто не купит — это не гироскопы, которые заменить нечем.
Выходит, уткнулись в барьер. Механику на кривой козе не объедешь. Единственный выход — поднимать плотность записи, поперечную и продольную. Продольная плотность (вдоль дорожки) влияет на производительность накопителя, т.е. на поток данных к остальным узлам компьютера. Но все равно, даже достигнутые 100-130 Мбайт/с — это для нынешних компьютеров слишком мало. Например, рядовая оперативная память (DRAM) имеет реальную производительность около 3 Гбайт/с, а кеш процессора — еще больше. Разница на порядки, и она сильно сказывается на общем быстродействии. Конечно, никто не требует от энергонезависимого накопителя, емкость которого в сотни раз превышает DRAM, такой же производительности. Но даже простое удвоение было бы заметно любому пользователю.
Поперечная плотность записи — это густота дорожек на пластине, в современных HDD она превышает 10000 на 1 миллиметр. Получается, что сама дорожка имеет ширину менее 100 нм (между прочим, нанотехнологии в чистом виде). Это позволяет резко поднять емкость в расчете на одну поверхность, а также ускоряет позиционирование за счет изощренных алгоритмов (их разработка потянула бы на пару докторских диссертаций).
Как итог, за последние годы емкость и производительность HDD значительно выросли. Все это стало возможным благодаря технологии перпендикулярной записи, которая существует уже более 20 лет, но до массового внедрения дозрела только в 2007 году. Причем емкость тогда выросла даже сильнее, чем требуется: первые терабайтные диски встретили вялый отклик пользователей. Народ просто не понимал, куда приспособить таких монстров, тем более что они поначалу строились на пяти пластинах, были капризными, шумными и горячими (речь о тогдашних флагманах Hitachi).
Потом, конечно, люди разобрались, торренты заработали в полную силу, да и количество пластин поуменьшилось. В то же время плотность записи выросла до 500-750 Гбайт на пластину (имеются в виду диски настольного сегмента с форм-фактором 3,5″). Вот-вот в массовое производство пойдут терабайтные пластины, что даст возможность выпустить винчестеры объемом до 4 Тбайт (больше четырех пластин в стандартном корпусе высотой 26,1 мм не уместить; хитачевские пятипластинные первенцы большого развития не получили).
Увы, скорость позиционирования выросла, мягко говоря, несильно, а у массовых моделей так вообще осталась на прежнем уровне, а то и упала в угоду… тишине. Маркетологи доказали, что потребитель голосует кошельком за гигабайты в расчете на один доллар, а не за миллисекунды доступа. Поэтому и небыстры дешевые диски по сравнению с породистыми серверными собратьями. Медлительность хорошо проявляется в скорости загрузки ОС, когда надо читать с диска большое количество мелких файлов, разбросанных по пластинам. Здесь главную роль играет скорость вращения шпинделя и мощный привод БМГ, дающий возможность больших ускорений.
Между прочим, «быстрые» диски легко отличить даже на вес — они заметно тяжелее «медленных». Полноразмерная банка с утолщенными стенками, способствующая геометрической стабильности и подавлению вибраций, скоростной шпиндельный двигатель, мощные магниты позиционера, двухслойная крышка повышенной жесткости — все это прибавляет такому накопителю десятки и сотни граммов. Еще больше отрыв в серверных моделях на 15000 об./мин, где пластины уменьшенного размера окружены внушительным объемом литого алюминия, а общий вес «харда» доходит до килограмма.
С удешевлением твердотельных SSD, использующихся, в первую очередь, под операционную систему, нужда в высокопроизводительных HDD стала снижаться, а сами они постепенно выделяются в особый сегмент рынка (такова, например, «черная» серия у WD). Подобными дисками комплектуются профессиональные рабочие станции с ресурсоемкими приложениями, критичными к скорости доступа. Рядовые же пользователи брать достаточно дорогие накопители не торопятся, предпочитая объем производительности.
На другом конце спектра — популярные «зеленые» модели с намеренно замедленным вращением шпинделя (5400-5900 об./мин вместо 7200) и небыстрым позиционированием головок. Дешевые, тихие, холодные и достаточно надежные, эти винчестеры идеально подходят для хранения мультимедийных данных в домашних компьютерах, внешних корпусах и сетевых хранилищах. На наших прилавках все эти Green и LP сильно потеснили другие линейки, так что в мелких «точках» порой ничего больше и не найдешь.
Расточительность магнитной записи
Намагниченность доменов жесткого диска, как и в середине двадцатого века, меняют с помощью магнитной головки, поле которой возбуждается переменным электрическим током и действует на магнитный слой через зазор. Также эта технология требует быстрого вращения пластин, прецизионного контроля положения головки и т.д. Двигатель и позиционер жесткого диска, а также управляющая ими электроника потребляют заметную мощность, да и стоят немало. Но главное — на само возбуждение магнитного поля тратится очень много энергии.
Расточительность стандартного метода магнитной записи трудно оценить, работая на персональном компьютере. Жесткие диски массовых серий даже при активной работе потребляют менее 10 Вт, что на фоне прочих комплектующих (100 Вт и более) почти незаметно. Но ваши взгляды сразу переменятся после посещения серверной комнаты какого-нибудь крупного банка, а чтобы получить впечатлений на всю оставшуюся жизнь, достаточно подойти к дисковой стойке суперкомпьютера. В шуме сотен и тысяч жестких дисков, обдувающих их вентиляторов и прецизионных кондиционеров становится понятно, сколько энергии в глобальном масштабе тратится на такую работу.
Недаром для систем хранения данных энергоэффективность в списке характеристик выходит на первый план. Вот уже и Google переводит свои дата-центры на баржи в море (вот где настоящие офшоры!). Оказывается, охлаждение СХД забортной водой радикально сокращает операционные затраты, в первую очередь за счет экономии на кондиционерах.
О питании жестких дисков
Будет ли работать обычная 220-вольтовая лампочка от 230 В? Конечно, будет. А от 240 В? Тоже. Вопрос — сколько она протянет? Понятно, что меньше или существенно меньше — это зависит от конкретной лампочки. Ей суждена яркая, но короткая жизнь.
Примерно та же ситуация и с жесткими дисками. Наивные производители проектировали их, полагаясь на стандартные +5 В и +12 В. Однако в типичном компьютерном блоке питания (БП) стабилизируется лишь линия 5 В. К чему же это приводит?
При высокой нагрузке на процессор (а современные «камни» потребляют немало) и недостаточной мощности БП линия 5 В проседает, и система стабилизации отрабатывает это дело, повышая напряжение до номинального значения. Одновременно повышается и напряжение 12 В (из-за отсутствия стабилизации по нему). В результате и так нестойкий к нагреву HDD работает еще и при повышенном напряжении, которое подается на самые греющиеся узлы — микросхему управления двигателем (на жаргоне ремонтников — «крутилка») и привод головок (т.н. «звуковая катушка»). Итог — смотри рассуждение о лампочке.
Отсюда советы по блоку питания. Чем больше его мощность, тем лучше (в разумных пределах: запас более 30-35% по отношению к реальному потреблению снижает КПД блока, так что вы будете греть комнату). Менее мощный, но фирменный БП лучше более мощного, но безродно-китайского. Помните — разгоняют не только процессоры. В первом приближении, 420 «китайских» ватт эквивалентны 300 «правильным».
По-хорошему, надо бы еще учитывать возраст БП: после 2-3 лет эксплуатации его реальная мощность заметно снижается, а выходные напряжения дрейфуют. Разумеется, в некачественных изделиях, работающих на честном китайском слове, процессы старения выражены гораздо резче. Хорошо еще, если подобный блок тихо умрет сам, а не утащит за собой в агонии половину системного блока!
Максимально допустимым считается 12,6 В (+5% от номинала). Однако у многих дисков c ростом напряжения наблюдается нелинейно-резкий нагрев упомянутых выше узлов — «крутилки» и «катушки». Поэтому я рекомендую строже контролировать БП с помощью внешнего вольтметра (датчики на материнской плате, измеряющие напряжение для BIOS и программ типа AIDA, могут быть весьма неточны).
Измерять напряжение лучше всего на разъемах Molex и обязательно под полной нагрузкой: процессор занят вычислениями с плавающей точкой, видеокарта — выводом динамичной трехмерной графики, а диск — дефрагментацией. При 12,2-12,4 В стоит призадуматься, 12,4-12,6 В — поволноваться, 12,6-13 В — бить тревогу, а в случае 13 В и выше — копить деньги на новый диск или положить гарантийный талон на видное место…
Если напряжение по линии 12 В сильно завышено, а вы не боитесь паяльника и способны отличить транзистор от диода, то можете включить последний в разрыв питания HDD (напомню, линии 12 В соответствует желтый провод). Диод сыграет роль ограничителя — на его p-n переходе упадут «лишние» 0,2-0,7 В (в зависимости от типа диода), и диску станет полегче. Только диод надо брать достаточно мощный, чтобы он выдерживал пусковой ток в 2-3 А.
И без фанатизма: результирующее напряжение не должно опускаться ниже 11,7 В. В противном случае возможна неустойчивая работа диска (множественные рестарты) и даже порча данных. А некоторые модели (в частности, Seagate 7200.10 и 7200.11) могут вообще не запуститься.
Миграция с флеш
Память NAND Flash появилась много позднее, чем HDD, и переняла ряд его технологий — взять хотя бы коды ECC. Далее оба направления развивались параллельно и сравнительно независимо. Но в последнее время наметился и обратный процесс: миграция технологий с флеш-памяти на жесткие диски. Конкретно речь идет о выравнивании износа.
Как известно, любой флеш-чип имеет ограниченный ресурс по числу стираний-записей в одну ячейку. В какой-то момент стереть ее уже не удается, и она навсегда застывает с последним записанным значением. Поэтому контроллер считает количество записей в каждую страницу и в случае превышения копирует ее на менее изношенное место. В дальнейшем вся работа ведется с новым участком (этим заведует транслятор), а старая страница остается как есть и не используется. Данная технология получила название Wear Leveling. Так вот, износ есть и в жестких дисках, но там он механический и температурный. Если магнитная головка все время висит над одной дорожкой (скажем, постоянно изменяется тот или иной файл), то растет вероятность повреждения дорожки при случайных толчках или вибрации диска (например, от соседних накопителей в корзине). Головка может коснуться пластины и повредить магнитный слой со всеми вытекающими печальными последствиями. Даже если вредного контакта нет, неподвижная головка локально нагревается и пусть обратимо, но деградирует. Запись в данное место происходит менее надежно, растет вероятность последующего неустойчивого считывания (а при современных огромных плотностях записи любое отклонение параметров губительно).
Эти соображения достаточно очевидны, и прошивка серверных дисков с интерфейсом SCSI/SAS (а они весьма горячи) давно научилась перемещать головки в простое, дабы они не перегревались. Но еще лучше вместе с головкой «перебрасывать» и информацию по пластине — в этом случае описанные эффекты подавляются максимально, а надежность накопителя растет. Вот Western Digital и ввел подобный механизм в новых моделях VelociRaptor. Это дорогие высокопроизводительные диски со скоростью вращения шпинделя 10000 об./мин и пятилетней гарантией, так что Wear Leveling там уместен.
Кроме того, вся линейка VelociRaptor нацелена на использование в высоконагруженных системах, в первую очередь серверах, где запись на диск ведется очень интенсивно и зачастую в одни и те же файлы (типичный пример — логи транзакций). Массовым «ширпотребным» дискам высокие нагрузки не грозят, греются они тоже умеренно, так что подобный изыск там вряд ли появится. Впрочем, поживем — увидим.
Аdvanced Format и его применение
Вот уже более 20 лет все жесткие диски имеют одинаковый размер физического сектора: 512 байт. Это минимальная порция записи на диск, позволяющая гибко управлять распределением дискового пространства. Однако с ростом объема HDD все сильнее стали проявляться недостатки такого подхода — в первую очередь неэффективное использование емкости магнитной пластины, а также высокие накладные расходы при организации потока данных.
Поэтому диски большой емкости (терабайт и выше) стали производиться по технологии Advanced Format, которая оперирует «длинными» физическими секторами в 4096 байт. Разметка магнитных пластин под AF весьма выгодна для производителя: меньше межсекторных промежутков, выше полезная емкость дорожки и всей пластины (а это, наряду с магнитными головками, самый дорогой компонент HDD). Именно Advanced Format позволил выпустить на рынок недорогие винчестеры, столь популярные ныне у потребителей аудио- и видеоконтента. AF-дисками емкостью 1-3 Тбайт комплектуются не только компьютеры, но и масса внешних накопителей, сетевых хранилищ и медиаплееров.
Но даром ничего не дается, новые диски уже начинают приносить в ремонт. Похоже, надежность все-таки просела. Ведь единичный сбой диска или дефект поверхности портит теперь в 8 раз больше данных пользователя, чем обычно. При физическом секторе в 4 Кбайт и эмуляции «коротких» секторов в 512 байт не будет читаться от 1 до 8 секторов. Операционная система на это реагирует понятно как: авария, все пропало! В итоге мелкая проблема на пластинах вырастает для пользователя в зависание или чего еще хуже.
Я считаю, на дисках с AF не стоит держать ОС, прикладные программы и базы данных со множеством мелких файлов. Пока что их удел — мультимедийные данные, некритичные к выпадениям.
Что стоит почитать о жестких дисках
В первую очередь рекомендую заглянуть на форум HARDW.net. Его раздел «Накопители информации» посещает множество профессиональных ремонтников и энтузиастов (почти 40 тыс. участников). Там можно найти ответы практически по любой теме, связанной с HDD, за исключением самых новых «нераскопанных» моделей. Начните с подраздела «Песочница»: на простые (в понимании профессионалов) вопросы там отвечают подробно и содержательно, а не отшивают, как в других местах, — «несите к ремонтнику».
Еще больше информации, правда, на английском языке, можно найти на портале HDDGURU. Помимо ремонтно-диагностического ПО и статей по
отдельным вопросам (например, как поменять головки у диска), там есть международный форум ремонтников, а также огромный архив ресурсов по HDD (firmware, документация, фото и т.п.). Портал прививает широкий взгляд на вещи, он будет интересен подготовленным и мотивированным людям. Во всяком случае, в закрытых конференциях ремонтников ссылки на него пробегают постоянно.