硬盘是目前PC系统中 主要之存储设备,同时硬盘是PC系统中出故障率 高之部件。用户在使用硬盘过程中,硬盘出现故障怎么办呢?如果还在质保期内,当然是尽量找到销售商要求保修。但现在大多数IDE硬盘质保期只有一年,而大多数用户都希望一个硬盘能使用三年以上。如果质保期过后硬盘出了故障,就得考虑更换或对它进行修理。
笔者这几年来一直从事硬盘检修工作,经常与国内外之同行交流,查阅过大量之外文专业资料,研究使用过多种专业之硬盘修复工具,成功修复了近万个硬盘。在这里,笔者与读者探讨一些硬盘缺陷及其修复原理,同时介绍并解释一些专业修复硬盘软件中常用到之概念。但笔者暂不探讨在各种操作系统下硬盘中之数据结构问题及数据恢复问题,而是直接探讨硬盘本身之缺陷问题。
一、缺陷之分类
如果经检测发现某个硬盘不能完全也很工作,则称这个硬盘是“有缺陷之硬盘”(Defect Hard Disk)。
根据检修经验,笔者将硬盘之缺陷分为六大类
①坏扇区(Bad sector),也称缺陷扇区(Defect sector)
②磁道伺服缺陷(Track Servo defect)
③磁头组件缺陷(Heads assembly defect)
④系统信息错乱(Service information destruction)
⑤电子线路缺陷(The board of electronics defect)
⑥综合性能缺陷(Complex reliability defect)
1.坏扇区(也称缺陷扇区)
指不能被也很访问或不能被正确读写之扇区。一般表现为:高级格式化后发现有“坏簇(Bad Clusters);用SCANDISK等工具检查发现有“B”标记;或用某些检测工具发现有“扇区错误提示”等。
一般每个扇区可以记录512字节之数据,如果其中任何一个字节不也很,该扇区就属于缺陷扇区。每个扇区除了记录512字节之数据外,另外还记录有一些信息:标志信息、校验码、地址信息等,其中任何一部分信息不也很都导致该扇区出现缺陷。
多数专业检测软件在检测过程中发现缺陷时,都有类似之错误信息提示,常见之扇区缺陷主要有几种情况:
①校验错误(ECC uncorrectable errors,又称ECC错误)。系统每次在往扇区中写数据之同时,都根据这些数据经过一定之算法运算生成一个校验码(ECC=Error Correction Code),并将这个校验码记录在该扇区之信息区内。以后从这个扇区读取数据时,都会同时读取其校检码,并对数据重新运算以检查结果是否与校检码一致。如果一致,则认为这个扇区也很,存放之数据正确有效;如果不一致,则认为该扇区出错,这就是校验错误。这是硬盘 主要之缺陷类型。导致这种缺陷之原因主要有:磁盘表面磁介质损伤、硬盘写功能不也很、校验码之算法差异。
②IDNF错误(sector ID not found),即扇区标志出错,造成系统在需要读写时找不到相应之扇区。造成这个错误之原因可能是系统参数错乱,导致内部地址转换错乱,系统找不到指定扇区;也有可能是某个扇区记录之标志信息出错导致系统没有法正确辨别扇区。
③AMNF错误(Address Mark Not Found),即地址信息出错。一般是由于某个扇区记录之地址信息出错,系统在对它访问时发现其地址信息与系统编排之信息不一致。
④坏块标记错误(Bad block mark)。某些软件或病毒程序可以在部分扇区强行写上坏块标记,让系统不使用这些扇区。这种情况严格来说不一定是硬盘本身之缺陷,但想清除这些坏块标记却不容易。
2.磁道伺服缺陷
现在之硬盘大多采用嵌入式伺服,硬盘中每个也很之物理磁道都嵌入有一段或几段信息作为伺服信息,以便磁头在寻道时能准确定位及辨别正确编号之物理磁道。如果某个物理磁道之伺服信息受损,该物理磁道就可能没有法被访问。这就是“磁道伺服缺陷”。一般表现为,分区过程非也很中断;格式化过程没有法完成;用检测工具检测时,中途退出或死机,等等。
3.磁头组件缺陷
指硬盘中磁头组件之某部分不也很,造成部分或全部物理磁头没有法也很读写之情况。包括磁头磨损、磁头接触面脏、磁头摆臂变形、音圈受损、磁铁移位等。一般表现为通电后,磁头动作发出之声音明显不也很,硬盘没有法被系统BIOS检测到;没有法分区格式化;格式化后发现从前到后都分布有大量之坏簇,等等。
4.系统信息错乱
每个硬盘内部都有一个系统保留区(service area),里面分成若干模块保存有许多参数和程序。硬盘在通电自检时,要调用其中大部分程序和参数。如果能读出那些程序和参数模块,而且校验也很之话,硬盘就进入准备状态。如果某些模块读不出或校验不也很,则该硬盘就没有法进入准备状态。一般表现为,PC系统之BIOS没有法检测到该硬盘或检测到该硬盘却没有法对它进行读写操作。如某些系列硬盘之常见问题:美钻二代系列硬盘通电后,磁头响一声,马达停转;Fujitsu MPG系列在通电后,磁头也很寻道,但BIOS却检测不到;火球系列,系统能也很认出型号,却不能分区格式化;Western Digital之EB、BB系列,能被系统检测到,却不能分区格式化,等等。
5.电子线路缺陷
指硬盘之电子线路板中部分线路断路或短路,某些电气元件或IC芯片损坏等。有部分可以通过观察线路板发现缺陷所在,有些则要通过仪器万用表测量后才能确认缺陷部位。一般表现为硬盘在通电后不能也很起转,或者起转后磁头寻道不也很,等等。
6.综合性能缺陷
有些硬盘在使用过程中部分芯片特性改变;或者有些硬盘受震动后物理结构产生微小变化(如马达主轴受损);或者有些硬盘在设计上存在缺陷…… 终导致硬盘稳定性差,或部分性能达不到标准要求。一般表现为,工作时噪音明显增大;读写速度明显太慢;同一系列之硬盘大量出现类似故障;某种故障时有时没有等等。
二、厂家处理缺陷之方式
用户在购买硬盘时,一般都通过各种工具检测硬盘没有缺陷后才会购买。而且,在质保期内可以找销售商将硬盘退回厂家修理。那么,厂家如何保证新硬盘不会被检测到缺陷呢?返修之硬盘又如何处理缺陷呢?首先,让我们来认识硬盘工厂之一些基本处理流程:
1.在生产线上装配硬盘之硬件部分,用特别设备往盘片写入伺服信号(Servo write)。
2.将硬盘之系统保留区(service area)格式化,并向系统保留区写入程序模块和参数模块。系统保留区一般位于硬盘0物理面之 前面几十个物理磁道。写入之程序模块一般用于硬盘内部管理,如低级格式化程序、加密解密程序、自监控程序、自动修复程序等等。写入之参数多达近百项:如型号、系列号、容量、口令、生产厂家与生产日期、配件类型、区域分配表、缺陷表、出错记录、使用时间记录、S.M.A.R.T表等等,数据量从几百KB到几MB不等。有时参数一经写入就不再改变,如型号、系列号、生产时间等;而有些参数则可以在使用过程中由内部管理程序自动修改,如出错记录、使用时间记录、S.M.A.R.T记录等。也有些专业之检修人员可以借助专业之工具软件,随意读取、修改写入硬盘中之程序模块和参数模块。
3.将所使用之盘片表面按物理地址全面扫描,检查出所有之缺陷磁道和缺陷扇区,并将这些缺陷磁道和缺陷扇区按实际物理地址记录在永久缺陷列表(P-list:Permanent defect list)中。这个扫描过程非常严格,能把不稳定不可靠之磁道和扇区也检查出来,视同缺陷一并处理。现在之硬盘密度极高,盘片生产过程再精密也很难完全避免缺陷磁道或缺陷扇区。一般新硬盘之P-list中都有少则数十,多则上万个缺陷记录。P-list是保留在系统保留区中,一般用户是没有法查看或修改之。有些专业之检修人员借助专业之工具软件,可以查看或修改大部分硬盘中之P-list。
4.系统调用内部低级格式化程序,根据相应之内部参数进行内部低级格式化。在内部低级格式化过程中,对所有之磁道和扇区进行编号、信息重写、清零等工作。在编号时,采用跳过(skipped)之方法忽略掉记录在P-list中之缺陷磁道和缺陷扇区,保证以后用户不会也不能使用到那些缺陷磁道和缺陷扇区。因此,新硬盘在出售时是没有法被检测到缺陷之。如果是返修之硬盘,一般就在厂家特定之检修部门进行检测检修。
小知识:什么是硬盘之磁道和扇区?磁道是磁盘一个面上之单个数据存储圆圈。如果将磁道作为一个存储单元,从数据管理效率来看实在是太低了,因此,磁道被分成若干编上号之区域,称之为扇区。这些扇区代表了磁道之分段(如图)。在PC系统中,通过标准格式化之程序产生之扇区容量都为512字节。这里大家需注意之是“扇区”与“簇”之关系,“簇”是操作系统在读或写一个文件时能处理之 小磁盘单元,一个簇等于一个或多个扇区。
三、硬盘缺陷之处理
如果不在硬盘工厂中,对普通用户或检修人员来说,又如何处理硬盘之缺陷呢?前面我们把硬盘之缺陷分为六大类,不同类型之缺陷用不同之处理方法。
1.对于综合性能缺陷,一般涉及到稳定性问题,用户随时有丢失数据之危险,可以说是“用之担惊,弃之可惜”。检修人员很难从根本上解决问题,建议用户还是趁早更换硬盘。
2.对于磁头组件缺陷,解决办法是更换磁头组件,这对设备及环境要求较高,检修成本也很高。除非是要求恢复其中之数据,否则不值得进行修复。有条件之检修公司可以在百级净化室中更换硬盘之磁头组件,对数据进行拯救。
3.对于线路缺陷,一般要求检修人员有电子线路基础,要有测试线路之经验和焊接芯片之设备,当然还要有必需之配件以备更换。目前许多专业检修硬盘之公司都有条件解决这类缺陷。对普通用户而言, 简单之判别和解决办法是找一个相同之也很线路板换上试试。
4.对于系统信息错乱,需要有专业之工具软件才能解决。首先要找个与待修硬盘参数完全相同之也很硬盘,读出其内部所有模块并保存下来;检查待修硬盘之系统结构,查到出错之模块,并将也很模块之参数重新写入。笔者用这个方法成功地修复了数以千计有这种缺陷类型之硬盘,而且一般不会破坏原有数据。要想写某系列硬盘之系统信息,相应之工具软件必须有严格针对性;该硬盘之CPU专用指令集;该硬盘之Firmware结构;内部管理程序和参数模块结构。一般只有硬盘厂家才能编写这样之专业工具软件,而且视为绝密技术,不向外界提供。但也有一些专业之硬盘研究所研究开发类似之专业工具软件,一般要价很高而且很难买到。
5.对于伺服缺陷,也要借助于专业工具。相应之专业工具可以通过重写来纠正伺服信息,解决部分磁道伺服缺陷。如果有部分没有法纠正,则要对盘片进行物理磁道扫描找出有伺服缺陷之磁道,添加到P-list(或另外之专门磁道缺陷列表)中。然后,运行硬盘内部之低级格式化程序。这段程序能自动根据需要调用相关之参数模块,自动完成硬盘之低格过程,不需要PC系统之干预。
PC-3000 专业级硬盘修复套件(原产俄罗斯)
坏扇区是 常见之缺陷类型,下面笔者着重论述。
四、坏扇区之修复原理
按“三包”规定,如果硬盘在质保期内出现缺陷,商家应该为用户更换或修理。现在大容量之硬盘出现一个坏扇区之概率实在很大,如果全部送修之话,硬盘商家就要为售后服务忙碌不已了。很多硬盘商家都说,硬盘出现少量坏扇区往往是病毒作怪或某些软件造成之,不是真正之坏扇区,只要运行硬盘厂家提供之某些软件,就可以纠正了。到底是怎么回事呢?从前面对坏扇区之说明来看,坏扇区有多种可能之原因,修复之方法也有几种:
1.通过重写校验码、标志信息等可以纠正一部分坏扇区。现在硬盘厂家都公开提供有一些基本之硬盘维护工具,如各种版本之DM、POWERMAX、DLGDIAG等,其中都包括有这样之功能项:Zero fill(零填充)或Lowlevel format(低级格式化)。进行这两项功能都会对硬盘之数据进行清零,并重写每个扇区之校验码和标志信息。如果不是磁盘表面介质损伤之话,大部分之坏扇区可以纠正为也很状态。这就是常听说之:“逻辑坏扇区可以修复”之道理。
2.调用自动修复机制替换坏扇区。为了减少硬盘返修之概率,硬盘厂商在硬盘内部设计了一个自动修复机制 Automatic Reallcation或Automatic Reassign 。现在生产之硬盘都有这样之功能:在对硬盘之读写过程中,如果发现一个坏扇区,则由内部管理程序自动分配一个备用扇区来替换该扇区,并将该扇区物理位置及其替换情况记录在G-list(增长缺陷表,Grown defects list 中。这样一来,少量之坏扇区有可能在使用过程中被自动替换掉了,对用户之使用没有太大之影响。也有一些硬盘自动修复机制之激发条件要严格一些,需要运行某些软件来检测判断坏扇区,并发出相应指令激发自动修复功能。比如常用之Lformat(低格) DM中之Zero fill,Norton中之Wipeinfo和校正工具,西数工具包中之wddiag,IBM之DFT中之Erase,还有一些半专业工具如:HDDspeed、MHDD、HDDL、HDDutility等(大家可以上网搜索下载)。这些工具之所以能在运行过后消除了一些坏扇区,很重要之原因就是这些工具可以在检测到坏扇区时激发自动修复机制。如果读者能查看G-list就知道,这些“修复工具”运行前后,G-list记录有可能增加一定数量。如:用HDDspeed可以查看所有Quantum Fireball系列之P-list和G-list;MHDD可以查看IBM和FUJITSU之P-list和G-list。
当然,G-list之记录不会没有限制,所有硬盘之G-list都会限定在一定数量范围内。如火球系列限度是500条,美钻二代之限度是636条,西数BB之限度是508条,等等。超过限度,自动修复机制就不能再起作用。这就是为何少量之坏扇区可以通过上述工具修复,而坏扇区多了不能通过这些工具修复。
3.用专业软件将缺陷扇区记录在P-list中,并进行内部低级格式化。用户在使用硬盘时,是不能按物理地址模式来访问硬盘之。而是按逻辑地址模式来访问。硬盘在通电自检时,系统会从系统保留区读取一些特定参数(与内部低级格式化时调用之参数有密切关系)存在缓冲区里,用作物理地址与逻辑地址之间转换之依据。有些专业软件可以将检测到之坏扇区之逻辑地址转换为对应之物理地址,直接记录在P-list中,然后调用内部低级格式化程序进行低级格式化。这样可以不受G-list之限制,能修复大量之坏扇区,达到厂家修复之效果。