SMART技术检测磁盘故障参数Word格式文档下载.docx

上传人:b****6 文档编号:18035568 上传时间:2022-12-13 格式:DOCX 页数:17 大小:31.45KB
下载 相关 举报
SMART技术检测磁盘故障参数Word格式文档下载.docx_第1页
第1页 / 共17页
SMART技术检测磁盘故障参数Word格式文档下载.docx_第2页
第2页 / 共17页
SMART技术检测磁盘故障参数Word格式文档下载.docx_第3页
第3页 / 共17页
SMART技术检测磁盘故障参数Word格式文档下载.docx_第4页
第4页 / 共17页
SMART技术检测磁盘故障参数Word格式文档下载.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

SMART技术检测磁盘故障参数Word格式文档下载.docx

《SMART技术检测磁盘故障参数Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《SMART技术检测磁盘故障参数Word格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。

SMART技术检测磁盘故障参数Word格式文档下载.docx

03(003)主轴起旋时间SpinUpTime 

主轴起旋时间就是主轴电机从启动至达到额定转速所用的时间,数据值直接显示时间,单位为毫秒或者秒,因此数据值越小越好。

不过对于正常硬盘来说,这一项仅仅是一个参考值,硬盘每次的启动时间都不相同,某次启动的稍慢些也不表示就有问题。

 

硬盘的主轴电机从启动至达到额定转速大致需要4秒~15秒左右,过长的启动时间说明电机驱动电路或者轴承机构有问题。

旦这一参数的数据值在某些型号的硬盘上总是为0,这就要看当前值和最差值来判断了。

对于固态硬盘来说,所有的数据都是保存在半导体集成电路中,没有主轴电机,所以这项没有意义,数据固定为0,当前值固定为100。

04(004)启停计数Start/StopCount 

这一参数的数据是累计值,表示硬盘主轴电机启动/停止的次数,新硬盘通常只有几次,以后会逐渐增加。

系统的某些功能如空闲时关闭硬盘等会使硬盘启动/停止的次数大为增加,在排除定时功能的影响下,过高的启动/停止次数(远大于通电次数0C)暗示硬盘电机及其驱动电路可能有问题。

这个参数的当前值是依据某种公式计算的结果,例如对希捷某硬盘来说临界值为20,当前值是通过公式“100-(启停计数/1024)”计算得出的。

若新硬盘的启停计数为0,当前值为100-(0/1024)=100,随着启停次数的增加,该值不断下降,当启停次数达到81920次时,当前值为100-(81920/1024)=20,已达到临界值,表示从启停次数来看,该硬盘已达设计寿命,当然这只是个寿命参考值,并不具有确定的指标性。

这一项对于固态硬盘同样没有意义,数据固定为0,当前值固定为100。

05(005)重映射扇区计数ReallocatedSectorsCount/退役块计数RetiredBlockCount 

数据应为0,当前值应远大于临界值。

当硬盘的某扇区持续出现读/写/校验错误时,硬盘固件程序会将这个扇区的物理地址加入缺陷表(G-list),将该地址重新定向到预先保留的备用扇区并将其中的数据一并转移,这就称为重映射。

执行重映射操作后的硬盘在Windows常规检测中是无法发现不良扇区的,因其地址已被指向备用扇区,这等于屏蔽了不良扇区。

这项参数的数据值直接表示已经被重映射扇区的数量,当前值则随着数据值的增加而持续下降。

当发现此项的数据值不为零时,要密切注意其发展趋势,若能长期保持稳定,则硬盘还可以正常运行;

若数据值不断上升,说明不良扇区不断增加,硬盘已处于不稳定状态,应当考虑更换了。

如果当前值接近或已到达临界值(此时的数据值并不一定很大,因为不同硬盘保留的备用扇区数并不相同),表示缺陷表已满或备用扇区已用尽,已经失去了重映射功能,再出现不良扇区就会显现出来并直接导致数据丢失。

这一项不仅是硬盘的寿命关键参数,而且重映射扇区的数量也直接影响硬盘的性能,例如某些硬盘会出现数据量很大,但当前值下降不明显的情况,这种硬盘尽管还可正常运行,但也不宜继续使用。

因为备用扇区都是位于磁盘尾部(靠近盘片轴心处),大量的使用备用扇区会使寻道时间增加,硬盘性能明显下降。

这个参数在机械硬盘上是非常敏感的,而对于固态硬盘来说同样具有重要意义。

闪存的寿命是正态分布的,例如说MLC能写入一万次以上,实际上说的是写入一万次之前不会发生“批量损坏”,但某些单元可能写入几十次就损坏了。

换言之,机械硬盘的盘片不会因读写而损坏,出现不良扇区大多与工艺质量相关,而闪存的读写次数则是有限的,因而损坏是正常的。

所以固态硬盘在制造时也保留了一定的空间,当某个存储单元出现问题后即把损坏的部分隔离,用好的部分来顶替。

这一替换方法和机械硬盘的扇区重映射是一个道理,只不过机械硬盘正常时极少有重映射操作,而对于固态硬盘是经常性的。

在固态硬盘中这一项的数据会随着使用而不断增长,只要增长的速度保持稳定就可以。

通常情况下,数据值=100-(100×

被替换块/必需块总数),因此也可以估算出硬盘的剩余寿命。

Intel固态硬盘型号的第十二个字母表示了两种规格,该字母为1表示第一代的50纳米技术的SSD,为2表示第二代的34纳米技术的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。

所以参数的查看也有两种情况:

50nm的SSD(一代)要看当前值。

这个值初始是100,当出现替换块的时候这个值并不会立即变化,一直到已替换四个块时这个值变为1,之后每增加四个块当前值就+1。

也就是100对应0~3个块,1对应4~7个块,2对应8~11个块…… 

34nm的SSD(二代)直接查看数据值,数据值直接表示有多少个被替换的块。

06(006)读取通道余量ReadChannelMargin 

这一项功能不明,现在的硬盘也不显示这一项。

07(007)寻道错误率SeekErrorRate 

数据应为0,当前值应远大于与临界值。

这一项表示磁头寻道时的错误率,有众多因素可导致寻道错误率上升,如磁头组件的机械系统、伺服电路有局部问题,盘片表面介质不良,硬盘温度过高等等。

通常此项的数据应为0,但对希捷硬盘来说,即使是新硬盘,这一项也可能有很大的数据量,这不代表有任何问题,还是要看当前值是否下降。

08(008)寻道性能SeekTimePerformance 

此项表示硬盘寻道操作的平均性能(寻道速度),通常与前一项(寻道错误率)相关联。

当前值持续下降标志着磁头组件、寻道电机或伺服电路出现问题,但现在许多硬盘并不显示这一项。

09(009)通电时间累计Power-OnTimeCount(POH) 

这个参数的含义一目了然,表示硬盘通电的时间,数据值直接累计了设备通电的时长,新硬盘当然应该接近0,但不同硬盘的计数单位有所不同,有以小时计数的,也有以分、秒甚至30秒为单位的,这由磁盘制造商来定义。

这一参数的临界值通常为0,当前值随着硬盘通电时间增加会逐渐下降,接近临界值表明硬盘已接近预计的设计寿命,当然这并不表明硬盘将出现故障或立即报废。

参考磁盘制造商给出的该型号硬盘的MTBF(平均无故障时间)值,可以大致估计剩余寿命或故障概率。

对于固态硬盘,要注意“设备优先电源管理功能(deviceinitiatedpowermanagement,DIPM)”会影响这个统计:

如果启用了DIPM,持续通电计数里就不包括睡眠时间;

如果关闭了DIPM功能,那么活动、空闲和睡眠三种状态的时间都会被统计在内。

0A(010)主轴起旋重试次数SpinupRetryCount 

数据应为0,当前值应大于临界值。

主轴起旋重试次数的数据值就是主轴电机尝试重新启动的计数,即主轴电机启动后在规定的时间里未能成功达到额定转速而尝试再次启动的次数。

数据量的增加表示电机驱动电路或是机械子系统出现问题,整机供电不足也会导致这一问题。

0B(011)磁头校准重试计数CalibrationRetryCount 

硬盘在温度发生变化时,机械部件(特别是盘片)会因热胀冷缩出现形变,因此需要执行磁头校准操作消除误差,有的硬盘还内置了磁头定时校准功能。

这一项记录了需要再次校准(通常因上次校准失败)的次数。

这一项的数据量增加,表示电机驱动电路或是机械子系统出现问题,但有些型号的新硬盘也有一定的数据量,并不表示有问题,还要看当前值和最差值。

0C(012)通电周期计数PowerCycleCount 

通电周期计数的数据值表示了硬盘通电/断电的次数,即电源开关次数的累计,新硬盘通常只有几次。

这一项与启停计数(04)是有区别的,一般来说,硬盘通电/断电意味着计算机的开机与关机,所以经历一次开关机数据才会加1;

而启停计数(04)表示硬盘主轴电机的启动/停止(硬盘在运行时可能多次启停,如系统进入休眠或被设置为空闲多少时间而关闭)。

所以大多情况下这个通电/断电的次数会小于启停计数(04)的次数。

通常,硬盘设计的通电次数都很高,如至少5000次,因此这一计数只是寿命参考值,本身不具指标性。

0D(013)软件读取错误率SoftReadErrorRate 

软件读取错误率也称为可校正的读取误码率,就是报告给操作系统的未经校正的读取错误。

数据值越低越好,过高则可能暗示盘片磁介质有问题。

AA(170)坏块增长计数GrownFailingBlockCount(Micron镁光) 

读写失败的块增长的总数。

AB(171)编程失败块计数ProgramFailBlockCount 

Flash编程失败块的数量。

AC(172)擦写失败块计数EraseFailBlockCount 

擦写失败块的数量。

AD(173)磨损平衡操作次数(平均擦写次数)/WearLevelingCount(Micron镁光) 

所有好块的平均擦写次数。

Flash芯片有写入次数限制,当使用FAT文件系统时,需要频繁地更新文件分配表。

如果闪存的某些区域读写过于频繁,就会比其它区域磨损的更快,这将明显缩短整个硬盘的寿命(即便其它区域的擦写次数还远小于最大限制)。

所以,如果让整个区域具有均匀的写入量,就可明显延长芯片寿命,这称为磨损均衡措施。

AE(174)意外失电计数UnexpectedPowerLossCount 

硬盘自启用后发生意外断电事件的次数。

B1(177)磨损范围对比值WearRangeDelta 

磨损最重的块与磨损最轻的块的磨损百分比之差。

B4(180)未用的备用块计数UnusedReservedBlockCountTotal(惠普)

固态硬盘会保留一些容量来准备替换损坏的存储单元,所以可用的预留空间数非常重要。

这个参数的当前值表示的是尚未使用的预留的存储单元数量。

B5(181)编程失败计数ProgramFailCount 

用4个字节显示已编程失败的次数,与(AB)参数相似。

B5(181)非4KB对齐访问数Non-4kAlignedAccess(Micron镁光)

B6(182)擦写失败计数EraseFailCount 

用4个字节显示硬盘自启用后块擦写失败的次数,与(AC)参数相似。

B7(183)串口降速错误计数SATADownshiftErrorCount 

这一项表示了SATA接口速率错误下降的次数。

通常硬盘与主板之间的兼容问题会导致SATA传输级别降级运行。

B8(184)I/O错误检测与校正I/OErrorDetectionandCorrection(IOEDC) 

“I/O错误检测与校正”是惠普公司专有的SMARTIV技术的一部分,与其他制造商的I/O错误检测和校正架构一样,它记录了数据通过驱动器内部高速缓存RAM传输到主机时的奇偶校验错误数量。

B8(184)点到点错误检测计数EndtoEndErrorDetectionCount 

Intel第二代的34nm固态硬盘有点到点错误检测计数这一项。

固态硬盘里有一个LBA(logicalblockaddressing,逻辑块地址)记录,这一项显示了SSD内部逻辑块地址与真实物理地址间映射的出错次数。

B8(184)原始坏块数InitBadBlockCount(Indilinx芯片) 

硬盘出厂时已有的坏块数量。

B9(185)磁头稳定性HeadStability(西部数据) 

意义不明。

BA(186)感应运算振动检测nducedOp-VibrationDetection(西部数据) 

BB(187)无法校正的错误ReportedUncorrectableErrors(希捷) 

报告给操作系统的无法通过硬件ECC校正的错误。

如果数据值不为零,就应该备份硬盘上的数据了。

报告给操作系统的在所有存取命令中出现的无法校正的RAISE(URAISE)错误。

BC(188)命令超时CommandTimeout 

由于硬盘超时导致操作终止的次数。

通常数据值应为0,如果远大于零,最有可能出现的是电源供电问题或者数据线氧化致使接触不良,也可能是硬盘出现严重问题。

BD(189)高飞写入HighFlyWrites 

磁头飞行高度监视装置可以提高读写的可靠性,这一装置时刻监测磁头的飞行高度是否在正常范围来保证可靠的写入数据。

如果磁头的飞行高度出现偏差,写入操作就会停止,然后尝试重新写入或者换一个位置写入。

这种持续的监测过程提高了写入数据的可靠性,同时也降低了读取错误率。

这一项的数据值就统计了写入时磁头飞行高度出现偏差的次数。

BD(189)出厂坏块计数FactoryBadBlockCount(Micron镁光芯片)

BE(190)气流温度AirflowTemperature 

这一项表示的是硬盘内部盘片表面的气流温度。

在希捷公司的某些硬盘中,当前值=(100-当前温度),因此气流温度越高,当前值就越低,最差值则是当前值曾经到达过的最低点,临界值由制造商定义的最高允许温度来确定,而数据值不具实际意义。

许多硬盘也没有这一项参数。

BF(191)冲击错误率G-senseerrorrate 

这一项的数据值记录了硬盘受到机械冲击导致出错的频度。

C0(192)断电返回计数Power-OffRetractCount 

当计算机关机或意外断电时,硬盘的磁头都要返回停靠区,不能停留在盘片的数据区里。

正常关机时电源会给硬盘一个通知,即StandbyImmediate,就是说主机要求将缓存数据写入硬盘,然后就准备关机断电了(休眠、待机也是如此);

意外断电则表示硬盘在未收到关机通知时就失电,此时磁头会自动复位,迅速离开盘片。

这个参数的数据值累计了磁头返回的次数。

但要注意这个参数对某些硬盘来说仅记录意外断电时磁头的返回动作;

而某些硬盘记录了所有(包括休眠、待机,但不包括关机时)的磁头返回动作;

还有些硬盘这一项没有记录。

因此这一参数的数据值在某些硬盘上持续为0或稍大于0,但在另外的硬盘上则会大于通电周期计数(0C)或启停计数(04)的数据。

在一些新型节能硬盘中,这一参数的数据量还与硬盘的节能设计相关,可能会远大于通电周期计数(0C)或启停计数(04)的数据,但又远小于磁头加载/卸载计数(C1)的数据量。

对于固态硬盘来说,虽然没有磁头的加载/卸载操作,但这一项的数据量仍然代表了不安全关机,即发生意外断电的次数。

C1(193)磁头加载/卸载计数Load/UnloadCycleCount 

对于过去的硬盘来说,盘片停止旋转时磁头臂停靠于盘片中心轴处的停泊区,磁头与盘片接触,只有当盘片旋转到一定转速时,磁头才开始漂浮于盘片之上并开始向外侧移动至数据区。

这使得磁头在硬盘启停时都与盘片发生摩擦,虽然盘片的停泊区不存储数据,但无疑启停一个循环,就使磁头经历两次磨损。

所以对以前的硬盘来说,磁头起降(加载/卸载)次数是一项重要的寿命关键参数。

而在现代硬盘中,平时磁头臂是停靠于盘片之外的一个专门设计的停靠架上,远离盘片。

只有当盘片旋转达到额定转速后,磁头臂才开始向内(盘片轴心)转动使磁头移至盘片区域(加载),磁头臂向外转动返回至停靠架即卸载。

这样就彻底杜绝了硬盘启停时磁头与盘片接触的现象,西部数据公司将其称为“斜坡加载技术”。

由于磁头在加载/卸载过程中始终不与盘片接触,不存在磁头的磨损,使得这一参数的重要性已经大大下降。

这个参数的数据值就是磁头执行加载/卸载操作的累计次数。

从原理上讲,这个加载/卸载次数应当与硬盘的启停次数相当,但对于笔记本内置硬盘以及台式机新型节能硬盘来说,这一项的数据量会很大。

这是因为磁头臂组件设计有一个固定的返回力矩,保证在意外断电时磁头能靠弹簧力自动离开盘片半径范围,迅速返回停靠架。

所以要让硬盘运行时磁头保持在盘片的半径之内,就要使磁头臂驱动电机(寻道电机)持续通以电流。

而让磁头臂在硬盘空闲几分钟后就立即执行卸载动作,返回到停靠架上,既有利于节能,又降低了硬盘受外力冲击导致磁头与盘片接触的概率。

虽然再次加载会增加一点寻道时间,但毕竟弊大于利,所以在这类硬盘中磁头的加载/卸载次数会远远大于通电周期计数(0C)或启停计数(04)的数据量。

不过这种加载/卸载方式已经没有了磁头与盘片的接触,所以设计值也已大大增加,通常笔记本内置硬盘的磁头加载/卸载额定值在30~60万次,而台式机新型节能硬盘的磁头加载/卸载设计值可达一百万次。

C2(194)温度Temperature 

温度的数据值直接表示了硬盘内部的当前温度。

硬盘运行时最好不要超过45℃,温度过高虽不会导致数据丢失,但引起的机械变形会导致寻道与读写错误率上升,降低硬盘性能。

硬盘的最高允许运行温度可查看硬盘厂商给出的数据,一般不会超过60℃。

不同厂家对温度参数的当前值、最差值和临界值有不同的表示方法:

希捷公司某些硬盘的当前值就是实际温度(摄氏)值,最差值则是曾经达到过的最高温度,临界值不具意义;

而西部数据公司一些硬盘的最差值是温度上升到某值后的时间函数,每次升温后的持续时间都将导致最差值逐渐下降,当前值则与当前温度成反比,即当前温度越高,当前值越低,随实际温度波动。

C3(195)硬件ECC校正HardwareECCRecovered 

ECC(ErrorCorrectingCode)的意思是“错误检查和纠正”,这个技术能够容许错误,并可以将错误更正,使读写操作得以持续进行,不致因错误而中断。

这一项的数据值记录了磁头在盘片上读写时通过ECC技术校正错误的次数,不过许多硬盘有其制造商特定的数据结构,因此数据量的大小并不能直接说明问题。

C3(195)实时无法校正错误计数OntheflyECCUncorrectableErrorCount 

这一参数记录了无法校正(UECC)的错误数量。

C3(195)编程错误块计数ProgramFailureblockCount(Indilinx芯片)

C4(196)重映射事件计数ReallocetionEventsCount 

这个参数的数据值记录了将重映射扇区的数据转移到备用扇区的尝试次数,是重映射操作的累计值,成功的转移和不成功的转移都会被计数。

因此这一参数与重映射扇区计数(05)相似,都是反映硬盘已经存在不良扇区。

C4(196)擦除错误块计数EraseFailureblockCount(Indilinx芯片) 

在固态硬盘中,这一参数记录了被重映射的块编程失败的数量。

C5(197)当前待映射扇区计数CurrentPendingSectorCount 

这个参数的数据表示了“不稳定的”扇区数,即等待被映射的扇区(也称“被挂起的扇区”)数量。

如果不稳定的扇区随后被读写成功,该扇区就不再列入等待范围,数据值就会下降。

仅仅读取时出错的扇区并不会导致重映射,只是被列入“等待”,也许以后读取就没有问题,所以只有在写入失败时才会发生重映射。

下次对该扇区写入时如果继续出错,就会产生一次重映射操作,此时重映射扇区计数(05)与重映射事件计数(C4)的数据值增加,此参数的数据值下降。

C5(197)读取错误块计数(不可修复错误)ReadFailureblockCount(Indilinx芯片)

C6(198)脱机无法校正的扇区计数OfflineUncorrectableSectorCount 

这个参数的数据累计了读写扇区时发生的无法校正的错误总数。

数据值上升表明盘片表面介质或机械子系统出现问题,有些扇区肯定已经不能读取,如果有文件正在使用这些扇区,操作系统会返回读盘错误的信息。

下一次写操作时会对该扇区执行重映射。

C6(198)总读取页数TotalCountofReadSectors(Indilinx芯片)

C7(199)UltraATA访问校验错误率UltraATACRCErrorRate 

这个参数的数据值累计了通过接口循环冗余校验(InterfaceCyclicRedundancyCheck,ICRC)发现的数据线传输错误的次数。

如果数据值不为0且持续增长,表示硬盘控制器→数据线→硬盘接口出现错误,劣质的数据线、接口接触不良都可能导致此现象。

由于这一项的数据值不会复零,所以某些新硬盘也会出现一定的数据量,只要更换数据线后数据值不再继续增长,即表示问题已得到解决。

C7(199)总写入页数TotalCountofWriteSectors(Indilinx芯片)

C8(200)写入错误率WriteErrorRate/多区域错误率Multi-ZoneErrorRate(西部数据) 

这个参数的数据累计了向扇区写入数据时出现错误的总数。

有的新硬盘也会有一定的数据量,若数据值持续快速升高(当前值偏低),表示盘片、磁头组件可能有问题。

C8(200)总读取指令数TotalCountofReadCommand(Indilinx芯片)

C9(201)脱道错误率OffTrackErrorRate/逻辑读取错误率SoftR

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 军事

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1