主机板的故障定位与维修方法Word格式文档下载.docx
《主机板的故障定位与维修方法Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《主机板的故障定位与维修方法Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
因為這些芯片一般都是專利產品,其他廠家不能隨便仿制出售。
而且即使費盡周折能找到芯片的供應商,對于這些芯片組件,銷售商一般只按套片銷售,因為這比較符合主板生產廠家的要求,但是對于維修部門來說,無疑會大大提高維修成本。
另外,那些專用可編程門陣列器件,無論購買還是測試,都存在較大的困難。
2、維修工具成本提高
目前主板上焊接的大規模集成電路芯片,普遍采用表面安裝設計SMD(SurfaceMountedDesign)
技朮,采用這種技朮的主板上面的芯片需要昂貴的焊接與脫焊設備才能進行焊接和拆卸。
因為采用SMD工藝的芯片一般都是具有數百個引腳的、并且是采用PQFP(PlasticQuadFlatPackage,塑料方型 扁平封裝)或BGA(BallGridArray,球型柵網陣列)封裝的超大規模IC,對于維修人員來講,無論是焊接方法和焊接技朮與過去都有很大的不同,過去適用于小規模集成電路的烙鐵加吸錫器方式已經落后,為了適應SMD主板的焊接與脫焊的需要,不得不更換為表面焊接設備多種型號芯片的焊接模塊,這又增加了資我的投入。
而且值得注意的是,由于芯片來源困難以及SMD技朮的應用,使行之有效的芯片替換法越來越不實際,實現起來也越來越困難。
3、要求更高檔次的測試設備
如果說過去使用萬用表,邏輯筆和示波器還能應付大多數是中小規模集成電路組成的主機板的
維修工作的話,那么在已經廣泛使用超大規模芯片的今天,再維持原來的工作恐怕是不可能的。
道理很明顯,輸入輸出信號之間的關系不再像中小規模集成電路那樣僅滿足一種與或非的邏輯關系,或者一般性的觸發、鎖存的時序關系。
輸入輸出之間的邏輯、時序關系更加復雜,有些還要受編程控制,這樣復雜的電路、復雜的信號,必須要提高測試設備的檔次才能滿足,而這些新設備一般涉及到微機診斷設備、邏輯分析儀、在線測試儀等較高檔的診斷工具,有時還要根據情況交替使作上述設備方可進行有效的診斷和測試工。
但是對這些設備的投資很大,如果沒有大量的維修業務給予支持的話,將會大大降低投資效率,同時使維修成本大大提高。
這些困難對于一般的維修單位理騅以克服的。
此外,目前流行的各種主板(如586以上的主板),很難找到齊全的電路資料,這也給維修工作帶來一定的困難。
綜上所述,隨著計算機技朮的發展,使計算機維修業也面臨嚴重的挑戰。
也許你是世界上最好的維修工程師,但你也無法修理損壞了的ASIC芯片,如果你既修不了又習不到已被確?
損壞的芯片,那么,除了更換整塊主板外已別無它法。
然而,對PC的故障檢測與定位仍具有一定的實際意義,因為通過對PC的故障檢測與定位可以盡快地找到故障部位,并尋求一種合理的解決方法,以便在較短的時間內,以最低的維修成本修復機器,使之恢復正常的工作。
隨著計算機的日益普及、PC的社會搖籃有量趁此機會來趁此機會大,所面臨的維修任務更加艱巨,因此掌握正確的維修方法和技朮手段,仍然具有很重要的現實意義。
7.1.2 PC系統故障的分類
近年來,雖然人們對PC系統的故障分類說法不一,但仍然沒有實質性的差別。
概括而言,一般有2種分類方法:
一種是按歸類與抽象的方法划分,另一種是按物理性質划分。
按歸類和抽象的方法可分為單點故障和多點故障兩大類。
單點故障是指計算機系統的故障在同一時刻是由一個故障點引起的。
而多點故障是指系統故障是由一個以上的故障點組成或引起的。
這樣后者要比前者復雜得多,排除后者的故障時要比前者困難得多。
但是根據維修實踐的統計,計算機發生的故障大都為單點故障,一般單點故障占發生故障的85%左右。
如果按故障的物理性質划分,又可划分為多種類型。
下面就對各種故障類別進行簡要的討論。
1、按故障的影響范圍分類
根據故障對計算機系統的影響范圍可分為局部性故障和全局性故障。
若按故障的相互影響或故
障本身的牽連關系,又可分為獨立性故障和相關性故障。
(1)局部性故障與全局性故障
局部性故障指系統某一個或几個功能運行不正常,如主板上打印控制芯片損壞,僅造成聯機不
打印或打印不正常,并不影響其他功能﹔即局部性故障只影響系統的一個或部分功能,只對局部系統(或子系統)產生影響,這樣系統仍可完成其他的功能,一般它不會影響全系統的正常運行。
而全局性故障往往影響整個系統的正常運行(如死機),使系統無全不能工作或使整個計算機系統喪失全部正常運行的功能。
例如時鐘發生器損壞將使整個系統因無正常基准時鐘而癱瘓。
(2)獨立性故障與相關性故障
獨主性故障指系統中完成某單一功能的芯片(或元器件)損壞,如主板上某一塊RAM芯片損壞,
僅影響對該存儲體的存取。
獨立性故障一般只影響到一個局部,不會由此造成別的故障。
相關性故障指一個故障與另外一些故障相關聯,其故障現象為多方面功能不正常,相關性故障發生后,一般會導致其他一個或几個部分功能無法正常工作,它們相互關連,又相互包含,其故障實質為控制諸功能的共同部分出故障引起。
例如軟、硬盤子系統工作均不正常,而軟硬盤控制接口呂其功能控制較為獨主,故障往往可能在主板上拓外設數據傳輸控制即DMA控制電路。
相關性故障判斷和定位造成了較大的困難。
按這種故障的划分方法,局部性故障和獨立性故障占故障發生總數的70%左右。
2、按故障的持續時間分類
根據故障發生的持續時間不同可分為蜇時性故障(或不穩定性故障)、永久性故障(或穩定性故
障)和臨界性故障。
(1)暫時性故障又稱間歇性故障或不穩定性故障或可恢復故障,它往往是由于接觸不良、元器
件性能變差,使芯片邏輯功能處于時而正常、時而不正常的臨界狀態而引起。
有時是指元器件由于環境條件因素(如溫度、濕度、塵埃、靜電等變化以及工作電壓、電網干擾、電磁沖擊、外界振動沖擊、接口電纜和插件板之間的接觸問題等原因)所引發的故障,具體表現在元件工作不穩定,或者因邏輯電平發生錯亂而引起功能錯誤。
如系統板上I/O插槽變形且灰塵較多,造成顯示卡與該插槽接觸不良,使顯示呈變化不定的錯誤狀態。
這類故障的特點是持續時間短,承受機性強,有時往往不需要人工就能自動恢復正常工作。
這是一種時隱時現的隨機故障,因而當頻度較低時,較難檢測定位,遇到這類故障時,應根據實際情況,使用相應的診斷方法,如采用指令重復執行或程序回歸的方法檢測等。
(2)永久性故障又稱為固定性故障或穩定性故障或不可恢復性故障。
永久性故障是由于元器件
失效,電路中存在短路、開路、機械損傷等物理性損壞而引起的故障,其故障現象可穩定重復出現、是固定性的,若不采取系統診斷與測試定位、進行人為干預排除與修復,設備(或系統)就不能正常工作。
(3)臨界性故障
臨界性故障又稱為邊緣故障,它是指由于材料缺陷、制造工藝不良及元器件篩選不良或不滿足
正常要求等原因,使系統在較惡劣的環境下工作或隨著使用時間的增長使元器件參數逐漸變壞、系統性能下降,以致逐漸損壞,最終故障的結果將導致永久性故障,在這個過程中引起的故障稱為臨界性故障。
臨界性故障在某些情況下與暫時性故障的表現形式相似,但它們的性質是不同的。
前者是因為元器件性能變差或其他先天不良的因素引起的故障,隨著時間的推移,臨界性故障大都會發展成為永久性故障,而暫時性故障的元器件及先天因素都正常,只是因為某種暫時性的特殊原因,造成了瞬間的功能故障,在此之后,還可自動恢復正常工作。
按上述故障的划分,永久性故障約占故障總數的90%左右。
3、按故障性質和產生來源分類
在此大類中,可分為硬件故障、軟件故障、固件故障、元器件故障等。
(1)硬件故障
硬件故障是指由于機器或部件的某些部位受到物理失效、損壞或電氣參數偏離允許值范圍所造
成的故障。
這類故障按故障性質又可分為邏輯故障和參數故障二種。
邏輯故障是指邏輯電路輸入和輸出信號間邏輯關系不正常的故障。
計算機的故障診斷理論基本上是以邏輯故障為前題的。
參數故障論基本上是以邏輯故障為前題的。
參數故障是因為器件參數偏離(如主頻變化引起時鐘錯誤、觸發器等電路偏差引起的時序錯誤、電壓、電流偏差引起的電源泉錯誤等)而引起的。
另外,硬件故障還可以接其發生的來源泉或部位分為器件故障、機械故障、介質故障、電源故障、總線故障和人為故障几大類。
硬件故障一般需要改變或修改硬件才能完成修復工作。
電源故障包括主板上正負12V、正負5V及正負3.3V電源和PowerGood信號故障﹔總線故障包括總線本身故障和總線控制權產生的故障﹔元件故障則包括電阻、電容、集成電路芯片及其他元部件的故障。
(2)軟件故障
軟件故障一方面包含了由于軟件本身設計不完善(即軟件本身)的潛在錯誤,這種錯誤是軟件開
發和維護階段引入的,如計划階段對軟件需求描述不完善或描述錯誤,開發階段由于人的活動和通信存在缺陷、選擇方法和工具不當及測試不完全,維護階段又引入了新的錯誤等。
現代計算機系統和應用軟件越來越多樣化、復雜化,這種故障只能在軟件設計中不斷更新和完善才能得到解決。
例如Microsoft(微軟)公司每一次發布的Windows操作系統版本都在不同程度上存在許多BUG(故障),而每次的解決辦法就是不斷地發布“補丁”程序來進行解決。
軟件故障的另一方面包含了計算機病毒故障。
目前計算機病毒到處橫行泛濫,嚴重破壞了計算
機各類的軟件的正常運行,這種故障雖然也可用消毒軟件或防毒軟件等預防與解決,但由于病毒的隱蔽性與多樣化,使得對其產生和發展趨勢很難預測和估計。
這種故障有時也可以歸類為人為故障。
軟件故障的特點是機器未受到物理損壞。
一般來說,排除軟件故障應仔細閱讀軟件說明書,注意軟件的運行環境,(如CPU、內存、顯示分辨率等)并檢查是否是由病毒引起的。
軟件故障一般可以在不改變硬件的條件下,通過運行某些程序,即采用的方法加以解決。
有時軟件故障與的故障所表現出來的現象是相同的,并且有時軟件的設置和使用不當也可加快(或造成)硬件的損壞。
因此維修人員要善于區分這兩類故障。
一般來說,硬件故障和病毒故障約占故障總數的90%左右。
(3)固件故障
固件(Firmware)故障是介于硬件、軟件故障之間的一種形式,它多數是由于固化在可編程硬件
電路器件(如:
可編程控制器PLC、EPROM、FlashROM等)之中的軟件受到破壞或器件本身故障引起的,這種故障既可能引起硬件故障,也可能引起軟件故障。
而且有病毒故障也會造成固件故障,例如,曾經以破壞用FlashROM用為載體的BIOS程序為目的的CIH病毒就會造成固件故障,使BIOS程序遭到破壞,進一步引起系統癱瘓。
(4)機械故障
機械故障實際上也是一種硬件故障,它是由于一些采用機電裝置的外部設備中的機械裝置的松
動、卡死、偏位、磨損、變形和折斷等引起的故障,這類故障通常受使用環境(如溫度、濕度、灰塵等因素)的影響,機器自身也難以完全避免出現機械故障。
例如軟盤驅動器磁頭定位系統出現偏差,鍵盤按鍵失效、打印機的走紙電機或字車電機卡死、針式打印機的打印針折斷等故障都是這類故障的典型例子。
隨著這些設備使用時間的加長,發生這些故障也屬正常現象。
這類故障一般需要通過機械中整,更換電機、打印針等相應措施才能解決。
而對于屬于純電子產品的主板,一般很少有機械故障產生。
(5)人為故障
人為故障既可以造成硬件故障也可以造成軟件故障。
人為故障一般指操作或維護人員動作錯誤或操作不當,使機器某些部件損壞或使機器不符合運行環境的要求而造成某些重要信息丟失等因素造成的故障,如扳錯開關、接錯鍵、裝錯位置、帶電拔插板卡、硬盤運行時突然關掉電源等。
人為故障的另一方面是故障編制或無意引入病毒程序。
避免這種故障沒有別的辦法,只能建立嚴格的可行的規章制度,并對操作人員進行一定的計算機維護知識方面的訓練,使之養成良好的操作習慣。
而對程序人員則應有良好的職業道德,不去編制、傳播計算機病毒程序。
(6)器件故障
器件故障也是屬于硬件故障。
它主要是由元器件、接插件和印制板電路等老化、失效、虛焊、
脫榮譽稱號、斷路或短路等引起的故障。
例如旁路電容造成電源負荷過重產生電源故障,器件參數漂移造成PC系統工作不穩定,集成路邏輯功能失效造成電腦功能錯誤,主板I/O通道(擴展總線插槽)接插件的簧片相碰或斷裂造成系統總線出錯,插件板、集成電路芯片接觸不良使設備無法工作,印制電路板虛焊造成線路接觸不良等等。
器件故障按其系統功能的不同又分為電源故障、總線故障、關鍵性故障和非關鍵性故障。
(7)介質故障
這類故障主要是由于軟盤或硬盤等存儲介質損傷導致引導信息丟失或其他重要數據丟失或損
壞,磁道划傷或磁盤霉變等造成的故障。
上述故障分類與划分的方法都是基于不同的出發點。
如果根據故障的症狀以及發生的故障的部位又可以分為系統主板故障、軟盤驅動器子系統(包括軟盤控制器、軟盤驅動器和軟盤片三部分)故障,硬盤子系統(包括硬盤控制接口和硬盤驅動)故障,顯示子系統(包括顯示接口卡和顯器)故障,以及鍵盤、鼠標、打印機、光盤驅動器(如CD-ROM光驅、DVD-ROM光驅等)、掃描儀等其他外設的故障,當然這些故障也都是屬于硬件故障。
由于硬件故障在計算機的維修當中占有相當大的比重,而且我們平常所指的計算機維修內容主要涉及到硬件維修,因此,本章主要針對與主板有關的硬件故障進行討論介紹其診斷測試及故障定位方法。
7.1.3 主機板故障的特點
主板是計算機系統中的一個最關鍵的部件,是整個計算機系統的心臟。
主板產生故障將會波及和影響整個計算機系統的工作。
若主板產生致命性的故障或其部分功能模塊失效,都會引起系統癱瘓或系統部分功能失效。
因此,當遇到一台出現故障的計算機,尤其是顯示器沒有任何顯示。
錯誤信息無法提示的情況下,應首先考慮并判斷是否是主板出了問題,而且進一步分析是主板的哪部分出了問題而造成系統故障。
主板常見的故障現象有:
開機加電無顯示、揚聲器無聲、鍵盤不起作用、磁盤驅動器不能引導等。
但就故障的性質的范圍來說仍然可划分為四大類:
電源故障、總線故障、關鍵性故障和非關鍵性故障。
下面簡要分析這几類故障產生的原因及特點。
1、電源故障
PC的電源一般均為無工頻變壓器的4路(AT結構為正負5V和正負12V)或5路(ATX結構還增
加了一路3.3V的電源)開關穩壓電源,286~486PC使用的電源功率一般為150~230W,而586以上的PC使用的電源功率一般為230~300W,它們均安裝在機箱內部,為主板、軟盤驅動、硬盤、光驅、各種選插件和鍵盤提供穩定的直流電源。
所有電源均帶有過壓和過載保護,若在使用中發直流過壓和過載故障,一般電源會自動關閉直至故障排除為止。
交流輸入則采用了簡單的過流保護措施。
PC電源共有4路或5路直流電壓輸出。
其中正5V是向主板、主板上的各種選插件、軟盤驅動器、硬盤、光驅、各種選插件和鍵盤等供用,正12V主要是向軟硬盤驅動器、光盤驅動器等部件供電,負5V用于某些擴展卡上的鎖相式數據分離電路,負12V用于為異步通信適配器提供EIA接口電源,3.3V主要為主板上的168線SDRAM內存以及PCI總線提供直流電源。
PC電源有一個特殊的輸出信號,稱為“PowerGood”(電源好)或“PG”信號。
PG信號在電源開啟后不是馬上輸出的,而經過一段時間(約100~500ms)的延時后才輸出的。
這是一個與TTL電平兼容的信號。
它由各直流輸出電壓檢測信號和交流輸入電壓失效信號邏輯與而獲得,當電源正常工作時為高電平,在故障情況下為低電平,故稱其為“電源好”信號。
當發生電源故障時,可能的原因是電源的直流輸出電壓中的任何一路無輸出或PG信號失效而引起主板無法正常工作,也可能是電源被燒壞等情況,最簡單的解決辦法是更換PC電源。
2、總線故障
總線是連接計算機各部件的一組公共信號線。
不同的總線通過總線緩沖器連接起來。
按總線的
功能和特征,可將總線分為局部總線(或CPU總線)、存儲總線、I/O通道總線和外圍接口總線4類(或4個層次)。
每類總線又分為地址總線、數據總線和控制總線三種。
地址總線和控制總線上的信號總是由執行總線操作的主設備產生奪,CPU可控制總線,其他總線主控器(如DMA控制器)也可以控制總線。
數據總線是為各部件之間提供數據傳送的通路。
在總線上只有在和某一時刻的命令控制信號組合起來,方有特定的含義。
因此只有了解總線結構才容易理解數據來自哪一級總線,發向哪一級總線,哪一級總線上連接了哪些設備,這些設備在某一時刻在干什么工作。
把主板的結構分成若干層次的總線能簡化對部件的控制,CPU 是通過總線完成各設備之間的數據交換。
總線上所涉及的器件和設備很多,但是總線故障主要表現在兩個方面:
(1)總線本身的故障
在各類總線中,任何一級總線的數據線、地址線和控制命令線出現故障,CPU就不可能在取指
令總線周期中讀取正確的指令碼,從而使以后CPU的執行失敗。
(2)總線控制權錯誤引起的總線故障
由于CPU內部一般設有總線仲裁機構,為滿足系統對多主控模塊爭用總線控制權的需要,在
總線接口中一般配備有總線控制器模塊。
此外,還有其他總線主控器(如DMA控制器)可以取得總線控制權,如果這些總線主控器及相關電路發生錯誤也會引起總線故障。
總而言之,總線故障主要是由于處理器模塊損壞域系統總線主控故障,擴充總線故障或擴充總
線驅動器故障,總線響應邏輯以及總線等待邏輯電路錯誤,總線通道上的一些鎖存、驅動等電路故障等各種因素引起的。
在分析總線故障時,應該從總線的相互關系以及總線控制權的交換出發,掌握排除總線故障的各種檢測方法,這樣遇到其他各種總線故障就比較容易排除。
3、關鍵性故障
主板上的CPU芯片、ROMBIOS芯片、定時器模塊、主板電路模塊、數據收發邏輯電路DMA
控制器及基本的16KBRAM存儲器部件(或DRAM內存條)以及DRAM刷新電路是系統運行的關鍵部件,一旦這些器件(或電路模塊)出現故障,將使整個系統陷于癱瘓。
在加電自檢(POST)程序中,首先對這些部件檢查,如果這些部件出錯就作為關鍵性故障。
一般以初始化顯示器子系統為界,在此以前出現的故障為關鍵性故障,這時屏幕無任何顯示,只有喇叭發出“嘟嘟”聲。
出現關鍵性故障時,系統不能繼續啟動(引導)。
ROMBIOS的POST程序對關鍵性故障以前的測試和處理過程如下:
第一步:
檢查CPU各標志位、寄存器和條件轉移。
中斷禁止,設置CP各標志位,用全“0”和全“1”順序檢查各寄存器,若標志位不能置位或清零,數據模式不能通過各寄存器,則轉入停機。
第二步:
對ROMBIOS校驗和測試,對ROMBIOS芯片測試和校驗若出錯則系統停機。
第三步:
對定時器械模塊和DMA控制器模塊中的寄存器初始化和測試,叵出錯轉入停機。
第四步:
執行基本DRAM測試,若出錯則轉入停機。
因此,出現關鍵性故障時應檢查CPU是否工作,而CPU工作的基本條件一般有3個:
CPU的時鐘信號(CLK)是否滿足要求﹔CPU復位信號(RESET)在開機時是否有一個明顯的正脈沖READY信號是否符合規定的電平。
此外,再檢查CPU芯片本身、ROMBIOS芯片及基本的存儲器。
AMIBIOS自檢時報警聲及其含義
“嘟”聲的次數 錯誤的含義
1 內存刷新失敗,主板的DRAM刷新電路故障。
2 奇偶校驗錯誤:
檢測出系統基本內存(第一個64KB)出現奇偶校驗錯誤。
3 基本64KB內存失敗一個64KB基本內存檢查失敗
4 時鐘失效:
主板上的Timer#1(第一號定時器)不工作。
5 處理器錯:
主板上的CPU產生錯誤
6
8042-門A20故障:
鍵盤控制器(8042)中包含有A20門開關,它可以使CPU按
實時或保護模式操作,該錯誤意味著BIOS不能把CPU切換為保護模式。
7 處理器例外中斷錯誤:
主板上的CPU產生一個例外中斷
8 顯示內存讀/寫錯誤:
顯示卡上無顯示內存或顯示錯誤
9 ROM檢查失敗:
ROM校驗和的值與BIOS中的記錄值不一致。
10 CMOS寄存器讀/寫錯誤:
CMOSRAM中的Shutdown寄存器故障。
11
Cache錯誤/外部Cache損壞:
表示外部Cache故障。
對于關鍵性故障,主要是根據機器所發出的“嘟嘟”報警聲次數來判斷故障的大致部位。
喇叭所發出的“嘟嘟”聲所代表的含義對于不責罵廠家的BIOS可能會有所不同,上表為AMIBIOS自檢時報警聲表示的錯誤含義。
4、非關鍵性故障
POST程序檢查完關鍵部件無誤之后,系統具備了最基本的運行條件,便可以對其他擴充部件
進行診斷和測試。
這些部件包括高端的內存DRAM芯片,顯示適配器(或顯示卡)、中斷控制器、鍵盤控制器、軟、硬、盤子系統、串/并行接口控制等,若檢測到這些部件有錯或故障,則稱為非關鍵性故障。
出現非關鍵性故障時顯示器還能顯示,這樣會將這些非關鍵性錯誤(故障)有的關信息顯示在屏幕上,這樣有利于根據出錯信息的提示來判斷故障的部位。
一般情況下,非關鍵性故障出現后,可允許系統繼續啟動。
非關鍵性故障的錯誤信息在屏幕上常以下列格式出現:
ERRORMessageLine1(錯誤