在拿到不良MB之时,请不要急于上电!应当先用眼睛仔细观察板面,有可能的话,用一块OK的MB比对着,看板面上的焊接情况以及零件的摆放状况(尤其是多件、错件、漏件和反件),因为很多Bug的产生都可以归功于这些
问题!有些仅仅是零件反件,由于Debug人员急于求成,把NGMB拿来就上电,导致了元器件损坏,从而要花好几倍的时间精力来Debug如果养成了EyesChecking这种习惯,则可以大大提高Debug的效率。
关于不显示和显示NG:
当试产MB在F/T被判为不显示时,往往仅是LCDPanel没有图像出现,并非MB的显示功能NG,例如CPU、RAM没插好也会导致此现象,所以:
不显示定义为当DebugCard跑过60H时,显示器始终没有画面出现;或者是由于某种原因使POST无法跑到60H。
显示NG指的是显示器上有画面出现,只是画面不清晰或者花屏;另外一个就是LCD、CRT、S-Video无法切换或者ErrorID等。
DisplayProblemDebugging
一、看Power是否OK;
用万用表量每一个PowerNet的对地阻抗,用良板作比对,则可以知道短路与否。有一个判断Power有没短路的最快捷的方法是使用PowerSupply,看其显示的电流值:
如果电流值偏大,则表示Power有短路,应立即移除ADP;用万用表量每一个PowerNet,看是哪个Net短路了;确定短路Net后,找到相关电路,将Bead一组组断开,直至找到短路的地方,然后将损坏的元器件更换。
如果电流值偏小,则表示有些Power没起来,依旧用万用表把它找出来。
有关Power方面的Debugging会在今后完成。
二、POST无法跑完造成的不显示;
(一)DebugCard的LED不亮;
在PowerOK的情况下,DebugCard的LED就会亮起来。如果不亮,可能是MiniPCI插槽或DebugCard本身的问题;还有可能是用了不兼容的CPU或RAM等,那样会导致LED不亮或者显示一些很古怪的符号。。。
(二)DebugCard显示FF(00);
DebugCard显示FF(00)表示CPU连第一道指令都没有去执行。
思路CPURST#<—>PLTRST#<—>PCIRST#
第一步:(请参考流程图及其解释)
去量CPU复位
信号CPURST#:如果OK,则跳到第二步,应该可以用万用表量到CPURST#的电压值有1.05V(Napa大概是1.5V);如果CPURST#量不到,则先在非BGA封装的PCIDeviceControllerPin脚上量PCIRST#:如果没有量到,则说明PCI总线上有问题,先
去看南桥的晶振、Clock信号、是否植过球(见下面的注释)以及怀疑其焊接问题,假如都OK,就要去一一断开每个PCIDevice与PCIRST#的连接,确定是哪个Device影响了PCIRST#;如果PCIRST#有量到,则去看
北桥复位信号PLTRST#有没从南桥发出:如没有发出,则依旧要看南桥本身的问题;如PLTRST#有发出,则看北桥有没收到。可以去量传送PLTRST#线路上连接北桥和南桥的电阻。如果北桥收到PLTRST#却没有发CPURST#,则需要去看北桥的晶振、Clock信号、是否植过球以及怀疑其焊接问题,排除这些问题之后,就跳到第二步。
注释:有时板子上BGAChip点了彩色的点,灰色的点表示Chip曾经被更换过,绿色或者红色的点则表示该Chip是工厂回收再利用的(经过重植球),极有可能本身就是坏的。点的颜色所代表的意思并非统一的,要看工厂怎么定。
第二步:
CPU本体OK,而且收到了CPURST#,DebugCard还是FF(00),则有可能是CPU或北桥的外围电路有问题,例如REF、TEST、COMP、CFG等。
CPUGTLREFandTEST
CPUCOMP[0,3]
North-BridgeH_VREF
North-BridgeStrapPin
North-BridgeH_XSCOMP/H_YSWING
另外一种可能是CPU和北桥之间的Data、Address信号沟通有问题,造成此问题的原因是CPUSocket、北桥或者PCBTrace的问题。(请参考流程图及其解释)
我们必须对HA#[3..31]和HD#[0..63]一一进行测量,来确定问题所在。这是一个处理起来很麻烦的问题,因为HA#[3..31]和HD#[0..63]一共有96根,而且万用表无法插入CPUSocket进行测量。所以,一种辅助工具——CPUPinSaver(Pin护套,见Figure.2),应运而生!
将CPUPinSaver插在Socket上,按照上面的标记(见Figure.3、4:Dothan或Celeron参考Figure.3的铅笔划的斜杠,Yonah参考Figure.4的大黑点A/D0.255V左右),测量HA#[3..31]和HD#[0..63]一共96个点的对地阻抗。(在这里,一般会把万用表打到测量二极体的那一档,用电压信号代替阻抗信号,因为这里的阻抗有时候不好显示出来。只要电压信号跟好板子的差不多就OK了。短路了电压就会很小,断路则没有电压。)如果量到CPUPinSaver某点对地短路了,则有可能BGA内有连锡了,先找到与该点相连的Via,再将CPUSocket吹下来,来确定是CPUSocket短路还是北桥短路;如果量到CPUPinSaver某点断路了,则表示有空焊了,需要去看该点和改点Net相对应Via,来确定是CPUSocket还是北桥空焊或者是PCB的Trace断裂。(见Figure.1,本人制作的关于CPU与NorthBridge之间HA#[3..31]/HD#[0..63]的走线示意图,以方便大家理解)排除这些问题之后,就跳到第三步。
Figure.1HA#[3..31]/HD#[0..63]FromCPUToNorth-Bridge
Figure.2CPUPinSaver(Pin护套)
Figure.3护套上代表HA#[3..31]和HD#[0..63]的孔都用铅笔连线作的标记
Figure.4YonahCPUSocketReference
第三步:
在CPU和北桥沟通正常的情况下,DebugCard显示FF(00),则要怀疑BIOS和EC了,因为FlashROM和EC是很容易出问题的器件。
首先看FlashROM;主要去看其VCC、VPP及其焊接情况,还有就是采用维修人员找到的一个简单的方法来判断其是否有故障,即:去量FlashROM的Pin4、Pin5、VCC和GND;FlashROM正常的情况下,Pin4会保持在0点几V,Pin5则为一长串3.3V的高电平信号,如果量到有不同,则需要刷新一次BIOS,如无法刷新,则更换FlashROM;如果量到VCC=0V,GND=3.3V,FlashROM在内部把高低电平倒置了,表明FlashROM可能曾经受到大电流的冲击,这时,也可以重新刷新BIOS,如无法刷新,则更换FlashROM。
Figure.4FlashROM
然后去看EC和南桥;观察EC的焊接情况,如果不佳,则使用烙铁加锡重新拖过一遍,然后,再去看EC和南桥在LPC上的沟通,即:量LAD0至LAD3,看是不是每根Pin上都有动作。如果不是,很有可能EC坏了;假如更换了EC后,还没有解决问题,就有可能是南桥的不良了,当然这个可能性相对EC来说会小很多。
Figure.5EC-97551LPCPin
(三)DebugCard显示停在一个ErrorCode上;
0A,28,2C,2E,38,E0
跟北桥、RAM、ClockGenerator、EC和BIOS有关。首先,去看RAM有没插好,多拔插几遍(用尽可能多的组合情况),看Code有无变化,若有变化,可能是BIOS程序被破坏,刷新BIOS试试;然后看Connector:是否NG(一根根Pin去量)和Pin脚的焊接情况;再去看RAM和北桥之间的上拉排阻(一个一个地量),将阻值不正常的更换掉;还有去看供给Connector的几组Power,看少了那组就去检查相应的Power电路;最后去量CLK_SDRAM0/CLK_SDRAM0#~CLK_SDRAM4,/CLK_SDRAM4#和SMBus上的SDATA/SCLK看有无动作,若没有动作,则尝试更换北桥或者ClockGenerator。若以上这些情况都排除了,则尝试更换北桥或者EC。
有时候BIOS资料丢失也可能跑38,重新刷新或者更换一颗新BIOS。
Figure.6OrcadReference
49
InitialPCIBusandDevice
跟南桥和每个PCIDevice都有关。首先量PCIRST#,如没有则按照之前的方法去找PCIRST#是南桥本身没有发出还是被某个PCIDevice拉掉了;再去看每个PCIConnector/Controller的Power、CLK、SMDATA/SMCLK以及焊接情况;然后去看PCIDevice相对应的E2PROM;以上都OK,则怀疑EC和BIOS。
69
InitializetheSMMhandler
SM模式控制器初始化,跟CPU本体有关,有可能是CPU被损坏了,可以尝试更换另一颗CPU。
88
88有时也会造成不显示,跟南桥、EC和BIOS有关。主要去Check南桥和EC沟通的几个Pin上的讯号,例如看LAD0~LAD3上是否有动作,如果没有则去判断是南桥还是EC的问题(一般南桥出问题的几率会大一些);如果有动作,则怀疑是不是BIOS没刷好、FlashROM没焊好或损坏。
Figure.7LPC
DA
跟VGA和GM北桥有关。首先去看VGA的Power、晶振、Clock信号、是否植过球以及怀疑其焊接问题,再去CheckPM北桥和VGA之间传输PCI-EXPRESSTXN/TXP讯号的电容,最后Check北桥端。
对于GM北桥,问题比较单纯,不是北桥自身问题就是其外围电路问题。
Figure.8-1PCI-ETXN/TXP
Figure.8-2GMNorth-bridgeREFSET
三、POST到C0以后的不显示和显示不良;
(一)不显示;
ErrorCodeC0后的不显示,一般为Cable没插好、Connector本身不良或是电源没有供给:
1.只有LCD不显示,检查LCDConnector,量DISP_ON和LCDVCCPowerSwitch电路:
2.只有CRT不显示,检查CRTConnector,量CRTVDD:
(二)无背光;
如果LCD可隐约看到影像,那是背光模组出了问题。背光模组和LCD显像模组是独立的两个部分。LCD内部会有CCFL灯管负责发光,系统透过Inverter将直流电压转成灯管所需的1000V左右的高压交流电。Inverter只用到5根pin:Vin、On/Off、Brightness、5V以及GND,首先应先去量这几根Pin,看是否有异常。没有背光除了有可能是LCD本身或Inverter损坏之外,也有可能是主板上的Lidswitch损坏造成背光被关掉。
Figure.9LidSwitch
(三)花屏或画面闪烁;
有时显示画面会花掉,造成花屏的原因有可能是VGA内寄存器地址数据发生错乱或者受到其他干扰。可先判断CRT或LCD是否有同样的问题:
如果CRT和LCD有相同的显示,可能是VGA本身不良或VGAMemory部分有问题。当记忆体的资料损毁时,CRT、LCD及TV的显示都会有问题;E2PROM里V-BIOS程序有误,也是造成花屏的原因。
如果只有CRT出现花屏或闪烁,先去量CRT的水平同步HSYNC及垂直同步VSYNC讯号,看CRTConnector端的CRT_HS/CRT_VS是否有输出。如果没有输出,则可能Connector本身不良或者是在VGA到CRTConnector之间的某个部分出了问题。
如果只有LCD花屏,可先确定LCDCable本身是否不良或没有插好,再检查板子上LCDConnector是否焊好,然后去CheckVGA端LVDS相关的讯号。
(四)颜色不对;
有时候CRT会出现颜色不对,因为CRT的三原色RED,GREEN,BLUE讯号有缺失。可以根据三原色示意图去判断缺少了什么颜色,然后去Check相应的线路:
Figure.10PrimaryColors
(五)Run3DShutDown或者花屏;
VGA/北桥空冷焊/连锡、VGAPower储能滤波电容漏件或损坏、V-BIOS没刷好等