HIS的應(yīng)用為大大提高醫(yī)院的工作效率。隨著醫(yī)院業(yè)務(wù)的發(fā)展,HIS的規(guī)模越來(lái)越大,出現(xiàn)問(wèn)題的環(huán)節(jié)也越來(lái)越多,本文介紹一例交換機(jī)故障的分析處理過(guò)程。
某工作站A報(bào)告客戶端程序錄入數(shù)據(jù)確定后報(bào)錯(cuò),重啟動(dòng)后不能登錄網(wǎng)絡(luò)。
由于只預(yù)留一條線路,工作站A和B通過(guò)集線器(HUB)連接二級(jí)交換機(jī)。根據(jù)實(shí)際情況,采取如下措施:從工作站A點(diǎn) ping本身和工作站B點(diǎn)均通,排除HUB和A、B點(diǎn)之間的故障;ping服務(wù)器和其它工作站均不通,重做HUB和交換機(jī)間網(wǎng)線兩端水晶頭,故障依舊;用測(cè)線器測(cè)量HUB交換機(jī)的網(wǎng)線,線路暢通;于是將問(wèn)題鎖定在交換機(jī)上,連接到該交換機(jī)的其他工作站均能正常工作,將問(wèn)題焦點(diǎn)轉(zhuǎn)移到交換機(jī)的端口上,與HUB相連的交換機(jī)端口指示燈不亮,是不是該端口關(guān)閉或者堵塞了呢?我們知道交換機(jī)上的端口狀態(tài)分為五種:關(guān)閉、阻塞、偵聽(tīng)、學(xué)習(xí)和轉(zhuǎn)發(fā),前四種狀態(tài)時(shí)都不接收用戶數(shù)據(jù)。由于交換機(jī)的端口已經(jīng)滿,沒(méi)有剩余的的端口可替換,只能先讓一工作站C暫停使用計(jì)算機(jī),然后將與HUB相連的網(wǎng)線接入C所使用的交換機(jī)端口,A和B能正常工作,現(xiàn)在可確定與HUB相連的交換機(jī)端口出現(xiàn)故障;由于工作時(shí)間不能重啟交換機(jī),只能暫時(shí)增加一個(gè)HUB擴(kuò)展端口來(lái)解決問(wèn)題。到了休息時(shí)間,將A點(diǎn)網(wǎng)線接入原先端口,交換機(jī)斷電后重啟,5分鐘后,問(wèn)題端口正常閃亮,通信正常,問(wèn)題解決。
我們知道,交換機(jī)相當(dāng)于相當(dāng)于一臺(tái)計(jì)算機(jī),收到數(shù)據(jù)包以后,處理端口會(huì)查找內(nèi)存中的MAC地址對(duì)照表,以確定目的MAC的網(wǎng)卡掛接在哪個(gè)端口上;通過(guò)內(nèi)部交換矩陣直接將數(shù)據(jù)迅速包傳送到目的節(jié)點(diǎn);目的MAC若不存在才廣播到所有的端口。交換機(jī)端口發(fā)生堵塞的原因有許多,例如網(wǎng)橋協(xié)議數(shù)據(jù)單元(BPDU)錯(cuò)誤、端口配置錯(cuò)誤、DHCP速率限制、光線接口GBIC故障、協(xié)議通道錯(cuò)誤、產(chǎn)生回路、廣播風(fēng)暴等。
分析這次故障產(chǎn)生的原因:在100M網(wǎng)絡(luò)中就要盡量減少使用HUB,但是由于建設(shè)時(shí)預(yù)留線路不足,不得不用HUB來(lái)擴(kuò)充端口;一些網(wǎng)卡經(jīng)常在10/100M自適應(yīng)下通信時(shí)斷時(shí)續(xù),將其降為10M全雙工就能正常工作;經(jīng)過(guò)Sniffer數(shù)據(jù)分析,發(fā)現(xiàn)網(wǎng)絡(luò)中有大量的廣播數(shù)據(jù)。結(jié)合以前的情況,可推斷在交換機(jī)、HUB和計(jì)算機(jī)之間產(chǎn)生局部廣播風(fēng)暴堵塞了交換機(jī)的一個(gè)端口。重啟交換機(jī)后,端口可恢復(fù)初始狀態(tài)。
最后要說(shuō)一點(diǎn),日常工作中故障診斷的順序是:用戶感知到網(wǎng)絡(luò)性能下降后告知網(wǎng)絡(luò)中心,網(wǎng)絡(luò)管理員從故障接入點(diǎn)開(kāi)始做故障診斷,這種方法完全是被動(dòng)的。理想的方法是使用主動(dòng)性、前瞻性地監(jiān)測(cè),定期地查詢每個(gè)交換機(jī)、監(jiān)測(cè)每個(gè)交換端口的流量、流量的趨勢(shì),同時(shí)檢測(cè)其他的相關(guān)網(wǎng)段,早期發(fā)現(xiàn)異常數(shù)據(jù)現(xiàn)象,預(yù)防故障的發(fā)生。