黃明亮
摘要:SKYNET-X空管自動(dòng)化系統(tǒng)包括多種類型的節(jié)點(diǎn),每種類型節(jié)點(diǎn)所需的系統(tǒng)環(huán)境,網(wǎng)絡(luò)配置,驅(qū)動(dòng)等均有所差異,人工安裝操作系統(tǒng)不僅工作量巨大且極易出錯(cuò)。我們通過(guò)EHCT工具可以輕松完成全系統(tǒng)節(jié)點(diǎn)操作系統(tǒng)安裝工作。本文詳細(xì)闡述了SKYNET-X自動(dòng)化設(shè)備通過(guò)EHCT工具遠(yuǎn)程安裝操作系統(tǒng)的原理和步驟,并結(jié)合系統(tǒng)安裝過(guò)程中常見(jiàn)的故障進(jìn)行分析,為全國(guó)SKYNET-X自動(dòng)化系統(tǒng)用戶提供了較好的THALIX 12操作系統(tǒng)裝機(jī)經(jīng)驗(yàn)參考。
關(guān)鍵詞:SKYNET-X、EHCT、THALIX
正文:
SKYNET-X空管自動(dòng)化系統(tǒng)采用基于Linux系統(tǒng)開(kāi)發(fā)而成的THALIX 12操作系統(tǒng)。SKYNET-X空管自動(dòng)化系統(tǒng)包括多種類型的節(jié)點(diǎn),每種類型節(jié)點(diǎn)所需的系統(tǒng)環(huán)境,網(wǎng)絡(luò)配置,驅(qū)動(dòng)等均有所差異,人工安裝操作系統(tǒng)不僅工作量巨大且極易出錯(cuò),為了解決批量安裝各節(jié)點(diǎn)操作系統(tǒng)的問(wèn)題,THALIX廠家提供了一套強(qiáng)大的在線安裝操作系統(tǒng)工具EHCT,通過(guò)EHCT工具,可以輕松完成全系統(tǒng)節(jié)點(diǎn)裝機(jī)工作。
SKYNET-X自動(dòng)化系統(tǒng)通常將DBM工作站配置為EHCT服務(wù)器,在該服務(wù)器中部署EHCT工具及相關(guān)腳本、系統(tǒng)RPM包、驅(qū)動(dòng)等。通過(guò)以下幾個(gè)步驟完成全系統(tǒng)節(jié)點(diǎn)自動(dòng)裝機(jī)工作:
一、在EHCTServer上開(kāi)啟DHCP、NFS和TFTP服務(wù)
系統(tǒng)裝機(jī)前,需確保以下系統(tǒng)服務(wù)已經(jīng)開(kāi)啟,開(kāi)啟這些服務(wù)需要root權(quán)限,并通過(guò)指令service dhcpd start 、service nsf start和 service xinetd restart開(kāi)啟對(duì)應(yīng)系統(tǒng)服務(wù)。
(一)DHCP服務(wù)
動(dòng)態(tài)主機(jī)設(shè)置協(xié)議(Dynamic Host Configuration Protocol,DHCP)是一個(gè)局域網(wǎng)的網(wǎng)絡(luò)協(xié)議,使用UDP協(xié)議工作,主要有兩個(gè)用途:給內(nèi)部網(wǎng)絡(luò)或網(wǎng)絡(luò)服務(wù)供應(yīng)商自動(dòng)分配IP地址,給用戶或者內(nèi)部網(wǎng)絡(luò)管理員作為對(duì)所有計(jì)算機(jī)作中央管理的手段。
(二)NFS服務(wù)
NFS(Network File System)即網(wǎng)絡(luò)文件系統(tǒng),它允許網(wǎng)絡(luò)中的計(jì)算機(jī)之間共享資源。在NFS的應(yīng)用中,本地NFS的客戶端應(yīng)用可以透明地讀寫位于遠(yuǎn)端NFS服務(wù)器上的文件。
(三)TFTP服務(wù)
TFTP(Trivial File Transfer Protocol,簡(jiǎn)單文件傳輸協(xié)議)是TCP/IP協(xié)議族中的一個(gè)用來(lái)在客戶機(jī)與服務(wù)器之間進(jìn)行簡(jiǎn)單文件傳輸?shù)膮f(xié)議,提供不復(fù)雜、開(kāi)銷不大的文件傳輸服務(wù)。
二、在EHCTServer上進(jìn)行相關(guān)參數(shù)配置
EHCT工具裝機(jī)前需對(duì)以下兩個(gè)文件夾中的文件參數(shù)進(jìn)行詳細(xì)配置,其中Database_HDMT目錄下的文件定義了系統(tǒng)節(jié)點(diǎn)安裝系統(tǒng)所需的各項(xiàng)配置;machine_types目錄下文件定義了系統(tǒng)各種機(jī)器類型。
(一)Database_HDMT目錄下關(guān)鍵配置文件解析
1.Configuration.hcs:定義系統(tǒng)需安裝的節(jié)點(diǎn)名稱。
2.Environment_linux.hcs:定義系統(tǒng)環(huán)境:系統(tǒng)名,版本,用戶和登錄密碼以及用戶對(duì)應(yīng)的SHELL目錄。
3.eurocat.hcs:定義系統(tǒng)各節(jié)點(diǎn)和系統(tǒng)分區(qū)的對(duì)應(yīng)關(guān)系。
4.graphic.hcs:定義機(jī)器類型對(duì)應(yīng)視頻圖像顯示。
5.hardware_params.hcs:定義安裝操作系統(tǒng)的硬盤分區(qū),此處路徑需與各節(jié)點(diǎn)機(jī)器/dev/disk/by-path/中定義保持一致。
6.hdmt_hosts.txt:存儲(chǔ)具有關(guān)聯(lián)IP地址的主機(jī)名的文本文件,所有節(jié)點(diǎn)/etc/hosts文件通過(guò)這個(gè)文件生成。
7.hdmt_networks.txt:是給計(jì)算機(jī)各網(wǎng)段起的一個(gè)名字,裝機(jī)時(shí)所有節(jié)點(diǎn)的/etc/networks通過(guò)這個(gè)文件生成。
8.hosts_linux.hcs:定義節(jié)點(diǎn)名字,編號(hào)(編號(hào)為該節(jié)點(diǎn)ip地址最后一位),機(jī)器類型,ntp服務(wù)配置和分配網(wǎng)段。
9.interface.hcs:定義各節(jié)點(diǎn)網(wǎng)卡配置和網(wǎng)卡工作模式。
10.mac.hcs:節(jié)點(diǎn)S網(wǎng)的網(wǎng)卡mac地址,裝機(jī)時(shí)EHCT服務(wù)器通過(guò)mac地址找到相應(yīng)的節(jié)點(diǎn),安裝操作系統(tǒng)。
11.machine_types.hcs:定義不同機(jī)器類型裝機(jī)所需安裝組件
12.master_slave_standby.hcs:定義EHCTserver備份服務(wù)器
13.xxx.ntp:定義系統(tǒng)時(shí)鐘同步。
(二)machine_types目錄下關(guān)鍵配置文件解析
1.+_etc_X11_xorg.conf:定義系統(tǒng)顯示輸出,視頻輸出接口以及視頻輸出分辨率等
2.+__lib__kbd__keymaps__lk461.map:定義系統(tǒng)鍵盤映射
3.hardware_params.txt:定義該類型節(jié)點(diǎn)安裝操作系統(tǒng)默認(rèn)pci編號(hào)
完成以上文件配置后,通過(guò)指令build_platform.sh,執(zhí)行平臺(tái)編譯腳本,結(jié)合以上配置的各項(xiàng)參數(shù),生成kickstart文件,kickstart文件位于/EHCT_data/built/GL/12/kickstart文件夾內(nèi),每個(gè)節(jié)點(diǎn)均有對(duì)應(yīng)的kickstart文件。kickstart文件為安裝系統(tǒng)指引,文件內(nèi)容包括裝機(jī)過(guò)程中需要執(zhí)行的腳本,命令以及需要從EHCTserver中獲取的軟件包,通過(guò)kickstar可以自動(dòng)完成節(jié)點(diǎn)系統(tǒng)安裝,網(wǎng)絡(luò)設(shè)置,硬盤分區(qū)等操作。
三、客戶機(jī)安裝操作系統(tǒng)
(一)將客戶機(jī)板載網(wǎng)卡在bios中禁用,設(shè)置USB啟動(dòng)為最高優(yōu)先級(jí),接上usb_key,啟動(dòng)機(jī)器進(jìn)入U(xiǎn)盤引導(dǎo)操作系統(tǒng)安裝進(jìn)程。
(二)客戶機(jī)eth0網(wǎng)口接入與EHCT服務(wù)器S網(wǎng)同一網(wǎng)絡(luò)后,客戶機(jī)會(huì)在網(wǎng)絡(luò)中廣播DHCP Discover報(bào)文,報(bào)文中包含客戶機(jī)eth0的mac地址。EHCT服務(wù)器收到客戶機(jī)的報(bào)文后,并通過(guò)DHCP服務(wù)為節(jié)點(diǎn)分配IP地址。
(三)客戶機(jī)通過(guò)NFS服務(wù),從EHCT服務(wù)器中下載kickstart文件,自動(dòng)完成操作系統(tǒng)的遠(yuǎn)程安裝和系統(tǒng)配置。
四、常見(jiàn)故障排查
(一)裝機(jī)過(guò)程提示W(wǎng)ARNING:THE “—no-network” option is deprecated:nvidia-installed will ignore this option。
當(dāng)節(jié)點(diǎn)顯卡型號(hào)不一致時(shí),系統(tǒng)裝機(jī)過(guò)程中容易出現(xiàn)這個(gè)告警提示,原因是由于該節(jié)點(diǎn)從EHCT服務(wù)器上獲取的顯卡驅(qū)動(dòng)與當(dāng)前的顯卡不適配造成,我們首先需要查看安裝節(jié)點(diǎn)的顯卡型號(hào),并從廠家獲取對(duì)應(yīng)顯卡THALES系統(tǒng)驅(qū)動(dòng)包,將對(duì)應(yīng)的顯卡驅(qū)動(dòng)放置在/EHCT_data/misc/EX_PACKAGE_T12/Drivers/目錄下,重啟機(jī)器后完成節(jié)點(diǎn)操作系統(tǒng)安裝。
(二)裝機(jī)過(guò)程提示warning:dracut-initqueue timeout – starting timeout scripts后,自動(dòng)退出裝機(jī)。
1.安裝節(jié)點(diǎn)eth0網(wǎng)卡mac地址與服務(wù)器配置參數(shù)不一致
取下安裝節(jié)點(diǎn)eth0所在網(wǎng)卡,記錄下網(wǎng)卡mac地址。在EHCT服務(wù)器上,進(jìn)入到/EHCT_data/database/GL/12/Database_HDMT目錄下,編輯mac.hcs文件,將節(jié)點(diǎn)的eth0網(wǎng)卡的mac地址填寫到對(duì)應(yīng)的節(jié)點(diǎn)名后,重新執(zhí)行build_platform.sh腳本,以更新kickstart文件,重啟節(jié)點(diǎn)后完成操作系統(tǒng)安裝。
2.安裝節(jié)點(diǎn)eth0網(wǎng)卡所在pci設(shè)備地址與服務(wù)器默認(rèn)配置不一致
該問(wèn)題經(jīng)常出現(xiàn)在機(jī)器型號(hào)與原安裝節(jié)點(diǎn)機(jī)器型號(hào)不一致時(shí),此時(shí)系統(tǒng)引導(dǎo)安裝文件kickstart中pci設(shè)備地址和實(shí)際不一致,我們需要通過(guò)指令ls–al /dev/disk/by-path 查看并記錄下sda1對(duì)應(yīng)地址信息。在EHCT服務(wù)器上打開(kāi)位于/EHCT_data/built/GL/12/kick start目錄對(duì)應(yīng)節(jié)點(diǎn)的kickstart文件,編輯并替換掉kickstart文件里兩處pci地址信息,由于是直接編輯的kickstart文件,所以不需要執(zhí)行腳本編譯,可以直接重啟節(jié)點(diǎn)完成操作系統(tǒng)安裝。
五、結(jié)束語(yǔ)
本文從原理和配置出發(fā),詳細(xì)闡述了SKYNET-X自動(dòng)化設(shè)備通過(guò)EHCT工具遠(yuǎn)程安裝操作系統(tǒng)的原理和步驟,并結(jié)合操作系統(tǒng)安裝過(guò)程中常見(jiàn)的故障進(jìn)行分析,為全國(guó)SKYNET-X自動(dòng)化系統(tǒng)用戶提供了較好的THALIX 12操作系統(tǒng)裝機(jī)經(jīng)驗(yàn)參考。
參考文獻(xiàn):
[1]蔣增恒 THALIX操作系統(tǒng)網(wǎng)絡(luò)安裝服務(wù)原理分析,《空中交通》,2016