【摘要】在嵌入式領域,如何降低系統(tǒng)與運行環(huán)境之間的相關性,在各種異構的嵌入式平臺上快速構建系統(tǒng)一直是研究的重點。本文基于FORTH語言,通過對虛擬機工作原理的分析,以自主構建的JLP FORTH虛擬平臺為例,描述了虛擬機的實現(xiàn)原理、指令定義、存儲方法和核心算法,并且在存儲上提出以分段的方式分離代碼和數(shù)據(jù),通過該方法構建的FORTH虛擬機具有了更高的系統(tǒng)安全性,并且調試方便、擴展性強,特別適合應用于嵌入式系統(tǒng)。
【關鍵詞】FORTH;虛擬計算機
1.引言
虛擬機最初是美國計算機科學家波佩克(Popek)與戈德堡(Gerald)在虛擬化需求中給出了定義,專指有效的、孤立的真實計算機的副本[1],現(xiàn)在則指可像真實計算機一樣運行程序的軟件實現(xiàn),包括跟任何真實計算機無關的虛擬機[2]。根據(jù)運用和與機器的相關性可分為系統(tǒng)虛擬機和程序虛擬機,一個提供了完整的操作系統(tǒng),另一個則以運行單個計算機程序為主。在嵌入式應用領域,嵌入式系統(tǒng)相關的CPU芯片和微計算機硬件系統(tǒng)種類繁多,并且不斷推陳出新,甚至多核處理器已被普遍采用[3]。但是在新平臺上,難以針對每一種芯片或平臺制定一種計算機語言來編程。解決的方法一是可采用公共計算機語言,用不同的編譯器來生成機器碼,但該方法需要具有該語言的編譯器,在新平臺上往往難以具備。另一種方法即建立一個虛擬機,然后用一個計算機語言,用一個解釋器來解釋執(zhí)行[4]。采用該方法,難點在于嵌入式虛擬機的構建,要能夠適應多種環(huán)境、快速構建、可擴展。FORTH是一種與眾不同的計算機程序設計語言。它具有極強的擴展性,通過字的定義,可實現(xiàn)不斷堆疊和擴展。同時,它又具有極好的交互性,指令可解釋執(zhí)行,這就為應用的調試帶來了極大的便捷。本文基于FORTH語言,以自主構建的JLP FORTH虛擬平臺為例,詳細闡述FORTH虛擬機的實現(xiàn)原理和核心實現(xiàn)方法,模擬和實現(xiàn)了通用的交互式計算機結構,實現(xiàn)了真實計算機的典型工作流程[4],并且一改過去FORTH代碼和數(shù)據(jù)混合存儲的方式,在內存的存儲上以分段的方式將內存分為CS、VS、DS、SS四個段,分別存儲指令和數(shù)據(jù),這樣,就實現(xiàn)了系統(tǒng)指令和用戶數(shù)據(jù)的分離,有效地提高了代碼和系統(tǒng)的安全性,并且調試方便、擴展性強,尤其適合應用于對安全性、兼容性、移植性、擴展性、交互性要求高的嵌入式系統(tǒng)領域。
2.FORTH虛擬機實現(xiàn)原理
真實計算機的基本工作原理是存儲和控制。計算機在控制器的指揮下,取出預先存儲的指令序列(即程序)和數(shù)據(jù),通過控制器譯碼,按指令的要求,取出數(shù)據(jù)完成運算,再把結果重新存儲起來,如此循環(huán),直至完成全部指令。對真實計算機來說,這個過程依托中央處理器CPU來實現(xiàn),CPU包括運算器、控制器和寄存器。如果描述CPU核心工作過程,主要包括以下步驟:(1)提取程序計數(shù)器值,該值指向的地址即指令地址;(2)從該地址取出指令;(3)程序計數(shù)器增加指令長度,即指向下一條指令地址;(4)解碼執(zhí)行指令;(5)返回結果。
由于FORTH虛擬機是工作在真實計算機上的,因此要實現(xiàn)FORTH虛擬機必須用對應關系依托真實計算機的代碼來實現(xiàn)這個核心過程。在FORTH虛擬機中,用核心算法——NEXT模擬了這個過程,將虛擬機指令和真實計算機指令實現(xiàn)對應,通過建立字典表,設置地址跳轉,以串線碼的方式將虛擬機命令字和直接機器指令實現(xiàn)對應,依托真實計算機指令完成了CPU的處理過程[6]。如圖1所示。
在字典表存放了各個FORTH高級字的名稱和代碼執(zhí)行地址,其中也有S字的定義,在S字的代碼場中存有S字的代碼執(zhí)行地址,該代碼執(zhí)行地址與code所描述的直接機器執(zhí)行代碼相對應,構成間接串線編碼。當執(zhí)行該指令時,首先查找字典表,找到S定義后,取出其WPF指令碼中存放的地址,然后跳轉到代碼場該地址中,由于是FORTH高級字定義,所以首先執(zhí)行“:”機器碼將程序計數(shù)器所記錄的下一條指令返回地址壓入棧,然后跳轉到參數(shù)場地址依序執(zhí)行,直到最后的“;”返回指令執(zhí)行后,再將原先存入棧的返回地址彈出,這樣即完成一條指令的執(zhí)行。其中,代碼場和參數(shù)場分別存儲指令和參數(shù)。以下以JLP FORTH虛擬機為例,詳細描述其字典表、代碼場、參數(shù)場的定義、虛擬機存儲和指針的分配,以及核心算法。
3.指令的定義和存儲
FORTH虛擬計算機采用該虛擬指令的存儲地址來表示該指令,稱為“地址碼”。虛擬計算機的每個指令用名稱(例如+、-、*)來表示,稱為“字(Word)”。FORTH虛擬計算機的指令包括“復合字”和“基本字”?;咀忠卜Q為“低級字”,由真實計算機機器碼和數(shù)據(jù)組成的,低級字組合可構成“復合字”,所以,“復合字”也稱為“高級字”。
高級字和低級字都可通過定義擴展。擴展高級字用“:”冒號定義,通過高級字定義用已有的指令形成新的指令。格式如下:
:名字 … leave … ;
其中執(zhí)行l(wèi)eave指令可以跳出該FORTH字的執(zhí)行,忽略掉其后的指令。擴展低級字則用機器碼定義,格式如下:
CODE 名字 … … NEXT, END-CODE
其中NEXT,指令可以讓計算機執(zhí)行下一條虛擬機指令。
對于真實計算機,用編譯器生成的指令碼序列中不需要保留指令名稱。FORTH虛擬計算機不同,由于需要虛擬機執(zhí)行和構造新的虛擬機指令,因此在虛擬計算機中要保留FORTH字的名稱,用于存儲FORTH字的存儲空間就是“字典表”。在JLP FORTH虛擬平臺中,字典表結構如表1,在圖1中也有標注。
WPF里存儲的指令碼即FORTH字在存儲空間的地址。由于允許FORTH字的名稱長度不一樣,因此采用鏈表結構可有效地存儲它們,在LPF中即存放了下一個字的定義地址。
代碼場和參數(shù)場用于共同存儲FORTH字,如表2。
其中CFA存放實現(xiàn)虛擬機功能的CPU機器碼開始地址。PFA依次存放組成它的虛擬機指令。對于基本字PFA的內容不一樣。對于一個常數(shù)基本字,PFA就直接存放這個常數(shù)。對于一個變量基本字,PFA就存放數(shù)據(jù)段中這個變量的地址[6]。
4.內存和指針分配
以往FORTH并未將代碼和數(shù)據(jù)分開,在嵌入式應用中,往往指令和程序相對固定,而代碼和數(shù)據(jù)混合致使調試不方便,同時在系統(tǒng)安全上也帶來問題。在JLP FORTH虛擬機上,將內存分為代碼段CS、代碼空間VS、數(shù)據(jù)段DS、系統(tǒng)段SS四個部分。
(1)代碼段CS:存放真實計算機的機器指令、內存分配信息以及與硬件有關的系統(tǒng)數(shù)據(jù)。
(2)“代碼”空間VS:用來存放虛擬計算機的指令和字典。
(3)數(shù)據(jù)段DS:用來存放用戶數(shù)據(jù)和虛擬機的堆棧等數(shù)據(jù)。
(4)系統(tǒng)段SS:用來存放系統(tǒng)堆棧和多任務系統(tǒng)數(shù)據(jù)表等,達到分離系統(tǒng)任務和用戶,保證系統(tǒng)安全的目的。
采用這種存放方式,就可將CS和VS放在FLASH中,將DS和SS放在RAM,如此實現(xiàn)程序和數(shù)據(jù)的分離。這種新的虛擬機架構不僅可以適合嵌入式系統(tǒng),也適合PC結構系統(tǒng),而且更有利于內存保護的實現(xiàn)。
真實計算機主要依靠寄存器來實現(xiàn)加減乘除等運算。例如將AX和BX寄存器的內容相加結果放到AX中,因此寄存器的數(shù)量是衡量CPU運算能力的一個指標。FORTH虛擬計算機則采用直接面向運算過程的方法,采用堆棧的方式來實現(xiàn)簡單的運算,例如取出堆棧頂上的兩個數(shù)相加后,結果放回堆棧頂。對于復雜運算,直接用復合字或者機器碼寫出面向數(shù)據(jù)的算法,比如對矢量和矩陣的運算等。由于沒有寄存器的概念,只有表示系統(tǒng)工作狀態(tài)的各種系統(tǒng)變量以及實現(xiàn)系統(tǒng)運行的各種指針。為了提高虛擬計算機的執(zhí)行效率,用間接尋址的CPU寄存器來實現(xiàn)。對應關系如下(注:箭頭為在X86計算機中對應的寄存器)。
通過這些指針的定義,F(xiàn)ORTH虛擬機可實現(xiàn)各種各樣復雜的算法。
5.NEXT核心算法與函數(shù)
FORTH虛擬機的核心算法——NEXT,它完成了指令的控制執(zhí)行過程。如借用以上描述,用形式化的方法表示為:
由于FORTH虛擬機是工作在真實計算機上,因此要實現(xiàn)FORTH虛擬機必須用真實計算機的代碼來實現(xiàn)這個核心過程,以X86匯編語言為例,其實現(xiàn)FORTH虛擬機核心過程的代碼為(16位地址空間):
ES:BX,SI MOV
SI,#2 ADD
ES:[BX]JMP
從代碼可以看出,它非常象一個子過程或函數(shù)的調用。在真實計算機中,函數(shù)是非常常用的一個功能,是若干指令的有序集合。在FORTH虛擬計算機中高級字就可認為是“函數(shù)”。表3是真實計算機和FORTH虛擬計算機在函數(shù)調用中的執(zhí)行過程對比。
6.實例
以下采用自下而上的編程方法,構造FORTH字P_DUMP用于查看內存基本信息,以此為例說明FORTH虛擬計算機相關程序的設計方法。參數(shù)有查看內存的段地址、偏移地址和區(qū)域長度。
//----初始化-------------------
HEX ROOT_ONLY // 使用根字典
//----內存顯示-------------------
:.BYTE //(n--) 顯示一個字節(jié)數(shù)據(jù)
00FF AND // 數(shù)據(jù)都是16位寬,只用低8位
20 EMIT // 先顯示一個空格
10 /MOD // 用16除 結果為 ( -- 余數(shù) 商)
H.H.; // 依次顯示高四位和低四位
: .INT // ( n -- ) 顯示一個16位整數(shù)數(shù)據(jù)
10 U/MOD 10 U/MOD 10 U/MOD 10 U/MOD DROP // 得到四個四位16進制
H.H.H.H.; // 依次顯示
: .CHAR // ( n -- ) 顯示一個字符
00FF AND // 字節(jié) ASC II 的字符
DUP 20 < OVER 7F > OR if DROP 2E endif // 只顯示ASC II 的字符碼 如果是字符,顯示為“.”,避免破壞顯示列表
EMIT ;
: .16BYTES // ( segment offset --- ) 顯示一整行16個字節(jié)
CRLF LDUP SWAP .INT 3A EMIT .INT 1 SPACES // 顯示開始地址
LDUP 0F 0 1 for P_COUNT .BYTE endfor LDROP // 顯示16進制數(shù)值內容
4 SPACES 0F 0 1 for P_COUNT .CHAR endfor LDROP // 顯示16個字符
;
: P_DUMP // ( segment offset length --- )
DEPTH 3 < 2 ?ERROR // 檢查參數(shù)的數(shù)量是否足夠
DUP 0 == if CRLF ,” 長度為零!\" .S ABORT endif // 長度為零
DUP F000 AND 0 != if CRLF ,” Too long!” .S ABORT endif // 長度太長
>S DUP FFF0 AND 10 + SWAP DUP 000F AND// ( 段 整數(shù)偏移 原始偏移 起始空格數(shù) -- )
S> OVER 10 SWAP - - >S
3 PICK -ROT // ( 段 整數(shù)偏移 段 原始偏移 起始空格數(shù) -- )
CRLF ,” seg.off.” .S 0F 0 1 for I .BYTE endfor // 顯示欄名
4 SPACES 0F 0 1 for I H. endfor
CRLF 2 PICK .INT 3A EMIT 1 PICK FFF0 AND .INT 1 SPACES // 顯示開始地址
2 PICK 2 PICK 2 PICK DUP 3 * SPACES // 跳過開始的空數(shù)據(jù)
10 SWAP - 1 1 for P_COUNT .BYTE endfor LDROP //顯示頭一行其余數(shù)據(jù)
4 SPACES DUP SPACES
10 SWAP - 1 1 for P_COUNT .CHAR endfor LDROP// 頭一行其余字符
S> 10 U/MOD SWAP >S // ( seg offset lines -- ) 中間的部分
DUP 0 >
if 1 1 for LDUP .16BYTES 10 + endfor // 顯示中間行
else DROP
endif
S> DUP 0 > if // 是否有最后一行
CRLF 2 PICK .INT 3A EMIT 1 PICK .INT 1 SPACES// 有最后一行
2 PICK 2 PICK 2 PICK // 復制參數(shù)
1 1 for P_COUNT .BYTE endfor LDROP // 最后一行數(shù)據(jù)數(shù)據(jù)
10 OVER - 3 * SPACES 4 SPACES
1 1 for P_COUNT .CHAR endfor LDROP // 最后一行字符
else
DROP LDROP // 無最后一行
endif
CRLF ;
7.結論
對于嵌入式應用來說,一個可擴展性好、可移植性好、可裁剪、實現(xiàn)快速,并且便于調試的嵌入式虛擬機,能給嵌入式應用的開發(fā)帶來極大的方便?;贔ORTH構筑的虛擬機,引入字典表完成指令和機器代碼的對應,并用字定義來完成指令的擴展,使系統(tǒng)的結構具有了極大的靈活性和擴展性,僅僅通過對基本字的堆疊、組合就可完成高級字的層層定義,實現(xiàn)極其復雜的系統(tǒng)。在JLP FORTH中存儲分段使得程序指令和數(shù)據(jù)能相對獨立,有效地增強了系統(tǒng)的安全性。這些設計思路使得在其上構建的FORTH虛擬機具有了代碼簡單、調試方便、安全性高、擴展性強等特點,特別適合應用于嵌入式系統(tǒng)中。
參考文獻
[1]維基.虛擬機[EB/OL].2013-3-28.http://zh.wikipedia.org/wiki/%E8%99%9B%E6% 93%AC%E6%A9%9F%E5%99%A8.
[2]Smith,Daniel E.;Nair,Ravi[C].The Architecture of Virtual Machines.Computer(IEEE Computer Society),2005:32-38.doi:10.1109/MC.2005,173.
[3]姚琳.多核的必由之路[M].電子設計技術,2007,9,24-26.
[4]肖鎮(zhèn),趙振西.一種能有效生成異構平臺上Forth系統(tǒng)的框架[J].中國科學技術大學學報,2002,6.
[5]Jean J.Labrosse.嵌入式實時操作系統(tǒng)μC/OS-II(第2版)[M].北京航空航天大學出版社,2003.
[6]BradfordJ.Rodriguez,writing Forth kernels,2000.
作者簡介:
王麗清(1971—),女,碩士,高級工程師,主要研究方向:信息處理、數(shù)字媒體技術、計算機應用。
楊為民(1955—),男,教授,主要研究方向:遙感和地理信息系統(tǒng)、嵌入式系統(tǒng)。
代紅兵(1963—),男,碩士,正高級工程師,主要從事嵌入式系統(tǒng)、數(shù)字電視技術工作。
周永錄(1965—),男,高級工程師,主要研究方向:嵌入式系統(tǒng)。