當(dāng)今顯卡不僅具備強(qiáng)大的運(yùn)算能力,在可編程性方面也有了長(zhǎng)足的進(jìn)步。面對(duì)顯卡市場(chǎng)的高額利潤(rùn)。Intel在2006年成立了可視化計(jì)算工作組(visual Computing Group,簡(jiǎn)稱VCG),并且希望在2007年底重返獨(dú)立顯卡市場(chǎng),近期Intel VSG公布的最新研究成果震動(dòng)了整個(gè)業(yè)界—Intel準(zhǔn)備讓GPU和CPU合二為一,憑借自己在CPU領(lǐng)域的霸主地位讓GPU在未來(lái)徹底消失!Intel憑什么能讓GPU在未來(lái)走人歷史?就讓我們一起探個(gè)究竟。
一“芯”多用,從根基撼動(dòng)顯卡世界
作為一個(gè)后來(lái)者,Intel如果在顯卡市場(chǎng)和NVIDIA、ATi展開(kāi)正面交鋒顯然不是明智之舉。為此Intel希望在未來(lái)借助CPU市場(chǎng)的成功來(lái)統(tǒng)治顯卡市場(chǎng),CPU、GPU混合芯片的大膽嘗試應(yīng)運(yùn)而生。Intel的研究表明,和GPU相比CPU具有不可超越的靈活性,但卻在浮點(diǎn)運(yùn)算能力和并行性方面遠(yuǎn)不及前者。而這兩個(gè)特性對(duì)于圖形操作來(lái)恰恰是至關(guān)重要的。一旦CPU具有強(qiáng)大并行性和浮點(diǎn)運(yùn)算能力,再加上天生的完全可編程能力,GPU就徹底失去了存在的必要。為了實(shí)現(xiàn)這一目標(biāo),Intel提出了順序執(zhí)行多內(nèi)核處理器的概念。
所謂順序執(zhí)行就是CPU按照每個(gè)線程的指令順序依次運(yùn)行的指令執(zhí)行模式。而當(dāng)今所有桌面CPU使用的亂序執(zhí)行,則會(huì)由CPU自動(dòng)將線程上指令分拆執(zhí)行,最后再合成。對(duì)于單線程任務(wù)來(lái)說(shuō),亂序執(zhí)行由于減少了指令之間的等待,因此具有極高的效率,但由于多出了指令分析和結(jié)果合成邏輯,所以要耗費(fèi)大量的晶體管。順序執(zhí)行盡管效率只有亂序執(zhí)行的1/3,但消耗的晶體管也少得驚人。在圖形操作領(lǐng)域,指令具有很強(qiáng)的并行性,這也是順序執(zhí)行大顯神威的地方。
當(dāng)今Core2 Duo雙內(nèi)核處理器在65納米制程下的芯片面積為140平方毫米。如果改用順序執(zhí)行單元,同樣芯片面積能夠容納多達(dá)10個(gè)內(nèi)核,每個(gè)內(nèi)核都具有同步多線程(SMT)功能,這樣Intel順序執(zhí)行處理器就能在一個(gè)時(shí)鐘周期執(zhí)行40條線程,從而達(dá)到1200GFlops浮點(diǎn)運(yùn)算能力,遠(yuǎn)遠(yuǎn)高于GeForce8800GTX的346GFlops。如果這款芯片配合VLIW超長(zhǎng)指令集,就能輕松完成各種Shader運(yùn)算,從而支持DirectX 10標(biāo)準(zhǔn)。
除了集成度驚人之外,Intel順序執(zhí)行處理器還將和CPU一樣具有4MB緩存。每個(gè)內(nèi)核都具有獨(dú)立的緩存區(qū)域,并且可以相互隨時(shí)訪問(wèn)。這種實(shí)際共享但卻又相互獨(dú)立的緩存架構(gòu),使得每個(gè)內(nèi)核都能獲得充足的帶寬——新架構(gòu)使得芯片內(nèi)部互聯(lián)帶寬達(dá)到了1TB/s,CPU與周邊設(shè)備連接帶寬也達(dá)到150GB/0s。
針對(duì)順序執(zhí)行處理器難以高效完成的抗鋸齒和各向異性過(guò)濾操作,Intel考慮在芯片內(nèi)部集成專門負(fù)責(zé)這些工作的固定單元,從而獲得最高效率。另外,采用順序執(zhí)行之后的處理器的單線程執(zhí)行效率極為落后。為了解決這個(gè)問(wèn)題,Intel希望通過(guò)大量并行線程來(lái)彌補(bǔ)單線程的低效率——在實(shí)現(xiàn)40線程并行之后,順序執(zhí)行處理器的單線程性能已經(jīng)達(dá)到了亂序執(zhí)行的50%。
必須指出的是,采用了全新順序執(zhí)行架構(gòu)和超長(zhǎng)指令集之后,新的處理器無(wú)法兼容X86指令集,這意味無(wú)法在這款處理器上運(yùn)行Windows等軟件。由此看來(lái)Intel很可能在初期將這款芯片作為協(xié)處理器與普通X86 CPU配合,然后逐步接替更多的圖形、聲音等浮點(diǎn)密集操作,最后將GPU徹底趕出機(jī)箱。
結(jié)語(yǔ)
盡管我們無(wú)法在短期內(nèi)看到Intel這款處理器和昱卡展開(kāi)殊死搏斗,但是Intel順序處理器使我們看到了圖形芯片發(fā)展的全新道路,在SSE4指令集中Intel也增加了CPU-GPU交互的指令,也許這款順序執(zhí)行架構(gòu)處理器僅僅是我們徹底擺脫顯卡功耗和成本狂飆的發(fā)展怪圖的開(kāi)端……