計(jì)算機(jī)硬件性能在摩爾定律的推動下越來越強(qiáng)大,這促使高性能計(jì)算機(jī)(HPC)也在發(fā)生著改變,那些位于數(shù)據(jù)中心的體積龐大的高性能計(jì)算機(jī)運(yùn)算速率已經(jīng)跨過了每秒千萬億次的門檻,而另一些計(jì)算能力在千億次甚至萬億次、但體積小巧的高性能計(jì)算機(jī)則走上了桌面,其應(yīng)用領(lǐng)域也日漸擴(kuò)展。
高性能計(jì)算(HPC)離不開超級計(jì)算機(jī)。在一些大學(xué)和研究機(jī)構(gòu)的實(shí)驗(yàn)室里,我們常能見到外形巨大的大型機(jī)器,它們幾乎占滿了機(jī)房。盡管在未來這些超級系統(tǒng)絕不會消失,但我們同時也看到,往日一直由超級計(jì)算機(jī)來處理的一些應(yīng)用正在走向桌面。
究其原因,分析人士認(rèn)為,在一臺標(biāo)準(zhǔn)PC上,8年前大約需要花1小時才能處理的任務(wù),現(xiàn)在只要6秒鐘就能完成,因?yàn)樽烂嬗?jì)算機(jī)的處理能力、圖形處理器(GPU)的性能、網(wǎng)絡(luò)帶寬和固態(tài)硬盤速度等都已經(jīng)有了大幅提升,加上64位的吞吐量,這些改進(jìn)已使桌面計(jì)算機(jī)越來越適合處理大規(guī)模計(jì)算項(xiàng)目。
正是由于這些進(jìn)步,向“桌面端超級計(jì)算機(jī)”轉(zhuǎn)變的步伐已經(jīng)邁出。眼下,地震模擬、核武器儲備模擬和DNA研究仍然還在傳統(tǒng)的超級計(jì)算機(jī)上進(jìn)行,但隨著處理器在今后10年間向多核技術(shù)發(fā)展,可想而知,以上這些應(yīng)用(或部分應(yīng)用)都會進(jìn)入到桌面端。
麻醉劑藥效的追蹤
盡管現(xiàn)今醫(yī)生們知道如何開麻醉劑,也知道其藥效,但并不知道病人被麻醉入睡后,這些藥的分子在起什么作用。這種分析需要強(qiáng)大的計(jì)算能力,要既能查看麻醉劑何時進(jìn)入呼吸系統(tǒng),還能查看如何開始發(fā)揮藥效。
為了解決這一問題,美國天普大學(xué)(Temple University)的研究人員研制出了相關(guān)的模型,可測試出對神經(jīng)細(xì)胞中的分子實(shí)施麻醉后出現(xiàn)的后果。目前,該模型正在超級計(jì)算機(jī)上運(yùn)行,不過,他們計(jì)劃將在有4個節(jié)點(diǎn)的NVIDIA(英偉達(dá))GPU集群上進(jìn)行運(yùn)算。這不但可以省錢,還能讓研究人員有更大的靈活性,他們可以在做好準(zhǔn)備工作的時候進(jìn)行測試,而沒必要非要在事先安排好的時間段里才能使用超級計(jì)算機(jī)進(jìn)行測試。在這種應(yīng)用需求下,每個GPU都擁有一個小型HPC集群的計(jì)算能力。GPU運(yùn)算所涉及的數(shù)學(xué)運(yùn)算其規(guī)模相當(dāng)于通常用來為渲染視頻游戲像素的運(yùn)算。
項(xiàng)目研究人員Axel Kohlmeyer博士表示,想弄明白這種模擬,最好的辦法就是想像一只盒子里面塞滿了橡皮球,每個球的尺寸略有不同,運(yùn)動速度也略有不同。它們之間相互用彈簧連起來,而這些彈簧的強(qiáng)度也不一樣,使得有些球的運(yùn)動速度比較快,而有些較慢,反應(yīng)不一樣。Axel Kohlmeyer可以在模擬中跟蹤所有分子的活動,看看麻醉藥在人體中的效果。
Axel Kohlmeyer說:“分子會形成粒子團(tuán),它們的運(yùn)動方向由相互聯(lián)系的數(shù)量來決定?!彼忉屨f,模擬已經(jīng)發(fā)展到了相互之間的聯(lián)系均衡的階段。溫度的變化會引起振動,使分子出現(xiàn)新的活動?!坝?jì)算模型難就難在需要成千上萬錯綜復(fù)雜的相互聯(lián)系。我們不僅想知道某些點(diǎn)之間的相互聯(lián)系,而且還想知道以后會如何慢慢變化。”他補(bǔ)充說,另一個難題就是不得不經(jīng)常重復(fù)運(yùn)算。
對Axel Kohlmeyer來說,模擬的目的在于發(fā)現(xiàn)人體中到底何時出現(xiàn)什么感覺都沒有的情況,而弄清楚了這點(diǎn),就有望研制出新型的麻醉藥,或幫助醫(yī)生查明為什么手術(shù)后會出現(xiàn)記憶力減退之類的問題。
手術(shù)模擬
美國俄亥俄州哥倫布市俄亥俄超級計(jì)算中心(OSC)的研究人員發(fā)現(xiàn),不是每項(xiàng)模擬都需要傳統(tǒng)的超級計(jì)算機(jī)。OSC主任兼生物醫(yī)學(xué)應(yīng)用部門的接口實(shí)驗(yàn)室研究科學(xué)家Don Stredney發(fā)現(xiàn)了超級計(jì)算機(jī)通常存在的一個局限性:批處理進(jìn)程是靜態(tài)的,只能在預(yù)定的時間段運(yùn)行。它們無法提供實(shí)時的相互聯(lián)系,所以無法模擬真實(shí)的外科手術(shù)。他表示,成本在6000美元到10000美元的桌面工作站使他的團(tuán)隊(duì)可進(jìn)行手術(shù)模擬,實(shí)時顯示外科手術(shù)是如何改變病人身體結(jié)構(gòu)的。
Don Stredney表示,他所在的行業(yè)得益于計(jì)算機(jī)游戲領(lǐng)域的創(chuàng)新,因?yàn)槠胀ǖ南M(fèi)級GPU的功能已經(jīng)變得極其強(qiáng)大,只要極低的成本就能得到非常逼真的效果。該領(lǐng)域的研究人員使用普通PC運(yùn)行標(biāo)準(zhǔn)的GPU,比如來自AMD公司ATI部門和NVIDIA公司的GPU,但不是高端GPU集群。不過他們發(fā)現(xiàn),當(dāng)一些模擬中的數(shù)據(jù)集變得太大時,就需要重新使用超級計(jì)算機(jī)運(yùn)算。Don Stredney表示,當(dāng)出現(xiàn)數(shù)據(jù)集急劇變得非常龐大,或每一幅圖像都有數(shù)GB大小,以及數(shù)據(jù)采集時通常為0.5TB大小的多尺度數(shù)據(jù)集這些情況時,他的團(tuán)隊(duì)會重新使用超級計(jì)算機(jī)。他表示,實(shí)時視覺和聽覺模擬需要越來越大的數(shù)據(jù)集和復(fù)雜的相互聯(lián)系,因而需要更高端的系統(tǒng)。
汽車設(shè)計(jì)
Autodesk公司汽車部門的Ed Martin經(jīng)理表示,注塑模擬對汽車廠商來說很重要。注塑是指利用塑料材料制作零部件的一種工藝。模擬可顯示注塑模(比如保險(xiǎn)杠)會不會引起痕陷,注塑模與汽車其他零部件的配合度如何,模擬還能暴露出任何瑕疵。設(shè)計(jì)師要考慮許多變量,如注塑模溫度、幾何形狀以及注塑工藝與某些材料的適合程度等。Ed Martin解釋說,單單防護(hù)板的一個物理原型造價(jià)就超過100萬美元,所以模擬越準(zhǔn)確,需要制造的原型數(shù)量就越少,因而生產(chǎn)成本就越低。
Ed Martin說:“模擬過去需要安裝大量的集群計(jì)算系統(tǒng),但我們現(xiàn)在用當(dāng)前的桌面計(jì)算機(jī)就能獲得同樣強(qiáng)的能力?!彼硎荆谶@方面起到最大作用的桌面領(lǐng)域的一些進(jìn)步包括:采用多核處理器、使用多個GPU以及64位吞吐量。Ed Martin使用的就是可以從沃爾瑪買到的標(biāo)準(zhǔn)桌面計(jì)算機(jī),它們配備了兼容3D的最新GPU和英特爾雙核處理器。
汽車行業(yè)還使用桌面軟件來為汽車設(shè)計(jì)制作模型。借助這類工具,汽車廠商就能制作出復(fù)雜的透視圖,效果可與一流視頻游戲中的圖形相媲美,甚至更出色。值得關(guān)注的是,當(dāng)這些模型在桌面PC上制作完畢后,常??梢杂糜跔I銷資料和電視廣告中。Ed Martin表示,完全可以將超級計(jì)算機(jī)上制作的模型傳輸?shù)絇C上,但如今PC之間傳輸文件來得更簡單,因?yàn)槲募袷皆诟鲬?yīng)用程序之間是兼容的,如果通過標(biāo)準(zhǔn)網(wǎng)絡(luò)來進(jìn)行傳輸,則有可能將圖形傳送給數(shù)量更多的用戶。
舉一個在桌面上制作模型的例子。設(shè)計(jì)師常常建立車漆模型,認(rèn)真觀察金屬片以及它們在某些塑料上的外觀,或者觀察車漆在某些光照條件下會不會顯得沒有光澤。模型越準(zhǔn)確,它們的制作工藝就越集中。過去,因?yàn)檐嚻嶂惺褂玫母叻肿硬牧洗蠹s有8000種,因此,高性能計(jì)算環(huán)境必不可少,Ed Martin表示,如今桌面系統(tǒng)就能勝任這種高速處理任務(wù)。
基于Web的計(jì)算搜索
HPC走向桌面最值得關(guān)注的途徑之一就是經(jīng)由Web。眼下這方面的最佳例子就是WolframAlpha網(wǎng)站,按該網(wǎng)站自己的話來說,就是互聯(lián)網(wǎng)上的這個“計(jì)算知識引擎”旨在“收集和保存所有客觀數(shù)據(jù),能夠計(jì)算可以計(jì)算的任何對象?!?/p>
這方面的巨大變化在于,雖然在WolframAlpha.com上進(jìn)行的搜索還是在超級計(jì)算機(jī)上進(jìn)行的,但搜索結(jié)果幾乎可以馬上返回到瀏覽器中。比如說,鍵入“moon”這個簡單的字后,其系統(tǒng)就會開始一系列復(fù)雜的計(jì)算,計(jì)算月球相對地球的軌道以及一段歷史時期內(nèi)的平均距離。
沃爾夫勒姆研究公司(Wolfram Research Inc)的架構(gòu)師Schoeller Porter表示,之所以能近乎實(shí)時地進(jìn)行運(yùn)算,那是由于HPC部件的成本降低了。在過去,這種復(fù)雜運(yùn)算需要向超級計(jì)算機(jī)請求運(yùn)行批處理任務(wù),請求占用幾分鐘、幾小時甚至一天的處理時間。這倒未必是由于運(yùn)算本身需要很長時間,而是由于處理資源極其昂貴。
你不妨親自試一下,往WolframAlpha搜索引擎中輸入一些運(yùn)算請求,比如詢問6個月后檀香山的潮汐(tides in honolulu in 6 months),還可以輸入類似以下一些運(yùn)算請求:International space station jun 24(國際空間站,6月24日);skychart Timbuktu yesterday at 8:00pm(Timbuktu昨晚8點(diǎn)的星空圖);y'' + sin y = x(數(shù)學(xué)表達(dá)式);GATTAACCC(基因組序列)等。
在WolframAlpha上進(jìn)行搜索時,可以在桌面上隨意改變?nèi)魏我粋€變量。你會注意到,一些查詢所花的時間比另一些查詢來得長,這取決于超級計(jì)算機(jī)需要多久才能確定結(jié)果。
雖然谷歌搜索也依賴后端的超級計(jì)算機(jī)或集群,但它們所用的計(jì)算算法與WolframAlpha不一樣。谷歌搜索信息后提供相關(guān)鏈接,WolframAlpha提供給用戶的是實(shí)際信息,而不是鏈接,這些信息可能是從知識庫獲取的,也可能是由它執(zhí)行的運(yùn)算生成的。
天氣預(yù)報(bào)
英特爾公司高性能計(jì)算軟件解決方案部門主管Bill Magro表示,天氣預(yù)報(bào)在過去的20年經(jīng)歷了重大變化,從原來的僅僅提供天氣模式的概況變成翔實(shí)資料的顯示,比如每個風(fēng)暴中心的詳細(xì)資料。之所以發(fā)生這種變化,主要是由于天氣預(yù)報(bào)所需的龐大數(shù)據(jù)集現(xiàn)在可以放在桌面計(jì)算機(jī)的存儲器中,其處理能力也有了突飛猛進(jìn)。現(xiàn)在用于氣象的部分天氣模擬可以在地方電視臺的桌面計(jì)算機(jī)上進(jìn)行,而不是只能在監(jiān)測天氣的政府機(jī)構(gòu)里才能進(jìn)行。
天氣預(yù)報(bào)的建模極其復(fù)雜,因?yàn)樘鞖庠陂_放的3D空間不斷變化,在溫度、位置、風(fēng)力及其他因素方面有成千上萬個變量。天氣模型取一個空間范圍,比如5000米的網(wǎng)格,一個數(shù)據(jù)點(diǎn)代表每個方向的每5000米,然后把它縮小到1000米,之后再縮小到500米。Bill Magro解釋說:“因?yàn)閺娜齻€維度來縮小,計(jì)算要求則提高了8倍。不僅僅數(shù)據(jù)更多了,所建立的模型也更詳細(xì)了。這其實(shí)說到底就是需要擁有足夠的內(nèi)存和足夠的計(jì)算能力?!?/p>
桌面計(jì)算機(jī)已經(jīng)開始用于一些地方電視臺的天氣模擬。未來,隨著處理器技術(shù)的進(jìn)一步發(fā)展,我們可以在PC上運(yùn)行所有詳細(xì)的個人天氣預(yù)報(bào)。Bill Magro表示,到那時,個人可以使用桌面計(jì)算機(jī)來查看鄰近地區(qū)的天氣模式,或者根據(jù)遇到的天氣狀況和輸入到模型中的天氣狀況,預(yù)測6個月后你想去的度假地的天氣情況。
更多應(yīng)用緊隨而來
美國佐治亞理工學(xué)院(Georgia Institute of Technology)的高性能計(jì)算執(zhí)行董事David Bader展望未來認(rèn)為,在接下來的10年里,HPC的另外幾種應(yīng)用會出現(xiàn)在桌面端。
David Bader表示,現(xiàn)在有望發(fā)現(xiàn)社會網(wǎng)絡(luò)當(dāng)中出現(xiàn)的新趨勢,或確認(rèn)影響社會網(wǎng)絡(luò)的關(guān)鍵因素??梢越o出相應(yīng)的建議措施,以改善諸多社會行為的能源效率,比如確定合理交通路線,以免堵塞;安排好計(jì)算機(jī)應(yīng)用的運(yùn)行時間,以便盡量減少能耗;監(jiān)測智能電網(wǎng)等。其他發(fā)展前景,包括利用大量的公共照片來構(gòu)建3D場景,利用發(fā)言人的身份證件實(shí)時記錄電視電話會議的文字內(nèi)容。
雖然專家們一致認(rèn)為,特大型超級計(jì)算機(jī)將在今后存在一段時間,但另外哪些傳統(tǒng)的HPC應(yīng)用最終會出現(xiàn)在桌面端,很值得期待。
鏈接
桌面端的特效
雖然電影行業(yè)仍然依賴傳統(tǒng)的高性能計(jì)算機(jī)來制作特效,但好萊塢在很早之前就采用64位工作站把制作特效的一部分工作轉(zhuǎn)移到了桌面上。
電影《2012》和《阿凡達(dá)》等影片中的特效通常需要異常強(qiáng)大的處理能力,明眼人一看就知道,由計(jì)算機(jī)生成(以及消費(fèi)級軟件制作)的動畫瀑布與真實(shí)的瀑布有著明顯區(qū)別。工業(yè)光魔(Industrial Light and Magic)、Uncharted Territory工作室和夢工廠等電影公司依賴龐大的計(jì)算集群和多臺服務(wù)器來制作特效,單單制作一幀視頻就要花好幾個小時。
計(jì)算機(jī)成像(CGI)特效需要強(qiáng)大的計(jì)算能力。運(yùn)用技術(shù)讓光均勻地照射到物體上,然后一起移動,僅僅在一個鏡頭中,屏幕上同時就有數(shù)百萬個像素。Autodesk公司電影和電視行業(yè)經(jīng)理Bruno Sargeant表示,著色器模型也起到了幫助作用,它相當(dāng)于像素的催化劑,使用數(shù)學(xué)算法讓像素的移動顯得更逼真。
但高端工作站已經(jīng)開始發(fā)揮作用。Adobe和Autodesk這兩家公司都一馬當(dāng)先,讓桌面計(jì)算機(jī)也能處理好CGI特效,而不需要龐大的多臺服務(wù)器或集群。前者擁有64位Mercury渲染引擎,而后者一款名為Smoke的專業(yè)軟件將在今年11月中旬向Mac Pro計(jì)算機(jī)推出。Bruno Sargeant表示,速度快得多的總線、多核處理器、固態(tài)硬盤和GPU加速,這些已經(jīng)萬事俱備。
瑞典業(yè)務(wù)開發(fā)咨詢公司Artair Group的分析師Bjorn Andersson說:“電影特效領(lǐng)域的競爭極其激烈。一些電影的成功依賴它們首次使用了哪種開拓性、突破性的特效。這反過來依賴兩個因素:一是能使用多強(qiáng)大的原始計(jì)算能力?二是開發(fā)新的軟件功能?!?/p>