在論壇里看到一個(gè)帖子說(shuō)有個(gè)外國(guó)變態(tài)用KGB Archiver這款壓縮軟件把439.6MB大小的Of-fice2007安裝包壓縮成了1.43MB大小,并發(fā)布到了網(wǎng)上。很多人的第一反應(yīng)就是不可能,但東西就在這兒,是真是假解壓出來(lái)就知道了,于是不少人就抱著將信將疑的態(tài)度,下載了這個(gè)1.43MB 的Office2007。然而解壓的時(shí)候卻讓眾人又大吃一驚,有人說(shuō)用P4 630的CPU、1GB內(nèi)存的電腦解壓要花6個(gè)小時(shí),配置差些的電腦甚至要花10~20 小時(shí)不等。如此漫長(zhǎng)的解壓時(shí)間,把眾人的胃口吊得更高了,于是在等待結(jié)果那段時(shí)間里,眾人就展開(kāi)了激烈的討論。
首先說(shuō)說(shuō)KGB Archiver 這款壓縮軟件吧,它是一款壓縮率高得不可思議的壓縮工具。它超越了如7zip和UHARC等以高壓縮率而著稱的壓縮工具,但是它對(duì)硬件的需求也較高,使用它的最大壓縮模式居然需要4GB內(nèi)存!軟件作者推薦的最低配置為1.5GHz CPU和256MB 的內(nèi)存,推薦最佳配置為3.0GHz的64位CPU和1.5GB 的內(nèi)存。
接著回到眾人的討論中,有人說(shuō)Maximum Compression網(wǎng)站有對(duì)各種壓縮軟件的變態(tài)測(cè)試,那里的測(cè)試結(jié)果是KGBArchiver可以把500MB 的數(shù)據(jù)壓縮到70多MB,即使是現(xiàn)在最強(qiáng)的WinRK 或者PAQ8G 也只能壓縮到60 幾MB,以此證明這個(gè)1.43MB 的Office2007 是忽悠人的(網(wǎng)址:http://www .maximumcompression.com/data/summary_mf.php)。但又有人提出了“微觀壓縮理論”,說(shuō)任何的數(shù)字?jǐn)?shù)據(jù)都可以用一個(gè)小于1 大于0 的有理數(shù)序列表表示,而這樣的數(shù)字都可以在數(shù)軸上表示出來(lái),因此只要一個(gè)字節(jié)就可以表示出最大地址值的數(shù)據(jù)量,最理想的情況下我們可以用1M B的空間存儲(chǔ)1 TB 的內(nèi)容。頓時(shí)就有人對(duì)這個(gè)在Google上都搜索不到的理論表示置疑,有的人就一步步分析此人的理論,說(shuō)經(jīng)壓縮后的1TB 數(shù)據(jù)依然屬于“任何”數(shù)據(jù),那么它就應(yīng)該能繼續(xù)重復(fù)壓縮,那就證明世界上所有數(shù)據(jù)的全集可以壓縮為容量1MB ,這顯然就很荒謬了。還有的人就把信息論之父C.E.Shannon 的理論搬出來(lái),說(shuō)信息編碼是有極限的,在一定的概率模型下,無(wú)損壓縮的編碼長(zhǎng)度不可能小于信息熵公式給出的結(jié)果。而提出微觀壓縮理論的人又說(shuō)這個(gè)理論是顛覆信息學(xué)的,不能用信息學(xué)來(lái)解釋,限制它實(shí)現(xiàn)的只有物理極限和技術(shù)水平。如此一番唇槍舌劍,讓論壇里多了一絲學(xué)術(shù)氣氛。
經(jīng)過(guò)6 個(gè)多小時(shí)的等待,終于有人把它解壓完了,然而安裝的時(shí)候卻提示OSETUP.DLL 文件的數(shù)字簽名無(wú)效,無(wú)法進(jìn)行安裝。難道等待了6 個(gè)小時(shí)就是這么個(gè)結(jié)果?所幸發(fā)布這個(gè)Office2007 的鬼佬后來(lái)又提供了單獨(dú)的OSETUP.DLL文件下載,但是替換掉這個(gè)文件后,仍然無(wú)法安裝。不甘心者本著實(shí)事求是的態(tài)度,用UltraEdit打開(kāi)了里面的幾個(gè)CAB文件,發(fā)現(xiàn)內(nèi)容竟然全部是FF,就連E XE 文件也有一大部分內(nèi)容是00,估計(jì)整個(gè)壓縮文件中可能就那么一兩個(gè)小文件是真實(shí)的。還有的人用Win R AR 的最大壓縮方式把解壓后的Office2007 又重新壓縮了一遍,最后得到的壓縮文件竟然只有3.73MB,由此更加證明Office2007安裝包里面絕大多數(shù)都是些空文件,根本就不是有效的安裝程序。如果是空文件,那么這么大的壓縮比就很好解釋了。所謂空文件,就是文件的16進(jìn)制內(nèi)容全是00的文件(也可以是FF),這樣的文件不管它的體積有多大,壓縮后的體積也會(huì)很小。熟悉數(shù)據(jù)庫(kù)操作的人就知道,隨便建一個(gè)1GB的數(shù)據(jù)庫(kù),這個(gè)空數(shù)據(jù)庫(kù)文件壓縮后可能就只有幾KB 大小。
最后終于可以得出結(jié)論:我們被這個(gè)鬼佬忽悠了一把。但是這件事也讓更多的人認(rèn)識(shí)到了K G B Archiver這款壓縮軟件。其實(shí),壓縮軟件一味地追求高壓縮率并不明智,因?yàn)楦邏嚎s率往往對(duì)硬件的依賴程度也很高,像解壓這個(gè)1.43MB的Office2007要花6個(gè)小時(shí),有這么多時(shí)間,都足夠通過(guò)網(wǎng)絡(luò)傳輸一份未經(jīng)壓縮的Office2007安裝程序了。隨著存儲(chǔ)技術(shù)和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,個(gè)人用戶將會(huì)在未來(lái)幾年體驗(yàn)到更大容量的存儲(chǔ)器和更快的網(wǎng)速。當(dāng)我們只要花1 分鐘就可以下載一部HDTV影片的時(shí)候,誰(shuí)還愿意去下載一部要花10 個(gè)小時(shí)解壓后才能觀看的影片呢?所以壓縮軟件不用一味地追求高壓縮率的神話,把握好壓縮率與時(shí)間以及硬件配置之間的平衡關(guān)系,才能讓大家用得滿意,這也就是為什么WinZIP 和WinRAR 能占有壓縮軟件市場(chǎng)絕大份額的原因之一吧。
本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。