亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        HDFS:大數(shù)據(jù)分析的軟肋

        2017-04-06 21:29:32
        中國(guó)信息化周報(bào) 2017年8期
        關(guān)鍵詞:和云瓶頸內(nèi)存

        如今,分布式文件系統(tǒng)是大型分析非常重要的一環(huán),即使在使用Spark仍然需要將大量的數(shù)據(jù)快速存入內(nèi)存,所以文件系統(tǒng)一定是高速率的。但其實(shí)HDFS并不像標(biāo)榜的那樣好,它是大數(shù)據(jù)分析的薄弱環(huán)節(jié)。

        我們知道,HDFS中的文件分配表的核心是NameNode,客戶端主要通過(guò)NameNode執(zhí)行數(shù)據(jù)操作,DataNode會(huì)與其他DataNode進(jìn)行通信并復(fù)制數(shù)據(jù)塊以實(shí)現(xiàn)冗余,這樣單一的DataNode損壞就會(huì)導(dǎo)致集群的數(shù)據(jù)丟失。但是NameNode一旦發(fā)生故障,后果就會(huì)非常嚴(yán)重。雖然NameNode可以故障轉(zhuǎn)移,但是花費(fèi)大量的時(shí)間,這也意味著序列中會(huì)有更多的等待時(shí)間。此外,HDFS的垃圾回收,尤其是Java垃圾回收還需要占用大量的內(nèi)存,一般是本機(jī)有效內(nèi)存的10倍左右。

        因?yàn)镠DFS的設(shè)計(jì)更多是建立在響應(yīng)“一次寫(xiě)入、多次讀寫(xiě)”任務(wù)的基礎(chǔ)上,多數(shù)情況下,分析任務(wù)都會(huì)涉及數(shù)據(jù)集中的大部分?jǐn)?shù)據(jù),也就是說(shuō)對(duì)HDFS而言,請(qǐng)求讀取整個(gè)數(shù)據(jù)集要比讀取一條記錄更加高效,所以HDFS在語(yǔ)言選擇方面更偏向于基礎(chǔ)語(yǔ)言,而不是高級(jí)語(yǔ)言。

        傳統(tǒng)的操作可以用更短的時(shí)間來(lái)開(kāi)發(fā)部署,維護(hù)成本更低、安全性更好。業(yè)內(nèi)有這樣一種說(shuō)法,大多數(shù)操作系統(tǒng)支持C語(yǔ)言、匯編和Java的原因是文件系統(tǒng)處于一個(gè)較低水平。HDFS的工具和其他文件系統(tǒng)工具相較存在差距,比起曾經(jīng)處理的任何文件系統(tǒng)或分布式存儲(chǔ),HDFS周?chē)墓ぞ弑憩F(xiàn)不佳?;贘ava的文件系統(tǒng)只能搭上IT人員最喜愛(ài)的POSIX工具的末班車(chē),嘗試過(guò)NFS掛載HDFS嗎?其它的HDFS工具的安裝也相對(duì)較復(fù)雜,相反如果使用REST bridge Tool和客戶端命令行就會(huì)非常容易。

        HDFS支持原生代碼擴(kuò)展,提高了運(yùn)行效率。另外社區(qū)也為NameNode的發(fā)展作出了很多貢獻(xiàn)。如果想要打造一個(gè)高端的系統(tǒng),那么必須打破監(jiān)測(cè)和診斷工具中的NameNode瓶頸,總之在操作系統(tǒng)上使用基于C或C ++的較為成熟的分布式文件系統(tǒng)往往是更好的選擇。

        早期的Hadoop企業(yè)部署基本上是在本地完成,隨著Spark和云部署的崛起,使用Amazon S3作為數(shù)據(jù)源的情況漸漸多了起來(lái)。Hadoop供應(yīng)商都期望能夠出現(xiàn)更為統(tǒng)一的Hadoop平臺(tái),期望HDFS能夠與安全組件集成。Spark本身就因文件系統(tǒng)的多樣性而存在很多矛盾,所以想要和文件系統(tǒng)緊密集成幾乎是不可能。這樣MAPR FS文件系統(tǒng)漸漸引起了企業(yè)的興趣,MAPR FS沒(méi)有NameNode,而是采用了更標(biāo)準(zhǔn)和熟悉的集群方案, MAPR的分區(qū)設(shè)計(jì)很好地避免了瓶頸。

        除了上述的分布式文件系統(tǒng),還有很多的分布式文件系統(tǒng)可以供選擇,例如Ceph、Gluster,其中Gluster是一種更為標(biāo)準(zhǔn)的分布式文件系統(tǒng),擅長(zhǎng)I/O操作。目前大多數(shù)人選擇使用Spark來(lái)存儲(chǔ)文件,是因?yàn)樗麄儗?duì)于Spark更加熟悉,而并非是因?yàn)樗阅芎?、速度快。大型HDFS安裝的遷移并不可能一蹴而就,但隨著時(shí)間的遷移,未來(lái)在Spark和云項(xiàng)目中會(huì)越來(lái)越少看到HDFS,也許HDFS會(huì)脫離YARN,單獨(dú)成為Hadoop的一部分。

        猜你喜歡
        和云瓶頸內(nèi)存
        “春夏秋冬”的內(nèi)存
        基于定位系統(tǒng)和云計(jì)算的電纜線路智能巡檢系統(tǒng)
        電力與能源(2017年6期)2017-05-14 06:19:38
        2017多媒體和云研討會(huì)
        突破霧霾治理的瓶頸
        花婆婆和云
        2017多媒體和云研討會(huì)
        突破瓶頸 實(shí)現(xiàn)多贏
        如何渡過(guò)初創(chuàng)瓶頸期
        基于內(nèi)存的地理信息訪問(wèn)技術(shù)
        繞過(guò)瓶頸
        玩弄人妻奶水无码AV在线| 夜夜添夜夜添夜夜摸夜夜摸 | 99久久国产露脸精品竹菊传媒| 日韩欧美国产自由二区| 丰满人妻被猛烈进入中文字幕护士| 亚洲高清中文字幕视频| 97精品超碰一区二区三区| 婷婷成人亚洲| 精品少妇后入一区二区三区| 日本视频一中文有码中文| 亚洲成av人的天堂在线观看| 久久精品国产亚洲av成人| 久久久精品人妻一区二区三区日本| 一本色道久久亚洲av红楼| 香蕉免费一区二区三区| 学生妹亚洲一区二区| 国产精品女同久久久久久| 国产精品一区av在线| 亚洲av无码乱码国产精品| 国产成人综合一区二区三区| 水蜜桃在线视频在线观看| 亚洲乱码av乱码国产精品| 人人爽久久涩噜噜噜丁香| 欧美自拍丝袜亚洲| 综合人妻久久一区二区精品| 中文字幕亚洲精品一区二区三区| 免费特级毛片| 不卡国产视频| 国产护士一区二区三区| 天天摸夜夜摸夜夜狠狠摸| 天天av天天爽无码中文| 国产伦理自拍视频在线观看| 久久综网色亚洲美女亚洲av| 中年熟妇的大黑p| 精品国产品欧美日产在线| 熟女少妇av一区二区三区| 日韩日韩日韩日韩日韩| 亚洲一区二区三区偷拍女厕| 亚洲综合原千岁中文字幕| av中文字幕一区不卡| 特级婬片国产高清视频|