亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)環(huán)境下MapReduce準入控制的設(shè)計與實現(xiàn)

        2016-03-17 01:55:33李亞如劉建華
        計算機測量與控制 2016年2期
        關(guān)鍵詞:用戶信息

        李亞如,劉建華

        (1.西安郵電大學(xué) 通信與信息工程學(xué)院,西安 710061; 2.西安郵電大學(xué) 信息中心,西安 710061 )

        ?

        大數(shù)據(jù)環(huán)境下MapReduce準入控制的設(shè)計與實現(xiàn)

        李亞如1,劉建華2

        (1.西安郵電大學(xué) 通信與信息工程學(xué)院,西安710061; 2.西安郵電大學(xué) 信息中心,西安710061 )

        摘要:為了保證Hadoop平臺的安全性,確保執(zhí)行MapReduce作業(yè)的TaskTracker節(jié)點符合Hadoop平臺的安全管理要求,杜絕非法用戶對TaskTracker節(jié)點訪問并對其分配任務(wù),提出了一種對JobTracker節(jié)點進行身份認證的方法,設(shè)計實現(xiàn)了對JobTracker節(jié)點進行身份認證的認證體系;該認證體系主要是基于802.1x進行準入控制,重點分析了MapReduce分布式計算的流程,提出了總體設(shè)計方案,完成了相關(guān)模塊的配置實現(xiàn),最終結(jié)果顯示只有通過認證的JobTracker才能通過交換機的可控端口給相應(yīng)的TaskTracker節(jié)點分配任務(wù),有效地避免了非法用戶的訪問,增強了Hadoop平臺的安全性、可靠性,為建設(shè)安全的大數(shù)據(jù)環(huán)境提供了很好的技術(shù)支持。

        關(guān)鍵詞:Hadoop;TaskTracker節(jié)點;802.1x ;大數(shù)據(jù)

        0引言

        隨著網(wǎng)絡(luò)的普及和發(fā)展,數(shù)據(jù)正在以爆炸式的方式生產(chǎn)積累,世界已進入網(wǎng)絡(luò)化的大數(shù)據(jù)時代,然而大規(guī)模數(shù)據(jù)的匯集無形中加大了信息泄漏的風(fēng)險性,因此大數(shù)據(jù)的安全問題成為新的挑戰(zhàn)。Hadoop作為對大數(shù)據(jù)時代所特有的數(shù)據(jù)進行存儲和處理的框架,以成本低、搭建靈活、便于管理等優(yōu)勢,在互聯(lián)網(wǎng)的各個領(lǐng)域得到了廣泛的應(yīng)用和發(fā)展,但其安全機制薄弱缺乏一個安全認證機制,以致無法保證在集群上進行操作的用戶為合法用戶[1]。就MapReduce分布式計算框架而言,JobTracker通過分配任務(wù)給TaskTracker節(jié)點運行,來協(xié)調(diào)管理全部運行在平臺上的作業(yè),如果任意用戶都可訪問TaskTracker節(jié)點并對其分配任務(wù),會導(dǎo)致信息的泄露,產(chǎn)生嚴重后果,這將直接影響著整個平臺的安全性能[2-3]。本文通過對Hadoop的MapReduce分布式計算框架的研究,改良其不足之處,設(shè)計實現(xiàn)對MapReduce進行基于802.1x的準入控制,從而避免非法用戶訪問TaskTracker節(jié)點并對其分配任務(wù),對提高Hadoop平臺的整體安全性能具有重要的現(xiàn)實意義。

        1系統(tǒng)總體設(shè)計

        Hadoop是一個能夠在集群上對大規(guī)模數(shù)據(jù)進行分布式計算和處理的開源框架,實現(xiàn)了Google的Map-Reduce編程模型和框架,能夠把應(yīng)用程序分割成許多小的工作單元,并把這些單元放到集群的節(jié)點上執(zhí)行處理[4]。Hadoop框架最核心的兩個設(shè)計模塊就是HDFS分布式文件系統(tǒng)和MapReduce分布式計算框架。HDFS以流式數(shù)據(jù)訪問的模式實現(xiàn)了大規(guī)模數(shù)據(jù)的存儲,MapReduce實現(xiàn)了對海量數(shù)據(jù)進行并行計算處理的應(yīng)用[5]。

        當client節(jié)點向Hadoop集群提交一個MapReduce作業(yè)時,JobClient調(diào)用runJob()方法創(chuàng)建JobClient實例并通過調(diào)用其submitJob()方法提交作業(yè),與此同時JobClient會在client節(jié)點將運行作業(yè)所需的資源信息打包成jar文件存儲到HDFS中。當JobTracker接收到submitJob()方法的調(diào)用后,會創(chuàng)建一個正在運行的作業(yè)對象,為創(chuàng)建任務(wù)運行列表,JobTracker需從共享文件系統(tǒng)(Shared FileSystem)中檢索Hadoop已劃分好的獨立的輸入數(shù)據(jù)分片(input slipt)。為了確保試圖在Hadoop集群上對TaskTracker節(jié)點執(zhí)行操作的用戶為安全合法用戶,JobTracker將每一個分片創(chuàng)建的task任務(wù)發(fā)送給TaskTracker時需通過認證者進行身份驗證,若為合法的安全用戶,任務(wù)發(fā)送成功,若不合法,任務(wù)發(fā)送失敗并重新進行身份驗證。當TaskTracker接收到分配的任務(wù)后,首先將任務(wù)所包含的所有信息從共享文件中檢索緩存,然后創(chuàng)建一個TaskRunner實例來執(zhí)行該任務(wù),TaskRunner將啟動一個新的JVM運行Map 任務(wù)或Reduce 任務(wù),以確保Map和Reduce的獨立性。具體系統(tǒng)的總體設(shè)計如圖1所示。

        圖1 具體系統(tǒng)的總體設(shè)計

        對于hadoop集群執(zhí)行MapReduce作業(yè)的過程來講,主要分為5個獨立的部分:Client節(jié)點、JobTracker節(jié)點、TaskTracke節(jié)點、HDFS和認證者。具體各部分功能概述如表1所示。其中JobTracker節(jié)點、TaskTracke節(jié)點和認證者構(gòu)成了認證體系,在認證體系模塊中進行詳細的介紹。

        表1 各部分功能概述

        2具體的設(shè)計方案

        2.1Hadoop集群的配置方案

        Hadoop集群是一種典型的主從式架構(gòu),它可劃分為Master和Slave兩個角色, 其中在Master節(jié)點上運行著NameNode、JobTracker,而在每個Slave節(jié)點上,都部署一個DataNode和TaskTracker。Hadoop是基于Java編程語言的可運行在大型主機群上的應(yīng)用程序,因此對Hadoop進行安裝之前首先要配置SSH和支持Java運行環(huán)境的JDK,其中SSH和JDK的配置安裝沒有先后順序。配置完成SSH和JDK后,再進行Hadoop的安裝配置,最后完成Hadoop集群的搭建。

        2.1.1SSH和JDK的配置

        Hadoop通過SSH(Secure Shell)來管理其守護進程,因此必須安裝SSH。在完全分布的模式下,Hadoop控制腳本依賴SSH來執(zhí)行針對整個集群的操作,為了支持無縫工作,需要在各個節(jié)點之間執(zhí)行指令的時候進行無密碼登陸的形式,所以在配置SSH需要無密碼公鑰認證的形式。

        首先確保 Hadoop集群的各個節(jié)點中SSH 已經(jīng)被安裝。為了實現(xiàn)無密碼登錄,在集群的master節(jié)點下生成一組無密碼登錄的密鑰,在默認的情況下將authorized_keys文件復(fù)制到各個授權(quán)的slave節(jié)點的/.ssh 目錄下。這樣配置之后,master節(jié)點可以無密碼登錄所有的slave節(jié)點。

        配置支持Java運行環(huán)境的JDK之前,先對集群的各個節(jié)點安裝jdk1.8.0_51并保證其安裝路徑一致,在此基礎(chǔ)上對/.bashrc文件中的環(huán)境變量JAVA_HOME、CLASSPATH、PATH和JRE_HOME進行配置。

        2.1.2Hadoop的配置

        搭建Hadoop集群首先在Master節(jié)點上安裝Hadoop,本系統(tǒng)使用的Hadoop版本為hadoop-1.2.1。安裝完成之后需要在hadoop/conf目錄下進行配置,其常用的3個配置文件為core-site.xml文件、hdfs-site.xml文件、mapred-site.xml文件,分別完成對HDFS地址和端口、HDFS數(shù)據(jù)副本數(shù)量、MapReduce的地址和端口的配置。啟動 Hadoop之前,需要對Hadoop 的HDFS文件系統(tǒng)進行格式化,在Master節(jié)點hadoop的安裝目錄下輸入bin/hadoop namenode -format命令格式化文件系統(tǒng),自此 Hadoop 的文件配置全部完成。

        2.1.3Hadoop集群的搭建

        完成Master節(jié)點的Hadoop安裝配置后,將該節(jié)點的hadoop文件夾拷貝至其他Slave節(jié)點處即可完成集群配置,在Master節(jié)點hadoop的安裝目錄下執(zhí)行bin/start-all.sh命令啟動 Hadoop集群。

        2.2認證體系的配置方案

        在Hadoop平臺執(zhí)行MapReduce作業(yè)的過程中,JobTracker節(jié)點作為請求者向TaskTracker節(jié)點發(fā)送分配任務(wù)時,根據(jù)802.1x認證程序,輸入認證信息發(fā)起802.1x認證,認證者通過非可控端口收到請求者提交的認證數(shù)據(jù)信息,發(fā)送至TaskTracker節(jié)點上的認證服務(wù)器進行驗證,服務(wù)器將接收到的用戶信息與數(shù)據(jù)庫中的用戶信息進行比對,如果用戶信息一致則認證成功,可控端口打開任務(wù)發(fā)送成功,如果認證失敗,交換機的端口保持關(guān)閉狀態(tài),任務(wù)分配失敗。

        802.1x是一種基于物理端口或邏輯端口(如VLAN)的認證協(xié)議,是一種對用戶身份進行認證的方法和策略。進行802.1x認證的最終目的就是限制未授權(quán)的用戶或設(shè)備通過端口接入網(wǎng)絡(luò)[6-7]。它的體系結(jié)構(gòu)包括二個模塊:即請求模塊、認證模塊,其中認證模塊包括認證者和認證服務(wù)器。具體的認證體系結(jié)構(gòu)如圖2所示。

        圖2 認證體系結(jié)構(gòu)

        2.2.1請求模塊的配置

        請求模塊一般是支持802.1x認證的用戶終端設(shè)備,用戶通過啟動客戶端軟件發(fā)起802.1x認證,由認證系統(tǒng)對其進行身份認證來實現(xiàn)基于端口的接入控制[8-9]。在MapReduce作業(yè)執(zhí)行的過程中JobTracker節(jié)點作為請求者訪問被分配任務(wù)的TaskTracker節(jié)點,因此在JobTracker節(jié)點進行配置以實現(xiàn)對802.1x認證標準的支持。

        2.2.2認證模塊的配置

        在hadoop 集群中執(zhí)行MapReduce作業(yè)的過程中,交換機和被分配任務(wù)的TaskTracker節(jié)點充當了認證體系中的認證模塊。交換機作為認證者通常為兩層可網(wǎng)管的交換機,其作用就是在端口上啟用802.1x進行認證、指定認證服務(wù)器的信息以及根據(jù)認證結(jié)果控制端口狀態(tài)等。

        TaskTracker節(jié)點作為認證服務(wù)器為認證系統(tǒng)提供認證服務(wù)的實體,本系統(tǒng)使用freeradius服務(wù)器來實現(xiàn)認證服務(wù)器的認證和授權(quán)功能。freeradius是一款開源的、免費的服務(wù)器軟件,不僅具有一般radius服務(wù)器所具有的認證、授權(quán)和計費功能,還可以靈活的配置和發(fā)送請求[10]。在TaskTracker節(jié)點上安裝freeradius軟件,并對其進行相關(guān)的配置,從而實現(xiàn)在Hadoop平臺下的認證服務(wù)器。由于需要在服務(wù)器系統(tǒng)通過獲取mysql數(shù)據(jù)庫中存儲的用戶名和密碼等認證信息,以此來校驗JobTracker節(jié)點發(fā)送來的認證信息,所以需先安裝mysql數(shù)據(jù)庫。安裝完數(shù)據(jù)庫之后再安裝freeradius并對其進行配置。配置完成后,啟動服務(wù)器,在終端輸入radtest test test 192.168.0.147 100 testing123,可以看到服務(wù)器收到了請求,并返回成功接收信息。如圖3所示。

        圖3 配置成功后服務(wù)器狀態(tài)

        3實驗結(jié)果與分析

        根據(jù)上述的設(shè)計方案,利用實驗室的資源搭建了一個Hadoop集群的實驗平臺,實現(xiàn)對TaskTracker節(jié)點進行訪問控制的驗證。整個實驗平臺由3臺普通的pc機和一個可網(wǎng)管的銳捷交換機組成,操作系統(tǒng)選擇ubuntu,支持Java運行環(huán)境的JDK版本為jdk-8u51-linux,Hadoop軟件版本為Hadoop-1.2.1,實現(xiàn)認證功能的服務(wù)器軟件為freeradius。

        在Hadoop的實驗平臺,將pc1作為JobTracker節(jié)點,pc2和pc3作為TaskTracker節(jié)點。平臺結(jié)構(gòu)如圖4所示。

        圖4 平臺結(jié)構(gòu)示意圖

        在master節(jié)點的hadoop安裝目錄下使用bin/start-all.sh命令開啟hadoop集群,然后可以通過 web 模式看到MapReduce基本信息的管理界面如圖5所示,通過該界面我們可以看到MapReduce 系統(tǒng)的運行狀態(tài),啟動時間等基本信息,以及集群正在運行的 maps 和 reduces 數(shù)目,活躍節(jié)點數(shù),Maptask 的容量,Reducetask的容量等的摘要信息。

        圖5 MapReduce 管理界面

        為了實現(xiàn)對TaskTracker節(jié)點進行訪問控制的驗證,開啟TaskTracker節(jié)點的 freeradius服務(wù)器來進行實驗測試。我們采用系統(tǒng)的 wordcount程序?qū)斎胛募M行單詞個數(shù)統(tǒng)計,并匯總所有統(tǒng)計結(jié)果輸出。輸入實驗測試信息,彈出用戶輸入憑據(jù),如圖6所示。

        圖6 用戶輸入憑據(jù)

        輸入正確的用戶信息后,點擊連接。實驗運行結(jié)束,可以通過 web 模式看到實驗結(jié)果信息的管理界面,如圖7所示。

        圖7 實驗結(jié)果界面

        通過在Hadoop的實驗平臺運行wordcount程序作業(yè)對TaskTracker節(jié)點進行身份認證的實驗,實現(xiàn)了Hadoop平臺中對TaskTracker節(jié)點進行身份認證的安全控制。從實際效果來看,系統(tǒng)整體運行狀況平穩(wěn),達到了系統(tǒng)設(shè)計目標。

        4結(jié)束語

        Hadoop作為一個能夠?qū)A繑?shù)據(jù)進行分布式存儲和計算的平臺,在各個領(lǐng)域得到了廣泛的應(yīng)用。MapReduce分布式計算作為Hadoop的核心技術(shù)之一,主要對海量數(shù)據(jù)進行分布式計算處理。但是目前在MapReduce計算的環(huán)境中缺乏一個安全機制,無法保證對TaskTracker節(jié)點進行任務(wù)分配的是合法安全的用戶,本設(shè)計通過使用802.1x協(xié)議的網(wǎng)絡(luò)準入控制對訪問者進行身份驗證,有效地避免了非法用戶訪問TaskTracker節(jié)點,增強了Hadoop平臺的安全性、可靠性,為建設(shè)安全的大數(shù)據(jù)環(huán)境提供了很好的技術(shù)支持。

        參考文獻:

        [1]李曉蕾. 基于Hadoop社交網(wǎng)絡(luò)分析平臺的設(shè)計與實現(xiàn)[J]. 計算機測量與控制,2014(12):4094-4097.

        [2]鄭曉薇,項明,張大為,等. 基于節(jié)點能力的Hadoop集群任務(wù)自適應(yīng)調(diào)度方法[J]. 計算機研究與發(fā)展,2014(3):618-626.

        [3]曹旭. Hadoop平臺下海量日志數(shù)據(jù)處理模型的研究及改進[D].杭州:浙江理工大學(xué),2013.

        [4]何翔,李仁發(fā),唐卓. 一種異構(gòu)環(huán)境下的基于MapReduce任務(wù)調(diào)度改進機制[J]. 計算機應(yīng)用研究,2013(11):3370-3373,3379.

        [5]任萱萱. 基于Hadoop平臺的作業(yè)調(diào)度研究[D].天津:天津師范大學(xué),2011.

        [6]王昌旭,周振柳,許榕生. 網(wǎng)絡(luò)接入安全控制研究[J]. 計算機應(yīng)用與軟件,2008(11):92-94.

        [7]朱兵,周爽,張攀. 基于主機信息的802.1x的改進方案設(shè)計[J]. 信息安全與技術(shù),2010(7):114-116.

        [8]鹿凱寧,韋乃文. 802.1x協(xié)議安全性能的改進[J]. 電子測量技術(shù),2007(1):107-109.

        [9]黃永鋒,王濱,許曉東. RADIUS在802.1x中的應(yīng)用[J]. 計算機工程與設(shè)計,2006(5):798-801.

        [10]楊凌鳳. 使用USBKey提高FreeRadius證書認證的安全性[J]. 計算機安全,2008(2):42-44.

        Design and Implementation of Mapreduce Access Control in Big Data Environment

        Li Yaru1,Liu Jianhua2

        (1.School of Communication and Information Engineering,Xi'an University of Posts and Telecommunications,Xi'an710061, China; 2.Information Center, School of Communication and Information Engineering,Xi'an University of Posts and Telecommunications,Xi'an710061, China )

        Abstract:In order to ensure the security of Hadoop platform,to ensure that the TaskTracker node of the MapReduce operation is in accordance with the safety management requirements of the Hadoop platform, Put an end to the illegal users access to TaskTracker node and the assigned task, A method of authentication for JobTracker node is proposed, Design and implementation of the authentication system for JobTracker nodes. The certification system is mainly based on 802.1x performs admission control, Focus on the analysis of the process of MapReduce distributed computing, Put forward the overall design scheme, Complete the configuration of the relevant module, The final result shows that the TaskTracker node assignment can be assigned to the corresponding JobTracker node through the control of the switch, Effectively avoid the illegal user access, Enhanced security and reliability of the Hadoop platform, For the construction safety of big data environment provides a good technical support.

        Keywords:Hadoop;TaskTracker node;802.1x;big data

        文章編號:1671-4598(2016)02-0114-04

        DOI:10.16526/j.cnki.11-4762/tp.2016.02.031

        中圖分類號:TP273

        文獻標識碼:A

        作者簡介:李亞如(1988-),女,山西晉城人,碩士研究生,主要從事網(wǎng)絡(luò)與信息安全方向的研究。劉建華(1963-),男,陜西西安人,教授,高級工程師,主要從事信息安全方向的研究。

        收稿日期:2015-12-03;修回日期:2015-12-30。

        猜你喜歡
        用戶信息
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        100萬用戶
        如何獲取一億海外用戶
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        国产黄大片在线观看画质优化| 中文乱码字幕在线中文乱码| 青青久久精品一本一区人人| 插鸡网站在线播放免费观看| 色噜噜狠狠一区二区三区果冻| 99国产精品视频无码免费| 色婷婷激情在线一区二区三区| 国产专区国产精品国产三级| 国内精品久久久人妻中文字幕| 无码人妻精品一区二区三区免费| 成人精品国产亚洲欧洲| 黄片免费观看视频播放| 人妻无码一区二区三区| 99偷拍视频精品一区二区| 久久夜色精品国产亚洲噜噜| 久久精品蜜桃美女av| 久久天天躁夜夜躁狠狠| 国产精品区一区第一页| 麻豆久久久国内精品| 四季极品偷拍一区二区三区视频| 亚洲av无码一区二区三区天堂古代 | 国产专区国产av| 色噜噜狠狠色综合欧洲| 亚洲国产一区二区网站| 少妇人妻综合久久中文字幕| 日韩毛片基地一区二区三区| av免费看网站在线观看| 亚洲精品1区2区在线观看| 无码人妻av一区二区三区蜜臀| 中文AV怡红院| 色婷婷精品大在线视频| 国产欧美日韩精品丝袜高跟鞋| 996久久国产精品线观看 | 国产成人精品午夜福利在线 | 久久一区二区三区少妇人妻| 亚洲精品国产美女久久久| 欧美a在线播放| 亚洲综合国产精品一区二区| 国内激情一区二区视频| 亚洲 小说区 图片区 都市| 亚洲精品无码久久久久av麻豆|