亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)絡(luò)爬蟲的教師信息技術(shù)能力提升研究

        2019-03-08 06:22:52聶文苗
        中國教育信息化 2019年4期
        關(guān)鍵詞:爬蟲工具信息技術(shù)

        聶文苗

        (湖南師范大學(xué) 教育科學(xué)學(xué)院,湖南 長沙410081)

        一、引言

        隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)信息量呈爆炸式增長,各個領(lǐng)域發(fā)生重大變化。在教育領(lǐng)域,面對海量、高頻、多樣化的數(shù)據(jù)資源,如何利用信息技術(shù)克服諸多問題、高效精準(zhǔn)地獲取目標(biāo)數(shù)據(jù)成為人們關(guān)注的熱點。2014年,教育部為加強教師隊伍建設(shè),全面提升教師信息技術(shù)應(yīng)用能力,頒發(fā)了《中小學(xué)教師信息技術(shù)應(yīng)用能力標(biāo)準(zhǔn)(試行)》(以下簡稱《能力標(biāo)準(zhǔn)》),該標(biāo)準(zhǔn)指出通過多種途徑獲取數(shù)字教育資源及掌握加工、利用和管理數(shù)字教育資源的工具與方法是提高信息技術(shù)應(yīng)用能力的重要內(nèi)容,也是信息化社會教師必備的專業(yè)能力。[1]這充分表明掌握獲取教育資源的技術(shù)是加強教師信息技術(shù)運用能力與專業(yè)發(fā)展支持力的重要影響因素。網(wǎng)絡(luò)爬蟲提供了多樣化信息獲取與管理途徑,因此,學(xué)習(xí)利用網(wǎng)絡(luò)爬蟲技術(shù)為信息化教育教學(xué)提供了條件,適應(yīng)了教育信息化2.0的行動要求,深化信息技術(shù)助推教育教學(xué)改革。

        目前,以“爬蟲”為主題的研究側(cè)重于技術(shù)應(yīng)用,與教育相結(jié)合的文獻很少,它潛在的教育領(lǐng)域價值沒有得到有效發(fā)揮,尤其對于教師信息技術(shù)能力的提升。本研究旨在使讀者理解網(wǎng)絡(luò)爬蟲概念、明確其獨特優(yōu)勢、了解多層遞階爬蟲工具的使用及對教師信息技術(shù)能力的作用,在一定程度上為教師提供了策略參考。

        二、網(wǎng)絡(luò)爬蟲優(yōu)勢分析

        網(wǎng)絡(luò)爬蟲(Web Crawler),又稱為網(wǎng)絡(luò)蜘蛛(Web Spider)或Web信息采集器,是一種按照一定的規(guī)則自動下載網(wǎng)頁的計算機程序或自動化腳本,是互聯(lián)網(wǎng)關(guān)鍵技術(shù)之一。按照系統(tǒng)結(jié)構(gòu)和實現(xiàn)細節(jié),可以將網(wǎng)絡(luò)爬蟲分為通用型網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲。[2]不同類型爬蟲在爬取范圍、運算方式等方面各具特色,可以將多種協(xié)作方式和不同類型爬蟲結(jié)合,使其共同發(fā)揮作用。本研究中多層遞階工具適用于通用和聚焦爬蟲。筆者總結(jié)了網(wǎng)絡(luò)爬蟲的優(yōu)勢,體現(xiàn)在以下三方面:

        1.彌補傳統(tǒng)搜索引擎的不足

        人們獲取資源的方式仍停留在依賴傳統(tǒng)的搜索引擎階段。傳統(tǒng)的通用搜索引擎作為輔助人們檢索獲取資源的工具成為用戶訪問萬維網(wǎng)的入口,使用普遍但存在一定的局限性:①不同領(lǐng)域用戶搜索后返回的結(jié)果往往包含大量無關(guān)內(nèi)容,無法滿足檢索需求;②通用搜索引擎對結(jié)構(gòu)化、信息密集的數(shù)據(jù)不敏感;③有限的搜索引擎服務(wù)器資源與無限的網(wǎng)絡(luò)資源之間的矛盾加深。對教師而言,處理好教育資源需求與“滯后”信息技術(shù)應(yīng)用能力之間的矛盾是信息化環(huán)境的必然要求。網(wǎng)絡(luò)爬蟲可以通過不同方式定向抓取多樣化有效數(shù)據(jù),彌補了傳統(tǒng)搜索引擎的諸多不足。

        2.用海量數(shù)據(jù)得到價值信息

        由于以往數(shù)據(jù)資源獲取受限,導(dǎo)致只能隨機抽樣采集數(shù)據(jù)達到“用最少數(shù)據(jù)得到最多信息”,而到了大數(shù)據(jù)時代,小數(shù)據(jù)時代的隨機抽樣已經(jīng)失去了原有的意義,隨之而來的“樣本=總體”的全數(shù)據(jù)模式受到廣泛認同。[3]教師為適應(yīng)這種“讓數(shù)據(jù)發(fā)聲”新模式,必須克服傳統(tǒng)觀念的局限性,發(fā)展“用海量數(shù)據(jù)得到價值信息”的新思維,拓展其他符合現(xiàn)實性需求的技能。例如利用網(wǎng)絡(luò)爬蟲獲取海量數(shù)據(jù),使之具有更高使用價值,滿足作為基于“技術(shù)理性”之上的教學(xué)能手的需求。

        3.避免獲取數(shù)據(jù)同數(shù)據(jù)分析和預(yù)測階段割裂

        數(shù)據(jù)作為一種特殊資產(chǎn),并不會隨著使用而減少,相反,可以被不斷處理來增加價值。我們強調(diào)生成并不意味著否定預(yù)設(shè),教師需要獲取某主題數(shù)據(jù)資源時,必須對爬取任務(wù)、數(shù)據(jù)分析和發(fā)現(xiàn)預(yù)測有一個清晰、理性的思考和安排,不能割裂相關(guān)階段的連接。在傳統(tǒng)教學(xué)中,教師已然習(xí)慣“拿來數(shù)據(jù)”,而不是實在地體驗或感受數(shù)據(jù)從哪里來、到哪里去,為改變這種被動狀態(tài),避免獲取數(shù)據(jù)同數(shù)據(jù)分析和預(yù)測階段割裂,掌握多層遞階爬蟲工具是一種可行之策。

        三、運用多層遞階爬蟲工具提升教師信息技術(shù)能力策略

        1.多層遞階爬蟲工具的使用

        2011年聯(lián)合國教科文組織創(chuàng)建了具有影響力的《教師信息和傳播技術(shù)能力標(biāo)準(zhǔn)》。歐洲組織根據(jù)教育發(fā)展現(xiàn)狀簡化了該標(biāo)準(zhǔn),提出了符合歐洲實際特點的《eTQF教師信息技術(shù)能力框架》,包括四個一級指標(biāo)和十三個二級指標(biāo),其中,將教師的技術(shù)能力發(fā)展水平分為入門工具、基本工具、普適工具、復(fù)雜工具四個階段。[4]這種劃分適應(yīng)了教師能力發(fā)展規(guī)律,也為各種技術(shù)工具的層級分類提供了參照。爬蟲工具作為爬蟲技術(shù)(基于Python)在實踐探索中的主要適應(yīng)性措施,在資源獲取與管理中占據(jù)著重要地位。結(jié)合網(wǎng)絡(luò)爬蟲的實際應(yīng)用特點,筆者將入門工具、基本工具、普適工具、復(fù)雜工具統(tǒng)稱為“多層遞階爬蟲工具”,體現(xiàn)爬蟲技術(shù)能力發(fā)展的四種層次階段,具體如圖1所示。每層級工具之間過渡特征明顯,總體呈梯度上升,又都對教師信息技術(shù)能力提升有影響,且影響維度具有一致性。

        圖1 多層遞階爬蟲工具作用模型

        在爬蟲技術(shù)能力發(fā)展中,入門工具主要指獲取和管理定向規(guī)模數(shù)據(jù),適合做教師學(xué)習(xí)入口,屬于輕量級的爬蟲;基本工具是指教師掌握一定的運用技巧,熟悉各種下載與解析方法的特點,以“通用爬蟲框架”為解決問題的利器;普適工具是借助于“已造輪子”——造數(shù)等新一代智能云爬蟲工具來快速地尋找并獲取資源;復(fù)雜工具是以重量級爬蟲——Scrapy框架為代表,它的應(yīng)用已到達爬蟲技能的高度發(fā)展水平,教師能適時適需修改編寫各組件內(nèi)容以適應(yīng)特殊主題或滿足具體情境的需要。各層級爬蟲工具的方法指導(dǎo)如表1所示。核心思想都是按照“發(fā)送請求—獲得頁面—解析頁面—抽取并存儲內(nèi)容”的流程進行,體現(xiàn)了比較完整的工具鏈。在由淺入深、由簡單到復(fù)雜的循序漸進過程中,各級工具之間的過渡特征明顯,表現(xiàn)為:①入門到基本工具的通用化,即將解析與翻頁的過程抽象成具有特定功能、可重用的函數(shù),以此為通用模板實現(xiàn)代碼復(fù)用;②基本到普適工具的智能化,即運用已搭建平臺持續(xù)積累數(shù)據(jù)資源、智能挖掘結(jié)構(gòu)化數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)價值;③普適到復(fù)雜工具的工程化,即通過各種組件的模塊化來增強爬蟲性能。當(dāng)然,具體問題具體分析,比如教師結(jié)合性能、使用難度、安裝難度三方面特征選擇合適的解析方法,Xpath性能快,使用較復(fù)雜,安裝相對困難,一般通過下載與計算機版本匹配的whl文件形式進行安裝,過程雖復(fù)雜但不會出現(xiàn)錯誤。

        表1 各層級爬蟲工具指導(dǎo)

        2.提升教師信息技術(shù)能力策略

        不同階段爬蟲工具使用難度和實現(xiàn)細節(jié)有差異,但都有助于提升教師的信息技術(shù)應(yīng)用能力。從教師工作角度來探討,其主要體現(xiàn)在教學(xué)、學(xué)習(xí)方式和專業(yè)發(fā)展三方面,這與《能力標(biāo)準(zhǔn)》中強調(diào)的內(nèi)容相符合。

        (1)“內(nèi)容開發(fā)+活動組織”改進課堂教學(xué)

        在教學(xué)方面,爬蟲作為一項出現(xiàn)較早但近幾年才被廣泛熟知的技術(shù),若合理融入到教師的教育工作中,不僅能夠通過提高技術(shù)攝入量來提升教師的技術(shù)素養(yǎng),它所爬取的優(yōu)質(zhì)資源還可作為開發(fā)教學(xué)內(nèi)容的重要補充、組織教學(xué)活動的基本線索。從生成的角度來講,教師首先將所獲取初始、凌亂、孤立的大規(guī)模數(shù)據(jù)整理分析形成自身的理解,其次對數(shù)據(jù)分析結(jié)果的意義形成自身的解讀,再次對爬取數(shù)據(jù)的分析結(jié)論內(nèi)容重新組合,形成新的知識整體(即具有新的模式或結(jié)構(gòu)的知識)。在這種遞進過程中,可以開發(fā)挖掘和合理利用豐富的資源成果,著眼知識整體的基礎(chǔ)上做適當(dāng)擴展,從而為學(xué)生提供感受不同知識間內(nèi)在關(guān)聯(lián)的機會和活動情境,使課堂變得生機勃勃,提升了教師教育教學(xué)能力。同時,也極易引發(fā)知識創(chuàng)新,從而影響教育活動組織,為信息化教學(xué)創(chuàng)造無限可能性。

        (2)“合作共享+自主探索”創(chuàng)新學(xué)習(xí)方式

        教師作為“自強標(biāo)兵”,其信息技術(shù)應(yīng)用能力不能僅局限于計算機等硬件設(shè)備和一些基礎(chǔ)性的簡單操作,如Word文檔、PPT課件,有必要發(fā)展適應(yīng)性技能。教師根據(jù)需要選擇合適的爬蟲方法,獲取雜亂的大規(guī)模數(shù)據(jù)并處理,并轉(zhuǎn)化為個人知識進一步加工,從而由知識的“容器”轉(zhuǎn)變?yōu)橹R的“發(fā)生器”,培養(yǎng)了自主學(xué)習(xí)能力,并樂于分享加工成果,形成合作共享、自主探索的學(xué)習(xí)方式。這樣既在合作交流中發(fā)揮集體智慧、增強凝聚力,又在多元化和全面性中提升自己的信息素養(yǎng),使教師能夠體驗到自主學(xué)習(xí)帶來的喜悅和成就感。除此之外,也為學(xué)生樹立了榜樣作用,啟迪學(xué)生以教師掌握的技術(shù)手段為模范,嘗試性地進行爬蟲技術(shù)的應(yīng)用,逐漸適應(yīng)自主檢索和獲取學(xué)習(xí)資源的過程,使自己的學(xué)習(xí)方式不再單一,更加靈活方便,促進學(xué)習(xí)的良性循環(huán)。

        (3)“群體建設(shè)+自我反思”共促專業(yè)發(fā)展

        教師的專業(yè)內(nèi)涵并不是封閉、靜態(tài)、一勞永逸的,需要經(jīng)常對專業(yè)知識和內(nèi)容進行動態(tài)更新,這就對教師信息技術(shù)能力提出了新要求。教師利用爬蟲技術(shù)手段整合多方資源,經(jīng)處理與分析后作為知識深化的重要渠道,可以應(yīng)用于解決現(xiàn)實復(fù)雜問題,循序漸進增長專業(yè)知識,并在此基礎(chǔ)上對專業(yè)發(fā)展進行再認識、再思考,然后通過反思這種理性智慧,對自己的教育觀念和專業(yè)內(nèi)涵進行客觀、理性的認識和判斷,形成對現(xiàn)象和問題的獨立思考和創(chuàng)造性見解。當(dāng)然,知識的獲取與存儲不是目的,知識的創(chuàng)新與分享才是目的。單個教師積極尋找新內(nèi)容和新策略解決所面臨的專業(yè)問題,分享從爬蟲中受益的成果,這容易產(chǎn)生“群體影響”,使教師的角色定位從“知識傳授者”向“研究者”轉(zhuǎn)變,進而改善社會形象,有利于建設(shè)新型教師隊伍,增強主動運用信息技術(shù)促進專業(yè)發(fā)展的意識,從而使教師工作獲得生命力,改變職業(yè)生存方式,增強職業(yè)競爭力。

        信息技術(shù)能力提升是教師繼續(xù)學(xué)習(xí)的重要表現(xiàn)。教師借助多層遞階爬蟲工具“玩轉(zhuǎn)數(shù)據(jù)”,高效獲取、加工、管理“個性資源”,促進專業(yè)成長和信息技術(shù)能力提升。當(dāng)然,網(wǎng)絡(luò)爬蟲仍然面臨著很多的挑戰(zhàn),例如網(wǎng)頁鏈接之間的復(fù)雜關(guān)系,這就需要在不斷發(fā)現(xiàn)問題的過程中解決問題,逐步完善爬蟲程序和工具,從而為教師提供精準(zhǔn)高效的途徑,促進教師信息技術(shù)應(yīng)用能力的發(fā)展。

        猜你喜歡
        爬蟲工具信息技術(shù)
        利用網(wǎng)絡(luò)爬蟲技術(shù)驗證房地產(chǎn)灰犀牛之說
        新一代信息技術(shù)征稿啟示
        基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
        新一代信息技術(shù)征稿啟示
        新一代信息技術(shù)征稿啟示
        波比的工具
        波比的工具
        信息技術(shù)在幼兒教育中的有效應(yīng)用
        甘肅教育(2020年2期)2020-09-11 08:00:44
        利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
        電子測試(2018年1期)2018-04-18 11:53:04
        “巧用”工具
        讀者(2017年18期)2017-08-29 21:22:03
        国产内射视频在线免费观看| 国产精品网站夜色| 久久99国产亚洲高清观看首页| 视频一区精品中文字幕| 巨爆中文字幕巨爆区爆乳| 亚洲精品无amm毛片| 一区二区国产在线观看| 久久久国产精品粉嫩av| 亚洲av熟女中文字幕| 无码av不卡一区二区三区| 国产精品va在线播放我和闺蜜| 国产一区二区丰满熟女人妻| 日韩伦理av一区二区三区| 91成人自拍国语对白| 亚洲精品美女久久久久99| 亚洲国产成人AV人片久久网站| 91麻豆精品激情在线观最新| 国产精品黑丝美女啪啪啪| 国产午夜福利100集发布| 亚洲精品综合第一国产综合| 在线免费观看亚洲毛片| 人妻少妇不满足中文字幕| 欧美xxxx色视频在线观看| 亚洲AV无码资源在线观看 | 国产亚洲一区二区在线观看| 香蕉人人超人人超碰超国产| 欧美成人免费观看国产| 亚洲自偷自拍另类第一页| 久久精品国产久精国产爱| 男男受被攻做哭娇喘声视频| 国产91色在线|亚洲| 国产优质av一区二区三区| 成视频年人黄网站免费视频| 欧美老妇与禽交| 激情五月婷婷六月俺也去| 青青手机在线观看视频| 亚洲av无码国产精品色软件下戴| 国产精品偷伦免费观看的| 偷拍一区二区三区黄片| 国产无套粉嫩白浆在线| 免费啪啪视频一区|