厲 毅,鄭 煒
(浙江廣播電視大學(xué),浙江 杭州 310030)
微格式是近年來信息技術(shù)研究與應(yīng)用領(lǐng)域出現(xiàn)的新概念,盡管出現(xiàn)才四五年時(shí)間,但受到了Yahoo、YouTube、Twitter、Google等著名網(wǎng)站的支持。它所體現(xiàn)的在網(wǎng)絡(luò)信息操作上語法、語義和語用一體化的原則,在不同網(wǎng)頁之間架起了對(duì)應(yīng)數(shù)據(jù)無縫化集成的標(biāo)準(zhǔn)橋梁。[1]由于微格式推崇松散組合微內(nèi)容的理念,使其在數(shù)字學(xué)習(xí)網(wǎng)站資源的整合、重用、共享以及語義化組織上存在著廣闊的應(yīng)用前景,同時(shí)也為現(xiàn)有學(xué)習(xí)資源在微型移動(dòng)學(xué)習(xí)領(lǐng)域的推行、應(yīng)用和擴(kuò)展提供了新的解決思路。
微格式是指建立在已有的、被廣泛采用的標(biāo)準(zhǔn)基礎(chǔ)之上的一組簡(jiǎn)單的、開放的數(shù)據(jù)格式(microformats.org官方定義)。它依托于標(biāo)準(zhǔn)的Web頁面寫作技術(shù),在HTML文檔中給標(biāo)簽(Tag)增加屬性(attribute),把語義嵌入到HTML語言中。通過語義相關(guān),讓網(wǎng)頁內(nèi)容人機(jī)可讀,實(shí)現(xiàn)的是兼顧人機(jī)可讀性的數(shù)據(jù)表達(dá)方式。網(wǎng)頁上的微格式數(shù)據(jù)如事件、人物、地點(diǎn)等容易被其他的工具軟件檢測(cè)并進(jìn)行提取,便于實(shí)施信息的索引、搜索和跨平臺(tái)共享。
微格式分為基本微格式和復(fù)合微格式,其技術(shù)體系如圖1所示。[2]基本微格式是解決單一問題的最小解決方案,包含XMDP、XFN、XOXO等。復(fù)合微格式由基本微格式和XHTML元素組成,包含hCard、hCalendar等。
根據(jù)應(yīng)用需求和作用的不同,微格式可以抽象成以下幾種類型:定義和標(biāo)記結(jié)構(gòu)化數(shù)據(jù),描述個(gè)人和組織信息,描述超鏈接屬性,描述評(píng)論機(jī)制,描述其他具體應(yīng)用。[3]
圖1 微格式技術(shù)體系
(1)標(biāo)記和定義結(jié)構(gòu)化數(shù)據(jù)的微格式
XMDP(XHTML Meta Data Profiles),用于定義 HTML元數(shù)據(jù)配置,可解釋和共享某個(gè)微格式的約定,包含格式相關(guān)的屬性、屬性定義、簡(jiǎn)短描述等信息。在Web上引用XMDP配置文件需提供關(guān)于微格式用法的聲明,使用者必須在實(shí)例文檔中使用此類鏈接。對(duì)于XHTML而言,宿主語言配置文件引用通常作為head元素的一個(gè)屬性。
XOXO(eXtensible Open XHTML Outlines),是拓展型開放XHTML規(guī)范的簡(jiǎn)稱,用來描述文檔的大綱或者類似博客提要的訂閱列表。XOXO格式大綱與普通的有序列表或者無序列表的唯一差別只在于頂部使用了類別名xoxo。
(2)描述個(gè)人和組織信息的微格式
hCard,用來發(fā)布個(gè)人、公司、組織、地點(diǎn)等詳細(xì)的聯(lián)系信息,可以包含在XHTML、Atom、RSS等可擴(kuò)展標(biāo)記語言中。它建立在vCard標(biāo)準(zhǔn)的基礎(chǔ)上,使用vCard(RFC 2426)的屬性和值來實(shí)現(xiàn)相關(guān)功能,以XHTML具有語義化的標(biāo)簽屬性表征個(gè)人和組織機(jī)構(gòu)的聯(lián)系信息,將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)變成結(jié)構(gòu)化的數(shù)據(jù)。
hCanlendar,可以為事件和基于時(shí)間或地點(diǎn)的活動(dòng)提供語義和結(jié)構(gòu)化信息。通過分享嵌入到網(wǎng)頁中的日歷數(shù)據(jù)標(biāo)準(zhǔn) iCalendar數(shù)據(jù),提供對(duì)“組織者”、“時(shí)間”、“地點(diǎn)”等項(xiàng)目的標(biāo)記和描述,并在互聯(lián)網(wǎng)上發(fā)布 “會(huì)議日程”、“課程安排”等與日程安排密切相關(guān)的非結(jié)構(gòu)化信息。hCalendar微格式描述的是在日歷中使用的事件或者任何基于時(shí)間的活動(dòng)信息,包括概述、日期和時(shí)間、地點(diǎn)、詳細(xì)描述、重復(fù)發(fā)生等。
XFN(XHTML Friends Network),用來描述網(wǎng)頁所有者與所鏈接的人之間的網(wǎng)絡(luò)關(guān)系。伴隨著在線社會(huì)化網(wǎng)絡(luò)的發(fā)展,XFN不是簡(jiǎn)單呈現(xiàn)“誰鏈接到誰”,而是對(duì)好友、家庭、同事等社交關(guān)系進(jìn)行描述,可以賦予超鏈接“Friendship (朋友)”、“Professional (工作關(guān)系)”、“Geographic(地緣關(guān)系)”、“Family(家庭關(guān)系)”、“Identify(其他所有的關(guān)系)”等7種關(guān)系和約束條件。
hResume,是一種發(fā)布簡(jiǎn)歷的復(fù)合微格式。它具有語義的結(jié)構(gòu)化信息,使用純文本對(duì)簡(jiǎn)歷進(jìn)行一般性的描述。在可能的情況下,可以重用原有微格式字段名稱rel-tag,hCard和hCalendar等,比如用hCard描述個(gè)人和機(jī)構(gòu)信息,用hCalendar描述工作經(jīng)歷,用rel-tag描述個(gè)人技能等。
(3)描述超鏈接屬性的微格式
(4)描述評(píng)論機(jī)制的微格式
hReview,描述的是對(duì)產(chǎn)品、事件、商業(yè)、地點(diǎn)等的評(píng)論。hReview鼓勵(lì)將評(píng)論標(biāo)準(zhǔn)化,讓各種評(píng)論的共享、發(fā)布、整合、聚合變得更加便捷。它有兩個(gè)不可少的組成部分:根類別名(hreview),項(xiàng)目信息(item)。當(dāng)前的 hReview規(guī)范要求評(píng)論至少提供被評(píng)論項(xiàng)目的全稱(fn),還有其他的 item 以外的可選屬性 version、summary、type、reviewer、dtreviewed、rating、description、tags、permalink 和 license等。
VoteLinks,是用于諸如博客流行度測(cè)評(píng)、現(xiàn)實(shí)生活選舉等評(píng)選的基本微格式。它使用rev屬性,帶有3個(gè)值:vote-for、vote-abstain和 vote-against,分別用來表示贊同、中立和反對(duì)。用戶按照微格式的要求進(jìn)行標(biāo)記,其意見就會(huì)被相關(guān)的識(shí)別和聚合軟件獲取。
(5)描述其他應(yīng)用的微格式
除了以上幾類微格式外,還有其他側(cè)重具體應(yīng)用的微格式。比如用于書簽發(fā)布的hFolk,用于物理測(cè)量的hMeasure,用于貨幣格式的hMoney,用于電子商務(wù)的rel-payment,用于地理經(jīng)緯度標(biāo)注的geo,用于酒評(píng)論的wine等。[4]
“語義化”是指機(jī)器在盡可能少的人類干預(yù)下能夠研究和收集信息,讓網(wǎng)頁能夠被機(jī)器理解,最終讓人類受益。利用微格式改造HTML頁面,增加HTML頁面的語義化處理能力,可以在網(wǎng)頁內(nèi)容、樣式等不變的情況下,使數(shù)據(jù)仍然便于人類閱讀,而且能夠?yàn)闄C(jī)器解析提供友好性,便于數(shù)據(jù)的共享。微格式的實(shí)現(xiàn)不存在很高的技術(shù)門檻,具有很強(qiáng)的實(shí)用性。運(yùn)用微格式語義化組織和編寫的網(wǎng)頁,容易使該頁面對(duì)外暴露的數(shù)據(jù)輕松納入到搜索引擎的索引中去,便于在互聯(lián)網(wǎng)上的傳播與擴(kuò)散。
如果從泛在學(xué)習(xí)、移動(dòng)學(xué)習(xí)的角度看,微格式語義化組織最吸引人的是其“可松散組合”的特性。[5]利用微格式規(guī)范改造的數(shù)字學(xué)習(xí)網(wǎng)站,可以在網(wǎng)頁中使用微格式設(shè)計(jì)和呈現(xiàn)數(shù)字學(xué)習(xí)資源,不但方便師生運(yùn)用軟硬件工具或者簡(jiǎn)單程序篩選和抽取學(xué)習(xí)資源,還可以實(shí)現(xiàn)系統(tǒng)向用戶自動(dòng)發(fā)送學(xué)習(xí)資源,不同用戶端設(shè)備會(huì)根據(jù)語義標(biāo)記讀取適合的課程內(nèi)容。即使網(wǎng)站樣式表出錯(cuò),仍能夠呈現(xiàn)清晰的網(wǎng)頁結(jié)構(gòu)。對(duì)樣式表支持較弱的手機(jī)、PDA等移動(dòng)終端,可根據(jù)顯示屏大小合理地呈現(xiàn)界面。因此,微格式的出現(xiàn),很大程度上改善了利用微型終端訪問網(wǎng)絡(luò)的用戶體驗(yàn)。[6]
數(shù)字學(xué)習(xí)網(wǎng)站上教學(xué)教務(wù)信息主要包括:學(xué)校地址、課程聯(lián)系人、聯(lián)系電話、電子郵件等通訊信息;學(xué)校歷史沿革、辦學(xué)網(wǎng)絡(luò)、教學(xué)服務(wù)點(diǎn)等介紹信息;實(shí)踐課程安排、課程時(shí)間變更、作業(yè)發(fā)布等通知和消息;專家講座、實(shí)驗(yàn)專題、學(xué)術(shù)會(huì)議等公告信息;相關(guān)院系、相關(guān)高校、相關(guān)研究院所的網(wǎng)絡(luò)鏈接列表等。這些與網(wǎng)站和師生相關(guān)的信息所包含內(nèi)容和格式比較相近,具備語義化結(jié)構(gòu)化的特點(diǎn),可以優(yōu)先考慮微格式化。
微格式技術(shù)體系中描述組織和個(gè)人信息的部分微格式可以用于這部分資源的微格式化。通訊信息采用hCard微格式化,授課通知、課程變更內(nèi)容可以采用hNews微格式化,教學(xué)進(jìn)度表、日程安排表采用hCalander微格式化,專題講座、課程介紹、師資介紹借助hResume等微格式化,院系鏈接、研究院所鏈接列表借助XFN描述鏈接關(guān)系。各類微格式都有詳細(xì)規(guī)定的必選和可選項(xiàng)目,可以根據(jù)需要進(jìn)行選擇和使用。
數(shù)字學(xué)習(xí)網(wǎng)站利用超鏈接將課程網(wǎng)頁、知識(shí)概念圖、IP課程、流媒體課程、評(píng)論等整合在一起為學(xué)生提供學(xué)習(xí)支持服務(wù)。這些超鏈接是非結(jié)構(gòu)化的,學(xué)生可能并不知道鏈接的內(nèi)容,或者學(xué)生可以通過鏈接的載體知曉但是機(jī)器卻不能識(shí)別,不能夠?qū)崿F(xiàn)預(yù)定任務(wù)的自動(dòng)抽取。
微格式技術(shù)體系中描述超鏈接屬性的微格式,可以用于數(shù)字學(xué)習(xí)網(wǎng)站超鏈接的微格式化改造。返回到網(wǎng)站首頁的鏈接可以用rel-home指明鏈接的目的地址,該標(biāo)簽為了導(dǎo)航使用,同時(shí)可以為頁面提供站點(diǎn)結(jié)構(gòu)的描述信息。學(xué)生虛擬社交頁面、在線交流頁面、小組協(xié)作學(xué)習(xí)頁面如 Blog、Flickr、Twitter、LinkedIn 等資料頁的鏈接可以添加rel="me",使得在任何網(wǎng)站上尋找共同學(xué)習(xí)者變成一件非常容易的事情。微格式規(guī)范要求鏈接的目的地址URL中最后一部分要包含“tag”的實(shí)際賦值,這種鏈接的組織方式也被稱作“標(biāo)簽空間(tagspace)”。可以在課程網(wǎng)頁中添加rel="tag"屬性,表明該課程知識(shí)是什么學(xué)科、什么類別的,從而實(shí)現(xiàn)課程內(nèi)容的有效組織和分類。對(duì)于網(wǎng)頁內(nèi)容的版權(quán)問題,可以用rel-license進(jìn)行描述,使鏈接所指向資源的版權(quán)信息在鏈接中有清晰的表述。
數(shù)字學(xué)習(xí)資源是數(shù)字化學(xué)習(xí)支持服務(wù)的主要載體,借助微格式進(jìn)行數(shù)字資源語義化組織有利于資源的整合,也有利于學(xué)習(xí)網(wǎng)站之間的資源共享。
對(duì)于靜態(tài)頁面形式的學(xué)習(xí)資源,采用現(xiàn)有載體類型的微格式進(jìn)行數(shù)字資源描述的改造。借助hAudio描述授課音頻資源,借助hMedia描述流媒體課件、虛擬動(dòng)畫、教學(xué)演示圖片相關(guān)信息,借助figure描述各類圖表,借助hAtom描述網(wǎng)志摘要,借助citation描述文章的引文信息,借助xFolk描述網(wǎng)絡(luò)標(biāo)簽,等等。當(dāng)然,靜態(tài)學(xué)習(xí)資源還可以借助前面提及的其他微格式hCalander、hReview等共同描述。對(duì)于一些特殊的資源,比如地理知識(shí)可以利用Geo微格式描述和傳遞數(shù)據(jù),對(duì)課程內(nèi)容的評(píng)價(jià)可用hReview描述,對(duì)思想交流和學(xué)習(xí)辯論中的贊成與否可用VoteLinks描述。
對(duì)于從數(shù)據(jù)庫(kù)中獲取并動(dòng)態(tài)更新的元數(shù)據(jù)學(xué)習(xí)資源,也可以進(jìn)行微格式化改造。在通用元數(shù)據(jù)標(biāo)準(zhǔn)DC的微格式化方面,已經(jīng)有了較為成熟的研究成果。西班牙卡羅三世大學(xué)的研究人員創(chuàng)建了DCMF格式;耶魯醫(yī)療信息中心開發(fā)的unAPI網(wǎng)絡(luò)API,可以利用微格式URI的編碼格式在HTML網(wǎng)站上發(fā)布含語義信息的對(duì)象。[7]
微格式是一種網(wǎng)絡(luò)信息標(biāo)記語言,借助網(wǎng)頁代碼中添加的相應(yīng)標(biāo)簽和屬性對(duì)各種信息進(jìn)行標(biāo)注。它的代碼仍然是XML代碼,在平常瀏覽的網(wǎng)頁上表現(xiàn)為XHTML代碼。正是通過 id、title、rel、rev、class等屬性的添加,實(shí)現(xiàn)了Web頁面元素的語義化存在。在使用微格式時(shí),可以根據(jù)需要選擇使用不同的微格式子集。
下文所示代碼就是添加了微格式的語句:
那么,程序就可以憑借class屬性快捷地聚合和共享這些內(nèi)容。
為便于微格式的編寫,微格式網(wǎng)站http://microformats.org/code提供有專門的在線自動(dòng)生成工具h(yuǎn)Card creator、hCalendar creator、hReview creator等。只要按照語義提示要求輸入需要描述的信息,就可以生成HTML代碼并進(jìn)行預(yù)覽。另外,實(shí)現(xiàn)微格式還有其他一些工具:pnh_mf插件和JMC_Event_Manager允許簡(jiǎn)單的微格式內(nèi)容添加,包括hCalendar。WordPress也擁有很多可以添加微格式內(nèi)容的插件如WP-Microformats、Structured Blogging和Movable Type等。Conference Schedule Creator可以使用hCalendar生成所有的會(huì)議時(shí)刻表。
要讀取網(wǎng)頁中的微格式數(shù)據(jù),可以先通過PHP代碼的HTTP_Client()函數(shù)讀取頁面,再將返回的HTML編碼轉(zhuǎn)換成DOM(XML Document Object Model)。部分代碼如下:
首先調(diào)用get_page()函數(shù)檢索頁面內(nèi)容,然后創(chuàng)建并加載DomDocument()函數(shù),再使用XPath獲取 vevent類所在頁面上的所有
因此,經(jīng)過微格式語義化組織后的課程內(nèi)容、教師信息、學(xué)習(xí)評(píng)價(jià)等可以通過程序代碼實(shí)現(xiàn)自動(dòng)抽取和顯示,不需要多次地重復(fù)發(fā)布。如果網(wǎng)站和課程的統(tǒng)計(jì)數(shù)據(jù)有經(jīng)常性的更新,也可以從按照微格式標(biāo)準(zhǔn)進(jìn)行編碼的網(wǎng)頁中直接抽取數(shù)據(jù),不需要額外征集相關(guān)數(shù)據(jù)和資料。
微格式是包含結(jié)構(gòu)化數(shù)據(jù)的開放標(biāo)準(zhǔn),既適合人類閱讀,又容易被機(jī)器處理。使用微格式定義和標(biāo)記數(shù)字學(xué)習(xí)網(wǎng)站,能夠促進(jìn)頁面信息的結(jié)構(gòu)化,優(yōu)化學(xué)習(xí)資源的分類和索引,方便其他的網(wǎng)站和應(yīng)用程序?qū)?shù)據(jù)的讀取。微格式語義化的網(wǎng)頁還可以在移動(dòng)學(xué)習(xí)終端呈現(xiàn)靈活的、適合手持設(shè)備的顯示效果,提供令人滿意的學(xué)習(xí)交互體驗(yàn)。[8]因此,微格式在瀏覽器擴(kuò)展、跨平臺(tái)服務(wù)和網(wǎng)站建設(shè)等方面存在著廣闊的發(fā)展前景。
[1]楊九龍,熊偉.“微格式”申論[J].圖書館雜志,2009,3(29):59-63.
[2]About Microformats[EB/OL].http://microformats.org/about.2011.12
[3]李書寧.基于微格式的信息組織與處理框架[J].圖書情報(bào)工作,2007,8(51):35-37.
[4]Michael,M.,Mohanad,A-J.,Philippe,T.Using Microformats to Personalize Web Experience.Proceedings of 7th Int.Workshop on Web- Oriented Software Technologies(IWW OST 2008):57-62.
[5]顧小清.終身學(xué)習(xí)視野下的微型移動(dòng)學(xué)習(xí)資源建設(shè)[M].上海:華東師范大學(xué)出版社,2011.5:36-39.
[6]Leventhal,A.Structure benefits all.Proceedings of the 2006 international cross-disciplinary workshop on web accessibility(W4A):33-37.
[7]李書寧,賈繼娥.圖書館網(wǎng)站基于微格式的語義化組織研究[J].圖書館雜志,2010,12(26):54-58.
[8]謝明穎,顧小清.微型內(nèi)容:微格式的解決思路[J].現(xiàn)代教育技術(shù),2011(3):95-99.