梁藝多 翟軍
(1. 大連外國語大學軟件學院,大連 116044;2. 大連海事大學航運經濟與管理學院,大連 116026)
近年來,政府數據開放已成為推進我國大數據戰(zhàn)略實施和實現數字社會建設目標的重要舉措。截至2021年4月,我國已有174個省級和城市地方政府上線了數據開放平臺[1],大量原本封閉在政府內部的數據資源被廣泛地發(fā)布、共享、開發(fā)和利用,極大地釋放了數據的潛在價值。API(Application Programming Interface,應用程序接口)是源于軟件領域的一個重要概念,在現代軟件開發(fā)中被廣泛使用。從本質上講,API是軟件庫對外提供服務的一組可訪問接口,開發(fā)人員通過調用API可快速構建項目并實現代碼復用,能有效提高軟件的生產效率[2]。在開放政府數據的應用中,API又被稱作“接口服務”或“數據服務”,它的技術優(yōu)勢集中體現在以封裝的接口形式屏蔽了煩瑣的數據組織結構,用戶可依據指定的接口調用格式,通過對程序訪問參數的有限賦值,從指定接口地址處獲取實時動態(tài)的海量數據。鑒于此,由中央網信辦等部委聯(lián)合印發(fā)的《公共信息資源開放試點工作方案》[3]對API的建設工作作出了具體要求,即試點地區(qū)可用API接口下載的數據集占開放數據集總量的比例不低于30%。由此可見,API已成為推進開放數據資源深度開發(fā)與利用乃至提升我國政府數據開放整體水平的強大助推器。
與此同時,隨著各地API的大量開放及廣泛使用,各類有關API的建設問題也隨之出現。在學術領域,部分學者對此開展了相關的研究工作:Planas等[4]設計一種模型驅動的API分析工具以幫助API提供者了解最終用戶的實際使用情況;翁丹玉等[5]分析我國開放數據平臺API的不足并給出開放標準化API的關鍵步驟;迪莉婭[6]從功能、類型、應用模式、存在問題及完善策略等方面對我國政府開放數據API的應用情況進行討論。可見,現有研究成果僅側重對API應用問題的宏觀討論,缺乏對其建設現狀的客觀評價。本文認為,高效利用政府數據開放API的基礎是確保各地所發(fā)布API的高可靠性,而對各地現存API建設情況全面而準確的評價是厘清問題根源、改善和提升API質量的首要前提。因此,本文立足于對我國地方政府數據開放API建設問題的研究,在設計評估方案的基礎上,對我國典型地區(qū)API的建設情況開展評價與分析,總結存在的問題進而給出優(yōu)化策略,以期為我國地方政府構建高質量的開放數據服務、促進API的高效利用提供一定的行動參照。
世界上,各國政府普遍采用通過建立數據開放平臺的作法以推進本國數據開放進程[7],而我國各地現有的API都是依托數據開放平臺而建立的。為了確保所調研API對象的典型性,本文參考由復旦大學數字與移動治理實驗室發(fā)布的《中國地方政府數據開放報告》[1],將其作為調研平臺的篩選依據。該報告于2017年5月首次發(fā)布,每半年更新一次,報告創(chuàng)新性地提出“中國開放數林指數”的概念,用于全面評估我國地方政府數據開放的整體水平。報告按省級(最新版稱為“省域”)和地級(含副省級,最新版稱為“城市”)單列,分別給出兩者的綜合指數得分、總排名和開放數級。本文認為,上線較早、發(fā)展穩(wěn)定以及排名靠前的地方平臺的建設基礎較好,能夠為其他地方平臺的后續(xù)發(fā)展及完善起到指示和引領的作用,更具代表性。因此,本文將選取整體水平較高的優(yōu)勢平臺作為調研的目標對象。在篩選過程中,考慮的因素包括:第一,所選平臺將覆蓋省級、副省級和地市級3個行政級別;第二,盡量選取上線時間早、平臺穩(wěn)定性高以及在歷次報告中整體排名靠前的典型地區(qū)。通過參考上述報告,最終選定的目標調研平臺及地址如表1所示。
表1 目標調研平臺及地址
通過文獻梳理發(fā)現,學術界圍繞政府數據開放的評價研究主要集中在政府數據開放程度的評價[8-9]、開放數據集的質量評價[10-14]、開放平臺的建設現狀評價[15-17]以及開放數據的利用效果評價[18-19]等,尚未出現專門面向開放數據API的建設現狀評價研究,也無可直接參照的API評價指標。因此,在設計評價指標時,本文既參考并復用上述研究中與API評價有關的通用指標,也根據API自身特性設計可衡量其實際水平的專用指標。同時,所采用的指標盡可能覆蓋從平臺供給側到用戶需求側的全過程,以確保評價結果的覆蓋面。擬采用的API評估框架及指標描述見表2。
表2 評估框架及指標描述
確保數據的優(yōu)質開放是高效利用數據資源的首要前提,而開放性是衡量政府數據開放程度的重要指標,它從側面反映了政府部門對數據開放工作的重視程度。本文引入“接口開放率”的概念對API的開放性進行衡量與考察。接口開放率是指開放數據平臺提供的API數量與數據集總量的比值[15],它反映了現有數據集在多大程度上以API形式對外提供數據的在線調用和訪問。本文認為,如果接口開放率越接近100%,則表明API與數據集的協(xié)同開放度越高,即平臺方較為重視API的建設工作;如果接口開放率明顯小于100%,則表明API的開放度不足且有待提升;如果接口開放率明顯大于100%,則表明平臺方在接口設計方面存在一定的異常,需要分析具體原因?;诖?,本文統(tǒng)計截至2021年9月15日各目標平臺已公布的API數量和數據集總量,并據此計算接口開放率。其中,API的統(tǒng)計對象是指已被平臺納入API總量統(tǒng)計且以獨立目錄形式發(fā)布的API條目。
根據統(tǒng)計結果發(fā)現,浙江、北京、深圳和福州的接口開放率均在100%左右,說明這4個地區(qū)除了靜態(tài)文件的方式外,均較為重視以API的形式對外提供數據的在線訪問和調用,API的開放度較高。而上海、廣東、青島、濟南和貴陽這5個地區(qū)接口開放率總體偏低,青島接近61%,上海和濟南不足45%,廣東和貴陽均低于15%,說明上述地區(qū)較為重視以靜態(tài)文件的方式發(fā)布數據集,對API的利用程度較為有限,API的開放度仍有提升空間。此外,哈爾濱的接口開放率雖高達204%,但這一數值明顯存在異常,通過進一步分析發(fā)現,該地存在將一個完整的API按不同功能拆分為多個API的情況,這些API并未按其所屬的數據集進行歸一化的整合處理,導致這些被拆分的API無規(guī)律地散落分布并被平臺單獨統(tǒng)計,形成大量的API碎片,進而出現接口開放率虛高的情況。
API多元性[16]用于描述其自身內容的多樣性和外部渠道的多源性。本文通過API的數據主題和發(fā)布部門兩個角度考察其多元性。
首先,參考《中國地方政府數據開放報告》[1],將API的數據主題劃分為城建住房、財稅金融、交通出行等14個分類,并據此考察各地區(qū)已開放API的主題覆蓋情況。對于采用與標準主題分類不同的地區(qū),將其主題進行必要的歸類與合并,并與標準主題分類進行映射,各地區(qū)主題分布的統(tǒng)計結果見表3。
表3 API數 據主題
由表3可見,在所有地區(qū)中,只有浙江、北京、青島、濟南和福州的API覆蓋到全部主題,而其他地區(qū)均存在某類主題接口缺失或某類主題接口數量偏少的情況,說明我國地方政府仍存在部分平臺對API主題多樣化建設的重視程度不足。在所有主題中,排名前5位的分別是機構團體、社保就業(yè)、經貿工商、社會民生和資源環(huán)境,說明此類API具有較高的社會公共價值,是政府提供API服務的重點領域,應給予優(yōu)先開放。此外,信用服務、城建住房、財稅金融、農業(yè)農村和交通出行等主題的API數量較少,數據價值發(fā)揮有限,應加大此類API的開放力度,確保各類主題API的協(xié)同、均衡發(fā)展。
其次,對各地參與API發(fā)布的部門數量進行統(tǒng)計。根據統(tǒng)計結果發(fā)現,北京和濟南兩地參與API發(fā)布的部門數量都在75個以上,說明兩地政府部門的重視度與參與度較高,確保了API來源的廣泛性。相比之下,除廣東為23個之外,其余各地參與API發(fā)布的部門數量較為接近,均在50個左右,總體偏少。通過進一步分析發(fā)現,市場監(jiān)管局、自然資源和規(guī)劃局、交通委和生態(tài)環(huán)境局等是提供API數量排名靠前的部門,此類部門與普通民眾的生產生活聯(lián)系緊密,可提供的API數據較多。同時,外事辦、國資委和市編辦等部門提供的API數量偏少,應采取更積極的措施加大上述部門的API開放力度,以確保數據來源的多渠道和覆蓋面。
多功能性用于描述API的不同功能類型及其用途。通過對各地API實例及用法的調研與分析,歸納出不同的API功能類型。其中,數據接口(也稱為“信息查詢服務”)用于一次性獲取接口中所有數據記錄,該類型接口的數據返回量大但處理難度高;分頁接口(也稱為“信息分頁查詢服務”)用于獲取接口的分頁查詢子集,并通過“當前頁數”和“當前頁行數”字段控制分頁效果;總數接口(也稱為“信息數據量查詢服務”),用于獲取接口的數據總量,且返回參數中包含“數據量”字段;更新接口(也稱為“數據更新查詢接口”)用于獲取接口的歷次更新日志,且返回參數中包含“數據更新日期”字段;文件接口與其他類型接口不同,獲取的是保存數據的文件介質信息,且返回參數包含“文件名稱”“文件更新時間”“文件獲取地址”字段。
基于上述功能類型,本文進一步統(tǒng)計不同類型API在各地的分布情況,結果見表4。
表4 API類型分布
由上表可知,在縱向上,分頁接口的地區(qū)分布數最多(6種),其次是數據接口(4種),而更新接口和文件接口的地區(qū)分布數最少(僅為1種);在橫向上,浙江和哈爾濱支持的接口類型最多(3種),而其他地區(qū)均只支持1種??梢?,各地對API的功能認知并不統(tǒng)一,接口形式也呈現出多樣性特點。通過進一步分析發(fā)現,上海、青島和濟南唯一采用的數據接口是一次性獲取全量數據,如果返回的數據量太大,則不易處理與控制,與廣東、深圳、福州和貴陽唯一采用的分頁接口相比,缺少一定的靈活性和可控性;北京的接口類型以文件接口為主,調用此類接口返回的并不是數據本身,而是保存數據的文件介質信息,不利于應用程序的直接處理;浙江接口類型最多且接口開放率控制在100%左右,相比之下,哈爾濱的接口類型與浙江相同,但接口開放率高于200%,原因在于:浙江對歸屬于同一API目錄的不同類型接口進行了有序化組織,即通過API目錄定位某個接口名稱后,可直接獲取該目錄對應的所有類型接口,而哈爾濱在接口目錄中并未對具有同一性的不同類型接口進行歸并處理,相反,這些接口散落分布且彼此間未建立關聯(lián),形成大量的碎片化現象。
API可用性反映了平臺提供的API能否正常滿足用戶的使用需求。本文認為,“低效用”和“低容量”是影響API可用性的兩類重要因素,而低可用性已成為政府開放數據向高價值數據邁進的主要障礙[20]。因此,本文從上述兩個角度對API的可用性進行分析。
首先,在低效用方面,本文通過對各平臺API實例的逐一考察,總結了影響API使用效果的典型問題,并將存在這些問題的API視為低效用API。其典型問題包括以下內容。第一,API目錄對應的頁面不存在。例如,訪問貴陽市的“貴陽市企業(yè)股東信息”API目錄和北京市的“保險代理機構設立審批”API目錄時都會出現API頁面不存在的情況。第二,API頁面未提供接口調用地址。例如,上海市的“醫(yī)療機構注銷通知書”API頁面中未提供“接口服務地址”字段。第三,API頁面的接口調用地址無效。例如,上海市的“統(tǒng)計年鑒查詢”API頁面中提供的接口地址實際是訪問上海市統(tǒng)計局官方網站中歷年“上海統(tǒng)計年鑒列表”的網址,而并非真實的接口地址。第四,API發(fā)布后至今從未被正式調用。例如,以2021年9月15日為截止日期,廣東的“普通貨物運輸車輛信息”API自2020年1月7日發(fā)布后至今未被調用,調用次數顯示為0。
基于上述標準,本文對各平臺的低效用API進行專門統(tǒng)計并計算其在所有API中所占的比值,結果見圖1。
圖1 各地低效用API對比結果
可見各地方平臺或多或少都存在一定數量的低效用API。其中,哈爾濱和北京所占比例較高,達到90%以上;上海超過60%;浙江和廣東相近,在25%左右;其余各地均控制在10%以下。這些低效用API或者因其自身問題根本無法正常使用,或者是在其發(fā)布之后至今從未被應用程序正式調用。無論何種情形,這類API都未真正發(fā)揮過其應有的價值,相反,平臺方在存儲和維護這類API時需耗費較大的空間和人力,一定程度上造成資源的浪費,對此,平臺方應定期開展檢查并及時給予優(yōu)化及清理。
其次,在“低容量”方面,本文認為,API的技術優(yōu)勢體現在對海量數據的發(fā)布和獲取,如果單個接口的數據量不足萬條,則采用靜態(tài)文件的方式保存數據更加便捷和靈活。據此,本文將數據量不足萬條的API視為低容量API,并對目標平臺API所含數據量情況按不同層次區(qū)間進行分段統(tǒng)計。以貴陽市為例,其API所含數據量的區(qū)間分布情況為:小于1 000條的占比為83.07%,大于等于1 000條且小于1萬條的占比為8.07%,大于等于1萬條且小于10萬條的占比為5.73%,大于等于10萬條的占比為3.13%。由此可知,在貴陽市的所有API中,超過90%的API數據量不足1萬條,且隨著統(tǒng)計區(qū)間段的層級遞增,各區(qū)段API的占比也逐漸減少,即低容量API占比偏高。除貴陽外,通過對其他可公開獲取API數據量的平臺分析發(fā)現,各地除了一些熱門API的數據量處于較高的水平外,其余API的數據量也普遍較低,甚至出現個別API只有1條或幾條數據的情況,對API的可用性造成一定的影響。因此,各地應進一步提升API自身的數據量,以推動其向高容量的轉化,最大程度地保證API使用效能的發(fā)揮。
可訪問性反映了用戶在使用API過程中所遇到的各種授權類型及其訪問權限。本文主要從API的查看權限、使用權限和調用權限3個角度考察其可訪問性。其中,API查看權限是指在查看某個API目錄的接口服務地址和使用說明等具體信息時是否需要事先實名注冊和認證;API使用權限是指某些特定API的開放屬性是否為有條件開放,即需要先申請并獲批后才可使用API;API調用權限是指在程序中調用具體的API時是否需要提供進行授權驗證的應用識別碼(如token或appKey)。各地API訪問權限的統(tǒng)計結果見表5。
表5 API訪問權限
可見除上海外,其余各地都支持以匿名身份對API進行查看。除北京和貴陽外,大多數地區(qū)都存在需要先申請再使用API的情況,但也存在一定的區(qū)別:上海和廣東只針對部分API需要申請,而其他各地對所有API都需要依據申請再使用。在API調用權限方面,所有地區(qū)都要求調用者提供能夠進行授權驗證的應用識別碼,并在應用程序中以參數的形式提交給API接口校驗,以確保訪問身份的專屬性和合法性,避免因無限制API調用給平臺帶來的負載壓力??傮w而言,多重訪問權限雖然在一定程度上保證了API的合理、合法調用,但同時也為使用者帶來了諸如隱私泄露、操作煩瑣等各類障礙和困擾,極易造成用戶的體驗感差、使用意愿低下甚至喪失信心和耐心等問題。
API導航性是指平臺為了方便用戶查找和使用API所提供的各種操作引導方式。本文從推薦排行榜、檢索方式和檢索結果查看方式3個角度對API的導航性進行考察。其中,推薦排行榜是指平臺能夠依據某項指標按照由高到低的順序向用戶推薦API排名榜單,檢索方式是指平臺提供的各種用于引導用戶查找API的篩選條件和查找方式,檢索結果查看方式是指平臺針對用戶API查找結果提供的多樣化展示方式。各地API導航性的統(tǒng)計結果見表6。
表6 API導航性
從總體看,上海和貴陽支持的導航方式最多,共計13種;而北京、深圳和哈爾濱三地最少,僅為7種??梢?,各地對API導航性的支持方式存在較大的差異。從推薦排行榜看,只有上海、福州和貴陽三地提供了3種API推薦排行榜,其余各地均存在缺失。其中,北京、深圳和哈爾濱三地只提供1種“按訪問量排名”的推薦方式,且北京和哈爾濱兩地的推薦榜單被放置在頁面底部,降低了導航的直觀性。從API檢索方式看,所有地區(qū)都支持“關鍵字檢索框”“按主題”“按部門”的檢索方式,說明此方式是提升API檢索結果的有效手段,應給予大力推廣。其中,僅有上海支持“按評分檢索”的方式,此方式可按評分高低對API進行等級分組,幫助用戶直接鎖定高質量API以減少篩選的時間,其他平臺應盡快給予采納。從API檢索結果查看方式看,所有地區(qū)均支持“按更新時間排序”和“分頁瀏覽”的方式,說明這兩種方式較為符合人們日常的瀏覽與閱讀習慣,應給予優(yōu)先使用。其中,僅有上海和貴陽兩地支持“按名稱排序”的查看方式,此方式可按API名稱的升降排序直接將內容關聯(lián)性強的API并靠羅列,確保了API查找的全面性。此外,僅有福州和貴陽兩地支持“按數據量排序”的查看方式,此方式可幫助用戶精準掌握目標API的數據容量,進而輔助API可性用大小的初步判斷,進一步提升了導航的實用性。
支持性是指平臺為促進API的有效利用而向用戶提供的各種支持和輔助措施。本文從API的效果評價、互動推廣和開發(fā)支持3個角度對其支持性進行考察。其中,效果評價是指用戶對API的使用效果進行打分和主觀評價;互動推廣是指平臺為了向用戶提供更全面API服務而設置的互動交流功能;開發(fā)支持是指平臺為了輔助開發(fā)者有效利用API開發(fā)應用App而設置的各類支持性措施。對API支持性的考察結果見表7。
表7 API支持性
從總體看,深圳在所有地區(qū)中對API的支持措施最多,共計12種;而北京和哈爾濱對API的支持措施最少,僅為8種,說明各地在對API的支持力度上存在明顯的差距。在效果評價方面,哈爾濱不支持任何對API的評價方式,北京僅支持1種,而上海、深圳和福州等地除了支持用戶對API的綜合評分外,還支持對其在完整性、準確性、及時性和可用性等分項的評分。在互動推廣方面,上海和深圳兩地支持所有的推廣功能;而哈爾濱僅支持“收藏”一項功能,與其他地區(qū)相比,互動性明顯偏弱,應給予加強。在開發(fā)支持方面,所有地區(qū)都提供了用戶對需求接口的申請、接口使用說明和App提交通道的支持,一定程度上推動了API資源的深度開發(fā)與持續(xù)利用。大部分地區(qū)提供了“接口示例樣本”這一元數據項,但需要指出的是,上海和哈爾濱兩地并未提供其具體取值,導致其無法發(fā)揮實際作用,應盡快給予改進。同時,只有部分地區(qū)提供了開發(fā)指導文檔和在線測試工具,此類措施可高效地輔助應用App的開發(fā)和調試,其他地區(qū)應加大對這一措施的支持力度。此外,為了加強API的應用推廣,所有地區(qū)都組織了以“開放數據”為主題的數據類競賽,起到了“以賽促用”的效果,但目前只有上海、深圳和福州等少數地區(qū)將比賽辦成了年度常規(guī)賽事。
我國各地方政府應充分認清API在促進政府數據開放整體水平提升中的重要作用與關鍵地位,提升思想重視度和行動參與度,堅持數據集開放與API開放的雙軌建設并舉,既要避免出現“重數據集、輕API”的開放失衡情況,也要杜絕“人為拆分完整API”的碎片化現象,力求將接口開放率控制在100%左右的合理水平,并在此基礎上最大限度地提升API的開放度。同時,為確保API開放工作的常態(tài)化與持續(xù)性,在具體工作中,應建立起“主要領導督辦、主管部門牽頭和責任部門配合”的三層管理體系,為扎實、有序推進API的建設工作提供堅實有力的組織保障。主要領導應充分發(fā)揮“一把手工程”的引領和帶動效應,做到靠前指揮、親自主抓,確保各項API開放政策與行動的貫徹落實。主管部門應切實擔負起宏觀統(tǒng)籌與協(xié)調聯(lián)動的指揮作用,立足已有的開放經驗與成果,開展充分調研與論證,深挖用戶的潛在需求,建立高價值主題API的指導性識別準則,采取激勵措施引導更多部門加入開放隊伍,建立和完善與API開放配套的管理制度與行動方案,確保API開放工作“有規(guī)可依、有章可尋”。責任部門作為API開放的執(zhí)行主體應切實從思想上重視該項工作,積極響應、密切配合,結合部門自身的實際情況,認真分析、科學研判,制定合理的API開放清單,在確保高價值主題優(yōu)先開放的基礎上,不斷擴大開放主題的覆蓋范圍,應建立本部門API新增與更新的日常執(zhí)行條例,制定與之配套的具體執(zhí)行計劃,并嚴格貫徹落實,以確保API開放工作持續(xù)、有序地向前推進。
我國各地方政府應立足本地區(qū)API開放的實際現狀,認真梳理并深入分析各類API質量問題,努力尋求破解之道。在實踐中,可參考全國大多數地區(qū)在API類型設置上的主流作法,即優(yōu)先使用“分頁接口”、合理使用“數據接口”、少用或停用其他類型接口,從根本上截斷碎片化API產生的來源。針對已有的碎片化API,應按照統(tǒng)一的API目錄加以歸一化整合,以確保功能不同但名稱相關的API都掛靠在同一個目錄下。各地區(qū)的主管部門應建立常態(tài)化的API質量檢查機制,推行各主體部門定期自查和主管部門不定期抽查的雙重檢查舉措,隨時監(jiān)測、發(fā)現低效用API,對于無法修正和優(yōu)化的API應當給予及時清除,以充分釋放平臺的空間資源。針對用戶關注的熱點API和高價值主題API,在滿足平臺可支撐、機器可處理的條件下,應進一步加大單個接口的數據開放量,并從總體上逐步提升高容量API的占比,為用戶創(chuàng)造更多的數據獲取和使用機會,以充分釋放API在處理海量數據方面的潛在價值。同時,在確保核心涉密數據不被泄露、數據所有權不受侵犯和用戶個人隱私得以保護的前提下,應竭力破除各類API訪問障礙、降低API使用門檻,支持用戶以匿名身份方式對API目錄進行瀏覽,減少或取消“依申請開放”類型API的數量,淡化行政審批在API使用中的干擾,力爭實現“封閉即禁用、開放即可用”的簡單API使用機制,構建用戶與API之間的良性互動態(tài)勢,持續(xù)擴大API的受眾面和影響力。
為了最大限度地挖掘和釋放政府數據開放API的潛在價值,各地政府應不斷建立和完善各項API的促用保障措施,持續(xù)優(yōu)化平臺的各類服務功能,不斷加大API建設的投入力度,針對不同API用戶群體制定有針對性的宣傳、推廣與服務策略,進一步擴大API的用戶基礎,全力保障API價值效能的充分釋放。針對現有API用戶,各地可從自身平臺出發(fā),補足平臺在API服務方面存在的短板。可通過提供多樣化的導航途徑以更友好的方式引導用戶查找、檢索、發(fā)現和組織所需的各類API資源;鼓勵用戶針對已開放API資源的實際水平進行分級打分以及主觀評價;支持用戶針對使用過程中遇到的問題及個性化需求開展反饋糾錯、互動咨詢、問題提報和收藏分享等;不斷補充和修訂接口使用說明書和API操作手冊等指導性開發(fā)文檔;提供API在線調用測試工具以支持應用App的開發(fā);拓展和豐富各類應用App數量并鼓勵更多的用戶參與下載和使用。針對潛在API用戶,可通過組織和舉辦API公益講座、API免費公開課等社群活動開展API使用的普適性教育,引導潛在用戶認知和認可API巨大的發(fā)展?jié)摿?,促使其向真實用戶轉變;各地可通過持續(xù)舉辦數據開放競賽,吸引更多對該領域感興趣的人加入其中,在提交參賽成果時,也潛移默化地成為API的事實使用者,最終實現以賽促用的推廣目標。