格雷戈里·維亞爾 江璟璐 塔尼婭·詹尼利亞 安-弗朗西絲·卡梅倫
北美一家大型醫(yī)院為人工智能(AI)賦能系統(tǒng)提高病患護(hù)理質(zhì)量的前景而歡欣鼓舞。然而,當(dāng)它打算從概念升級到原型構(gòu)建時,卻發(fā)現(xiàn)建立和運行系統(tǒng)所需的數(shù)據(jù)分散在20個傳統(tǒng)系統(tǒng)中,檢索起來非常復(fù)雜。最后,它只好放棄該項目。
高級分析技術(shù)和AI有望產(chǎn)生幫助企業(yè)保持競爭優(yōu)勢的洞見。它們在這方面的能力很大程度上取決于能否獲得優(yōu)質(zhì)的數(shù)據(jù),但有時候,組織偏偏沒有能讓AI發(fā)揮作用的數(shù)據(jù)。
最近,我們研究了組織如何將AI項目從實驗室研發(fā)環(huán)境轉(zhuǎn)至生產(chǎn)環(huán)境,以及在此過程中它們遇到了哪些問題。為此,我們采訪了六家北美公司的AI主管和信息提供者,這些公司的規(guī)模和所處行業(yè)各不相同。一個關(guān)鍵發(fā)現(xiàn)是,盡管許多人在評定數(shù)據(jù)質(zhì)量時,主要依據(jù)的是其準(zhǔn)確度和完整性(參見副欄“什么是優(yōu)質(zhì)數(shù)據(jù)”),但是數(shù)據(jù)可被機(jī)器訪問的程度(數(shù)據(jù)質(zhì)量的一個維度)似乎才是將AI從實驗成果轉(zhuǎn)化為商業(yè)應(yīng)用過程中會遇到的更大挑戰(zhàn)。更重要的是,我們發(fā)現(xiàn)數(shù)據(jù)可訪問性通常僅被當(dāng)作IT問題來處理。實際上,我們的分析表明這是一個管理問題,而人們對AI數(shù)據(jù)可訪問性的性質(zhì)和作用存在誤解,則令這一問題更加嚴(yán)重。
數(shù)據(jù)可訪問性的關(guān)鍵不在于數(shù)據(jù)本身的屬性,而在于是否具備能夠讓機(jī)器獲取數(shù)據(jù)的要素。雖然組織擁有的數(shù)據(jù)浩如煙海,但數(shù)據(jù)訪問仍然是一大挑戰(zhàn),尤其是在AI開發(fā)與運行的環(huán)境中,這一挑戰(zhàn)因為以下兩個彼此關(guān)聯(lián)的原因而變得更加艱巨。首先,AI項目通常會牽涉各種利益相關(guān)者群體,他們對數(shù)據(jù)可訪問性的興趣各不相同。其次,典型的AI開發(fā)生命周期往往會削弱數(shù)據(jù)可訪問性的重要性。
大部分?jǐn)?shù)據(jù)可訪問性問題的核心是,AI項目會牽涉各種各樣的參與者群體,對于數(shù)據(jù)可訪問性的性質(zhì)和作用,他們有不同的興趣、觀點和影響力。例如,業(yè)務(wù)主管通常會參與流程的啟動和收尾工作,幫助界定AI的用例,并利用最終產(chǎn)品,但他們往往并不會考慮數(shù)據(jù)的訪問方式?!皹I(yè)務(wù)部門的人總是以為自己有AI需要的數(shù)據(jù)?!币患褹I咨詢公司的產(chǎn)品交付副總裁說?!八麄兿肟禳c開始,然后,當(dāng)我們掀開蓋子時,”他笑著說,“我們得到了PDF文件、Excel電子表格,接著我們要收集所有這些東西,再用光學(xué)字符識別技術(shù)來處理。這從來都不是一件容易的事情。”
另一方面,開發(fā)、測試并維護(hù)模型的數(shù)據(jù)科學(xué)家,還有可能與之合作的科學(xué)顧問都會重點關(guān)注獲取模型開發(fā)所需的數(shù)據(jù)。與業(yè)務(wù)部門的利益相關(guān)者一樣,他們對數(shù)據(jù)可訪問性的興趣也不大。
數(shù)據(jù)工程師負(fù)責(zé)構(gòu)建基礎(chǔ)設(shè)施,以生成數(shù)據(jù),供數(shù)據(jù)科學(xué)家的模型使用。他們會適當(dāng)關(guān)注一下數(shù)據(jù)的可訪問性。但他們常常認(rèn)為,從操作系統(tǒng)中提取出來用于原型開發(fā)的數(shù)據(jù),也可以直接用于生產(chǎn)。這種看法有時并不正確。
數(shù)據(jù)可訪問性問題對于軟件工程師來說更重要一些。他們負(fù)責(zé)將AI打包到產(chǎn)品或服務(wù)中,這些產(chǎn)品或服務(wù)必須能夠在生產(chǎn)環(huán)境中獲取數(shù)據(jù)。雖然IT部門的成員很少被視為AI項目的主要參與者,但他們要為AI所需的技術(shù)基礎(chǔ)設(shè)施(包括數(shù)據(jù))提供支持。他們的工作能幫助組織嚴(yán)格遵守保護(hù)技術(shù)和數(shù)據(jù)資產(chǎn)的安全政策和治理機(jī)制。
上述每一類利益相關(guān)者都各自發(fā)揮著重要作用。同時,他們對數(shù)據(jù)可訪問性的看法也受其直接職責(zé)所限。例如,一家大型金融機(jī)構(gòu)的AI主管告訴我們,他的團(tuán)隊需要從操作系統(tǒng)中獲取大量數(shù)據(jù)。然而,許多操作系統(tǒng)是在主機(jī)上運行的,從構(gòu)建之初,就無法在支持常規(guī)操作的同時,再支持此類數(shù)據(jù)訪問需求。當(dāng)負(fù)責(zé)維護(hù)操作系統(tǒng)的IT人員聽說他的AI項目要求訪問數(shù)據(jù)時,很是不情不愿。他告訴我們,有一次,他們這樣回答:“我可不想讓那些剛出校門的技術(shù)狂每天都跑過來檢索15TB的數(shù)據(jù),那會把整個系統(tǒng)都給搞崩的?!?h3> AI生命周期削弱數(shù)據(jù)可訪問性
除了各類利益相關(guān)者興趣不同的問題之外,AI項目的典型生命周期也會促使團(tuán)隊專注于模型的快速迭代開發(fā)。于是,關(guān)于數(shù)據(jù)可訪問性的重要對話,尤其是與AI在組織中實施相關(guān)的對話,遲遲沒有開展。在此過程中,數(shù)據(jù)可訪問性的性質(zhì)發(fā)生了改變,它同組織的數(shù)據(jù)管理結(jié)構(gòu)、機(jī)制和技術(shù)基礎(chǔ)設(shè)施的關(guān)系,從彼此獨立轉(zhuǎn)為相互關(guān)聯(lián)。隨著AI從一個單純的概念轉(zhuǎn)變?yōu)榻M織使用的實際產(chǎn)品或服務(wù),關(guān)鍵利益相關(guān)者在AI開發(fā)各個階段的參與情況也隨之發(fā)生變化(參見副欄“AI生命周期中的利益相關(guān)者和數(shù)據(jù)”)。我們在之前研究的六個組織中發(fā)現(xiàn),典型的AI生命周期都是分為五個階段。為了弄明白數(shù)據(jù)可訪問性為何經(jīng)常被忽視,我們需要逐一分析這幾個階段。
第一階段:構(gòu)思 構(gòu)思階段相當(dāng)于一個過濾器,用于找出AI在組織中的潛在高級業(yè)務(wù)用例。在這個階段,大多數(shù)對話都是在管理人員、商務(wù)顧問和科學(xué)顧問(有時也是全職學(xué)者)之間進(jìn)行的,其目標(biāo)是為商業(yè)和科學(xué)創(chuàng)造一個會談空間,由此催生出來的業(yè)務(wù)用例應(yīng)該看起來前景良好、切實可行。在AI咨詢公司,這個關(guān)鍵第一步的作用是向客戶科普AI的潛力。不過,這個階段的重點是數(shù)據(jù)的存在,而不是數(shù)據(jù)可訪問性。討論的核心話題是業(yè)務(wù)目標(biāo)以及應(yīng)用AI模型解決組織當(dāng)前的問題。
第二階段:藍(lán)圖 出于優(yōu)先級別、資源限制或缺乏潛在價值等原因,構(gòu)思階段產(chǎn)生的用例并不能全部被選中在一定時間內(nèi)實施。藍(lán)圖階段會生成一個綜合用例,其中包含一些細(xì)節(jié),例如清晰且可衡量的業(yè)務(wù)目標(biāo)、列出具體AI技術(shù)的行動計劃,以及應(yīng)當(dāng)準(zhǔn)備好提供給AI的數(shù)據(jù)要素。在藍(lán)圖階段,評估數(shù)據(jù)可訪問性仍然以數(shù)據(jù)的存在為唯一指標(biāo),因為組織會著眼于流程的下一個階段,即構(gòu)建工作原型。其背后的假設(shè)是,只要數(shù)據(jù)存在就足夠了,因為這樣團(tuán)隊就可以繼續(xù)向前推進(jìn)。
第三階段:概念驗證 在概念驗證階段,數(shù)據(jù)科學(xué)家構(gòu)建一個或多個模型來實施商定的用例。大部分工作的重點是以迭代方式創(chuàng)建、訓(xùn)練和測試模型,衡量比較它們各自的性能,并檢驗輸入新數(shù)據(jù)的AI是否達(dá)到了預(yù)期效果。數(shù)據(jù)從源系統(tǒng)中被提取出來,由數(shù)據(jù)工程師進(jìn)行轉(zhuǎn)換,使其符合在建模型的格式和精度要求。解決方案最終可能是通過一個裝有用戶界面的應(yīng)用程序交付,或者緊密集成在組織的業(yè)務(wù)流程中(比如說,用于修改銀行的信貸申請流程),但在概念驗證階段,這些工作通常還不是重點。同樣,團(tuán)隊主要關(guān)心的是獲取數(shù)據(jù)來推進(jìn)他們的短期工作,幾乎不會考慮AI進(jìn)入生產(chǎn)階段后,數(shù)據(jù)訪問最終會采取何種形式。
第四階段:最簡可行產(chǎn)品(minimum viable product, MVP) 一旦概念驗證的某個版本表現(xiàn)出足夠的價值,就可以被優(yōu)化為MVP。此時,數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師便功成身退,下一步工作由軟件工程師接手,因為如果AI適于應(yīng)用,最終就會走出實驗室,被部署在組織的基礎(chǔ)設(shè)施中,并與其他生產(chǎn)系統(tǒng)集成。在先前幾個階段,模型開發(fā)是大家密切關(guān)注的問題,由此產(chǎn)生的一個意外結(jié)果是,對生產(chǎn)中數(shù)據(jù)可訪問性的考慮已退居次要地位。當(dāng)軟件工程師和IT人員深入討論待交付解決方案的規(guī)格和集成時,就可能會從數(shù)據(jù)可訪問性相關(guān)問題中發(fā)現(xiàn),模型使用的某個關(guān)鍵功能需要大量計劃外的工作。
第五階段:生產(chǎn) 在最后這個階段,包含AI的改進(jìn)版MVP被投入生產(chǎn),現(xiàn)在必須向其輸入直接從生產(chǎn)系統(tǒng)中獲取的數(shù)據(jù)。數(shù)據(jù)可能需要從多個系統(tǒng)中提取并進(jìn)行轉(zhuǎn)換,從而生成模型所需的輸入項來支持生產(chǎn)中的業(yè)務(wù)用例。無論這一工作是實時進(jìn)行還是批量進(jìn)行(例如,頻繁反復(fù)訓(xùn)練和測試模型),與AI集成相關(guān)的真正問題總是會在這一步浮現(xiàn)出來,尤其是涉及組織數(shù)據(jù)基礎(chǔ)設(shè)施的問題。如果自主系統(tǒng)無法按照要求的數(shù)量或速度提供、提取并集成數(shù)據(jù)(比如受傳統(tǒng)系統(tǒng)所限),AI就可能會失去全部的潛在價值。
除了弄清AI開發(fā)的不同作用和階段及其對數(shù)據(jù)可訪問性的影響之外,了解人們對數(shù)據(jù)性質(zhì)的一些主要誤解,以及許多組織如何看待數(shù)據(jù)的性質(zhì),也會有所幫助。
誤解一:數(shù)據(jù)可訪問性是個技術(shù)問題 雖然技術(shù)問題往往頗為復(fù)雜,但只要找到合適的人才和資源,通常都是可以解決的。參與我們研究的人認(rèn)為,數(shù)據(jù)可訪問性其實是一個涉及技術(shù)的管理問題。在設(shè)計AI解決方案之初就必須明確認(rèn)識到,哪怕是完整、準(zhǔn)確、及時的數(shù)據(jù),如果無法實現(xiàn)快速方便的檢索,也沒有任何價值。數(shù)據(jù)存在于大量數(shù)據(jù)庫和電子表格中的某個位置,未必就意味著它是可以訪問的。有時,之所以出現(xiàn)數(shù)據(jù)可訪問性問題,是因為數(shù)據(jù)治理或安全政策限制了訪問。
業(yè)務(wù)人員和IT人員之間的優(yōu)先權(quán)之爭已經(jīng)存在了幾十年。如果再把AI團(tuán)隊的優(yōu)先級別也加到這對組合中,那么事情很快就會變成一團(tuán)亂麻。如果僅僅將數(shù)據(jù)可訪問性視為技術(shù)問題,產(chǎn)品和服務(wù)或許就會卡在概念驗證階段,直到其他團(tuán)隊來解決數(shù)據(jù)可訪問性的難題,最終導(dǎo)致進(jìn)度延誤、成本增加。還有一種可能是,數(shù)據(jù)太復(fù)雜或檢索成本太高導(dǎo)致數(shù)據(jù)被遺漏,使產(chǎn)品和服務(wù)無法發(fā)揮全部潛力。在這兩種情況下,AI都無法兌現(xiàn)承諾,其原因不在于AI模型,而在于數(shù)據(jù)可訪問性。
誤解二:數(shù)據(jù)只是運營的副產(chǎn)品 當(dāng)組織中分析和AI活動與運營分離,人們尚未意識到AI有潛力改進(jìn)或革新整個組織的流程時,經(jīng)常會出現(xiàn)這種誤解。于是,雖然運營系統(tǒng)(例如企業(yè)資源規(guī)劃和客戶關(guān)系管理)消費并生產(chǎn)數(shù)據(jù),但沒有人了解這些數(shù)據(jù)對AI的潛在價值。如果分析團(tuán)隊或AI團(tuán)隊想要使用運營產(chǎn)生的數(shù)據(jù),只能自己去檢索并加以利用,這與傳統(tǒng)數(shù)據(jù)倉庫團(tuán)隊做了多年的工作并無太大區(qū)別。
在充斥著此類誤解的地方,組織可能坐擁大量數(shù)據(jù),卻沒有被AI充分利用。造成這一現(xiàn)象的主要原因是,業(yè)務(wù)流程產(chǎn)生的數(shù)字痕跡往往散布在各個運營系統(tǒng)。如此一來,檢索必要的數(shù)據(jù)以重建流程全貌就成了難題。簡而言之,數(shù)據(jù)作為價值創(chuàng)造輸入項的戰(zhàn)略潛力未能得到充分開發(fā)。
誤解三:數(shù)據(jù)可訪問性問題可以等到AI生命周期的后期階段再解決 AI生命周期的五個階段旨在推動AI團(tuán)隊以敏捷模式工作,尤其是在概念驗證階段和MVP階段。就其本身的性質(zhì)而言,AI是一種不確定的努力,因此它很適合采用這種方法。團(tuán)隊必須有能力用模型開展實驗,根據(jù)實驗結(jié)果來找出解決組織問題的最佳方案。但遺憾的是,這種方式也會促使團(tuán)隊在前三個階段的大部分時間里,幾乎完全專注于AI工作中的科研部分。參與構(gòu)思、藍(lán)圖和概念驗證階段的利益相關(guān)者,同處理數(shù)據(jù)可訪問性問題的利益相關(guān)者不是同一群人。數(shù)據(jù)工程師主要關(guān)心的是創(chuàng)建可供數(shù)據(jù)科學(xué)家構(gòu)建和訓(xùn)練模型的平面文件。他們認(rèn)為,只要能生成此類文件,動用能力所及的一切手段(包括黑客、變通辦法和模擬數(shù)據(jù))都是合理的。
若想讓AI賦能的系統(tǒng)為組織增值,就必須將其打包為可以同組織基礎(chǔ)設(shè)施集成的產(chǎn)品或服務(wù)。集成問題常常是在生命周期的后期階段解決(參見副欄“AI生命周期中的利益相關(guān)者和數(shù)據(jù)”)。于是,軟件工程師和IT人員就成了公布壞消息的人。如果公司不盡早解決數(shù)據(jù)可訪問性問題,最終往往就會付出始料未及的額外成本。此外,當(dāng)其他利益相關(guān)者(通常是IT人員)的優(yōu)先次序被意外打亂以解決數(shù)據(jù)可訪問性問題時,項目可能會停滯下來。在某些情況下,AI項目甚至可能無法在生產(chǎn)中實現(xiàn)。
誤解四:實驗室數(shù)據(jù)和實際運營數(shù)據(jù)是一樣的 公司構(gòu)建AI基礎(chǔ)上的概念驗證已經(jīng)越來越純熟。然而真正的考驗是,它們能否從概念驗證階段的受控實驗室環(huán)境順利過渡到散亂無序的生產(chǎn)環(huán)境。人們常常認(rèn)為,一旦AI通過了MVP階段進(jìn)入生產(chǎn)階段,就可以復(fù)制概念驗證階段的數(shù)據(jù)檢索流程,幾乎不用付出任何成本。但是別忘了,概念驗證階段的數(shù)據(jù)來自一些平面數(shù)據(jù)文件,而這些文件通常是基于歷史數(shù)據(jù)快照創(chuàng)建,專門用來構(gòu)建和測試模型的。
在生產(chǎn)階段,AI必須連接到多個即時系統(tǒng),這些系統(tǒng)會檢索AI工作所需的輸入項,有時以實時方式進(jìn)行。需要提取的這些數(shù)據(jù)可能具有相同的特征,但其訪問和檢索方式千差萬別。例如,運營對數(shù)據(jù)量和速度的要求,或許與反復(fù)訓(xùn)練模型的要求相差甚遠(yuǎn)。實際上,我們研究的一些AI咨詢公司會刻意限定自己的業(yè)務(wù)范圍,僅提供概念驗證開發(fā)服務(wù),從而完全避開生產(chǎn)中的數(shù)據(jù)問題。
如果組織認(rèn)定實驗室數(shù)據(jù)和生產(chǎn)數(shù)據(jù)是一樣的,就會忽視數(shù)據(jù)可訪問性當(dāng)中相當(dāng)多的復(fù)雜性。這意味著AI項目或許能快速啟動,但需要付出大量額外的時間和精力才能在生產(chǎn)中運行。
數(shù)據(jù)可訪問性問題會影響AI在組織中的成功。為了解決這一問題,我們提出三條建議,以幫助組織更好地管理AI的數(shù)據(jù)可訪問性:讓利益相關(guān)者將數(shù)據(jù)可訪問性理解為業(yè)務(wù)問題,認(rèn)識到組織數(shù)據(jù)對AI的價值,在AI的整個生命周期中始終考慮數(shù)據(jù)可訪問性。
宣傳數(shù)據(jù)可訪問性時,首先強(qiáng)調(diào)它是業(yè)務(wù)問題,其次才是技術(shù)問題。AI項目的所有利益相關(guān)者必須對數(shù)據(jù)可訪問性形成統(tǒng)一認(rèn)知,將其視為數(shù)據(jù)質(zhì)量的必要組成部分,不僅影響IT,還影響運營,因此在AI的整個生命周期內(nèi)都要予以關(guān)注。利益相關(guān)者要將各自掌握的數(shù)據(jù)可訪問性專業(yè)知識集中起來,從而建立“數(shù)據(jù)可訪問性是業(yè)務(wù)問題”的共識。
改變我們對數(shù)據(jù)可訪問性的觀念可能需要一定時間,還要開展前所未有的對話和協(xié)作。在我們研究的一家AI咨詢公司中,數(shù)據(jù)可訪問性已成為員工與客戶之間早期高級別討論的一部分,并被納入AI生命周期的構(gòu)思階段。在其他一些公司中,利益相關(guān)者之間會持續(xù)開展對話,從而確保AI團(tuán)隊的需求與組織資源(如IT人員)協(xié)調(diào)一致,并長期保持這種協(xié)調(diào)性。僅僅在戰(zhàn)略層面上將數(shù)據(jù)可訪問性界定為一個重要業(yè)務(wù)問題或許是不夠的,組織必須為之付出持續(xù)的努力和關(guān)注。否則,數(shù)據(jù)可訪問性問題仍然只是技術(shù)問題,積壓在IT人員的待辦事項清單中等待解決——至于最終能否解決,就是個未知數(shù)了。
這也意味著組織需要讓AI團(tuán)隊的成員明白,識別數(shù)據(jù)可訪問性問題并將其報告給管理層非常重要。從技術(shù)層面來解決數(shù)據(jù)可訪問性問題或許很簡單,但可能要經(jīng)過漫長的審批流程,而且安全政策可能也會導(dǎo)致數(shù)據(jù)無法訪問。在這些情況下,技術(shù)手段是行不通的,唯一可行的解決方案就是認(rèn)真地討論一下,看看能否適當(dāng)放寬安全政策來支持AI團(tuán)隊的工作,當(dāng)然,前提是構(gòu)思階段形成的業(yè)務(wù)用例能支持這一方案。
任何數(shù)據(jù)都可作為AI的潛在備選數(shù)據(jù)。數(shù)據(jù)可訪問性之重要,不僅僅是對當(dāng)前的AI業(yè)務(wù)用例而言。組織面臨的許多問題,都會有各種不同的AI解決方案,這意味著任何數(shù)據(jù)都有可能成為AI項目的寶貴輸入項。改進(jìn)整個組織的數(shù)據(jù)可訪問性,一個關(guān)鍵因素就是跳出“數(shù)據(jù)只是運營的副產(chǎn)品”這一思維框架。換言之,某些數(shù)據(jù)即使在執(zhí)行特定流程的有效生命周期結(jié)束時,仍可作為AI的輸入項繼續(xù)創(chuàng)造價值。在我們研究的一個案例中,供暖、通風(fēng)和空調(diào)系統(tǒng)多年來例行收集的運行日志,如今已成為創(chuàng)建預(yù)防性維護(hù)模型的輸入項。
在數(shù)據(jù)驅(qū)動的文化中,員工依靠數(shù)據(jù)來指導(dǎo)自己的決策。這種文化通常關(guān)注最終產(chǎn)品,也就是對所提取數(shù)據(jù)的使用,而不是將數(shù)據(jù)呈現(xiàn)給員工的流程。業(yè)務(wù)部門必須明白,他們輸出的數(shù)據(jù)可能會為AI提供輸入項。例如,傳統(tǒng)上,旅行社會根據(jù)客服人員的工作日志來監(jiān)督他們的生產(chǎn)率,并確保其完成客服電話指標(biāo)。但是,如果組織能獲取關(guān)于客服電話類型和持續(xù)時間的既往詳細(xì)數(shù)據(jù),就可以將其用作AI的輸入項,從而根據(jù)員工的專業(yè)知識,對排班進(jìn)行優(yōu)化和個性化調(diào)整。從跨職能的角度認(rèn)識到數(shù)據(jù)的雙重作用,明白它既是輸出項(在本案例中,指旅行社客服的通話終止時間),也是輸入項(指客服電話的持續(xù)時間,AI用它來優(yōu)化排班),可能會影響組織對解決方案或供應(yīng)商的選擇或者系統(tǒng)的配置。
我們研究的最成功的業(yè)務(wù)用例,都是在建立運營流程時,就考慮到其支持系統(tǒng)最終要為AI提供數(shù)據(jù)。在一個案例中,一家大型金融機(jī)構(gòu)的AI主管告訴我們,流程再造和系統(tǒng)升級(例如遷移到基于云的服務(wù))是將AI納入現(xiàn)有業(yè)務(wù)流程的重要條件。達(dá)成這一目標(biāo)的關(guān)鍵要素,就是實行有效的治理機(jī)制,讓人和機(jī)器都能方便地檢索和訪問數(shù)據(jù)。
在AI項目啟動之初解決數(shù)據(jù)可訪問性問題。AI生命周期中的迭代式模型開發(fā),并不排斥在AI項目早期考慮數(shù)據(jù)可訪問性,并引入合適的專業(yè)知識。在我們研究的一些案例中,這意味著在藍(lán)圖階段讓軟件工程師和IT人員參與進(jìn)來,從而使嵌入AI的最終產(chǎn)品或服務(wù)的高級參數(shù)廣為人知,對數(shù)據(jù)可訪問性的擔(dān)憂也能相應(yīng)地被提出來。更重要的是,這將確保組織在流程后期盡量減少意外的同時,也考慮到今后將AI集成到組織基礎(chǔ)設(shè)施中的問題。為此,我們建議管理者將兩項任務(wù)明確區(qū)分開來:一是獲取數(shù)據(jù)以構(gòu)建AI,二是在生產(chǎn)中實現(xiàn)數(shù)據(jù)可訪問性。在受控實驗室環(huán)境中構(gòu)建AI當(dāng)然沒有問題,但這并不意味著可以忽視AI未來在生產(chǎn)中的應(yīng)用。
這種方式的一個重要好處是,部分工作可以同步進(jìn)行。例如,可以鼓勵數(shù)據(jù)工程師及早同IT人員展開討論,以制定數(shù)據(jù)路線圖。到AI生命周期的MVP階段,大部分?jǐn)?shù)據(jù)工程管道都會做好接入生產(chǎn)基礎(chǔ)設(shè)施的準(zhǔn)備。另一種可能的模式是與數(shù)據(jù)可訪問性、數(shù)據(jù)工程和各種迭代建模相關(guān)的交錯式任務(wù),類似于在數(shù)據(jù)密集型項目中提出過的那一類任務(wù)。在這種模式下,各項活動可以同步推進(jìn),同時又容許一定程度的滯后,以便在必要時加以調(diào)整。即便在付出上述所有努力后,AI項目仍未突破概念驗證階段或MVP階段,但組織層面數(shù)據(jù)可訪問性的提高必定會在將來的AI項目中發(fā)揮作用。
數(shù)據(jù)是企業(yè)的一項關(guān)鍵資產(chǎn),這種觀點已被企業(yè)領(lǐng)導(dǎo)者廣泛接受,同時,他們也普遍期望使用這些數(shù)據(jù)的AI系統(tǒng)能為企業(yè)帶來新的競爭優(yōu)勢。但決定成敗的往往是實施中的細(xì)節(jié)。所有利益相關(guān)者對數(shù)據(jù)質(zhì)量的維度缺乏全面了解,AI項目同運營脫節(jié),自行其是,這些都可能會削弱AI項目的效果或使其徹底失敗。那些從AI中獲益最多的企業(yè)明白,為了讓AI走出研發(fā)階段,將其集成到運營當(dāng)中,就不僅要看重數(shù)據(jù)作為輸出項的價值,還要看重數(shù)據(jù)作為輸入項的價值,并對數(shù)據(jù)可訪問性給予應(yīng)有的重視。