摘" 要:數(shù)字化時代的人類記憶,即數(shù)字記憶,是由現(xiàn)實社會中人類在數(shù)字化世界中的“生活痕跡”自然構建而成,與人類日常生活密切相關,甚至可以認為是現(xiàn)實社會在數(shù)字世界的虛擬映射。但數(shù)字記憶背后所涉及的所有權爭議以及諸如回收、刪除等處理方式,數(shù)字遺忘權的缺失等都存在一定倫理問題,并在其物化形態(tài)中處于一種隱形的情景之中。伴隨著技術的變化與發(fā)展,這些倫理問題凸顯出來,而對于這些問題的分析和解答方式,為面向數(shù)字記憶的相關設計倫理問題提供了可能的回應。本文借助AI程序,分析用戶個人數(shù)字記憶并運用AI生成式建模程序以三維模型的形式對其進行視覺化呈現(xiàn),后續(xù)也為用戶提供輸出接口以期為用戶個性化需求提供便利,從而實現(xiàn)用戶與數(shù)字記憶間的更合乎倫理的互動。在方法維度與結果維度上,運用AI技術對于數(shù)字記憶這一對象的處理實現(xiàn)了數(shù)字記憶的可視化,構建出一個數(shù)字存在體(可延伸為現(xiàn)實存在體)。這在豐富理論實踐的同時,延續(xù)了現(xiàn)實世界中具身的“真實的我”與數(shù)字世界中離身的“虛擬的我”之間在倫理上的契合,實現(xiàn)數(shù)字記憶的倫理可持續(xù)。
關鍵詞:數(shù)字記憶;倫理可持續(xù);可視化;價值延續(xù)
記憶是一個老生常談又時談時新的話題,它是個體的經驗歷經復雜排列組合后的身體性留存[1],胡塞爾稱之為第一持存。在數(shù)據(jù)化時代之前,身體記憶的長存依賴于人類大腦的生理結構。正因為有了記憶,人類歷史才得以傳承,文化記憶才得以延續(xù)。從西方古典哲學家們著手思辨記憶的本質,到數(shù)字化的信息時代人們探究全新記憶形態(tài)的多種可能,人類如何研究并評論與記憶相關的問題一直都是熱鬧非凡。從發(fā)展脈絡來看,不同學科從不同的視域和認知角度,探究記憶問題并提出獨特見解,不斷豐富人們對記憶的認知。社會學將記憶研究的范疇由個體延伸至集體,并在此之上結合社會、文化、媒介、檔案、歷史等眾多跨學科的學術話語發(fā)展出許多記憶類型,如媒介記憶等。數(shù)字記憶是指將信息通過現(xiàn)代數(shù)字技術轉化為存儲在電子設備中的數(shù)據(jù),便于計算、提取和傳輸。根據(jù)斯蒂格勒的觀點,數(shù)字記憶是一種物質性記錄形式,數(shù)字技術本質上是記憶技術的進化。在數(shù)字技術的廣泛應用下,個體的記憶通過數(shù)據(jù)的存儲得到了增強,甚至實現(xiàn)了永存[2]。數(shù)字記憶的這種“永生”,促使關乎個人隱私的數(shù)據(jù)信息像疤痕一般,緊貼在個體的“數(shù)字身體”之上。同時,個體的數(shù)字記憶如今被收集和挖掘,成為工業(yè)化的原材料。大數(shù)據(jù)和算法對這些記憶的選擇和檢索進行規(guī)范,導致個人失去對自身數(shù)據(jù)的控制,進而引發(fā)了一系列被忽視的、亟待解決的倫理問題。在后數(shù)字時代我們如何看待這些倫理矛盾?如何通過建立倫理范式和諧處理相關倫理問題?這些都以從設計角度出發(fā)討論和思考設計應該如何跨學科介入社會倫理建構為目的,為設計倫理研究提供了新的命題和討論對象。
一、數(shù)字記憶的倫理問題
英國電視臺出品的科幻劇《黑鏡》,一貫以黑科技介入生活世界的敘述手法,其中有一個名為“你的全部歷史”的故事。它講述了在身體內植入一種刻寫有個人全部視覺經歷的高技術芯片對個體日常生活可能產生的影響。技術的進步使得人們能夠隨意回溯芯片中的記錄,查看任何時段里的視覺圖像,幾乎不再擔心遺忘??稍诹硪环矫?,這種無法遺忘的狀態(tài)卻拘束著每個人的日常生活和社交。個體的確可以通過這種方式不斷回顧生活中的美好時刻,然而這些記錄也可能被用來全面審查個人。負面記錄可能被無限放大,造成難以預測的不良影響甚至個人的災難,乃至于刪除記錄的行為也被視為道德瑕疵。個人的歷史和隱私被置于大眾的眼光之下,并且大眾對此沒有倫理責任。在巨大的社會壓力下,人們只得使用芯片。具有黑色幽默的是,芯片被竊取這一例外反而使得個體逃避了被自我和公眾監(jiān)視的命運。
上述科幻作品固然是虛構的,但它也提出來一個需要深入思考的問題:在數(shù)字化時代背景下,各種電子設備與軟件構成一個龐大的系統(tǒng),將人類的日常所有內容以數(shù)據(jù)的形式刻錄進虛擬世界,并憑借強大的技術支持能夠進行長時間的存儲和跨長時間調用時候,我們——無論個體還是社會——是否做好了準備去面對這種極難忘記的離身的外在記憶?
遺忘與記憶一樣,也是人類基本的常態(tài)化文化母題。它與記憶相伴,實際上可以視為記憶的一種延續(xù)。在數(shù)字時代,數(shù)據(jù)丟失和損壞的風險依然存在,同時數(shù)據(jù)修復、復制甚至永久保存的技術卻也得到了顯著提升。這就使得記憶與遺忘在前數(shù)字技術時代彼此間的動態(tài)平衡失去控制,“遺忘”變得越發(fā)困難。而當信息系統(tǒng)默認“保存”作為初始模式時,繁而難辨的數(shù)據(jù)便理所應當?shù)爻蔀橐环N負累,這也意味著“重新定義我們自己的自由度減少了”[3],這迫使我們不得不進行有選擇的刪除,從而再次凸顯出遺忘的價值。
數(shù)字記憶最主要的特征是它自身所具備的虛擬性。數(shù)字記憶沒有具體的的形態(tài),它們彼此間通過二進制編程數(shù)據(jù)呈現(xiàn)并以相互連接的形式存儲于虛擬的互聯(lián)網(wǎng)世界中,換句話說,它的本質特性是無形性。但數(shù)字記憶也是真實存在的,如果通過一些特殊方法對其加以使用便可在一些方面契合人們的精神需要。虛擬性的數(shù)字記憶對于個人的實際意義,在某種程度上與傳統(tǒng)記憶之于個人的意義相比,其實并無二致。作為二進制數(shù)據(jù)的數(shù)字記憶,其存在必須依附于相應的媒介或載體,如互聯(lián)網(wǎng),因此數(shù)字記憶的流轉也高度依賴于虛擬互聯(lián)網(wǎng)。也正是因此,互聯(lián)網(wǎng)與數(shù)字記憶之間的緊密關系是研究數(shù)字記憶的繼承何以可能之時必然要考慮的問題。此外,數(shù)字記憶是個人行為在互聯(lián)網(wǎng)世界留下的“痕跡”,天然地會涉及諸如聊天記錄、音視頻等隱私信息。如若對這部分用戶不愿意公開的信息進行繼承將會侵犯用戶的隱私權,不僅侵犯用戶的人格,在很大程度上與我國法律法規(guī)中的要求相沖突,同時還違背了當事人繼承數(shù)字記憶的本意表述。所以,隱私問題是數(shù)字記憶相關研究的一個突出倫理問題。另外,數(shù)字記憶概念中所涵蓋的微信聊天記錄、微博、視頻照片等生前信息均具有極強的人格屬性,對于其親屬也具有紀念意義。但是卻無法用現(xiàn)存的價值標準對這些信息進行準確的價值衡量,同時這些對于普通人毫無用處的信息常常也被默認是互聯(lián)網(wǎng)的資產而被長期獨占,目前也不存在一致性地標準對數(shù)字記憶進行權責的確認。故而不確定的數(shù)字記憶價值確認標準也是數(shù)字記憶倫理研究的主要問題之一。
二、數(shù)字記憶建構路徑
數(shù)字記憶建構的理論基礎首先應關注數(shù)字記憶的形成及其建構的本質。不僅需要明確其價值取向,還需系統(tǒng)整理數(shù)字記憶建構的核心觀念,并深入探討在數(shù)字時代下記憶與遺忘的內在聯(lián)系。
(一)數(shù)字身體、交往與記憶構成
從靜態(tài)角度看,記憶的構成主要涉及“主體、客體與中介”,即記憶的主體、回憶的內容以及回憶的方式[4]53。這一構成在歷史進程中是不斷變化的。書寫時代的記憶通過日常書寫獨立于主體的身體存在。而在數(shù)字時代,記憶主體依托數(shù)字技術形成“數(shù)字身體”,在互聯(lián)網(wǎng)的記憶空間中重新獲得了“身體在場”。它通過圖像、視頻、聲音、表情符號等發(fā)展出一種全新的在場傳播進路來傳遞記憶主體的身份與信息。在這樣的傳播過程中,人們對于自我、他者與世界關系的認知必定受到影響,并可能形成全新的交往方式與行動趨勢,最終作用于人們記憶的內容。但從數(shù)字記憶其形態(tài)的角度看,數(shù)字時代的記憶往往通過一種數(shù)據(jù)的形式被外化為許多非實體物,并與書寫時代的記憶(以實體物質為承載媒介)有著迥然的差異。對于這種以數(shù)據(jù)形式存在的記憶,需要更為智能化和高效化的管理方式,這些數(shù)據(jù)不僅供給記憶的基材,還是人們在實踐過程中形成個體自身與自我認知的“緩存記錄”。這種認知形成了我們對數(shù)字記憶的基本理解:它源自于人類在互聯(lián)網(wǎng)中生產生存的虛擬的實踐活動,并表征為一種“數(shù)據(jù)化”的痕跡。在這種數(shù)據(jù)化的形式中,個人記憶的容積得到顯著擴展。通過多種技術手段對數(shù)字記憶數(shù)據(jù)元素處理,可以在這些記憶之間建立諸多充盈靈動的聯(lián)系與聯(lián)想,使得數(shù)字記憶的內容更加生動和活躍。
(二)數(shù)字記憶建構思路
根據(jù)法國哲學家亨利·柏格森(Henri Bergson)通過對“記憶什么、如何記憶以及記憶的動力”[4]54等問題的研究所得到關于記憶的分析觀點,與記憶的建構要有“普惠意義”的觀點[5],我們可以梳理數(shù)字記憶的發(fā)展脈絡,大致可以歸納出幾種具有普遍意義上的數(shù)字記憶建構進路(如圖1)。
為避免本研究的內容過于繁雜,本文需要懸置前兩個數(shù)字記憶建構觀,并主要借助面向數(shù)字人文的記憶建構觀下的個人人文類記憶作為研究對象,擬采用AI技術對于用戶個人人文類數(shù)字記憶進行關鍵詞分析,再運用AI生成式建模技術生成三維模型作為個人數(shù)字記憶的“數(shù)字身體”,并為用戶提供后續(xù)接口實現(xiàn)個人個性化定制,從而在互動方式上實現(xiàn)數(shù)字記憶倫理問題的妥善解決。
三、一種設計嘗試:分析與生成式建模
(一)AI文本分析
AI文本分析首先是挖掘個人數(shù)字記憶中的文本內容,其中關鍵詞提取是關鍵環(huán)節(jié)之一。通過這一環(huán)節(jié),可以揭示文本的主要內容,從而應用于文本推薦或搜索環(huán)節(jié)中。目前,關鍵詞提取算法一般可分為有監(jiān)督和無監(jiān)督兩種(如圖2)。
有監(jiān)督的算法的運作邏輯是運用二分法對提取到的所有候選關鍵詞進行逐個判定,最終確定核心關鍵詞。因而這種算法模型的訓練需要人工耗費時力對文檔集合事先標注好候選關鍵詞,人工成本高昂,所以無監(jiān)督算法通常更為普遍。
無監(jiān)督算法則是通過諸如基于文本統(tǒng)計特征、詞圖模型和主題模型等多種方法識別文本中重要的詞匯來提取關鍵詞。不同方法有不同策略,常見的策略有TF-IDF、TextRank和LDA三種,極大增強了適用性。其提取文本關鍵詞的流程如圖3。
1.TF-IDF關鍵詞提取
TF-IDF是關鍵詞提取中最簡單易懂的方法。雖然在一篇文章中判斷詞語的重要性常常依賴詞頻(即詞出現(xiàn)的頻率),但高頻詞并不一定總是重要,因為某些詞可能在許多文本中都頻繁出現(xiàn),此時它們的重要性會相對降低。統(tǒng)計學上,TF-IDF通過賦予那些不常見的詞較大的權重,同時降低那些在多篇文章中不重要的常見詞的權重,從而衡量詞語的重要性。IDF(逆文檔頻率)就是用來調整詞語權重的參數(shù),而TF指代詞頻。TF和IDF的計算公式如下:
某個詞的IDF值是基于整個語料庫計算得出的。如果某個詞在語料庫中出現(xiàn)得越頻繁,那么其IDF值的分母就越大,結果便趨近于0。為了避免分母為0的情況(即所有文檔都不包含該詞),通常需要在分母中加1,以確保計算的穩(wěn)定性。最終得到TF-IDF值:
TF-IDF值與詞在文檔中的出現(xiàn)次數(shù)成正比,而與其在整個語料庫中的出現(xiàn)次數(shù)成反比。換句話說,若某個詞的TF-IDF值較高,意味著該詞在語料庫中較少見,但在特定文檔中的頻率較高,因此可能是該文檔的關鍵詞。盡管TF-IDF實現(xiàn)簡單且易于理解,但也存在一些明顯的缺陷。例如,TF-IDF過度依賴語料庫,對語料庫的質量和與處理文本的一致性要求很高。此外,IDF本身旨在壓抑噪聲,其加權傾向于低頻詞,這可能降低TF-IDF的精度。另一個缺陷是該方法不考慮詞的位置,典型情況是文本的標題或首尾句中的重要信息,但TF-IDF并未賦予這些位置較高的權重。
基于統(tǒng)計特征的關鍵詞提取算法通過對特征量化指標進行排序,從中提取Top-K個詞作為關鍵詞。特征量化指標的計算是此類算法的關鍵,不同的量化指標會導致不同的結果。因此,在實際應用中,通常會采用多種量化指標來構建指標矩陣,以便得到Top-K個詞作為關鍵詞。
2.TextRank關鍵詞提取
TextRank從詞圖模型的角度出發(fā)來識別文本中的關鍵詞,其基本理念脫胎于PageRank算法。作為Google搜索引擎的核心算法,PageRank算法是通過網(wǎng)頁之間的鏈接來計算網(wǎng)頁的重要性。它將整個互聯(lián)網(wǎng)視為一個有向圖,網(wǎng)頁作為圖中的節(jié)點,而圖中的邊表示不同網(wǎng)頁之間的鏈接。根據(jù)重要性傳遞的原理,如果一個Page α向Page β發(fā)送了一個鏈接,則Page β的重要性排名將受到Page α的重要性影響,從而得到提升,具體如圖4所示。
PageRank算法通過迭代計算網(wǎng)頁的PR值來評估其重要性。算法利用以下公式進行更新:
其中,d是阻尼系數(shù)(通常為0.85),N是總網(wǎng)頁數(shù),L(i)是指向網(wǎng)頁i的網(wǎng)頁集合,是網(wǎng)頁j的出鏈數(shù)量。
類似的,TextRank算法應用于文本分析時,它將詞匯視為圖中的節(jié)點,詞匯之間的共現(xiàn)關系視為邊,通過設定一個固定長度的窗口來確定共現(xiàn)關系,然后通過迭代計算詞匯的權重值PR。公式為:
其中,V是詞匯總數(shù),N(i)是與詞匯i有共現(xiàn)關系的詞匯集合,wji是詞匯j到詞匯i的邊的權重。
TextRank通過計算詞匯的PR值來排序,提取出重要的關鍵詞或關鍵句。
3.LDA關鍵詞提取
D.M.Blei在2003年提出的LDA模型通過詞袋模型簡化了關鍵詞提取過程。在LDA中,每篇文檔由多個主題的概率分布構成,而每個主題又由多個單詞的概率分布構成。這些分布都遵循狄利克雷先驗分布。文檔生成模型可以表示為圖5所示。其中超參數(shù)a和b分別控制文檔主題分布與主題單詞分布,b為第k個主題下的所有單詞的分布,c為文檔的主題分布,表示文檔中各主題的比例,g為文檔的詞,e為g所對應的主題[6]。
LDA模型能夠挖掘文本的深層語義,通過主題表示文本,從而降低文本向量的維度,這種方法在文本分類中表現(xiàn)良好。LDA的核心在于從文檔的隱含語義中提取關鍵詞。然而,該模型提取的關鍵詞通常較為寬泛,難以準確反映文本主旨。此外,LDA的時間復雜度高,需要大量的訓練。
Python jieba庫中fxsjy/jieba中提供了以TF-IDF算法和TextRank算法作為基礎平臺的關鍵詞提取的源代碼,通過分析jieba庫的源碼介紹中文分詞中關鍵詞提取算法的實現(xiàn)①(如圖6)。
總結以上常見關鍵詞提取算法的優(yōu)劣,本文選取在TF-IDF算法和TextRank算法之上構建的關鍵詞提取核心算法,即jieba庫此項開源算法進行對于個人數(shù)字記憶的關鍵詞分析。
(二)AI自動生成模型
借鑒前文中對于文本關鍵詞提取算法的比較分析,以AI介入?yún)?shù)化搭建三維模型的自動生成,通過軟件編寫,構建出以文本輸入、關鍵詞分析、智能生成為主要流程的數(shù)字記憶參數(shù)化造型生成系統(tǒng)。數(shù)據(jù)可視化過程是通過一些參數(shù)化設計以得到相應的結果,而參數(shù)化設計本身可通過參數(shù)調節(jié),改變造型的最終結果。利用編程技術使系統(tǒng)在改變參數(shù)時按照既定的美學規(guī)律變化,可得到更加符合審美要求的設計造型。參數(shù)化造型智能生成系統(tǒng)(如圖7),實現(xiàn)此產品智能生成系統(tǒng)大致需要以下三個階段:
在本系統(tǒng)中,影響造型生成的關鍵階段為設計輸入階段。本文選取github上開源的“Dream Field-3D”②的關鍵詞生成3D模型算法為基礎,嘗試將某一個片段的數(shù)字記憶進行解構,得到一些關鍵詞,再用這些關鍵詞構建數(shù)字記憶的“實體”形式,實現(xiàn)數(shù)字記憶的可視化。
“Dream Field-3D”算法將神經渲染與多模態(tài)圖像和文本表示相結合,僅從自然語言描述合成不同的3D對象。它可以在沒有3D監(jiān)控的情況下生成大量物體的幾何形狀和顏色。由于缺乏多樣化的帶標題的3D數(shù)據(jù),以前的方法只能從少數(shù)類別中生成對象,如ShapeNet。相反,這一算法使用預先訓練過的圖片-文本模型來指導生成,這些模型由來自網(wǎng)絡的帶有標題的圖像的大型數(shù)據(jù)集組成。它從許多相機視圖中優(yōu)化神經輻射場,因此根據(jù)預訓練的CLIP模型,渲染的圖像與目標標題匹配度較高。為了提高保真度和視覺質量,此算法引入了簡單的幾何先驗,包括稀疏誘導透光正則化、場景邊界和新的MLP架構。在實驗中,Dream Fields從各種自然語言標題中產生了逼真的、多視角一致的物體幾何形狀和顏色(如圖8)。
(三)AI技術轉化
通過前文對技術路徑的論述,要將上述想法在最終結果中落地,首先需要結合與個人數(shù)字記憶相關的各類數(shù)據(jù)與用戶喜好,以此設定合理的設計方向,并在AI技術結果的范圍內進行設計實踐。以用戶需求為導向,以用戶個人數(shù)字記憶為藍本,通過AI分析得到關鍵詞參數(shù)并以此構建三維模型,生成數(shù)字記憶的網(wǎng)絡中的“實體”,并給用戶提供接口便于個性化需求。以下為通過這一流程最終效果展示(如圖9)。其中,球體體積代表在一段數(shù)字記憶中相關關鍵詞的權重,可以從某一側面反映這一段歷程中某件事情的重要性。同時,多個關鍵詞所呈現(xiàn)的權重對比又在一定程度上反映出數(shù)字記憶所有者數(shù)字生活的多面向性。
四、結語
本文借助AI程序算法,分析用戶個人數(shù)字記憶并運用AI生成式建模程序將之以三維模型的形式進行視覺化呈現(xiàn),后續(xù)也為用戶提供輸出接口以期為用戶個性化需求提供便利,從而實現(xiàn)用戶與數(shù)字記憶間的更合乎倫理地互動。在方法維度與結果維度上,運用AI技術對于數(shù)字記憶這一對象的處理實現(xiàn)了對于數(shù)字記憶的可視化,構建一個數(shù)字存在體(可延伸為現(xiàn)實存在體)。這在豐富理論實踐的同時,讓用戶能切身了解到數(shù)字記憶的存在。數(shù)字記憶不僅可以轉變?yōu)閷嶓w物質(遵從實物的遺忘遺產屬性),更是可以進行留念回憶的事物,因而延續(xù)了現(xiàn)實世界中具身的“真實的我”與數(shù)字世界中離身的“虛擬的我”之間在倫理上的契合,實現(xiàn)數(shù)字記憶的倫理可持續(xù)。
注釋:
①Python jieba庫中fxsjy/jieba完整算法代碼查閱地址:jieba/tfidf.pyat master·fxsjy/jieba·GitHub。
②DreamField-3D模型的詳細代碼參見:https://github.com/shengyu-meng/dreamfields-3D。
參考文獻:
[1]周耀林,劉晗.數(shù)字記憶建構:緣起、理論與方法[J].山東社會科學,2020(8):50-59.
[2]吳靜.第三持存和遺忘的可能:數(shù)字時代的莫涅莫緒涅困境[J].江海學刊,2021(5):122-127.
[3]Luciano Floridi.The Fourth Revolution:How the Infosphere Is Reshaping Human Reality[M].New York:Oxford University Press,2014:72.
[4]閆宏秀.數(shù)字時代的記憶構成[J].自然辯證法研究,2018,34(4).
[5]楊文.數(shù)字人文視閾下的社會記憶構建研究[J].情報資料工作,2019(5):38-45.
[6]劉學穎.無監(jiān)督的專利文本關鍵詞提取研究[D].重慶:重慶郵電大學,2021:6-11.
作者簡介:劉琪,廣東工業(yè)大學藝術與設計學院碩士研究生。研究方向:設計方法、設計理論。