亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關于人工智能類書刊文章中符號和公式編排的思考

        2022-05-13 06:19:54
        中國傳媒科技 2022年5期
        關鍵詞:符號人工智能

        韓 飛

        (高等教育出版社,北京 100029)

        導語

        當前,新一代人工智能正在全球范圍內(nèi)蓬勃發(fā)展,促進人類社會生活、生產(chǎn)和消費模式巨大變革,為經(jīng)濟社會發(fā)展提供新動能,推動經(jīng)濟社會高質(zhì)量發(fā)展,加速新一輪科技革命和產(chǎn)業(yè)變革。

        2017年,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,目標是搶抓人工智能發(fā)展的重大戰(zhàn)略機遇,讓我國在人工智能領域構筑先發(fā)優(yōu)勢。我國頂級的IT企業(yè)和一流高校陸續(xù)成立協(xié)同創(chuàng)新中心、人工智能研究院、人工智能學院等機構。

        教育方面,《新一代人工智能發(fā)展規(guī)劃》提出“實施全民智能教育項目,在中小學階段設置人工智能相關課程,逐步推廣編程教育”的要求。不少省、區(qū)、市都已經(jīng)開始探索在義務教育階段開展人工智能教育。人工智能高等教育更是走在前列。2018年,教育部印發(fā)了《高等學校人工智能創(chuàng)新行動計劃》,將完善人工智能領域人才培養(yǎng)體系作為三大任務之一,并積極加大人工智能專業(yè)建設力度。

        在這些背景下,我國的人工智能類書刊文章近幾年以幾何級數(shù)增加,給出版單位的編輯提出了新的要求和挑戰(zhàn)。從人工智能的理論基礎來看,一方面,人工智能脫胎于計算機學科,是研究使用計算機來模擬智能的科學,需要用計算機程序?qū)崿F(xiàn)這些智能應用;另一方面,當前以深度神經(jīng)網(wǎng)絡為代表的新一代人工智能又是建立在以線性代數(shù)和概率論為框架的基礎數(shù)學之上,通過在多維上簡單地組合實現(xiàn)復雜的功能。因此,在人工智能類書刊文章中不可避免地會碰到大量的數(shù)學公式、物理量符號、計算機算法和程序段代碼交織在一起的情況,給編輯加工帶來一定的困擾。本文主要談談編輯加工人工智能書刊文章中的符號和公式時遇到的幾個典型問題,并簡單進行總結和歸納。[1]

        1.人工智能類書刊文章中的大、小寫

        人工智能類書刊文章中的大、小寫表示,除了人名、地名、機構等專有名詞的英文釋義需要首字母大寫,名詞英文縮寫、部分運算符號、人名引申的單位符號、集合符號等全部大寫外,其他的英文字符均建議用小寫表示。這和一般科技類書刊文章中的表示是統(tǒng)一的,下面舉幾個人工智能文章中的例子做具體說明。

        例 1(1)Python語言、GPU、LeNet神經(jīng)網(wǎng)絡——這些都是與人工智能相關的專有名詞或?qū)S忻~縮寫,有些已經(jīng)收入相關的《專有名詞詞典》或者在“術語在線”上能查到,但也有相當一部分還沒有,但是可以按照約定俗成來表示。

        (2)支持向量機(support vector machine,SVM)卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)——人工智能書刊文章中出現(xiàn)的算法、方法、公式名稱的英文釋義一般全用小寫表示,縮寫一般全用大寫表示。

        (3) 隱 馬 爾 科 夫 模 型(hidden Markov model,HMM)、蒙特卡洛樹搜索(Monte-Carlo tree search)——英文釋義中涉及人名或者地名等專有名詞,專有名詞保持首字母大寫,其他單詞用小寫表示,縮寫還是全用大寫。

        (4)國際計算機視覺大會ICCV(IEEE International Conference on Computer Vision)——頂級會議和機構名稱的英文釋義保留首字母大寫。

        人工智能類書刊文章中的大、小寫表示一般是遵循約定的原則而非通用標準,所以尺度比較寬松,編輯加工中做到同一類情況全書或全文統(tǒng)一也就可以了。

        2.人工智能類書刊文章中的正、斜體

        2.1 量和單位

        人工智能類書刊文章中的量和單位首先要符合一般性的量和單位正規(guī)表達方式。[2]量的符號,包括物理量和計算過程中用到的變量,通常是單個的拉丁字母或希臘字母,都必須用斜體表示,如x,y,z,W,α,β,Θ等。

        有一種情況容易忽略,即變量出現(xiàn)在名詞中,如人工智能類書刊文章中會出現(xiàn)k-均值(k-mean)算法、n元語法(n-gram)模型等名詞,其中的k和n表示為變量,所以不管是在中文名稱還是英文釋義中都應該用斜體表示。

        單位符號則一律用正體表示,如厘米(cm)、千克(kg)等。人工智能書刊文章中還經(jīng)常會遇到計算機中常用的單位,如比特(b)、比特率(b/s)、千比特每秒(Kb/s)、字節(jié)(B)、千字節(jié)(KB)、兆字節(jié)(MB)等。特別要注意小寫k、m和大寫K、M作為SI詞頭(加在單位前的符號)的用法,一般來說,103= k,10-3= m,106= M,但在計算機二進制中還有210= K,220= M,所以要根據(jù)上下文的準確意思來標注單位符號。

        人工智能書刊文章中的單位符號還有幾個通用原則需要遵循。

        (1)作為科技書籍或文獻,單位符號一般應全部使用英文符號,不能中文英文單位混用,除非該量只有中文單位,如計數(shù)單位“元”“人”“冊”等,計時單位“時辰”“旬”等,因為沒有對應的字母符號,所以只能用中文符號。

        (2)多個具有共同單位的數(shù)值并列或區(qū)間表示時,可以只在最后一項數(shù)值后保留單位符號,其他數(shù)據(jù)后省略,例如,100、200、500 HZ(或100,200,500 HZ),100~500 b/s,1991—1995 年等。

        (3)多個數(shù)值相乘表示面積、體積、分辨率時,每個數(shù)值的單位都應該保留,例如,體積2 m×5 m×3 m,分辨率 800px×600px等。這和上文“多個具有共同單位的數(shù)值并列”是有明顯區(qū)別的,需要特別注意。

        2.2 函數(shù)、常數(shù)及運算符號

        數(shù)學公式中常見的函數(shù)、常數(shù)及運算符號一律用正體表示,如sin,cos,∑,∏,log,ln,Δ,π,e(自然對數(shù)底)等。

        微分號“d”和偏微分號“?”本文認為也是運算符號的一種,所以應該用正體表示。

        要注意的是,不能見著符號e就把它排成正體,一定要明白它代表的數(shù)學意義,e作為字母變量時應該用斜體表示,同樣的情況還是有π,∑等,這些符號也常用作變量。

        人工智能用到的公式除高等數(shù)學外,還涉及統(tǒng)計學的內(nèi)容,例如統(tǒng)計機器學習部分的內(nèi)容。統(tǒng)計學的運算符號一般用斜體表示,還應注意大、小寫的表示規(guī)則,如概率計算為大寫斜體P,算數(shù)平均數(shù)計算使用大寫斜體M,總體的標準差計算用小寫斜體σ等。

        人工智能類書刊文章中還有一類特殊的函數(shù)——激活函數(shù),如softmax,logistic,sigmoid,tanh,ReLU等,實際處理中,作為一般的數(shù)學函數(shù)對待,不管是在正文中還是在公式中,都用正體表示。

        2.3 上、下標的正、斜體

        一般原則是,物理量符號或者在計算過程中用到的變量符號出現(xiàn)在上、下標的時候使用斜體表示,其他均應用正體表示。[3]

        例2Wij,其中的ij是雙變量符號,使用斜體表示;

        Wi,Wo,其中i,o表示物理量的輸入、輸出狀態(tài),使用正體表示;

        WT,其中的T是時間變量,使用斜體表示;

        WT,其中的T表示矩陣的轉置,使用正體表示。

        人工智能類書刊文章中變量的上、下標還會用到函數(shù)符號,如果是標準數(shù)學函數(shù)或特定的函數(shù)符號,如sin(正弦),max(最大),lim(極限),exp(以e為底的指數(shù)函數(shù)),tanh(雙曲正切)等,均用正體表示。但是,很多作者也會用到自定義的函數(shù)符號做變量的上、下標,一般來說自定義的函數(shù)在公式計算中用斜體表示,因此,用作變量的上、下標時也用斜體表示,如等。

        2.4 計算機程序中的正、斜體

        人工智能類書刊文章中還會遇到大量的程序代碼,計算機執(zhí)行程序時一般不區(qū)分正、斜體,所以程序代碼編排時不管是變量還是常量一律用正體表示。通常,為表述一致,程序段的注釋部分(用“#”或“/*”等標注)出現(xiàn)的變量也一律用正體表示,但如果在兩個程序段中間出現(xiàn)的沒有用“#”或“/*”等標示的語句,可以認為是正文,其中出現(xiàn)的變量還是要用斜體表示。

        3.人工智能類書刊文章中的黑、白體

        3.1 矢量、向量、張量和矩陣

        《量和單位國家標準實施指南》[4]中規(guī)定:矢量、向量、張量和矩陣用黑斜體表示。

        人工智能類書刊文章中的公式會大量用到向量、張量、矩陣,但作者在寫作的時候往往會忽略標注黑體,編輯因為專業(yè)知識的限制,有時也很難判斷某些量是標量還是向量、矩陣、張量。[5]簡單的方法就是從上下文信息判斷出某些量的屬性,例如,判斷矩陣的直觀方法有轉置(T)、取模(║·║)等運算,再由這些已知的量推導出其他量的性質(zhì)。但是,人工智能類書刊文章中大部分的量都無法這么簡單判斷,本文根據(jù)編輯此類書刊文章的經(jīng)驗以及與相關作者的交流溝通,以機器學習和神經(jīng)網(wǎng)絡為例給出一些編輯加工思路。

        單特征的回歸網(wǎng)絡,本質(zhì)上就是一元線性問題,其計算公式就是一個線性方程:

        zi=xi·w+b

        w和b都是一個標量,每個特征x對應一個輸出z,所以都是白體。

        多特征的回歸網(wǎng)絡,其計算公式也可以簡單歸納為一個線性方程:

        Z=WTX+B

        其中,X=,即多個特征向量的矩陣,所有都是黑體。

        往后,更復雜的計算模型,例如多特征的多分類問題以及深度學習問題,樣本數(shù)肯定大于2,甚至是多維數(shù)據(jù),所以輸入和輸出都應該是矩陣或張量,特征數(shù)也肯定多于一個,甚至是多維特征,所以特征和偏置也都是矩陣或張量,都應該用黑體表示。[6]

        例如,對具有n個訓練數(shù)據(jù){(x1,y1)…,(xn,yn)}的神經(jīng)網(wǎng)絡,其中(xi,yi)(1≤i≤n)分別為輸入樣本及其對應的標簽,都是向量表示。對該神經(jīng)網(wǎng)絡進行優(yōu)化,一般需要計算該神經(jīng)網(wǎng)絡的損失函數(shù),可表示為Loss(yi,f(W,xi))。其中,Loss是損失函數(shù)符號,因為是自定義函數(shù),此處用的是斜體;f(W,xi)表示參數(shù)為W的神經(jīng)網(wǎng)絡對輸入xi的預測,對卷積神經(jīng)網(wǎng)絡而言,W表示神經(jīng)元連接權重和卷積核權重等需要學習的參數(shù)。

        此外有個細節(jié)要特別小心,即使判定變量為向量、張量、矩陣,也不要一股腦地把此變量整個排成黑體,要注意上、下標的量的屬性。只有同樣是向量、張量、矩陣的上、下標才需要排成黑體,其余仍是白體。例如,Loss(yi,f(W,xi))中,雖然y和x都是用黑斜體表示,但下標i是用白斜體表示。

        3.2 集合

        集合一般都是用大寫拉丁字母的白體表示,如A,B,X,Y,Z等,但某些特殊的集合符號需要用黑正體或空心正體(或花體)形式表示,如N或N(非負整數(shù)集),Z或Z(整數(shù)集),R或R(實數(shù)集)等。

        但要特別注意是集合內(nèi)的元素有可能是向量或張量,這在人工智能類書刊文章中非常常見,例如輸入數(shù)據(jù)集合X={x1,x2,x3,… ,xn},這時,很多作者在寫書過程中容易直接把X集合標成黑體并直接代入后面算式進行計算,混淆了數(shù)據(jù)集合和數(shù)據(jù)矩陣。其實,數(shù)據(jù)集合和數(shù)據(jù)是兩個不同的概念,集合只能參與集合運算,不能參與普通運算,直接寫進公式就寫錯了。碰到此類情況,本文有如下一種編輯加工時的修改方案。

        定義數(shù)據(jù)集合X= {x1,x2,x3,… ,xn},注意X是大寫的白體,另定義小寫黑體x=(原則上另定義大寫黑體X也可以,但是同時出現(xiàn)不好區(qū)分,也使讀者疑惑)或者xi(i=1,…,n)代表數(shù)據(jù)代入公式進行運算。這里的x或xi不再表示集合而是表示數(shù)據(jù)矩陣或單個數(shù)據(jù)向量、張量。

        可見,符號和公式的正、斜、黑、白體看似不起眼,實則非常重要,有時不僅僅是規(guī)范性問題,還是科學性問題。[7]

        4.公式、算法偽代碼和程序段混排中的處理

        能正確標注公式中的正、斜、黑、白體已經(jīng)很難了,如果再碰上公式、算法偽代碼和程序段混排的情況,那就更容易混淆了。下面通過一個例子來說明本文的處理方式。

        例3 如果使用深度神經(jīng)網(wǎng)絡來擬合動作─價值函數(shù),則該算法被稱為深度Q學習。……,是對的估計值,……,利用梯度下降法來更新參數(shù)θ。

        算法 參數(shù)化的Q學習算法

        此例中的θ,從上下文來看是個多維參數(shù),必然是向量或張量,所以正文中用黑斜體表示。本文認為算法偽代碼也是正文的一種形式,只不過加入了repeat、until、for、goto這樣的偽語句(偽語句的編排向程序段靠攏,用正體表示),所以期內(nèi)的公式表述還是應該和普通正文表述保持一致。所以此例中出現(xiàn)的θ都統(tǒng)一用黑斜體表示。如果算法偽代碼后面還接了一段Python程序,其中定義了同一個變量θ,按照前文所述原則,程序內(nèi)的θ按照正白體處理。[8]

        5.小結

        以上分析了人工智能類書刊文章中常見的符號使用和公式編排問題,并給出了規(guī)范性的思考。但符號和公式使用的實際情況要復雜得多,特別是人工智能涉及的公式都是抽象公式,其中變量的一符多用或多符共用的情況普遍存在,用好用準并不容易。作者和編輯要在熟悉規(guī)范的前提下,根據(jù)知識內(nèi)容的實際情況,準確表達,一起提高此類書刊文章中符號和公式使用的規(guī)范性,提高成果質(zhì)量,為我國新一代人工智能的發(fā)展保駕護航。

        猜你喜歡
        符號人工智能
        我校新增“人工智能”本科專業(yè)
        學符號,比多少
        幼兒園(2021年6期)2021-07-28 07:42:14
        “+”“-”符號的由來
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        變符號
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        南風窗(2016年19期)2016-09-21 16:51:29
        下一幕,人工智能!
        南風窗(2016年19期)2016-09-21 04:56:22
        倍圖的全符號點控制數(shù)
        国产精品亚洲A∨天堂| 肥老熟妇伦子伦456视频| 天堂网在线最新版www| 人与嘼av免费| 亚洲综合网一区二区三区| 无码国产精品第100页| 亚洲色www无码| 97国产精品麻豆性色| 熟女肥臀白浆一区二区| 未满十八勿入av网免费| 日本高清www午色夜高清视频| 国产精品 视频一区 二区三区 | 亚洲VA中文字幕无码毛片春药| 99久久精品国产一区色| 白白在线视频免费观看嘛| 国产精品无码素人福利不卡| 亚洲精品午夜无码专区| 精品无码久久久久久久动漫| 蜜桃一区二区三区自拍视频| 蜜桃a人妻精品一区二区三区| 欧美日韩在线视频一区| 另类老妇奶性生bbwbbw| 无码人妻一区二区三区免费n鬼沢| 亚洲欧美成人久久综合中文网| 国产无套一区二区三区久久| 亚洲午夜av久久久精品影院色戒 | 久久精品av在线视频| 中文精品久久久久人妻不卡| 青青青国产精品一区二区| 久久久精品电影| 一区二区三区在线乱码| 国产精品一区二区三区自拍| 高h纯肉无码视频在线观看| 中文字幕亚洲情99在线| 国产精品麻豆成人AV电影艾秋| 亚洲国产精品午夜一区| 91九色老熟女免费资源| 国内a∨免费播放| 亚洲日产无码中文字幕| 国产精品亚洲一区二区三区久久| 朝鲜女人大白屁股ass孕交|