李滕飛 孫東 王平 張曉龍 張譯心 李雷
【摘要】如今多數(shù)文章被文體語(yǔ)法等方面限制,自動(dòng)生成文章為人們的生活提供便利和創(chuàng)造力,有利于解放固有思想模式,建立多元文化,提高文章的新穎性。
【關(guān)鍵詞】自動(dòng)生成文章 ?深度學(xué)習(xí) ?大數(shù)據(jù)分析 ?數(shù)學(xué)建模
一、引言
通過(guò)大數(shù)據(jù)在數(shù)據(jù)庫(kù)中提取各類所需文章進(jìn)行整理,并在深度學(xué)習(xí)的技術(shù)支持下實(shí)現(xiàn)計(jì)算機(jī)創(chuàng)作出的文章的高質(zhì)量,在如今快節(jié)奏的時(shí)代里能夠更多的節(jié)省人們的時(shí)間,方便人們的生活。這個(gè)項(xiàng)目對(duì)于短時(shí)間內(nèi)需要一些高質(zhì)量、創(chuàng)新性、廣泛性文章的人們來(lái)講是非常的高效而且實(shí)用,通過(guò)這個(gè)項(xiàng)目使需要新文章新思路等需求的工作人群的壓力得到緩解,更好的便民利民。
二、項(xiàng)目實(shí)施的意義
(一)從本項(xiàng)目的實(shí)際意義
如今我們的生活壓力過(guò)大,多數(shù)文章被文體語(yǔ)法等方面限制,在線生成文章可方便人們的生活,具體目的如下:
(1)解決家長(zhǎng)的講故事難問(wèn)題,激發(fā)孩子的想象力與語(yǔ)言表述能力,鍛煉孩子的外語(yǔ)能力。
(2)實(shí)時(shí)生成最新新聞的過(guò)程與評(píng)論。
(3)創(chuàng)造出新的文體文風(fēng),擴(kuò)展文學(xué)領(lǐng)域。
(4)給無(wú)創(chuàng)作思路的人群提供素材模板與思想。
(5)生成提供廣告語(yǔ)、主持人臺(tái)詞、劇本內(nèi)容、藏頭詩(shī)、結(jié)婚請(qǐng)柬等。
(二)從本項(xiàng)目的開(kāi)發(fā)角度
對(duì)素材的收集的過(guò)程也是一種學(xué)習(xí),這一過(guò)程能對(duì)統(tǒng)計(jì)的結(jié)果過(guò)行簡(jiǎn)單的分析,對(duì)機(jī)器學(xué)習(xí)的過(guò)程理解的更加深刻,發(fā)展初步的應(yīng)用意識(shí)。對(duì)大學(xué)的本科學(xué)生進(jìn)行專業(yè)技能的綜合訓(xùn)練和實(shí)踐,在已經(jīng)學(xué)習(xí)過(guò)的各種專業(yè)課程,如:計(jì)算機(jī)科學(xué)與技術(shù)、程序設(shè)計(jì)語(yǔ)言、數(shù)據(jù)庫(kù)原理、等專業(yè)課程的基礎(chǔ)之上,進(jìn)行多門(mén)專業(yè)課程的綜合訓(xùn)練和實(shí)踐活動(dòng),讓學(xué)生在感興趣的情境中,產(chǎn)生統(tǒng)計(jì)的需求,探究收集數(shù)據(jù)的方法,感知數(shù)學(xué)和生活的聯(lián)系,對(duì)深度學(xué)習(xí)產(chǎn)生認(rèn)知。
三、問(wèn)題分析
(1)在眾多文章中能夠篩選出所需文章類型對(duì)應(yīng)的素材的問(wèn)題。
(2)用大數(shù)據(jù)在眾多文章中的選擇問(wèn)題。
(3)計(jì)算機(jī)如何對(duì)提供的關(guān)鍵字和文體對(duì)應(yīng)下的文章迅速整理生成問(wèn)題。
(4)對(duì)文本生成技術(shù)和數(shù)學(xué)方面知識(shí)方面的學(xué)習(xí),初步設(shè)計(jì)和模型的建立還需要進(jìn)一步學(xué)習(xí)和了解。
(5)研究用神經(jīng)網(wǎng)絡(luò)來(lái)表達(dá)單詞的意義和深度學(xué)習(xí)應(yīng)用于自然語(yǔ)言處理的辦法.
四、項(xiàng)目研究?jī)?nèi)容
(一)深度學(xué)習(xí)
機(jī)器學(xué)習(xí)包括深度學(xué)習(xí),但是深度學(xué)習(xí)能產(chǎn)生更好的效果,可以讓計(jì)算機(jī)通過(guò)學(xué)習(xí)變得越來(lái)越智能。計(jì)算機(jī)是如何進(jìn)行學(xué)習(xí)的,是我們重點(diǎn)研究的內(nèi)容。歸根結(jié)底,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)都是以數(shù)學(xué)建模為工具,運(yùn)用深度學(xué)習(xí)的算法分析數(shù)學(xué)模型,對(duì)大量數(shù)據(jù)進(jìn)行分析,計(jì)算機(jī)從中找出規(guī)律,再把規(guī)律運(yùn)用到下一次“測(cè)試”中。
深度學(xué)習(xí),從字面意義上來(lái)看,就是計(jì)算機(jī)的自我學(xué)習(xí),和人類學(xué)習(xí)語(yǔ)言有一定的相似之處。首先,先理解一下人類學(xué)習(xí)語(yǔ)言的過(guò)程。人類在剛開(kāi)始進(jìn)行語(yǔ)言學(xué)習(xí)時(shí),接觸的都是一些較為簡(jiǎn)單的字詞句,不斷學(xué)習(xí)簡(jiǎn)單的字詞,與字詞多次見(jiàn)面后就記住了,再通過(guò)簡(jiǎn)單的字詞總結(jié)出記憶方法,在簡(jiǎn)單字詞的基礎(chǔ)之上進(jìn)行復(fù)雜字詞的理解與記憶。而深度學(xué)習(xí)的進(jìn)程,與人類剛開(kāi)始接觸一門(mén)語(yǔ)言的過(guò)程有異曲同工之處,計(jì)算機(jī)要學(xué)習(xí)的是龐大的數(shù)據(jù),通過(guò)不斷分析和調(diào)試參數(shù)最終得出無(wú)窮逼近結(jié)果的模型。
(二)大數(shù)據(jù)
深度學(xué)習(xí)需要以大數(shù)據(jù)為支撐,在如今科技飛速變革的時(shí)代,更需要深度學(xué)習(xí)和大數(shù)據(jù)的緊密結(jié)合。大數(shù)據(jù),顧名思義,就是龐大的數(shù)據(jù)?,F(xiàn)如今我們提到的大數(shù)據(jù),是信息交換、存儲(chǔ)、處理的過(guò)程中產(chǎn)生的數(shù)據(jù)。數(shù)據(jù)來(lái)源于生活,瀏覽器的搜索引擎、社交網(wǎng)站、購(gòu)物網(wǎng)站等都會(huì)產(chǎn)生眾多數(shù)據(jù)。
五、解決方案
(1)利用互聯(lián)網(wǎng)廣泛收集文章的句式、文體與語(yǔ)法。
(2)通過(guò)大數(shù)據(jù)分析將大量高質(zhì)量的文章收集并篩選其精良的部分,利用大數(shù)據(jù)將各類型素材集中。
(3)鉆研計(jì)算機(jī)模仿人類的語(yǔ)言學(xué)習(xí)行為的運(yùn)轉(zhuǎn),令機(jī)器學(xué)習(xí)整理生成創(chuàng)作出消費(fèi)者所需類型的文章。
六、結(jié)語(yǔ)
時(shí)代飛速發(fā)展,人們的壓力不斷增大,通過(guò)計(jì)算機(jī)的機(jī)器學(xué)習(xí)自動(dòng)生成文章便利了人們的生活。解放固有思想模式,建立多元文化,提高文章的新穎性,激發(fā)孩子的想象力與語(yǔ)言表述能力,緩解新聞媒體編輯者壓力,豐富新聞播出內(nèi)容,開(kāi)拓新的文學(xué)領(lǐng)域,減小創(chuàng)作者壓力并提供共鳴與靈感,降低廣告商的支出。運(yùn)用深度學(xué)習(xí)技術(shù)自動(dòng)生成文章有良好的發(fā)展前景。
參考文獻(xiàn):
[1][美] 伊恩·古德費(fèi)洛 / [加]約書(shū)亞·本吉奧 / [加] 亞倫·庫(kù)維爾.深度學(xué)習(xí).人民郵電出版社.
[2]Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein.算法導(dǎo)論.機(jī)械工業(yè)出版社.
[3]吳軍.數(shù)學(xué)之美.人民郵電出版社.
基金項(xiàng)目:吉林建筑大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目,項(xiàng)目編號(hào):201910191115 。