亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集成機(jī)器學(xué)習(xí)的數(shù)據(jù)資產(chǎn)定價(jià)模型及系統(tǒng)設(shè)計(jì)

        2022-09-23 09:25:46任建宇
        中國(guó)管理信息化 2022年14期
        關(guān)鍵詞:價(jià)值特征模型

        任建宇

        (重慶交通大學(xué) 經(jīng)濟(jì)與管理學(xué)院,重慶 400000)

        0 引言

        當(dāng)今社會(huì)背景下,經(jīng)濟(jì)蓬勃發(fā)展,數(shù)據(jù)體量不斷增長(zhǎng)。我國(guó)政府始終密切關(guān)注數(shù)據(jù)發(fā)展,高度重視數(shù)據(jù)資產(chǎn)挖掘帶來的價(jià)值,并出臺(tái)多項(xiàng)專門政策支持?jǐn)?shù)據(jù)資產(chǎn)應(yīng)用于各大領(lǐng)域,由此,數(shù)據(jù)挖掘與應(yīng)用領(lǐng)域迎來了悄無聲息卻影響深遠(yuǎn)的革新。表1 是近年來我國(guó)出臺(tái)的關(guān)于數(shù)據(jù)發(fā)展的部分政策,筆者發(fā)現(xiàn)了相關(guān)政策對(duì)數(shù)據(jù)資產(chǎn)定價(jià)的有效指引,認(rèn)識(shí)到有效發(fā)掘數(shù)據(jù)資產(chǎn)價(jià)值、快速實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)交易已逐漸成為市場(chǎng)創(chuàng)造價(jià)值和促進(jìn)決策的熱點(diǎn)。

        表1 關(guān)于數(shù)據(jù)發(fā)展的部分政策文件統(tǒng)計(jì)

        數(shù)據(jù)資產(chǎn)交易雖逐漸成為熱點(diǎn),但目前市場(chǎng)數(shù)據(jù)資產(chǎn)的有效挖掘仍存在諸多難點(diǎn)和限制。數(shù)據(jù)資產(chǎn)是一種全新的無形資產(chǎn),也因此具備無形資產(chǎn)的屬性特點(diǎn),即無實(shí)體形態(tài),具有不確定性、時(shí)效性、非競(jìng)爭(zhēng)性等。同時(shí),數(shù)據(jù)的價(jià)值會(huì)受到數(shù)據(jù)容量、用途、規(guī)模等因素直接或間接的影響。筆者針對(duì)以上情況,在對(duì)大數(shù)據(jù)資產(chǎn)的應(yīng)用場(chǎng)景及價(jià)值影響因素進(jìn)行界定的基礎(chǔ)上,應(yīng)用集成機(jī)器學(xué)習(xí)的算法來評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值,從而對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行更準(zhǔn)確的價(jià)值評(píng)估。

        1 文獻(xiàn)綜述

        目前,不少學(xué)者通過改進(jìn)傳統(tǒng)研究方法建立定價(jià)模型,進(jìn)行價(jià)值評(píng)估。其中,成本法、市場(chǎng)法和收益法是傳統(tǒng)資產(chǎn)評(píng)估方法的代表。成本法作為反映企業(yè)經(jīng)營(yíng)情況最基本的方法,在市場(chǎng)不活躍的情況下更為適用,相較于收益法和市場(chǎng)法具有較大優(yōu)勢(shì)。市場(chǎng)法是指對(duì)市場(chǎng)上相同或相似資產(chǎn)的近期交易價(jià)格通過直接或者間接對(duì)比,分析其中的差異,估算數(shù)據(jù)資產(chǎn)的價(jià)值。劉琦等人提出了運(yùn)用“市場(chǎng)法”評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值的基本思路,在對(duì)技術(shù)水平、價(jià)值密度、數(shù)據(jù)容量等差異因素進(jìn)行量化調(diào)整的基礎(chǔ)上,評(píng)估同一類型的大數(shù)據(jù)資產(chǎn)的價(jià)值。收益法是評(píng)估大數(shù)據(jù)資產(chǎn)價(jià)值的首要方法。收益法在國(guó)際企業(yè)價(jià)值評(píng)估中的地位愈發(fā)突出,其使用前提是已知數(shù)據(jù)預(yù)期收益、折現(xiàn)率和效益期限。陳媛將收益法運(yùn)用于房地產(chǎn)估價(jià)中,從多個(gè)維度進(jìn)行深度思考。黃樂等人借鑒同樣作為無形資產(chǎn)的品牌價(jià)值評(píng)估的主流辦法,將收益法、成本法和市場(chǎng)法結(jié)合已有的數(shù)據(jù)資產(chǎn)評(píng)估模型,創(chuàng)造性地將平臺(tái)活躍系數(shù)等參數(shù)引入平臺(tái)式數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型。左文進(jìn)和劉麗君則在傳統(tǒng)數(shù)據(jù)資產(chǎn)評(píng)估方法的基礎(chǔ)上引入Shapley 值法和破產(chǎn)分配法,從而構(gòu)建大數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型。

        由此可見,數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估仍處于發(fā)展探索階段,學(xué)術(shù)界對(duì)于數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估缺乏統(tǒng)一的評(píng)判標(biāo)準(zhǔn)。另外,傳統(tǒng)算法前期需要繁復(fù)的特征工程,效率低下,模型精確度很大程度上會(huì)受到特征工程的干擾。因此,構(gòu)建相對(duì)完善的評(píng)估系統(tǒng)、選擇客觀正確的衡量標(biāo)準(zhǔn)對(duì)于健全當(dāng)前數(shù)據(jù)資產(chǎn)評(píng)估體系具有積極意義。

        2 數(shù)據(jù)資產(chǎn)定價(jià)模型的建立

        數(shù)據(jù)資產(chǎn)評(píng)估特征多、特征復(fù)雜且冗余度高,使得如何尋找評(píng)估分類器的最優(yōu)評(píng)估特征集成為難點(diǎn)。鑒于此,筆者通過建立一個(gè)模型,有效處理樣本缺失值,降低特征工程的難度,提高精度。

        在建立本數(shù)據(jù)資產(chǎn)定價(jià)模型時(shí),筆者使用了多種模型和算法幫助系統(tǒng)功能的實(shí)現(xiàn),包括引入詞向量的概念,將文本數(shù)據(jù)轉(zhuǎn)化為可供機(jī)器識(shí)別的數(shù)字?jǐn)?shù)據(jù),即對(duì)原始數(shù)據(jù)進(jìn)行數(shù)字化預(yù)處理。另外,筆者利用爬蟲抓取網(wǎng)絡(luò)數(shù)據(jù)后生成原始數(shù)據(jù)表,該數(shù)據(jù)表將表格作為載體,在對(duì)數(shù)據(jù)表進(jìn)行詞向量化后生成詞向量矩陣,將表中的文本數(shù)據(jù)轉(zhuǎn)化為能被機(jī)器識(shí)別且與文本相對(duì)應(yīng)的數(shù)字?jǐn)?shù)據(jù)。除此之外,將以下模型和算法運(yùn)用于整個(gè)系統(tǒng)的建立與運(yùn)行過程中,這是本定價(jià)模型和系統(tǒng)的核心。①CBOW 模型(Continuous Bag-Of-Words Model)主要用于實(shí)現(xiàn)系統(tǒng)中詞預(yù)測(cè)的功能,設(shè)定某個(gè)中心詞的前后選取范圍,通過范圍內(nèi)連續(xù)詞來計(jì)算該中心詞出現(xiàn)的概率。②長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory LSTM)相較于無法處理長(zhǎng)距離依賴問題的循環(huán)神經(jīng)網(wǎng)絡(luò),其細(xì)胞的結(jié)構(gòu)和運(yùn)算存在變化。其細(xì)胞狀態(tài)能夠傳遞序列處理過程中的信息,在訓(xùn)練過程中通過“門”結(jié)構(gòu)不斷學(xué)習(xí)保存或遺忘來實(shí)現(xiàn)添加和移除信息。③XGBoost 算法運(yùn)用于預(yù)測(cè)結(jié)果的全過程,首先采用CART 回歸樹對(duì)數(shù)據(jù)進(jìn)行擬合,每個(gè)樣本可得到相應(yīng)預(yù)測(cè)分?jǐn)?shù),將所有分?jǐn)?shù)相加,可得到該樣本在此模型下的分?jǐn)?shù)。

        從數(shù)據(jù)形態(tài)的角度來看,本系統(tǒng)基于以上算法和模型將原始數(shù)據(jù)進(jìn)行數(shù)次分析轉(zhuǎn)化,得出評(píng)估數(shù)據(jù)價(jià)值的結(jié)果。原始數(shù)據(jù)利用爬蟲獲取的文本數(shù)據(jù)在CBOW 模型的作用下轉(zhuǎn)化為可供機(jī)器識(shí)別的數(shù)據(jù),并建立數(shù)據(jù)矩陣生成三維詞向量,在LSTM 神經(jīng)網(wǎng)絡(luò)的作用下使詞向量二維化,最后利用XGBoost 算法進(jìn)行回歸分析,預(yù)測(cè)數(shù)據(jù)的價(jià)值。

        3 系統(tǒng)設(shè)計(jì)及運(yùn)行流程

        3.1 系統(tǒng)功能實(shí)現(xiàn)

        在建立數(shù)據(jù)資產(chǎn)評(píng)估模型的基礎(chǔ)上,數(shù)據(jù)資產(chǎn)評(píng)估系統(tǒng)可以做到以下幾點(diǎn)。首先,界定數(shù)據(jù)資產(chǎn)的使用場(chǎng)景。數(shù)據(jù)具有多維使用的特性,不同應(yīng)用場(chǎng)景下的數(shù)據(jù)資產(chǎn)價(jià)值不盡相同,因此在定價(jià)前要分析數(shù)據(jù)資產(chǎn)標(biāo)題的文本相似度,根據(jù)應(yīng)用場(chǎng)景將其劃分為不同類別。其次,推進(jìn)數(shù)據(jù)資產(chǎn)定價(jià)合理化。根據(jù)現(xiàn)有數(shù)據(jù)資產(chǎn)交易平臺(tái)上的交易相關(guān)信息構(gòu)建恰當(dāng)?shù)闹笜?biāo)體系,形成系統(tǒng)框架;根據(jù)可比交易的歷史數(shù)據(jù)構(gòu)建基于市場(chǎng)法的數(shù)據(jù)資產(chǎn)估值定價(jià)模型,為數(shù)據(jù)資產(chǎn)交易定價(jià)的公平合理提供更多、更易于被廣泛接受的實(shí)踐依據(jù),同時(shí)支持實(shí)時(shí)數(shù)據(jù)估值計(jì)算。在對(duì)數(shù)據(jù)資產(chǎn)特征進(jìn)行研究的基礎(chǔ)上,使用機(jī)器學(xué)習(xí)相關(guān)算法,建立數(shù)據(jù)資產(chǎn)實(shí)時(shí)估值系統(tǒng),通過模型參數(shù)的調(diào)優(yōu)提高估值效率。數(shù)據(jù)估值系統(tǒng)的組成部分主要包括數(shù)據(jù)采集器、數(shù)據(jù)處理器、交互模塊和數(shù)據(jù)估值模型。

        3.2 系統(tǒng)模塊設(shè)計(jì)

        3.2.1 數(shù)據(jù)輸入接口模塊

        數(shù)據(jù)輸入接口模塊能夠反映數(shù)據(jù)資產(chǎn)交易信息特征類型多的特點(diǎn)。該模塊分為兩個(gè)子模塊:一是數(shù)據(jù)輸入模塊。此模塊測(cè)試數(shù)據(jù)包括數(shù)據(jù)大小、數(shù)據(jù)類型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時(shí)間等自變量數(shù)據(jù)。二是數(shù)據(jù)分類模塊。此模塊按照產(chǎn)業(yè)經(jīng)濟(jì)、金融征信、輿情監(jiān)測(cè)、科研技術(shù)等應(yīng)用場(chǎng)景,利用文本相似度將數(shù)據(jù)輸入模塊中,劃分為不同的可比案例集。

        3.2.2 數(shù)據(jù)采集模塊

        數(shù)據(jù)資產(chǎn)具備量大、高維、數(shù)據(jù)類型多樣等特點(diǎn),本系統(tǒng)有針對(duì)性地組建數(shù)據(jù)采集模塊,借助Python對(duì)數(shù)據(jù)資產(chǎn)交易平臺(tái)作最大限度的信息獲取,信息類型包括塊數(shù)據(jù)和數(shù)據(jù)資產(chǎn)標(biāo)題、數(shù)據(jù)大小、數(shù)據(jù)條數(shù)、交易價(jià)格等。

        3.2.3 異常數(shù)據(jù)預(yù)處理模塊

        針對(duì)歷史交易數(shù)據(jù)存在數(shù)據(jù)類型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)存在缺失等問題,本系統(tǒng)組建異常數(shù)據(jù)預(yù)處理模塊,以提高數(shù)據(jù)質(zhì)量。在實(shí)現(xiàn)數(shù)據(jù)采集和存儲(chǔ)后,將若干條數(shù)據(jù)資產(chǎn)歷史交易信息數(shù)據(jù)輸入該模塊,進(jìn)行一致性檢驗(yàn)、缺失數(shù)據(jù)處理和回歸分析等預(yù)處理操作。

        3.2.4 特征工程構(gòu)建模塊

        在特征工程構(gòu)建模塊輸入若干條數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),輸出對(duì)應(yīng)模型的特征數(shù)據(jù),具體實(shí)現(xiàn)以下3 方面功能。①文本情感分析。將數(shù)據(jù)資產(chǎn)標(biāo)題的文本轉(zhuǎn)化為詞向量,再利用詞向量平均模型將其轉(zhuǎn)化為句向量,通過卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)特征降維。②One-Hot編碼。對(duì)于商品類別和數(shù)據(jù)類型這兩類分類特征,將離散特征的取值擴(kuò)展到歐式空間,優(yōu)化特征之間的距離計(jì)算,使其更具合理性。③對(duì)于數(shù)據(jù)大小、采集時(shí)間、字段數(shù)量、字段條數(shù)等變量采用歸一化和標(biāo)準(zhǔn)化處理方式,消除量綱級(jí)影響。

        3.2.5 估值定價(jià)模塊

        在估值定價(jià)模塊輸入特征工程提取的特征信息,輸出待估數(shù)據(jù)資產(chǎn)的參考定價(jià),具體實(shí)現(xiàn)以下兩方面功能。一是輸入可比實(shí)例與數(shù)據(jù)資產(chǎn)特征數(shù)據(jù),通過編碼完成匹配后形成特征價(jià)格矩陣,作為可比基礎(chǔ)。二是根據(jù)輸入可比實(shí)例的特征數(shù)據(jù),利用XGBoost 等多種機(jī)器學(xué)習(xí)算法訓(xùn)練數(shù)據(jù),輸入得到的可比案例至模型中,準(zhǔn)確計(jì)算待估數(shù)據(jù)資產(chǎn)的市場(chǎng)價(jià)值并輸出參考價(jià)格。

        3.3 系統(tǒng)運(yùn)行流程

        系統(tǒng)運(yùn)行流程如圖1 所示。首先利用Python 爬蟲技術(shù)在數(shù)據(jù)資產(chǎn)交易平臺(tái)上收集數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),在數(shù)據(jù)輸入模塊輸入數(shù)據(jù),其中包括數(shù)據(jù)大小、類型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時(shí)間等;隨后進(jìn)行數(shù)據(jù)處理,針對(duì)數(shù)據(jù)類型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)缺失等問題對(duì)數(shù)據(jù)進(jìn)行一致性檢驗(yàn)、缺失數(shù)據(jù)處理和回歸分析等預(yù)處理操作;將經(jīng)過預(yù)處理的數(shù)據(jù)輸入對(duì)應(yīng)模型的特征數(shù)據(jù),對(duì)數(shù)據(jù)資產(chǎn)標(biāo)題進(jìn)行文本情感分析、One-Hot 編碼與數(shù)據(jù)的歸一化和標(biāo)準(zhǔn)化處理;最后輸入可比實(shí)例的特征數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)等多種機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,將得到的可比案例輸入模型,準(zhǔn)確計(jì)算待估數(shù)據(jù)資產(chǎn)的市場(chǎng)價(jià)值,并輸出參考價(jià)格。

        圖1 系統(tǒng)運(yùn)行流程

        4 系統(tǒng)運(yùn)行效果與展望

        本系統(tǒng)已開發(fā)成功,可進(jìn)行多個(gè)對(duì)象的預(yù)測(cè),應(yīng)用人工智能對(duì)數(shù)據(jù)資產(chǎn)特征進(jìn)行系統(tǒng)分析、提取與量化。在完善評(píng)估系統(tǒng)后,評(píng)估系統(tǒng)部署于阿里云服務(wù)器,便于外部基本用戶使用。本系統(tǒng)基于集成人工智能算法,有效解決了數(shù)據(jù)資產(chǎn)交易歷史數(shù)據(jù)特征多、特征復(fù)雜、冗余度高的問題,相對(duì)于一般的機(jī)器學(xué)習(xí)算法具有更好的泛化能力和模型精度。系統(tǒng)可操作性強(qiáng),可服務(wù)于數(shù)據(jù)資產(chǎn)估價(jià)機(jī)構(gòu)及各大數(shù)據(jù)交易網(wǎng)站,具有強(qiáng)推廣性和自主成長(zhǎng)能力。

        本系統(tǒng)將順應(yīng)時(shí)代發(fā)展不斷更新。筆者認(rèn)為,此定價(jià)模型及系統(tǒng)能適用更優(yōu)化的模型和算法,從系統(tǒng)的預(yù)測(cè)精度和速度兩個(gè)維度進(jìn)行提升,利用體量更大、質(zhì)量更好的數(shù)據(jù)不斷訓(xùn)練優(yōu)化模型,并持續(xù)更新數(shù)據(jù),以滿足系統(tǒng)的時(shí)效性要求。

        猜你喜歡
        價(jià)值特征模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        一粒米的價(jià)值
        “給”的價(jià)值
        3D打印中的模型分割與打包
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        国产日产一区二区三区四区五区| 久久久综合九色合综国产| 国产杨幂AV在线播放| 国产精品国产传播国产三级| 东北少妇不戴套对白第一次| 国产欧美日韩久久久久| 2022国内精品免费福利视频| av在线资源一区二区| 国产精品美女久久久免费| 熟妇人妻无乱码中文字幕| 99久久99久久久精品久久| av免费网站不卡观看| 欧美又大粗又爽又黄大片视频| 青青青爽在线视频免费播放| 亚洲三区在线观看内射后入| 免费a级毛片出奶水| 456亚洲人成在线播放网站| 亚洲中文字幕一区av| 欧美老肥妇做爰bbww| 久久久久国产精品免费免费搜索| 亚洲AV手机专区久久精品| 免费国产一区二区视频| 成人欧美日韩一区二区三区| 一本色道久久99一综合| 成在线人免费视频播放| 爆操丝袜美女在线观看| 肥臀熟女一区二区三区| 纯肉无遮挡H肉动漫在线观看国产 国产精品自产拍在线观看免费 | 精品极品视频在线观看| 97久久精品人妻人人搡人人玩| 欧美日本日韩aⅴ在线视频| 国产目拍亚洲精品区一区| av影院手机在线观看| 国产揄拍国产精品| 久久亚洲高清观看| 亚洲中文字幕一区av| 国产偷久久久精品专区| 91视频88av| 国产精品久久一区二区蜜桃| 精品卡一卡二卡3卡高清乱码| 欧美黑人疯狂性受xxxxx喷水|