喬 鐵
(鄭州大學(xué),河南 鄭州450000)
現(xiàn)在手機(jī)上出現(xiàn)了很多用來(lái)給相貌評(píng)分的軟件,這些趣味軟件制作初衷大多是為了博君一笑,不講究評(píng)分的準(zhǔn)確性和可重復(fù)性。 但是這也予人啟發(fā):如果婚戀網(wǎng)站的軟件能更客觀的給每個(gè)會(huì)員一個(gè)準(zhǔn)確評(píng)分的話,網(wǎng)站就能更好幫助用戶,從數(shù)百萬(wàn)人的資料中尋找到最符合要求的目標(biāo)。 本文就探討一下進(jìn)行評(píng)價(jià)需要采集哪些信息,以及如何用綜合評(píng)價(jià)的方法由個(gè)人信息得出更合理的評(píng)分。
介紹對(duì)象的時(shí)候通常需要詢問(wèn)擇偶者,獲得其對(duì)身高年齡等方面的要求。所以網(wǎng)站對(duì)會(huì)員評(píng)價(jià)前也要先采集身高,體重,年齡,相貌,財(cái)產(chǎn)等信息項(xiàng),然后根據(jù)這些信息得到數(shù)字型的指標(biāo)。 這些信息有些本來(lái)就是數(shù)字,例如身高年齡,可以把這些值直接作為指標(biāo)值;有些則比較主觀,例如相貌,這就需要先取得清晰的照片,之后依據(jù)下文的方法從中獲得指標(biāo)值。指標(biāo)中有些是極大型的,例如收入,指標(biāo)值是越大越好;有些是居中型的,例如體重,適中最好。 我們要把這些不同類型的指標(biāo)統(tǒng)一轉(zhuǎn)換成取值范圍相同的極大型評(píng)分。 下面就具體地分項(xiàng)討論。
常人覺(jué)的身高是越高越好, 但實(shí)際上配偶雙方的身高差太大,不但生活中有很多不便,而且擇偶者(評(píng)價(jià)結(jié)果使用者)也會(huì)感到不妥。因此目標(biāo)的最佳身高可以由擇偶者的身高加上(女性擇偶者)或減去(男性擇偶者)社會(huì)平均男女身高差確定,在此基礎(chǔ)上依據(jù)擇偶者偏好修正。 可見(jiàn)此項(xiàng)指標(biāo)是一項(xiàng)居中性指標(biāo),最接近最佳身高的指標(biāo)應(yīng)取得最高分,偏離到一定程度取得最低分。用公式表示的話,目標(biāo)身高指標(biāo)記為H,根據(jù)擇偶者身高和偏好確定的最佳身高為H0,當(dāng)事人能接受的偏差值為ΔH,最高分為100 分,最低分為0 分,那么可以使用以下公式:根據(jù)身高指標(biāo)獲得評(píng)分。另外,年齡的性質(zhì)和身高類似,評(píng)分也可用同樣的方法得到。
體重是否合適與身高有關(guān),目前國(guó)際上常用的衡量人體胖瘦程度以及是否健康的一個(gè)標(biāo)準(zhǔn)BMI 指數(shù)即身體質(zhì)量指數(shù), 是用體重公斤數(shù)除以身高米數(shù)平方得出的數(shù)字。 bmi 低于18.5 是過(guò)輕,18.5-24.99是偏瘦,20-25 是適中,25-28 是過(guò)重,超過(guò)28 為肥胖。 因此由身高和BMI 適中范圍[20,25]能得到一個(gè)最佳的體重區(qū)間[G1,G2],在這個(gè)區(qū)間的體重都取得最高分100,超出這個(gè)區(qū)間遞減;根據(jù)身高和BMI 指數(shù)18 和25 的界限可以得到體重可接受下限L1和上限L2,在界限處取得最低分0 分。 取得的體重指標(biāo)記為G, 那么,體重的評(píng)分可以由以下公式給出:
雖然有人對(duì)財(cái)產(chǎn)是否越多越好有異議,這里還是根據(jù)一般人的看法,讓更多的財(cái)產(chǎn)獲得更高的評(píng)分。 不過(guò)財(cái)產(chǎn)也有邊際效應(yīng),從0 到100 萬(wàn)和從100 到200 萬(wàn)意義完全不一樣。 所以評(píng)分和財(cái)產(chǎn)值不視為線性關(guān)系。 由財(cái)產(chǎn)數(shù)目獲得評(píng)分,如果要簡(jiǎn)單處理的話可以用一些初期定義域?yàn)? 到無(wú)窮大,值域?yàn)? 到100,既是單調(diào)增加且凸的函數(shù)來(lái)給出評(píng)分,例如:(其中W 為財(cái)產(chǎn)數(shù)目。ω 為系數(shù),根據(jù)物價(jià)水平等因素確定)。
如果想要更有理論根據(jù)的話可以先對(duì)擇偶者做一個(gè)調(diào)查,獲得可接受最低財(cái)產(chǎn)數(shù),較滿意財(cái)產(chǎn)數(shù),滿意財(cái)產(chǎn)數(shù),這些數(shù)目對(duì)應(yīng)評(píng)分0分,60 分,80 分。這樣把財(cái)產(chǎn)作為自變量,評(píng)分作為變量用程序進(jìn)行擬合,得到擬合函數(shù)。 然后就可以用得到的函數(shù)對(duì)評(píng)價(jià)對(duì)象的財(cái)產(chǎn)指標(biāo)進(jìn)行評(píng)分。
一般人把相貌看作是主觀的事物,其實(shí)古人已經(jīng)給出了一些客觀的評(píng)價(jià)標(biāo)準(zhǔn),例如“三庭五眼”。五眼指的是臉的寬度比例,以眼形長(zhǎng)度為單位,把臉的寬度分成五個(gè)等分,從左側(cè)發(fā)際至右側(cè)發(fā)際,為五只眼形。 兩只眼睛之間有一只眼睛的間距,兩眼外側(cè)至側(cè)發(fā)際各為一只眼睛的間距,各占比例的1/5。 三庭指臉的長(zhǎng)度比例,把臉的長(zhǎng)度分為三個(gè)等分,從前額發(fā)際線至眉骨,從眉骨至鼻底,從鼻底至下頦,各占臉長(zhǎng)的1/3。 當(dāng)然這是古人的看法,未必準(zhǔn)確,但是也說(shuō)明了相貌與器官比例有關(guān)。 現(xiàn)代人可以用統(tǒng)計(jì)學(xué)獲得最佳比例,例如,有人總結(jié),理想的臉型產(chǎn)生距離。眼睛的寬度,應(yīng)為同一水平臉部寬度的3/10;下巴長(zhǎng)度應(yīng)為臉長(zhǎng)的1/5;眼球中心到眉毛底部的距離,應(yīng)為臉長(zhǎng)的1/10;眼球應(yīng)為臉長(zhǎng)的1/14;鼻子的表面積,要小于臉部總面積的5/100;理想嘴巴寬度應(yīng)為同一水平臉部寬度的1/2。[2]那么就可以根據(jù)評(píng)分對(duì)象的標(biāo)準(zhǔn)照片來(lái)識(shí)別出各項(xiàng)比例,根據(jù)最佳比例用評(píng)價(jià)身高的方法對(duì)每一項(xiàng)進(jìn)行評(píng)分,再用下文所述方法得到相貌綜合分。相貌還取決于膚色,其影響更大的是膚色的均勻程度,膚色越均勻越好。對(duì)于這一項(xiàng),可以從照片的皮膚部分選取采樣點(diǎn),從采樣點(diǎn)獲取亮度值,然后計(jì)算這些值的方差,方差越小說(shuō)明膚色越均勻。
如果除了以上信息之外還能獲得第三方對(duì)評(píng)價(jià)對(duì)象的感受的話,也可以根據(jù)這些主觀感受進(jìn)行評(píng)分。 例如把感受分為很好, 較好,一般,較差,很差五個(gè)選項(xiàng),用做選擇題的方式讓網(wǎng)站會(huì)員對(duì)瀏覽過(guò)的異性會(huì)員信息進(jìn)行評(píng)價(jià),我們可以把這些選擇量化為100,80,60,40,20這樣的數(shù)值評(píng)分,然后把所有網(wǎng)友評(píng)分的算術(shù)平均值作為主觀方面的評(píng)分。
依照以上方法得到了身高、體重等分項(xiàng)評(píng)分S1、S2,…,Sn,然后要根據(jù)這些分?jǐn)?shù)獲得最后的綜合分。 因?yàn)楦黜?xiàng)的重要程度不同,所以要給各項(xiàng)以不同的權(quán)值ωi,讓更重要的項(xiàng)對(duì)最終評(píng)分有更大影響。 權(quán)值要滿足因?yàn)檫@樣才能使綜合評(píng)分有和分項(xiàng)分有一樣的取值范圍。這里指標(biāo)的重要性是比較主觀的東西,所以要采用主觀賦權(quán)法。例如可以采用10 分制打分, 評(píng)價(jià)人按照自己的價(jià)值觀對(duì)每項(xiàng)信息的重要性給出評(píng)分Ki,則權(quán)值有了各項(xiàng)評(píng)價(jià)分和各項(xiàng)的權(quán)值, 那么我們就可以根據(jù)某種評(píng)價(jià)模型獲得綜合評(píng)分,例如可以用線性加權(quán)綜合模型,這時(shí)第j 個(gè)評(píng)價(jià)對(duì)象的綜合分也可以使用非線性加權(quán)模型,這時(shí)第j 個(gè)評(píng)價(jià)對(duì)象的綜合分還可以用逼近理想解法(TOPSIS),這些方法各有優(yōu)劣。 如何選擇,讀者可以參考相關(guān)的資料。 這樣,用綜合評(píng)價(jià)模型依據(jù)每個(gè)評(píng)價(jià)對(duì)象的信息給出綜合分,對(duì)評(píng)分進(jìn)行排序之后就可把分值高的目標(biāo)推薦給擇偶人。
本文的方法適用于婚戀網(wǎng)站,這些網(wǎng)站可以在用戶注冊(cè)的時(shí)候要求提供各項(xiàng)個(gè)人信息和自己的傾向要求,然后依據(jù)用戶(評(píng)價(jià)人)的傾向用綜合的方法對(duì)網(wǎng)站的數(shù)據(jù)庫(kù)里巨量的異性資料進(jìn)行評(píng)分,這樣就可以把分值高的推薦給用戶。 如果要對(duì)模型改進(jìn)的話,可以用數(shù)據(jù)挖掘工具對(duì)成功配對(duì)的會(huì)員進(jìn)行分析, 然后根據(jù)獲得的關(guān)聯(lián)改進(jìn)模型。此外,招聘網(wǎng)站亦可從本文得到借鑒。
[1]韓中庚.數(shù)學(xué)建模實(shí)用教程[M].北京:高等教育出版社,2012.