亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        技術(shù)宅算到真愛

        2014-04-29 23:07:38茫茫
        大學(xué)生 2014年8期
        關(guān)鍵詞:個人資料頁面用戶

        茫茫

        身為標準的技術(shù)宅,克里斯也有和《生活大爆炸》里的4位主角一樣不堪回首的交友經(jīng)歷:

        在號稱可以用算法找到最佳匹配約會對象的OkCupid網(wǎng)站上,他向數(shù)十位女性發(fā)送了“求交往”私信,

        但只有6個人答應(yīng)與他見面,而見面結(jié)果也不過了了??死锼拐J為:這不科學(xué)!

        其實克里斯曾經(jīng)闖入過著名的“麻省理工21點小組”的大門,在賭桌上揮霍數(shù)學(xué)天賦,

        這讓他發(fā)現(xiàn)“數(shù)學(xué)系學(xué)生在很多情況下都可以用到自己的專業(yè)”。

        而現(xiàn)在,愛情讓他重出江湖。2012年6月的一個清晨,克里斯想到,算法其實可以幫助自己尋找真愛,前提是,得是一個足夠牛的算法。

        既然網(wǎng)站不能提供,于是他決定自己建構(gòu)一個。

        魚兒不上鉤,“抽”出來

        克里斯所使用的OkCupid網(wǎng)站是由哈佛大學(xué)數(shù)學(xué)專業(yè)的學(xué)生在2004年創(chuàng)建的交友網(wǎng)站。它最與眾不同的地方在于,它要求會員完成大量的多項選擇題,內(nèi)容包括政治、宗教、家庭、愛、性、智能手機等等方面,根據(jù)這些問題結(jié)果,網(wǎng)站可以用算法算出最匹配的約會對象。

        所有的問題林林總總有數(shù)千道之多,但一般來說,用戶只需要挑選自己感興趣的350道問題進行回答。比如“以下哪項最有可能吸引你去看一部電影?”或者“宗教或神對你的生命有多重要?”除了選擇問題,用戶還可以選擇只看有特定回答的對象,并且可以用從1到5的打分方式來表示這道問題對自己的重要性:0代表“不重要”,5代表“必不可少”。

        在提交了所有的問題答案和要求后,OkCupid的引擎就開始忙碌工作,整理數(shù)據(jù)來計算兩人的匹配度。分值越高代表越匹配,如果出現(xiàn)了100%,就表示這是每個人夢寐以求的“靈魂伴侶”??上У氖牵死锼古c洛杉磯女性的匹配度著實令人失望,問題在于OkCupid的算法。OkCupid所采用的問題,僅限于雙方用戶都回答了的問題。不巧的是,克里斯總是劍走偏鋒,總喜歡選擇冷門問題,這就直接導(dǎo)致了與他匹配的女性基數(shù)大為下降。在洛杉磯總共200萬女性中,有約8萬人在使用OkCupid網(wǎng)站,但克里斯的交友列表上,僅有不到100位用戶和他有值得考量的90%的匹配度。

        既然魚不上鉤,于是克里斯決定有的放矢,先了解自己的理想型都選擇了哪些問題,然后再針對那些問題,修改自己的個人資料。這樣的話,所有符合他的眼光的西施們都會出現(xiàn)在匹配列表里,而不符合的東施們則會被剔除在外。但怎樣才能做到這一點呢?答案是,統(tǒng)計抽樣。

        要統(tǒng)計,最基本的就是數(shù)據(jù)。在靈感突如其來的這天凌晨,克里斯設(shè)置了12個OkCupid假賬戶,并編寫了一個Python腳本,用來搜索他的夢中情人。這些潛在用戶包括了從25歲到45歲的女性,這些用戶的個人頁面里的所有可用信息——種族、身高、星座、甚至吸煙習(xí)慣,都可以被Python腳本捕捉到,并且反饋給克里斯。

        與此同時,為了深入了解芳心,克里斯還編寫了一個bot機器人來偵測她們的問卷答案。由于OkCupid的“只有雙方都有回答才能被顯示”原則,所以bot機器人的工作是管理12個假賬戶,以這些虛擬身份隨機回答每一個問題。反正假賬戶的存在目的并不是塑造完美先生,而只是探聽對方都是怎么回答問題的,所以bot就算在每一個問題后“呵呵”也無關(guān)緊要。Bot機器人幫克里斯收集了大約1000份資料,讓他初嘗了技術(shù)在愛情上的威力。

        真愛藏在600萬條數(shù)據(jù)里

        Bot機器人工作雖然賣力,但到了1000人上頭,就被OkCupid網(wǎng)站屏蔽了。原來,OkCupid設(shè)置了一個“防套近乎”系統(tǒng),如果有短時間內(nèi)連續(xù)答題情況出現(xiàn)的話,就會被它毫不猶豫地拉黑??死锼购茔皭?,怎樣能讓機器人bot看起來不那么像機器人呢?

        克里斯找到了他的神經(jīng)學(xué)家朋友山姆?托里西。山姆也是個剩男,也在用OkCupid找女友,聽到克里斯的偉大計劃,一拍即合。他讓克里斯在自己的計算機上安裝了一個間諜軟件,讓這個軟件跟蹤記錄自己使用OkCupid的方式。于是bot模仿了山姆的點擊和打字速度,升級成了“山姆2號”,順利地把OkCupid給騙過去了。

        Bot機器人的成功臥底,讓克里斯決定馬不停蹄地從家里搬來第二臺計算機,接上數(shù)學(xué)系的寬帶,讓機器人火力全開日夜運行。3個星期后,bot機器人沖出了洛杉磯,走向了全美,從2萬女性用戶那里搜集來了約600萬條問題和答案。

        龐大的數(shù)據(jù)群讓克里斯陷入了數(shù)學(xué)狂歡。他把數(shù)學(xué)系的小小隔間當成家,像bot機器人一樣日夜開工,只有在困得不行的時候,才在辦公桌上鋪個床墊,打個小盹兒。讓克里斯不可自拔的是一個名叫K-Modes的算法,它最早出現(xiàn)在貝爾實驗室在1998年對大豆作物的病變分析報告中,特點是可以把具有相似性的數(shù)據(jù)凝結(jié)在一起??死锼拐{(diào)整了這個算法,使數(shù)據(jù)結(jié)果的粘度變得更為清晰。于是他發(fā)現(xiàn),他的刻度盤把2萬女性用戶分為了7個在統(tǒng)計學(xué)上有明顯區(qū)別的類型。

        這一發(fā)現(xiàn)讓克里斯“欣喜若狂”。為了證明自己的運算是正確的,他給機器人再次下達指令:搜集5000名在過去1個月內(nèi)登錄過OkCupid的洛杉磯和舊金山女性的問題和答案。這是一個參考樣本,同樣要被修改過的K-Modes算法進行分類。結(jié)果,第二次的樣本以分毫不差的方式被分類為同樣的7個類型。克里斯的統(tǒng)計抽樣法經(jīng)受住了實踐的考驗!

        “算”出來不等于走在一起

        在克里斯分析得到的7個類型里,并不是所有類型都讓他怦然心動。比如說有1個類型太蘿莉,另2個則太高齡,還有一個類型有著忠誠的基督教信仰,讓克里斯望而卻步。

        克里斯感興趣的是兩款類型:一款是20多歲特立獨行的年輕人,大多從事音樂和藝術(shù)相關(guān)活動;另一款則是熟女,從事創(chuàng)造性工作,比如編輯或者設(shè)計師??死锼共扇×恕棒~和熊掌兼得”的策略,針對這2種目標人群創(chuàng)建了2份不同的個人資料,一份有他攀巖的照片,另一份則是他在一次演出中彈吉他的照片。

        在這2種類型中,克里斯挑選出最常被選擇的500道問題,并提交了答案。由于不希望自己未來的愛情建立在謊言上,所以他盡量如實作答。但技術(shù)宅的好強心讓他沒有到此止步。他又找出了一種名為“自適應(yīng)提升”(adaptive boosting)的機器學(xué)習(xí)算法,在針對每個問題的重要性的評分上,計算出打幾分才是最合適的。比如在“不管未來的計劃如何,眼下更吸引你的是什么?是性還是愛情?”這一題中,雖然同樣回答“愛情”,但克里斯按照“自適應(yīng)提升”算法的建議,在針對年輕姑娘的問卷中,給該問題打分為“非常重要”,而對于熟女群,則給該問題打了5分,即“必不可少”。

        在用算法全面武裝了個人資料之后,克里斯重新檢查了一遍自己與洛杉磯女性用戶的匹配度,驚人的結(jié)果出現(xiàn)了。從前與他達到90%的匹配度的人數(shù)不超過100,現(xiàn)在光是匹配度達到99%的用戶就已經(jīng)溢出了第1頁的列表。不敢置信的克里斯不停地翻到下一頁,發(fā)現(xiàn)直到匹配度由高到低的1萬名用戶列表最后,匹配度仍然保持在90%以上。

        即使有超乎常人的高匹配度,這還只是成功了一半,克里斯深知這一點。為了在有著同樣匹配度的競爭對手中間讓自己顯得更加炫酷,克里斯專門寫了一個新程序,用來查看與他有著高匹配度的女性用戶的頁面。這樣每當程序瀏覽了對方頁面,對方就會收到來自網(wǎng)站的提醒,自然也就會注意到克里斯的存在??死锼咕帉懙某绦虿⒉皇请S機瀏覽的,而是按照年齡順序:周一瀏覽1000名41歲女性的頁面,周二瀏覽1000名40歲女性的頁面,以此類推,一直到兩個星期后,瀏覽1000名27歲女性的頁面。2個星期后,克里斯收到了約400次“被瀏覽”的消息:他成功吸引了女孩兒們的注意。

        與網(wǎng)站發(fā)送的消息一道光臨的,還有很多“求交往”私信:“我到現(xiàn)在為止還沒有遇到過算牌很厲害的人,我覺得你的個人資料很有意思。我想跟你打個招呼?!薄班?,你的個人資料確實打動了我,我想跟你打個招呼。我認為我們之間有相當多的共同點,也許不是數(shù)學(xué),但肯定有很多其他方面!”

        克里斯一直鍥而不舍地用程序和算法尋找女友,期間他經(jīng)歷拒絕與被拒絕,直到第88次約會。女主角是28歲的藝術(shù)系學(xué)生王婷,她也是克里斯用算法捕獲的潛在女友之一。她覺得克里斯用數(shù)學(xué)找女友的方式很有意思,于是約了他出來。這一次,克里斯沒有再找下一位。

        到現(xiàn)在,克里斯和王婷的戀愛關(guān)系已經(jīng)維持了一年多。在聽完克里斯關(guān)于自己用算法找真愛的故事之后,王婷說:“我覺得這有點黑暗,有點玩世不恭,但我喜歡?!辈贿^克里斯本人倒是很謙虛:“跟OkCupid上其他所有用戶做的事情相比,我只不過多用了一點算法,活動規(guī)模更大一點,還使用了一些機器學(xué)習(xí)技術(shù)?!辈贿^兩人都同意的一點是,雖然算法和程序幫助他們走到一起,但序曲結(jié)束后的一切,還得靠他們自己。就像克里斯說的那樣:“并不是說我們匹配度高,就會有良好的關(guān)系。那只是一種讓我們走到一起的方式?!痹谧罱囊淮蜸kype通話中,克里斯對著鏡頭拿出一枚鉆石戒指向王婷求婚,而她答應(yīng)了。不過至于何時結(jié)婚,可能還需要再仔細算一下。

        猜你喜歡
        個人資料頁面用戶
        大狗熊在睡覺
        刷新生活的頁面
        讀者調(diào)查表
        旅游休閑(2017年1期)2017-06-16 20:18:03
        《旅游休閑》讀者調(diào)查表
        旅游休閑(2016年4期)2017-01-19 23:56:45
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        大數(shù)據(jù)時代個人資料隱私權(quán)的法律保護
        同一Word文檔 縱橫頁面并存
        久久亚洲免费精品视频| 未满十八勿入av网免费| 中文字幕成人精品久久不卡| 国产自拍三级黄片视频| 影音先锋久久久久av综合网成人| 国产一极内射視颍一| aaa毛片视频免费观看| 久久精品这里就是精品| 国产成人亚洲一区二区| 色天使综合婷婷国产日韩av| 99re6热在线精品视频播放6| 欧洲无码一级毛片无遮挡| 国产在线精品成人一区二区三区| 中国老太婆bb无套内射| 国产suv精品一区二区69| 欧美人与动牲交片免费播放| 一区二区高清免费日本| 天天碰免费上传视频| 亚洲中文字幕第一页在线| av网站影片在线观看| 自由成熟女性性毛茸茸应用特色| 亚洲成av人片在www| 免费一区在线观看| av有码在线一区二区| 精品人妻一区二区三区浪人在线| 人妻无码αv中文字幕久久琪琪布| 囯产精品无码一区二区三区| 少妇一区二区三区精选| 精品国产天堂综合一区在线 | 成人爽a毛片在线播放| 国产内射爽爽大片视频社区在线| 亚洲欧美日韩精品高清| 精品一区二区三区长筒靴| 国产精品内射久久一级二| 国产人妻人伦精品1国产盗摄| 国产精品午夜波多野结衣性色| 在线观看二区视频网站二区| 亚洲av无码一区东京热| 一本色综合亚洲精品蜜桃冫| 久久麻豆精亚洲av品国产精品| 国产在线观看91一区二区三区|