吳秀梅
(賽默飛世爾(上海)儀器有限公司,上海 201206)
U分布和T分布在研發(fā)階段設(shè)計(jì)驗(yàn)證數(shù)據(jù)處理中的應(yīng)用
吳秀梅
(賽默飛世爾(上海)儀器有限公司,上海 201206)
在研發(fā)階段僅對(duì)單一的樣機(jī)做測(cè)試,并以測(cè)試結(jié)果作為結(jié)論來(lái)評(píng)價(jià)產(chǎn)品的設(shè)計(jì)質(zhì)量,這一做法顯然具有很大的隨機(jī)性,不能全面準(zhǔn)確的評(píng)估設(shè)計(jì)成果。而對(duì)多臺(tái)樣機(jī)的測(cè)試就會(huì)不可避免的涉及到數(shù)據(jù)處理的問(wèn)題。在實(shí)際項(xiàng)目中,我們引入了U分布和T分布統(tǒng)計(jì)方法對(duì)測(cè)試數(shù)據(jù)做處理,以期對(duì)設(shè)計(jì)有個(gè)客觀準(zhǔn)確的評(píng)價(jià)。
樣本 抽樣 U分布 T分布 正態(tài)分布 置信度 置信區(qū)間 樣本均值
自從2007年畢業(yè)以來(lái),本人一直從事新產(chǎn)品測(cè)試工作。剛開(kāi)始測(cè)試樣本數(shù)量一般是1臺(tái),且用“通過(guò)”或“不通過(guò)”作為測(cè)試的結(jié)論。后來(lái)發(fā)現(xiàn)1臺(tái)樣本隨機(jī)性太強(qiáng),很難代表新研發(fā)產(chǎn)品的設(shè)計(jì)品質(zhì),所以樣本數(shù)量增加到多臺(tái)。這樣一來(lái)測(cè)試中經(jīng)常發(fā)現(xiàn)下列幾種狀況:一、多個(gè)測(cè)試結(jié)果結(jié)論不統(tǒng)一,有的結(jié)果在規(guī)格內(nèi),有的則在規(guī)格外;二、所測(cè)多個(gè)樣機(jī)的電壓值均在規(guī)格內(nèi),但普遍靠近規(guī)格上限或下限;三、對(duì)同一臺(tái)樣機(jī)多次測(cè)試,所得結(jié)果有的在規(guī)格內(nèi),有的在規(guī)格外;針對(duì)這些測(cè)試結(jié)果,簡(jiǎn)單用“通過(guò)”或“不通過(guò)”來(lái)評(píng)估該設(shè)計(jì)顯然是不充分的,有必要引入其他的描述對(duì)整體的設(shè)計(jì)品質(zhì)做評(píng)估,來(lái)準(zhǔn)確判定設(shè)計(jì)的質(zhì)量。
經(jīng)過(guò)各種借鑒和學(xué)習(xí),最終我們引入統(tǒng)計(jì)學(xué)方法對(duì)測(cè)試所得的多組數(shù)據(jù)做處理,并利用“樣本均值”“置信度”“置信區(qū)間”等概念對(duì)樣本作全面的評(píng)估。
2.1 CPK的廣泛應(yīng)用
常用的統(tǒng)計(jì)學(xué)方法有多種,U分布、T分布、Z分布等。因?yàn)閁分布是多種分布的理論基礎(chǔ),也是應(yīng)用最廣的分布,所以開(kāi)始我們采用cpk作為設(shè)計(jì)質(zhì)量判斷的指數(shù)。Cpk(Complex process capability index) 全稱(chēng)是制程能力指數(shù),一般用來(lái)反映生產(chǎn)過(guò)程性能的允許最大變化范圍與過(guò)程的正常偏差的比值。也有公司用它來(lái)表征產(chǎn)品設(shè)計(jì)的質(zhì)量。在此不做論證其適用性,僅對(duì)實(shí)用過(guò)程做說(shuō)明。
表1 cpk數(shù)值對(duì)應(yīng)的設(shè)計(jì)質(zhì)量分析
圖1
2.2 CPK的不足
以上計(jì)算過(guò)程簡(jiǎn)單,結(jié)論明確,可操作性強(qiáng)。但實(shí)際應(yīng)用于項(xiàng)目中后發(fā)現(xiàn)根據(jù)取樣數(shù)據(jù)所得cpk值偏低,并不能準(zhǔn)確反映設(shè)計(jì)情況。追究原因可能源于以下幾點(diǎn):
(1)所得樣本數(shù)據(jù)存在異常點(diǎn),即由于非設(shè)計(jì)因素影響使得測(cè)試結(jié)果出現(xiàn)偏差;而在統(tǒng)計(jì)分析中沒(méi)有排除這些點(diǎn);(2)樣本數(shù)據(jù)分布形態(tài)不符合正態(tài)分布;(3)最重要的一點(diǎn),樣本數(shù)據(jù)量過(guò)小,不符合用cpk分析設(shè)計(jì)質(zhì)量的要求。因?yàn)橄嚓P(guān)資料中介紹cpk時(shí)有建議取樣數(shù)據(jù)最少要在120個(gè)以上,而在實(shí)際的研發(fā)試樣中,樣機(jī)總數(shù)量很少超過(guò)15臺(tái),遠(yuǎn)達(dá)不到要求。(4)沒(méi)有考慮隨機(jī)因素的影響。
3.1 T分布介紹
基于以上原因,我們決定采用T分布來(lái)進(jìn)行數(shù)據(jù)分析,并加入了“預(yù)測(cè)符合度”的考量對(duì)分析所得區(qū)間做調(diào)整?,F(xiàn)將T分布介紹如下。T分布以U分布為理論基礎(chǔ),是一簇曲線其形態(tài)變化與樣品數(shù)量n有關(guān)。樣品數(shù)量越小,t分布曲線越低平,樣品數(shù)量越大,t分布曲線越接近標(biāo)準(zhǔn)正態(tài)分布曲線,當(dāng)樣品數(shù)量大于120個(gè)時(shí),T分布曲線和標(biāo)準(zhǔn)正態(tài)分布曲線無(wú)限接近(圖1所示)。簡(jiǎn)單說(shuō)來(lái),每一種樣品數(shù)量都對(duì)應(yīng)著T分布的的一條曲線。這樣就使得樣品分布與T曲線的符合度高,就解決了樣品數(shù)量過(guò)小的問(wèn)題(事實(shí)上當(dāng)樣品數(shù)量小于30個(gè)時(shí),使用T分布是合適的)。
另外,T分布中考慮了置信度,即考慮了在抽樣對(duì)總體參數(shù)做出估計(jì)時(shí),由于樣本的隨機(jī)性,其結(jié)論總是不確定的。因此置信度是一種概率的陳述方法,也就是數(shù)理統(tǒng)計(jì)中的區(qū)間估計(jì)法,即估計(jì)值與總體參數(shù)在一定允許的誤差范圍以?xún)?nèi),其相應(yīng)的概率有多大。
再者,考慮到設(shè)計(jì)本身所固有的可變性(與制造過(guò)程的可變性無(wú)關(guān)),引入了預(yù)測(cè)符合度的概念,用以對(duì)T分布統(tǒng)計(jì)計(jì)算所得區(qū)間范圍做調(diào)整。
現(xiàn)將T統(tǒng)計(jì)計(jì)算過(guò)程詳述如下:
對(duì)應(yīng)著不同的預(yù)測(cè)符合度水平,y有不同的數(shù)值,如下:
y = 1 minimum 68% conforming
y = 1.28 minimum 80% conforming
y = 1.64 minimum 90% conforming
y = 1.96 minimum 95% conforming
y = 2.58 minimum 99% conforming
y = 3 minimum 99.7% conforming
3.2 T分布在實(shí)際中的應(yīng)用
以下9個(gè)數(shù)據(jù)來(lái)自對(duì)5V電壓源的測(cè)試所得,該電壓源的規(guī)格范圍為4.5V到5.5V,置信度為95%,預(yù)測(cè)符合度為90%,請(qǐng)根據(jù)測(cè)試數(shù)據(jù)對(duì)設(shè)計(jì)水平做評(píng)價(jià)。
測(cè)試數(shù)據(jù):5.1V,5.2V,4.9V,5.0V,5.0V,4.8V,5.1V,4.8V,4.5V。
則