許建梅 周穎
摘要: 當前黑板檢驗仍是桑蠶絹絲檢驗中的主要檢驗手段之一,但是各檢驗機構所使用的黑板樣照卻存在不同程度的老化、褪色,因此浙江絲綢科技有限公司新研制了一批絹絲黑板樣照。為了有效評價新樣照與老樣照間的吻合程度,文章設置了感官評價準則和評價員培訓方法,采用了差別成對比較檢驗方法,對新舊樣照的差異性進行檢驗與評價;并對新樣照進行了試套檢驗,利用成對T檢驗來獲得新舊樣照在評等定級上的差異性。結果表明,感官評價方法與對試套檢驗數據進行的成對T檢驗方法結果相一致,可以從兩個不同的方面對新制絹絲黑板樣照進行有效評價。
關鍵詞: 絹絲黑板樣照;吻合度;感官檢驗;成對比較檢驗;成對T檢驗
中圖分類號: TS147
文獻標志碼: A
文章編號: 1001-7003(2017)12-0001-06
Abstract: Seriplane test is currently still one of the main test methods in spun silk inspection. However, the seriplane photographs that different inspection centers are using have become aging and color fading to different degrees. Thus Zhejiang Silk Science and Technology Company developed a new set of seriplane photographs for spun silk. To evaluate the goodness of fit between the new and the old photographs effectively, the sensory evaluation rules and an assessor training method were applied, and paired comparison test was used to test and evaluate the differences between the new and the old photographs. Meanwhile, actual inspection was done for the new photographs. The paired T test was used to gain the differences of new and the old photographs in grade rating. The results showed that the sensory evaluation was in accord with the paired T test for actual inspection, and the new seriplane photographs could be effectively assessed from the two different aspects.
Key words: seriplane photograph for spun silk; goodness of fit; sensory evaluation; paired comparison test; paired T test
目前,桑蠶絹絲品質技術指標主要包括條干均勻度、潔凈度、千米疵點、支數變異系數等,而前三個指標的檢驗主要還是依靠檢驗員對照標準黑板樣照進行檢驗。經過長期使用,各檢驗機構所使用的黑板樣照均存在不同程度的老化、褪色;有的企業(yè)及檢測機構的樣照甚至已損毀或丟失,而這些黑板樣照都沒有原樣。因此,急需研制一批新的黑板樣照替代舊樣照。而新樣照的研制必然要先準備標準黑板實物,通過拍照制作底版,再進行沖印[1-2]。在這個過程中若黑板實物制備與舊標準樣照有偏差,那么新樣照與舊樣照間就會存在較大差異;在拍照制作底版、相紙選擇、沖印過程中又存在諸多因素,會導致最后的樣照與黑板實物存在細微的差異。為此,需要采取合適的方法來評價新制黑板樣照與舊樣照間的差異。以往黑板樣照的研制中大多集中在研究樣照制作[3-4]、樣照反映疵點的基本原理[5],對于新樣照與舊樣照間的差異研究少有涉及。當前正在使用的樣照已有數十年,且有國家標準作依托,在產品的評等定級上已廣為接受,因此新樣照對舊樣照的吻合度就成為關鍵。如果新樣照不能做到與舊樣照無顯著差異,則一旦采用新樣照,在絹絲產品評等定級中便會出現(xiàn)較大的波動與誤差,給絹絲生產企業(yè)造成較大的損失,同時也會對檢驗機構的公信力造成一定的損害,擾亂絹絲貿易秩序。
為此,本研究擬采用感官評價方法與新舊樣照的試套試驗,對新舊樣照間的吻合度即差異性進行評價。感官評價一般是通過評價員的視覺、嗅覺、觸覺、味覺和聽覺,對受測量物進行定性評價的一種科學方法[6-7],最早是1975年由美國食品協(xié)會提出,并在后來廣泛應用于食品、紡織等行業(yè)[8]。本研究中主要是指利用評價員的視覺來評定新舊黑板樣照間的差異。對于感官評價結果的分析,如果是用來評價兩受檢驗物間有無明顯差異,通常都是采用“成對比較法”進行差別檢驗,這種方法在食物的感官評價中使用相當普遍[9]。本研究中借鑒食物差異性評價的方法[10]來進行新舊樣照的吻合度分析。除此以外,本研究還進行了新舊樣照的試套檢驗,對檢驗結果采用“成對T檢驗”進行差異顯著性分析[11],從另一個方面來分析新舊樣照的吻合度、新樣照對舊樣照的可替代性問題,聯(lián)合采用這兩種手段即可對新舊樣照的吻合度和差異性進行準確有效的評價。
1 新舊樣照差異的感官評價方法
1.1 感官評價準則的建立
感官評價方法是請具有多年絹絲黑板檢驗經歷的資深檢驗員按一定的方法經過培訓之后,對新制絹絲黑板樣照與舊樣照的差別進行感官描述性評價。為了更深層次地了解新舊黑板的差異程度,本研究將評價員的感觀量化,以100為固定模數,建立了以下的量化評價系統(tǒng),評價范圍為0~100分。
100分:新舊樣照完全一致,憑肉眼看不出差別。
95分:新舊樣照無顯著差異,僅限于光影、明暗上的差別,新樣照可以替舊樣照檢驗,不會造成檢驗成績的差異。
90分:新舊樣照存在細微差別,如果分別按照新樣照和舊樣照對同一黑板進行多次重復檢驗,條干均勻度成績差異平均2.5分左右;潔凈度成績平均達2.5分左右;千米疵點成績低支的為0.2只左右,中支的0.3只左右,高支的0.4只左右。
80分:新舊樣照存在一定差別,個別疵點翻拍后走樣,如果分別按照新樣照和舊樣照對同一黑板進行多次重復檢驗,條干均勻度成績差異平均在5分左右;潔凈度成績平均在5分左右;千米疵點成績低支的為0.4只左右,中支的0.7只左右,高支的0.8只左右。
70分:新舊樣照存在顯著差別,如果分別按照新樣照和舊樣照對同一黑板進行多次重復檢驗,條干均勻度成績差異平均10分左右;潔凈度成績平均在10分左右;千米疵點成績低支的0.8只左右,中支的1.4只左右,高支的1.6只左右。
60分:新舊樣照存在極顯著差別,如果分別按照新樣照和舊樣照對同一黑板進行多次重復檢驗,條干均勻度成績差異平均20分左右;潔凈度成績平均在20分左右;千米疵點成績低支的1.5只左右,中支的為2只左右,高支的2.5只左右。
0分:完全不相關。
1.2 檢驗人員的選擇與培訓
根據ISO 11056:1999 Sensory analysis-Methodology-Magnitude estimation method中的規(guī)定,當選用的評價員為有經驗的經過高度專業(yè)培訓的檢驗員時,評價員個數最少可以只有5人,推薦人數是10人。本試驗中選取6人,這6人在利用黑板樣照檢驗絹絲紗線疵點方面不僅經過高度專業(yè)培訓,而且都是具有多年檢驗經驗的資深檢驗員。
首先對評價員介紹上述的評分規(guī)則。然后準備幾組示例,讓評價員打分,如果6個評價員的打分結果差別較大,則需重新培訓,直至對同一示例,6個評價員的目光一致,評分結果一致。這時才可以使6位評價員進行正式評分環(huán)節(jié)。
1.3 樣本準備與試驗方法
試驗準備了兩套舊樣照,一套新樣照。每套樣照分別包括高支絹絲、中支絹絲、低支絹絲的條干均勻度、千米疵點、潔凈度指標檢驗的共9塊樣照。
試驗中采取成對比較的感官檢驗方法。這種方法是以隨機先后評價順序出示兩個樣品給評價員[8],請評價員對新樣照與舊樣照(兩塊舊樣照可隨機任選一塊)之間的差異,以及兩塊舊樣照之間的差異分別進行打分。打分時評價員并不知道哪些為新樣照,哪些為舊樣照,以免產生心理暗示。前面一組打分主要是用來衡量新舊樣照間的差異,而最后一組為對照組,用來衡量前面兩組打分的有效性。因為最后一組兩個舊樣照應是無顯著差別的,如果最后一組打分低于90分,則需要根據實際情況確認該評價員打分是否有效。
1.4 試驗數據與分析
根據上述試驗方法與規(guī)則,由6位評價員最后打出的評分結果見表1,其中“新∶舊”表示新舊黑板樣照間的對比,“舊∶舊”表示兩塊舊黑板樣照間的對比。
對試驗結果進行差別檢驗時采用成對比較法。表1中分數大于等于90的可認為新舊樣照間無差異,小于90分的認為有差異,小于70分的為極顯著差異。根據ISO 5495—2005 Sensory analysis-Methodology-Paired comparison test的規(guī)定,在進行成對比較差別檢驗時,原假設為新舊黑板樣照間無顯著差異。最低響應數可采用下式進行計算:
nR=n+12+z0.25n(1)
式中:n為評價員個數;z的取值與顯著性水平α的選擇相關,若α=0.05,則z=1.64,若α=0.1,則z=1.28。
因此,當評價員個數為6時,顯著性水平α=0.05時,最低響應數為6;α=0.1時,最低響應數為5。也就是說在置信水平為0.05時,要6個檢驗員結果一致,才能得到統(tǒng)一的結論;如果顯著性水平為0.1,則僅需5人結果一致。比如說,表1中低支絹絲的條干均勻度新舊黑板打分均超過95分,則接受原假設,認為這兩塊新舊樣照間無顯著差異;而對于低支千米疵點新舊黑板間差異5人打分在95分以上,有一人打分為80分,則在10%的顯著性水平上接受原假設,即只有90%的把握認為比較的兩塊新舊樣照間無顯著差異。按此準則,可以得出低中高支絹絲三個指標共9塊新黑板與對應的舊黑板的差異情況,結果見表2。表2中檢驗結果均是基于顯著性水平為0.05的基礎上得出的,表中打“*”的兩處如果顯著性水平調整為0.1,則為接受原假設。這說明對于低支千米疵點和高支條干均勻度,新舊樣照間可能無明顯差異,只是這個結論的顯著性程度不高。因此,單靠感官評價結果,部分新制樣照能否替代舊樣照還無法得到最終結論,并且該差異檢驗也無法對新樣照的偏緊偏松作出判斷。為了更準確地評價新樣照,還需要進行實際的黑板檢驗,即試套試驗。
需要注意的是兩套舊樣照均是根據絹絲檢驗中對標準樣照的標準要求而制作,理論上應是完全一樣的。在檢驗過程中,如果評價員6人當中只有個別人(人數不超過1人)對兩塊舊樣照間差異打分低于90分,則說明在這組黑板樣照差異的評價中,該評價員目光可能不準確,這組評價結果則應全部舍棄。這時有效評價員數就為5人。根據式(1)計算可得,此時置信水平α=0.05時,最低響應數為5;α=0.1時,最低響應數為4.43,仍約等于5人。表1中打“*”的數據即為異常數據,則對應的新舊樣照間打分數據也應剔除,在表1中用實線方框標出的,即為要剔除的數據。
兩套舊樣照雖然理論上應完全一致,但是因為不是來自同一生產商,且出廠時間不一致,在不同的檢驗中心使用,所以使用時間與頻率不同,保養(yǎng)維護不同,可能會出現(xiàn)不同程度的老化、褪色。因此在感官判斷時,可能評價員會出現(xiàn)一定的目光差異,對于這種情況則不應作數據剔除。為此,本研究認為如果6人中有超過2人(含2人)對兩塊舊黑板樣照的判斷打分低于90分時,則不作異常數據剔除。比如表1中陰影部分數據,表示的是有2人對中支條干均勻度的兩塊舊樣照提出存在差異,這時則不應剔除他們對相應新舊的打分數據。
2 新舊樣照試套比對試驗
2.1 樣本準備與試驗方法
準備高支絹絲22批、中支絹絲36批、低支絹絲5批,共63批絹絲的試樣筒子,每批10個筒子,再由這10個筒子搖取2塊黑板,共20片絲。對每批2塊黑板分別對照新舊樣照逐一打分,給出條干均勻度、千米疵點、潔凈度成績結果。具體打分細則根據FZ/T40003—2010《桑蠶絹絲試驗方法》標準中規(guī)定進行。為了使結果更具代表性,高中支絹絲樣本分成了兩組,分別在兩個檢驗中心檢驗。
2.2 數據與分析
2.2.1 首次試套比對試驗
根據上述試驗方法,制備黑板試樣并評分。表3列出的是高支黑板樣照試套檢驗數據,其中中支的因為有36批數據太多,就不一一列出。為了分析同一黑板按新舊樣照檢驗的結果之間有無差異,本研究采取成對T檢驗法,即從兩個方面來分析:一是分析按新舊樣照,檢驗評分上有無差異;二是分析按新舊樣照,檢驗等級上有無差異。一般來說,只要按新樣照檢驗時在最后的等級評定上跟舊樣照沒有差別即可。為了便于檢驗運算,對每處疵點的評價等級進行量化,以0表示優(yōu)等品,1表示一等品,2表示二等品。在進行成對T檢驗時,首先需要對每對數據求差。如果按舊樣照評為優(yōu)等品,按新樣照評為一等品,求差時結果為1,也就是表示兩種定級結果級差為1。
在成對T檢驗時,若兩組數據變量分別用x,y表示,則首先求成對數據的差d=x-y,該差值反映的就是兩個檢測結果間的差異。為此,兩個檢驗結果的有無差異問題就轉化為判斷成對數據的差是否服從均值為0的正態(tài)分布[11]。提出原假設H0∶E(d)=0。在H0為真的條件下,檢驗統(tǒng)計量:
式中:T表示檢驗統(tǒng)計量服從自由度為n-1的t分布。
利用表3計算統(tǒng)計量,再查t檢驗表即可得知是否接受原假設。本研究采取直接根據統(tǒng)計量計算p值的方法,省去了查表的麻煩,結果更加一目了然。p值的計算公式如下:
式中:p≤0.01,則說明統(tǒng)計量T落在了拒絕域內,表示在顯著性1%的水平上拒絕原假設;若p≤0.05,則表示在顯著性5%的水平上拒絕原假設。
表4即為成對T檢驗的結果,其中打“*”的p值均大于0.05,表示在顯著性5%的水平上接受原假設,新舊黑板樣照間無顯著差異。其中低支千米疵點樣照p值為0.036,表示雖然在顯著性5%的水平上不能接受原假設,但是可以在顯著性1%的水平上接受原假設。從表4可以看出,與舊樣照存在顯著差異的主要是中支和高支的潔凈度新樣照,高支的條干均勻度和千米疵點樣照也存在差異。
這樣的結果與表2中的感官檢驗在中支和高支樣照的判斷上是一致的,但是在低支樣照的判斷上出現(xiàn)一些偏差,主要是低支潔凈度樣照的判斷上。分析認為是因為在試套試驗中低支試樣僅有5批,這使得數據失真,誤差增加。因此,在低支樣照的判斷上仍應采信表2的感官判斷結果。
此外,值得注意的是表4中高支條干均勻度樣照雖然假設檢驗結果為存在顯著差異,但是結合表3中原始數據可以發(fā)現(xiàn):對于高支絹絲,選取的這些批次的樣絲條干均勻度成績大多在72.5~75分,而按照FZ/T42002—2010中規(guī)定條干成績大于等于75即為優(yōu)等品,70~75分則為一等品。很多批次按舊樣照批分為75分,按新樣照則批分為72.5分,這時雖然分值僅發(fā)生一點變化,等級卻要低一個等級。而中支絹絲選取的試樣條干均勻度成績則分散在75~82.5,因此中支條干均勻度樣照在檢驗等級上測不存在顯著差異。因此,在這種情況下,就不能僅以p值結果確認新舊樣照在檢驗定等上有無顯著差異,而應注意在試套試驗中擴大受檢樣絲的質量變化范圍,以提高統(tǒng)計檢驗結果的可靠性。
2.2.2 樣照修正后試套比對試驗
從上述的感官檢驗與試套試驗中可以發(fā)現(xiàn),潔凈度新樣照普遍與舊樣照存在顯著差異,且新樣照標準明顯過緊。為此,樣照研制小組又重新取樣,重新制備了一套潔凈度樣照。對于新制備的樣照有必要再進行試套試驗來檢驗修正后的樣照效果。為此,重新準備了高支絹絲試樣20批,中支40批進行新舊樣照的試套檢驗。檢驗時同樣對三個指標均進行了檢測,對檢測結果進行成對T檢驗,結果見表5。表5中打“*”的數值與表4中一樣,仍表示p值大于0.05,接受原假設,即新舊樣照間無顯著差異。
由表5可以看到,潔凈度樣照經過修正后與舊樣照在顯著性5%的水平上無顯著差異,而高支條干均勻度樣照仍有差異,具體原因與前面一樣,是因為高支條干的批分恰好都集中在75分左右。
3 結 論
針對絹絲黑板樣照研制過程中,新制樣照與舊樣照的吻合度與可替代性問題,本研究建立了感官評價差異的方法,包括感官評價準則的建立、評價員的選擇與培訓、成對比較檢驗法對感官量化結果的統(tǒng)計分析;采用成對T檢驗法,對新樣照與舊樣照的比對試套數據進行了分析;結合感官評價差異的方法與成對T檢驗法的結果,對絹絲黑板樣照提出了準確的修正方法;并利用成對T檢驗對修正的結果進行了再檢驗,證明了修正后樣照與舊樣照的高度吻合,無顯著差異。同時,說明了采用感官檢驗與試套試驗可以從兩個不同方面對新舊樣照的吻合度進行有效準確的評價。
參考文獻:
[1]陳慶官,李廣榮.生絲黑板檢驗標準樣照的制作[J].絲綢,1994,39(5):46-48.
CHEN Qingguan, LI Guangrong. Development of the standard seriplane photograph for raw silk[J].Journal of Silk,1994,39(5):46-48.
[2]陳慶官,袁美珍,李廣榮.桑蠶雙宮絲特征標準樣品(樣照)的制作[J].絲綢,2000(12):44-45.
CHEN Qingguan, YUAN Meizhen, LI Guangrong. Preparation of standard sample photograph for features of mulberry doupion silk[J]. Journal of Silk,2000(12):44-45.
[3]孫萍.樣照的研制及在檢驗中的作用[J].中國檢驗檢疫,2001,16(5):18-19.
SUN Ping. Study and development of the photograph and its application in inspection[J]. China Inspection and Quarantine,2001,16(5):18-19.
[4]張陸蓮.紗線條干,結雜目光檢驗樣照及評定方法探討[J].廣西紡織科技,1996,25(1):44-46.
ZHANG Luliang. Discussion on the visual inspection photographs of yarn evenness and defects and the rating method[J]. Guangxi Textile Science & Technology,1996,25(1):44-46.
[5]平慰庭,徐應和.黑板樣照[J].現(xiàn)代商檢科技,1993,3(2):53-55.
PING Weiting, XU Yinghe. Seriplane photograph[J]. Modern Commodity Inspection Science and Technique,1993,3(2):53-55.
[6]劉方菁,劉輝,寧娜,等.感官評價原理在肉質評價中的應用[J].肉類工業(yè),2011,22(2):12-15.
LIU Fangjing, LIU Hui, NING Na, et al. Application of sensory evaluation principles in meat quality[J]. Meat Industry,2011,22(2):12-15.
[7]KOEHL Ludovic, ZHOU Bin, ZENG Xianyi, et al. Sensory evaluation in characterization of fabric hand[J]. Journal of Donghua University,2004,21(3):76-81.
[8]LIU Xiaohong, ZENG Xianyi. A model of selecting expert in sensory evaluation[J]. Advances in Intelligent System and Computing,2014,214:151-161.
[9]SANZ T, TARREGA A, SALVADOR A. Effect of thermally inhibited starches on the freezing and thermal stability of white sauces: rheological and sensory properties[J]. LWT-Food Science and Technology,2015,67:82-88.
[10]魏永義,王艷芳.火腿腸的差別成對比較檢驗研究[J].肉類工業(yè),2015(6):16-17.
WEI Yongyi, WANG Yanfang. Study on difference paired comparison test of ham sausage[J]. Meat Industry,2015(6):16-17.
[11]MENDENHALL William, BEAVER J Robert, BEAVER M Barbara. Introduction to Probability and Statistics[M]. 11th Edi, Boston: Thomason Learning,2004:386-390.