蔣雄
(九江天賜高新材料股份有限公司,江西九江,332599)
隨著精細(xì)化工行業(yè)競(jìng)爭(zhēng)加劇,企業(yè)開始使用連續(xù)反應(yīng)器替代間歇反應(yīng)器[1]。使用反應(yīng)動(dòng)力學(xué)數(shù)據(jù)設(shè)計(jì)連續(xù)反應(yīng)器能有效避免間歇反應(yīng)器直接轉(zhuǎn)化連續(xù)反應(yīng)器時(shí)因濃度分布及停留時(shí)間分布不同帶來的放大效應(yīng)[2]。不同化學(xué)反應(yīng)的反應(yīng)動(dòng)力學(xué)千差萬別,而影響反應(yīng)速率方程的因素眾多,因此根據(jù)不同化學(xué)反應(yīng)本身特點(diǎn)進(jìn)行預(yù)判隨后選擇不同的測(cè)試方法和測(cè)試環(huán)境符合企業(yè)需求[3,4]。
常用的反應(yīng)動(dòng)力學(xué)的分析方法有積分法、微分法、半衰期法、作圖法、孤立法[5]。常見的動(dòng)力學(xué)測(cè)試體系使用間歇釜作為容器,微通道反應(yīng)器[6]及量熱儀[7]因其等溫環(huán)境而被作為新型的測(cè)試容器。在研發(fā)人員開展的實(shí)際工作中,經(jīng)常出現(xiàn)反應(yīng)動(dòng)力學(xué)測(cè)試誤差大、數(shù)據(jù)不可信等問題。因此,在方案設(shè)計(jì)前確定好最佳的反應(yīng)動(dòng)力學(xué)測(cè)試方法和實(shí)驗(yàn)設(shè)計(jì)成為研發(fā)人員關(guān)注的方向[8]。
當(dāng)前,關(guān)于化學(xué)反應(yīng)動(dòng)力數(shù)據(jù)處理的軟件研究較多[9,10],但涉及反應(yīng)動(dòng)力學(xué)方案設(shè)計(jì)階段的處理軟件鮮有報(bào)道。當(dāng)下,基于機(jī)器學(xué)習(xí)開發(fā)的各種機(jī)器學(xué)習(xí)算法正在各行各業(yè)鋪展開來,其中,決策樹[11]、聚類[12]、樸素貝葉斯[13]、支持向量機(jī)[14]、隨機(jī)森林[15]等算法已經(jīng)基本達(dá)到商業(yè)化要求和特定場(chǎng)景的商業(yè)化水平。其中,決策樹算法尤其適合結(jié)論多特征多分類問題,將化學(xué)反應(yīng)動(dòng)力學(xué)需要考慮的因素與機(jī)器算法結(jié)合起來,形成一套基于機(jī)器學(xué)習(xí)開發(fā)的動(dòng)力學(xué)反應(yīng)測(cè)試建議系統(tǒng),在用戶進(jìn)行化學(xué)反應(yīng)動(dòng)力學(xué)測(cè)試前,基于已知反應(yīng)條件推薦最合理的動(dòng)力學(xué)測(cè)試方法,這樣,既可以減少化工領(lǐng)域研發(fā)人員的學(xué)習(xí)成本,也可以提升企業(yè)研發(fā)及工藝改進(jìn)的效率。
反應(yīng)動(dòng)力學(xué)涉及反應(yīng)的本征性質(zhì),與一些表觀現(xiàn)象之間沒有強(qiáng)相關(guān)性。先對(duì)反應(yīng)動(dòng)力學(xué)進(jìn)行拆解,細(xì)化成多個(gè)不同的維度進(jìn)行表征,再按照多個(gè)維度的表述與動(dòng)力學(xué)分析方法固有的偏差產(chǎn)生點(diǎn)進(jìn)行比較,可得到具體的化學(xué)反應(yīng)不能運(yùn)用的動(dòng)力學(xué)分析方法及測(cè)試環(huán)境;隨后,可通過排除法建立起反應(yīng)本征性質(zhì)與動(dòng)力學(xué)測(cè)試方法和測(cè)試環(huán)境之間的聯(lián)系。對(duì)于少量的特征與反應(yīng)動(dòng)力學(xué)分析方法之間產(chǎn)生的數(shù)據(jù)對(duì),可以直接記憶或者使用excel 等表格進(jìn)行匹配,但是對(duì)于大量的反應(yīng)特征與動(dòng)力學(xué)分析方法之間產(chǎn)生的數(shù)據(jù),則無法通過人工的方法獲取,借助計(jì)算機(jī)學(xué)習(xí)算法是一條可行的路徑。
如下圖1 所示,基于反應(yīng)動(dòng)力測(cè)試系統(tǒng)的運(yùn)作邏輯,本文設(shè)計(jì)了一套軟件界面用于用戶輸入關(guān)于反應(yīng)的基本信息,從反應(yīng)的方程式入手繪制反應(yīng)網(wǎng)絡(luò),以作為反應(yīng)機(jī)理研究的判據(jù)。對(duì)于復(fù)雜反應(yīng),反應(yīng)物網(wǎng)絡(luò)是否完整直接決定了進(jìn)行動(dòng)力學(xué)測(cè)試時(shí)是否會(huì)產(chǎn)生不可控因素。
圖1 動(dòng)力學(xué)推薦系統(tǒng)界面
隨后,在界面內(nèi)強(qiáng)調(diào)有14 個(gè)關(guān)于反應(yīng)信息的基礎(chǔ)問題,并對(duì)每個(gè)問題預(yù)設(shè)2~4 個(gè)答案,這樣就會(huì)產(chǎn)生大量不同的組合選項(xiàng)以應(yīng)對(duì)實(shí)際情況下的使用需求。在界面中間的圖層是反應(yīng)物網(wǎng)絡(luò)繪圖區(qū)和反應(yīng)能級(jí)圖,從反應(yīng)物網(wǎng)絡(luò)圖中可以清晰地表達(dá)反應(yīng)網(wǎng)絡(luò)和反應(yīng)復(fù)雜程度,而從能級(jí)圖中可以看出主反應(yīng)路線出現(xiàn)的能量變化和反應(yīng)活化能之間的關(guān)系,用以對(duì)反應(yīng)建立基礎(chǔ)的印象,選擇適合的熱量管理/時(shí)間管理規(guī)則。
在界面右側(cè),集成了兩個(gè)表和一個(gè)結(jié)論區(qū),圖表區(qū)內(nèi)清晰表達(dá)了在這種情況下建議使用的數(shù)據(jù)處理方法和使用的動(dòng)力學(xué)測(cè)試方法。下方的結(jié)論區(qū)針對(duì)反應(yīng)的機(jī)理,反應(yīng)的控制規(guī)律,反應(yīng)中控難度,反應(yīng)使用的數(shù)據(jù)處理方法及動(dòng)力學(xué)測(cè)試方法的具體使用限制進(jìn)行了文字說明,能指導(dǎo)測(cè)試人員了解動(dòng)力學(xué)測(cè)試規(guī)律。
如圖2 所示,簡(jiǎn)單反應(yīng)需要研究反應(yīng)速率,反應(yīng)受溫度、壓力、催化劑、中控的影響及表觀的反應(yīng)時(shí)間、放熱、速率快慢、分離要求以確定反應(yīng)需要的測(cè)試方案和數(shù)據(jù)處理方法。復(fù)雜反應(yīng)需要考慮反應(yīng)機(jī)理,先明確反應(yīng)存在競(jìng)爭(zhēng)、連串、可逆或者組合形式,再將復(fù)雜反應(yīng)轉(zhuǎn)化為簡(jiǎn)單反應(yīng)以確定具體的數(shù)據(jù)處理方案和測(cè)試方法。只有競(jìng)爭(zhēng)反應(yīng)時(shí)需分別測(cè)試兩反應(yīng)的動(dòng)力學(xué)過程,了解反應(yīng)的溫度/濃度條件,以及在不同條件下能否控制為一個(gè)特定產(chǎn)物。如果通過反應(yīng)溫度/濃度控制可以有效控制,即可轉(zhuǎn)化為簡(jiǎn)單反應(yīng)處理,反之需按表觀反應(yīng)動(dòng)力學(xué)進(jìn)行處理。
圖2 動(dòng)力學(xué)測(cè)試軟件工作程序
對(duì)于串級(jí)反應(yīng),需明確反應(yīng)是需要中間體還是產(chǎn)物。對(duì)于需要中間體的反應(yīng)判斷指標(biāo)是中間體能否穩(wěn)定存在;對(duì)于需要產(chǎn)物的反應(yīng)判斷標(biāo)準(zhǔn)為是否有中間體殘留。如果反應(yīng)需要中間體,且表觀現(xiàn)象中間體能穩(wěn)定存在,則一般決速步驟就是中間體繼續(xù)反應(yīng)步驟,整個(gè)反應(yīng)只需要進(jìn)行原料到中間體的簡(jiǎn)單反應(yīng)考慮,并遵照上面簡(jiǎn)單反應(yīng)的流程來詢問并給出建議;如果反應(yīng)需要產(chǎn)物,中間體有殘留,則反應(yīng)決速步驟是第二步。判斷標(biāo)準(zhǔn)是中間體到產(chǎn)物這一段反應(yīng)為簡(jiǎn)單反應(yīng)或?qū)ζ溥M(jìn)行表觀動(dòng)力學(xué)測(cè)試。
最后,對(duì)既有連串又有平行反應(yīng)的結(jié)構(gòu)來說,需要關(guān)注產(chǎn)物所在的主要路線,先研究主要路線上存在的是競(jìng)爭(zhēng)反應(yīng)還是連串反應(yīng),再按照上面說的連串反應(yīng)或競(jìng)爭(zhēng)反應(yīng)進(jìn)行分析。在對(duì)其他副產(chǎn)物所在的其他反應(yīng)進(jìn)行分析時(shí),按照簡(jiǎn)單反應(yīng)進(jìn)行研究。
企業(yè)在做反應(yīng)時(shí)的普遍做法是一鍋法,先合成產(chǎn)物再進(jìn)行分離,盡可能獲得更高的原料轉(zhuǎn)化率,但該種方法在連續(xù)化反應(yīng)器中并不適合。因此,需要收集實(shí)驗(yàn)中的表觀實(shí)驗(yàn)現(xiàn)象進(jìn)行動(dòng)力學(xué)方案設(shè)計(jì)。
本文設(shè)計(jì)了14 個(gè)問題,見表1,每個(gè)問題預(yù)設(shè)2~4 個(gè)選項(xiàng),用于收集反應(yīng)信息,具體預(yù)設(shè)方案如下:
表1 預(yù)設(shè)問題一覽表
通過1,2,3,4 問題對(duì)反應(yīng)的復(fù)雜程度進(jìn)行分析,定義競(jìng)爭(zhēng)、連串、酸堿、可逆反應(yīng)。對(duì)復(fù)雜反應(yīng)而言,研究反應(yīng)機(jī)理是優(yōu)化反應(yīng)路線、減少反應(yīng)安全風(fēng)險(xiǎn)和三廢產(chǎn)量的關(guān)鍵。復(fù)雜反應(yīng)需要將反應(yīng)中的主要反應(yīng)和副反應(yīng)都表達(dá)清晰,然后將繪制反應(yīng)物網(wǎng)絡(luò)作為研究反應(yīng)機(jī)理的重要手段。通過對(duì)5,6,7,8,9,10,11,12,13,14 問題進(jìn)行分析,主要探究反應(yīng)過程規(guī)律,按照反應(yīng)規(guī)律匹配適合的測(cè)試體系和數(shù)據(jù)分析方法。
本文共設(shè)計(jì)14 個(gè)問題,每個(gè)問題又分別設(shè)置2~4 個(gè)不同選項(xiàng),共計(jì)產(chǎn)生995329 項(xiàng)組合,根據(jù)初始數(shù)據(jù)和特定的決策依據(jù)形成3072 種結(jié)論。對(duì)于如此龐大的問題組合,如何在各個(gè)問題之間做出權(quán)衡并找到最佳的動(dòng)力學(xué)測(cè)試方法或者其他的建議,必須依靠機(jī)器算法來完成。
本文使用機(jī)器迭代算法,生成上述14 個(gè)問題995329 行,25 列的初始數(shù)據(jù)庫,通過判斷14 個(gè)問題的答案選項(xiàng),組合成后續(xù)結(jié)論項(xiàng)種機(jī)理/過程規(guī)律/分析能力/數(shù)據(jù)處理方法/使用測(cè)試儀器的標(biāo)準(zhǔn)選項(xiàng)。通過機(jī)器學(xué)習(xí)算法,對(duì)產(chǎn)生的數(shù)據(jù)進(jìn)行學(xué)習(xí),在用戶界面返回正確的結(jié)論。本文采用數(shù)字化方法替代文字進(jìn)行運(yùn)算,默認(rèn)0 代表任意14 個(gè)問題中的第一個(gè)選項(xiàng),1 代表第二個(gè)選項(xiàng),2 代表第三個(gè)選項(xiàng),3 代表第四個(gè)選項(xiàng)。按照反應(yīng)機(jī)理明確與否,反應(yīng)規(guī)律和中控方法選擇動(dòng)力學(xué)數(shù)據(jù)處理方法。動(dòng)力學(xué)處理方法決定了實(shí)驗(yàn)設(shè)計(jì)方案。如下表2、表3 所示。
表2 五種分析方法算法規(guī)律
表3 三種測(cè)試方法算法規(guī)律
按照反應(yīng)實(shí)際情況,根據(jù)機(jī)理/規(guī)律/中控/熱量/時(shí)間規(guī)律/催化綜合考慮適合的測(cè)試儀器,作為實(shí)驗(yàn)儀器選擇依據(jù)。
以上結(jié)論在確定了使用數(shù)據(jù)分析方法和測(cè)試儀器之后,由軟件輸出對(duì)應(yīng)的文字信息提示操作者最可能的動(dòng)力學(xué)測(cè)試方案。
本文預(yù)設(shè)多個(gè)問題并給出選項(xiàng),然后根據(jù)選項(xiàng)的結(jié)果進(jìn)行判斷,形成大量的數(shù)據(jù)行。就此類機(jī)器學(xué)習(xí)語言的選擇而言,常見的做法是決策樹/樸素貝葉斯算法/隨機(jī)森林算法等。本文中數(shù)據(jù)集按照特定規(guī)則產(chǎn)生,結(jié)論按照選項(xiàng)進(jìn)行判斷后填充,結(jié)論和選項(xiàng)之間存在相關(guān)性,不存在過多異常值和噪聲,三種方法在此情況下都可以解決問題。本文對(duì)三種常見方法進(jìn)行模擬測(cè)試,結(jié)果如表4 所示。
表4 三種算法模擬結(jié)論對(duì)比表
表5 隨機(jī)測(cè)試輸入數(shù)據(jù)結(jié)論對(duì)比表
本文使用三種算法對(duì)同一個(gè)數(shù)據(jù)集進(jìn)行計(jì)算,分別評(píng)測(cè)三種算法的耗時(shí)和準(zhǔn)確度。模型使用預(yù)訓(xùn)練(30%),將多模型多分類方法作為默認(rèn)條件。從表4結(jié)果可以看出,決策樹在準(zhǔn)確度和耗時(shí)上是最佳的選擇,能保持100%準(zhǔn)確度和149s 的分析時(shí)間;樸素貝葉斯不適合本類問題的求算,出現(xiàn)0.54 的準(zhǔn)確度,精度不夠;隨機(jī)森林算法在準(zhǔn)確度上完成較好,但耗時(shí)較長(zhǎng)。
本文根據(jù)6 組不同情況對(duì)模型結(jié)果進(jìn)行實(shí)測(cè),用以驗(yàn)證動(dòng)力學(xué)測(cè)試建議系統(tǒng)功能的完整性。從下表可以看出,隨機(jī)抽取6 組不同組合,機(jī)器模型均給出相應(yīng)的測(cè)試建議和結(jié)果,結(jié)果與預(yù)期結(jié)果對(duì)照,準(zhǔn)確度為1.0,符合向研發(fā)人員推薦動(dòng)力學(xué)測(cè)試的要求。
本文通過機(jī)器設(shè)計(jì)一套動(dòng)力學(xué)測(cè)試分析建議系統(tǒng),對(duì)常見的反應(yīng)問題進(jìn)行預(yù)設(shè),對(duì)其中問題進(jìn)行定義并與最終動(dòng)力學(xué)測(cè)試的數(shù)據(jù)處理方法和測(cè)試容器進(jìn)行關(guān)聯(lián),產(chǎn)生90 余萬條原始數(shù)據(jù)。通過反應(yīng)方程的輸入,能夠自動(dòng)生成反應(yīng)物網(wǎng)絡(luò)和可能的主反應(yīng)能級(jí)圖,以直觀呈現(xiàn)反應(yīng)復(fù)雜程度和反應(yīng)受熱力學(xué)控制程度,從而幫助人員確定反應(yīng)規(guī)律。
通過對(duì)比機(jī)器學(xué)習(xí)決策樹/樸素貝葉斯/隨機(jī)森林的算法時(shí)間和準(zhǔn)確度,確定使用決策樹作為機(jī)器學(xué)習(xí)的算法,并使用二維數(shù)組處理90 余萬條數(shù)據(jù),決策樹運(yùn)行時(shí)間縮減為4s,整體軟件運(yùn)行時(shí)間少于1min。此外,通過隨機(jī)進(jìn)行6 組預(yù)設(shè)問題檢測(cè),可以獲取準(zhǔn)確度為1.0 的結(jié)果,從而證明該算法能夠穩(wěn)定運(yùn)行,基本滿足企業(yè)動(dòng)力學(xué)初步方案設(shè)計(jì)需求。