【摘要】隨著信息技術(shù)的發(fā)展,數(shù)據(jù)管理不再僅僅是存儲(chǔ)和管理數(shù)據(jù),而轉(zhuǎn)變成用戶所需要的各種數(shù)據(jù)管理的方式。文章介紹數(shù)據(jù)庫(kù)技術(shù)發(fā)展的今天,怎樣才能通過(guò)日常維護(hù)管理來(lái)提高數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定運(yùn)行。
【關(guān)鍵詞】服務(wù)器管理;磁盤;安全管理
1.引言
新疆空管局氣象中心數(shù)據(jù)庫(kù)系統(tǒng)是全國(guó)七大地區(qū)空管局氣象中心之一,其中最核心的氣象設(shè)備之一——?dú)庀髷?shù)據(jù)庫(kù)系統(tǒng),主要由全國(guó)七大地區(qū)中心數(shù)據(jù)庫(kù)系統(tǒng)聯(lián)網(wǎng)組成一個(gè)大型的分布式數(shù)據(jù)庫(kù)系統(tǒng),實(shí)現(xiàn)資料的備供存儲(chǔ)、匯交分發(fā)、信息共享。在這種情況下,如何提高數(shù)據(jù)庫(kù)系統(tǒng)的安全性和可靠性,保護(hù)信息資源的安全成為維護(hù)的重點(diǎn)。
2.服務(wù)器管理
總體來(lái)說(shuō),氣象數(shù)據(jù)庫(kù)服務(wù)器系統(tǒng)的管理是整個(gè)系統(tǒng)管理工作中的重中之重,所以AIX和UNIX系統(tǒng)管理對(duì)于管理員來(lái)說(shuō),是必須要掌握的。幾乎所有的數(shù)據(jù)庫(kù)系統(tǒng)都在不停地更新。但并不是所有的更新都有技術(shù)文檔。而一個(gè)求知欲強(qiáng)的數(shù)據(jù)庫(kù)系統(tǒng)管理員將安裝最新版本的數(shù)據(jù)庫(kù)系統(tǒng),并立即開始搜尋那些哪怕是細(xì)微的功能和性能上的差異和增強(qiáng),從而改進(jìn)自己的工作,理解數(shù)據(jù)字典(Data Dictionary)、管理工具(Tools)或者其他支持包(Packages)。
3.關(guān)鍵設(shè)備的維護(hù)和管理
數(shù)據(jù)庫(kù)系統(tǒng)關(guān)鍵設(shè)備包括核心交換機(jī)、核心交換機(jī)、防火墻、服務(wù)器,對(duì)于這些節(jié)點(diǎn)維護(hù)和管理,除了需要經(jīng)驗(yàn)積累外,還通過(guò)一些專用的網(wǎng)絡(luò)管理工具以及自主研發(fā)的軟件來(lái)進(jìn)行監(jiān)控其工作狀態(tài),流量,以便及時(shí)發(fā)現(xiàn)故障,及時(shí)進(jìn)行故障排除。目前在關(guān)鍵網(wǎng)絡(luò)設(shè)備方面,主要掌握cisco、華為3com品牌設(shè)備的配置與管理。
4.用戶以及IP地址的管理
用戶管理是網(wǎng)絡(luò)管理中一個(gè)重點(diǎn)以及難點(diǎn),所涉及的方面非常多,如用戶賬戶、密碼、文件和網(wǎng)絡(luò)訪問(wèn)權(quán)限、用戶權(quán)限、用戶配置文件及用戶安全策略。根據(jù)每個(gè)不同用戶設(shè)置權(quán)限以及密碼,數(shù)據(jù)庫(kù)用戶的管理定期對(duì)管理員等重要用戶密碼進(jìn)行修改,限制WEB服務(wù)器可登陸的賬號(hào)數(shù)量,及時(shí)注銷過(guò)期用戶,關(guān)閉不用的網(wǎng)絡(luò)服務(wù)等 。IP地址管理是網(wǎng)絡(luò)能夠保持高效運(yùn)行的關(guān)鍵。目前使用IPV4版本,在IPV4協(xié)議中,IP地址的分配一般有2種方式,根據(jù)本地網(wǎng)絡(luò)情況,對(duì)于服務(wù)器以及網(wǎng)絡(luò)中成員機(jī)給一個(gè)固定IP,不采用DHCP動(dòng)態(tài)分配。
5.安全策略
第一,系統(tǒng)安全策略:包括了數(shù)據(jù)庫(kù)用戶管理、數(shù)據(jù)庫(kù)操作規(guī)范、用戶認(rèn)證、操作系統(tǒng)安全4個(gè)部分。
(1)數(shù)據(jù)庫(kù)用戶管理。數(shù)據(jù)庫(kù)用戶對(duì)信息訪問(wèn)的最直接途徑就是通過(guò)用戶訪問(wèn)。因此需要對(duì)用戶進(jìn)行嚴(yán)格的管理,只有真正可信的人員才擁有管理數(shù)據(jù)庫(kù)用戶的權(quán)限;
(2)數(shù)據(jù)庫(kù)需要有操作規(guī)范。數(shù)據(jù)庫(kù)中數(shù)據(jù)才是核心,不能有任何的破壞,數(shù)據(jù)庫(kù)管理員是唯一能直接訪問(wèn)數(shù)據(jù)庫(kù)的人員,管理員的操作是非常重要的,因此需要對(duì)數(shù)據(jù)庫(kù)維護(hù)人員培訓(xùn),樹立嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,同時(shí)需要規(guī)范操作流程;
(3)用戶身份的認(rèn)證。Oracle數(shù)據(jù)庫(kù)可以使用主機(jī)操作系統(tǒng)認(rèn)證用戶,也可以使用數(shù)據(jù)庫(kù)的用戶認(rèn)證,從安全角度出發(fā),initSID.ora文件中的remote_os_authent參數(shù)設(shè)成FALSE,以防止沒(méi)有口令的連接。建議將remote_os_roles設(shè)成FALSE,防止欺騙性連接;
(4)操作系統(tǒng)安全。對(duì)于運(yùn)行任何一種數(shù)據(jù)庫(kù)的操作系統(tǒng)來(lái)說(shuō),都需要考慮安全問(wèn)題。數(shù)據(jù)庫(kù)管理員以及系統(tǒng)賬戶的口令都必須符合規(guī)定,不能過(guò)于簡(jiǎn)單而且需要定期的更換口令,對(duì)于口令的安全同樣重要。
6.數(shù)據(jù)庫(kù)日常管理
6.1 日間維護(hù)
(1)檢查已起的所有實(shí)例
查看所有的實(shí)例是否已起 確定數(shù)據(jù)庫(kù)是可用的,把每個(gè)實(shí)例寫入日志并且運(yùn)行日?qǐng)?bào)告或是運(yùn)行測(cè)試 文件。當(dāng)然有一些操作我們是希望它能自動(dòng)運(yùn)行的??蛇x擇執(zhí)行:用ORACLE 管理器中的‘PROBE’事件來(lái)查看。
(2)查找一些新的警告日志
查找新的警告日志文件:
①聯(lián)接每一個(gè)操作管理系統(tǒng)。
②使用‘TELNET’或是可比較程序。
③對(duì)每一個(gè)管理實(shí)例,經(jīng)常的執(zhí)行$ORACLE_ BASE//bdump操作,并使其能回退到控制數(shù)據(jù)庫(kù)的SID。
④在提示下,使用UNⅨ中的‘TAIL’命令查看alert_.log,或是用其他方式檢查文件中最近時(shí)期的警告日志。
⑤如果以前出現(xiàn)過(guò)的一些ORA_ERRORS又出現(xiàn),將它記錄到數(shù)據(jù)庫(kù)恢復(fù)日志中并且仔細(xì)的研究它們,這個(gè)數(shù)據(jù)庫(kù)恢復(fù)日志在〈FILE〉中。
(3)檢查DBSNMP 是否在運(yùn)行
查看DBSNMP 的運(yùn)行情況 檢查每個(gè)被管理機(jī)器的‘DBSNMP’進(jìn)程并將它們記錄到日志中。在UNⅨ中,在命令行中,鍵入ps-ef|grep dbsnmp,將回看到2個(gè)DBSNMP進(jìn)程在運(yùn)行。如果沒(méi)有,重啟DBSNMP。
(4)檢查數(shù)據(jù)庫(kù)備份是否正確
查數(shù)據(jù)庫(kù)備份是否成功。
(5)檢查備份到磁帶中的文件是否正確
檢查備份的磁帶文檔是否成功。
(6)檢查數(shù)據(jù)庫(kù)的性能是否正常合理,是否有足夠的空間和資源
檢查對(duì)合理的性能來(lái)說(shuō)是否有足夠的資源:
①檢查在表空間中有沒(méi)有剩余空間。對(duì)每一個(gè)實(shí)例來(lái)說(shuō),檢查在表空間中是否存在有剩余空間來(lái)滿足當(dāng)天 的預(yù)期的需要。當(dāng)數(shù)據(jù)庫(kù)中已有的數(shù)據(jù)是穩(wěn)定的,數(shù)據(jù)日增長(zhǎng)的平均 數(shù)也是可以計(jì)算出來(lái),最小的剩余空間至少要能滿足每天數(shù)據(jù)的增長(zhǎng)。(a)運(yùn)行‘FREE.SQL’來(lái)檢查表空間的剩余空間。(b)運(yùn)行‘SPACE.SQL’來(lái)檢查表空間中的剩余空間百分率。
②檢查回滾段回滾段的狀態(tài)一般是在線的,除了一些為復(fù)雜工作準(zhǔn)備的專用段,它一般狀態(tài)是離線的。(a)每個(gè)數(shù)據(jù)庫(kù)都有一個(gè)回滾段名字的列表。(b)你可以用V$ROLLSTAT 來(lái)查詢?cè)诰€或是離線的回滾段的現(xiàn)在狀態(tài)。(c)對(duì)于所有回滾段的存儲(chǔ)參數(shù)及名字, 可用DBA_ROLLBACK_SEGS來(lái)查詢。但是它不如V$ROLLSTAT準(zhǔn)確。
③識(shí)別出一些過(guò)分的增長(zhǎng) 查看數(shù)據(jù)庫(kù)中超出資源或是增長(zhǎng)速度過(guò)大的段,這些段的存儲(chǔ)參數(shù)需要調(diào)整。(a)收集日數(shù)據(jù)大小的信息,可以用‘ANALYZE5PCT.SQL’。如果你收集的是每晚的信息,則可跳過(guò)這一步。(b)檢查當(dāng)前的范圍,可用‘NR.EXTENTS.SQL’。(c)查詢當(dāng)前表的大小信息。(d)查詢當(dāng)前索引大小的信息。(e)查詢?cè)鲩L(zhǎng)趨勢(shì)。
④確定空間的范圍。如果范圍空間對(duì)象的NEXT_EXTENT 比表空間所能提供的最大范圍還要大,那么這將影響數(shù)據(jù)庫(kù)的運(yùn)行。如果我們找到了這個(gè)目標(biāo),可以用‘ALTER TABLESPACE COALESCE’調(diào)查它的位置,或加另外的數(shù)據(jù)文件。運(yùn)行‘SPACEBOUND.SQL’。如果都是正常的,將不返回任何行。
⑤回顧C(jī)PU,內(nèi)存,網(wǎng)絡(luò),硬件資源論點(diǎn)的過(guò)程a)檢查CPU的利用情況,進(jìn)到x:.htm =>system metrics=>CPU利用頁(yè),CPU 的最大限度為400,當(dāng)CPU的占用保持在350以上有一段時(shí)間的話,我們就需要查看及研究出現(xiàn)的問(wèn)題。
(7)將文檔日志復(fù)制到備份的數(shù)據(jù)庫(kù)中
將存檔日志復(fù)制到備用數(shù)據(jù)庫(kù)中如果有一個(gè)備用數(shù)據(jù)庫(kù),將適當(dāng)?shù)拇鏅n日志復(fù)制到備用數(shù)據(jù)庫(kù)的期望位置,備用數(shù)據(jù)庫(kù)中保存最 近的數(shù)據(jù)。
(8)要??碊BA用戶手冊(cè)
經(jīng)常查閱DBA用戶手冊(cè)如果有可能的話,要廣泛的閱讀,包括DBA手冊(cè),行業(yè)雜志,新聞組或是郵件列表。
6.2 夜間維護(hù)
晚間維護(hù)程序收集VOLUMETRIC 的數(shù)據(jù)大部分的數(shù)據(jù)庫(kù)產(chǎn)品將受益于每晚確定的檢查進(jìn)程的運(yùn)行。收集VOLUMETRIC數(shù)據(jù),分析計(jì)劃和收集數(shù)據(jù)更準(zhǔn)確的分析計(jì)算并保存結(jié)果。(a)如果你現(xiàn)在沒(méi)有作這些的話,用‘MK VOLFACT.SQL’來(lái)創(chuàng)建測(cè)定體積的表。(b)收集晚間數(shù)據(jù)大小的信息,用‘ANALYZE COMP.SQL’。(c)收集統(tǒng)計(jì)結(jié)果,用‘POP VOL.SQL’。(d)在空閑的時(shí)候檢查數(shù)據(jù),可能的話,每周或每個(gè)月進(jìn)行。
7.總結(jié)
數(shù)據(jù)庫(kù)作為整個(gè)系統(tǒng)的一部分,它的表現(xiàn)直接受服務(wù)器、操作系統(tǒng)、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用程序中SQL語(yǔ)句的質(zhì)量、數(shù)據(jù)庫(kù)設(shè)計(jì)的質(zhì)量、以及其它諸多因素的影響,這些因素加在一起非常復(fù)雜,經(jīng)驗(yàn)在數(shù)據(jù)庫(kù)管理中起著非常重要的作用。
參考文獻(xiàn)
[1]軟件開發(fā)DBA必知7原則 [Z].安徽凱美耐.
[2]DBA(數(shù)據(jù)庫(kù)管理員)應(yīng)該具有什么樣的素質(zhì)[J].
[3]數(shù)據(jù)庫(kù)系統(tǒng)安全策略探析[J].
作者簡(jiǎn)介:陽(yáng)梅(1971—),女,湖南新化人,民航新疆空中交通管理局氣象中心計(jì)算機(jī)工程師,研究方向:計(jì)算機(jī)應(yīng)用開發(fā)。