一、Update Statistics的作用
為了提高數(shù)據(jù)庫的效率,INFORMIX提供了一個(gè)基于成本的查詢優(yōu)化器,執(zhí)行update statistics語句的作用就是將您創(chuàng)建的數(shù)據(jù)庫表的有關(guān)統(tǒng)計(jì)信息更新到系統(tǒng)sysmaster的相關(guān)表中(如systables、syscolumns、sysindexes、sysdistrib、sysprocplan等),以便查詢優(yōu)化器選擇最佳的執(zhí)行路徑。當(dāng)sysmaster庫中沒有相應(yīng)的統(tǒng)計(jì)信息,或者統(tǒng)計(jì)信息不十分準(zhǔn)確時(shí),優(yōu)化器便無法制定一個(gè)行之有效的查詢策略,其結(jié)果必然是進(jìn)行大量極其可怕的順序掃描,產(chǎn)生嚴(yán)重的性能問題。
因此,當(dāng)您重新裝載數(shù)據(jù)或者對數(shù)據(jù)庫表進(jìn)行了大量的更新操作后,應(yīng)該及時(shí)執(zhí)行update statistics。也許您會發(fā)現(xiàn),數(shù)據(jù)庫一些參數(shù)配置的不合理可能使數(shù)據(jù)庫效率降低百分之幾,但如果您沒有定期執(zhí)行update statistics的話。數(shù)據(jù)庫的性能則可能降低幾到十幾倍。
二、Update Statistics的語法
執(zhí)行update statistics共有三個(gè)級別,即:update statistics low、updates tatistics medium、update statistics high。
1 update statistics[low]for table[{table-name|synonym-name}[(column-list)]]][drop distributions]
update statistics low只更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息,對字段的分布情況不做統(tǒng)計(jì)。其語法說明如下:
(1)update statistics或update statistics low,對當(dāng)前數(shù)據(jù)庫中所有表(包括系統(tǒng)表)及過程進(jìn)行更新統(tǒng)計(jì)。
(2)update statistics low for table,對當(dāng)前數(shù)據(jù)庫中所有表(包括臨時(shí)表,但不包括系統(tǒng)表)進(jìn)行更新統(tǒng)計(jì)。
(3)update statistics low for table tablename,對指定的表所有字段進(jìn)行更新統(tǒng)計(jì)。
(4)update statistics low for table tablename(column-list),對指定表的指定字段進(jìn)行更新統(tǒng)計(jì)。
(5)如果不帶drop distributions,原有字段分布情況依然保留;否則,原有字段分布情況將被刪除。
2 update statistics medium[for table[{table-name|synonym-name}[(column-list)]]][resolution percent[conf]][distributions only]
update statistics medium除了更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息外,對字段的分布情況會采取抽樣的辦法來統(tǒng)計(jì),因此與update statistics low相比需要花費(fèi)更多的時(shí)間。其語法說明如下:
(1)resolution percent是指分布統(tǒng)計(jì)的詳細(xì)程序,percent定義的是一個(gè)百分?jǐn)?shù),如resolution2意思是指按照字段的值分布統(tǒng)計(jì)成50段,如果不指定resolution percent,缺省值為2.5。
(2)conf是指分布統(tǒng)計(jì)時(shí)取樣的比例,conf參數(shù)的取值范圍為0.80—0.99,缺省值為0.95。
(3)如果指定了distributions only,則對索引的信息不做更新統(tǒng)計(jì)。
3 update statistics high[for table[{table-name|synonym-name}[(column-list]]][resolutionpercent][distributions only]
update statistics high與update statistics medium的區(qū)別是在統(tǒng)計(jì)字段的分布情況時(shí),后者采用了取樣的辦法,而前者進(jìn)行全部統(tǒng)計(jì),因此update statistics high更新統(tǒng)計(jì)最全面,執(zhí)行時(shí)間也最長。其語法說明如下:
(1)如果不指定resolution percent,缺省值為0.5。
(2)如果指定了distributions only,則對索引的信息不做更新統(tǒng)計(jì)。
4 update statistics for procedure[procedure-name],只對指定的過程進(jìn)行更新統(tǒng)計(jì),對表不做更新統(tǒng)計(jì)
三、如何執(zhí)行Update Statistics
通常執(zhí)行update statistics的方法是:
1 對表中不帶索引的字段執(zhí)行update statistics medium,每個(gè)表執(zhí)行一次。一般情況下,缺省參數(shù)就足夠了。對于特別大的表(執(zhí)行update statistics時(shí),通常把超過26570條記錄的表定義為特別大的表),可以帶參數(shù)resolution1.00.99。
2 對表中帶有索引的字段執(zhí)行update statistics high,每個(gè)字段執(zhí)行一次。
3 對表中帶有復(fù)合索引的字段執(zhí)行update statistics low,每個(gè)表執(zhí)行一次。
4 對每一個(gè)小表執(zhí)行update statistics high。
四、注意事項(xiàng)
1 數(shù)據(jù)庫本身不會自動更新sysmaster庫中有關(guān)statistics統(tǒng)計(jì)信息,只有執(zhí)行update statistics語句后,才能得到更新。
2 執(zhí)行update statistics語句時(shí),必須具有DBA權(quán)限或者為表的屬主。
3 由于update statistics通常為單線程運(yùn)行,不能利用PDQ等并發(fā)功能,對于一個(gè)較大的數(shù)據(jù)庫,執(zhí)行update statistics語句一般需要幾個(gè)小時(shí)。為提高效率,可以將update statistics分為多個(gè)shell程序同時(shí)執(zhí)行,并充分考慮數(shù)據(jù)空間分布情況,在并發(fā)執(zhí)行時(shí)減少磁盤讀寫的沖突。
4 執(zhí)行update statistics語句會占用一些臨時(shí)空間,當(dāng)臨時(shí)空間不夠時(shí),數(shù)據(jù)庫將提示錯(cuò)誤。您可以通過設(shè)置DBUPSPACE環(huán)境變量,使update statistics在遇到臨時(shí)空間不夠時(shí)分步來執(zhí)行排序統(tǒng)計(jì)。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。