包含列組統(tǒng)計信息的 RUNSTATS 列組(Column Group)統(tǒng)計信息將獲得一組列的不同值組合的數(shù)目。通常,DB2 優(yōu)化器可用的基本統(tǒng)計信息不檢測數(shù)據(jù)相關性。列組的使用將給多個謂詞的聯(lián)合選擇提供更準確的估計。列組統(tǒng)計信息假設數(shù)據(jù)是均勻分布的;但還無法獲得列組上的分布統(tǒng)計信息。 較于列組的基數(shù),單個列的基數(shù)(cardinality)的乘積將獲得更好的相關性估計。 下列例子說明了如何使用 RUNSTATS 收集捕獲了列組信息的目錄統(tǒng)計信息:
示例 19:收集捕獲了列組的目錄統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department ON COLUMNS ((deptno, deptname), deptname, mrgno, (admrdept, location)) | 本例中,總共有兩個列組:(deptno, deptname) 和 (admrdept, location)。
包含 LIKE STATISTICS 的 RUNSTATS 當在 RUNSTATS 中指定 LIKE STATISTICS 子句時,將收集附加的列統(tǒng)計信息。這些統(tǒng)計信息存儲在 SYSIBM.SYSCOLUMNS 表里的 SUB_COUNT 和 SUB_DELIM_LENGTH 列中。它們僅針對字符串列進行收集,查詢優(yōu)化器用它們來提高“column LIKE ‘%abc‘”和“column LIKE ‘%abc%‘”類型謂詞的選擇性估計。 下列例子說明了如何使用 RUNSTATS 收集捕獲了 LIKE 統(tǒng)計信息的目錄統(tǒng)計信息:
示例 20:收集所有列上的目錄統(tǒng)計信息并指定 VARCHAR 列上的 LIKE 統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department ON ALL COLUMNS and COLUMNS (deptname LIKE STATISTICS) |
包含統(tǒng)計信息配置文件的 RUNSTATS 現(xiàn)在,可以在 DB2 V8.2 中為 RUNSTATS 建立一個統(tǒng)計信息的配置文件。統(tǒng)計信息配置文件是指一組選項,它預先定義了特定表上將要收集的統(tǒng)計信息。 當將命令參數(shù)“SET PROFILE”添加到 RUNSTATS 命令時,將在表描述符和系統(tǒng)目錄中注冊或存儲統(tǒng)計信息配置文件。若要更新該統(tǒng)計信息配置文件,則可以使用命令參數(shù)“UPDATE PROFILE”。 沒有刪除配置文件的選項。 下列例子展示了如何使用這項功能:
示例 21:只注冊一個統(tǒng)計信息配置文件,不收集目錄統(tǒng)計信息 RUNSTATS ON TABLE db2admin.department AND INDEXES ALL SET PROFILE ONLY | RUNSTATS 中的子句“SET PROFILE ONLY”不收集統(tǒng)計信息。
示例 22:注冊一個統(tǒng)計信息配置文件,并執(zhí)行所存儲統(tǒng)計信息配置文件的 RUNSTATS 命令選項來收集目錄統(tǒng)計信息 RUNSTATS ON TABLE db2admin.department AND INDEXES ALL SET PROFILE |
示例 23:僅修改現(xiàn)有的統(tǒng)計信息配置文件,不收集任何目錄統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department WITH DISTRIBUTION AND INDEXES ALL UPDATE PROFILE ONLY |
示例 24:修改現(xiàn)有的統(tǒng)計信息配置文件,并執(zhí)行已更新的統(tǒng)計信息配置文件的 RUNSTATS 命令選項來收集目錄統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department WITH DISTRIBUTION AND INDEXES ALL UPDATE PROFILE |
示例 25:根據(jù)前面已注冊的統(tǒng)計信息配置文件來查詢 RUNSTATS 選項
SELECT STATISTICS_PROFILE FROM SYSIBM.SYSTABLES WHERE NAME = ‘DEPARTMENT‘ AND CREATOR = ‘DB2ADMIN‘ |
示例 26:使用前面已注冊的統(tǒng)計信息配置文件收集目錄統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department USE PROFILE |
帶有抽樣的 RUNSTATS 隨著數(shù)據(jù)庫快速不斷地增長,通過訪問所有數(shù)據(jù)收集統(tǒng)計信息的能力可能會受到固定的批量窗口、內(nèi)存和 CPU 約束的阻礙。 目前,要運行表上的 RUNSTATS,就要執(zhí)行全表掃描。通過數(shù)據(jù)抽樣,只需掃描數(shù)據(jù)的一個子集即可。 如果一個查詢試圖預計總的趨勢和模式,且某一誤差域(margin of error)內(nèi)的近似答案足以監(jiān)測這些趨勢和模式,那么數(shù)據(jù)抽樣或許是比全表掃描更好的選擇。 在 DB2 V8.1 中,引入了 SAMPLED DETAILED 子句,允許通過抽樣計算詳細的索引統(tǒng)計信息。該子句的使用將減少為獲得詳細索引統(tǒng)計信息而執(zhí)行的后臺計算量和所需的時間,但在大多數(shù)情況下,都會使數(shù)據(jù)足夠的精確。 以下是一些關于該子句的使用的例子:
示例 27:收集兩個索引上的詳細目錄統(tǒng)計信息,但對每個索引條目使用抽樣來代替執(zhí)行詳細的計算
RUNSTATS ON TABLE db2admin.department AND SAMPLED DETAILED INDEXES ALL |
示例 28:收集索引上的詳細抽樣統(tǒng)計信息和表的分布統(tǒng)計信息
RUNSTATS ON TABLE db2admin.department WITH DISTRIBUTION ON KEY COLUMNS AND SAMPLED DETAILED INDEXES ALL | 在 DB2 V8.2 中,提供了對表數(shù)據(jù)進行抽樣的兩種新方法:行級的貝努里(Bernoulli)抽樣和系統(tǒng)頁級的抽樣。
帶有行級貝努里(Bernoulli)抽樣的 RUNSTATS 行 級貝努里(Bernoulli)抽樣利用 sargable(search + argument-able 謂詞是一個可以由數(shù)據(jù)管理器來評估的謂詞)謂詞獲得百分之 P 的表行樣本,在樣本中包含每一行的概率是 P/100,而不包含它的概率則是 1 - P/100。 例如,對于 10% 貝努里(Bernoulli)抽樣,將會選擇 10%(10/100)的行,而拒絕 90%(1-10/100)的行。在貝努里(Bernoulli)抽樣中,每一頁將會引發(fā)一次 I/O,因為要掃描該表。將生成一個隨機數(shù)來確定是否選擇一行(類似于以 P/100 的概率扔錢幣)。即使每一頁都發(fā)生一次 I/O,我們?nèi)匀还?jié)省了處理數(shù)據(jù)所需的 CPU 時間。 在行級貝努里(Bernoulli)抽樣中,需要讀取每一個數(shù)據(jù)頁。然而,它仍然可以帶來極大的性能提高,因 為 RUNSTATS 是 CPU 密集的。如果索引是可用的,那么就會改進抽樣。如果數(shù)據(jù)是群集的,它還可以提供更準確的統(tǒng)計信息(所獲得的樣本更好地代表了整個表數(shù)據(jù))。
帶有系統(tǒng)頁級抽樣的 RUNSTATS 系 統(tǒng)頁級抽樣與行級抽樣類似,除了抽樣的對象是頁面而不是行。以 P/100 的概率選擇每一頁,而以 1 - P/100 的概率拒絕頁的選擇。在所選中的每一頁中,要選擇所有的行。系統(tǒng)頁級抽樣優(yōu)于全表掃描或貝努里(Bernoulli)抽樣的地方是它節(jié)省了 I/O。 抽樣頁也是預取的,所以該方法將比行級貝努里(Bernoulli)抽樣更快。與不進行抽樣相比,頁級抽樣極大地提高了性能。 RUNSTATS repeatable 子句允許通過 RUNSTATS 語句生成相同的樣本,只要表數(shù)據(jù)沒有發(fā)生更改。為了指定該選項,用戶還必須提供一個整數(shù),以表示將用于生成樣本的種子(seed)。通過使用相同的種子,可以生成相同的樣本。 總之,統(tǒng)計信息的準確性取決于抽樣率、數(shù)據(jù)傾斜(data skew)以及用于數(shù)據(jù)抽樣的數(shù)據(jù)群集。 下面是一些使用貝努里(Bernoulli)行級和系統(tǒng)頁級抽樣的 RUNSTATS 例子:
示例 29:收集統(tǒng)計信息,包含 10% 行上的分布統(tǒng)計信息 RUNSTATS ON TABLE db2admin.department WITH DISTRIBUTION TABLESAMPLE BERNOULLI (10) |
示例 30:為了控制收集統(tǒng)計信息的樣本集,以及可以重復使用相同的樣本集,需要使用下列語句:
RUNSTATS ON TABLE db2admin.department WITH DISTRIBUTION TABLESAMPLE BERNOULLI (10) REPEATABLE (1024) |
示例 31:收集 10% 的數(shù)據(jù)頁上的索引統(tǒng)計信息和表統(tǒng)計信息。請注意,只對表數(shù)據(jù)頁進行抽樣,而不是索引頁。本例中,10% 的表數(shù)據(jù)頁用于表統(tǒng)計信息的收集,而對于索引統(tǒng)計信息,將使用所有的索引頁。
RUNSTATS ON TABLE db2admin.department AND INDEXES ALL TABLESAMPLE SYSTEM (10) |
收集目錄統(tǒng)計信息的可供選擇的方法 對于數(shù)據(jù)庫中的所有表,收集統(tǒng)計信息的一個可供選擇的方法就是發(fā)出一條 REORGCHK 命令,如下所示:
示例 32:使用 REORGCHK 收集所有表的目錄統(tǒng)計信息
REORGCHK UPDATE STATISTICS ON TABLE ALL | reorgchk 命令的 update statistics 選項的作用類似于調(diào)用 RUNSTATS 例程來更新數(shù)據(jù)庫中所有表的目錄統(tǒng)計信息,但是所有列上的統(tǒng)計信息只能通過默認的 RUNSTATS 選項來收集。通過使用該命令,還可以收集單個表上或同一模式下一組表的統(tǒng)計信息。
示例 33:使用 REORGCHK 收集一個表的目錄統(tǒng)計信息 REORGCHK UPDATE STATISTICS ON TABLE db2admin.department |
示例 34:使用 REORGCHK 收集一個模式的目錄統(tǒng)計信息
REORGCHK UPDATE STATISTICS ON SCHEMA systools | 雖然該方法看上去是一種在多個表上收集目錄統(tǒng)計信息的快速方法,但是僅僅當 REORGCHK 可以在合理的時間內(nèi)完成執(zhí)行時,該方法才是可取的。 在表的 LOAD REPLACE 期間以及索引的創(chuàng)建期間,也可以進行目錄統(tǒng)計信息的收集。 在 UDB V8.2 中,為了在 LOAD 期間調(diào)用目錄統(tǒng)計信息的收集,必須將選項“STATISTICS USE PROFILE”添加到 LOAD 控制語句中。選項“STATISTICS YES”仍然有用,但它現(xiàn)在已是過時的語法。若在表的 LOAD 之后在同一表上執(zhí)行 RUNSTATS,那么在 LOAD 期間發(fā)出“STATISTICS USE PROFILE”的目的就是為了減少正常運行過程中占用的時間。在執(zhí)行 load 之前,就必須創(chuàng)建統(tǒng)計信息配置文件,它現(xiàn)在允許指定與 RUNSTATS 命令中相同的統(tǒng)計信息選項。
示例 35:使用 LOAD 命令和 STATISTICS USE PROFILE 子句收集目錄統(tǒng)計信息
LOAD FROM inputfile.del OF DEL REPLACE INTO db2admin.department STATISTICS USE PROFILE | 大多數(shù)情況下,RUNSTATS 是在創(chuàng)建索引之后執(zhí)行的。然而,在執(zhí)行索引創(chuàng)建操作時,也能收集索引的統(tǒng)計信息。這將避免為了收集統(tǒng)計信息而進行的另一項索引掃描。下列例子說明了完成這項工作可以使用的一些選項:
示例 36:收集基本的索引目錄統(tǒng)計信息:
CREATE INDEX db2admin.inx1 ON db2admin.department (deptno) COLLECT STATISTICS |
示例 37:收集擴展的索引目錄統(tǒng)計信息:
CREATE INDEX db2admin.inx2 ON db2admin.department (deptname) COLLECT DETAILED STATISTICS |
示例 38:收集擴展的索引目錄統(tǒng)計信息,指定使用抽樣:
CREATE INDEX db2admin.inx3 ON db2admin.department (deptname) COLLECT SAMPLED DETAILED STATISTICS |
包含授權和用戶訪問的 RUNSTATS 為了可以對一個表或索引收集統(tǒng)計信息,必須能夠連接到包含該表和索引的數(shù)據(jù)庫,并具有下列授權級別之一: - sysadm
- sysctrl
- sysmaint
- dbadm
- 表上的 CONTROL 權限
當對一個表運行 RUNSTATS 時,有兩種用戶訪問選項:允許讀訪問和允許寫訪問。 在 RUNSTATS 命令中的參數(shù) ALLOW READ ACCESS 指定計算統(tǒng)計信息時,其他用戶可以只讀地訪問該表。 在 RUNSTATS 命令中的參數(shù) ALLOW WRITE ACCESS 指定計算統(tǒng)計信息時,其他用戶可以讀取或?qū)懭朐摫?。如果該表在任何時刻都必須是可用的,那么應該使用該子句。
分區(qū)數(shù)據(jù)庫中的 RUNSTATS 當 在一個分區(qū)數(shù)據(jù)庫中發(fā)出 RUNSTATS 命令,并且一個表分區(qū)位于發(fā)出 RUNSTATS 的數(shù)據(jù)庫分區(qū)中時,那么 RUNSTATS 將在該數(shù)據(jù)庫分區(qū)上執(zhí)行。如果表分區(qū)不在該數(shù)據(jù)庫分區(qū)上,那么將請求發(fā)送給數(shù)據(jù)庫分區(qū)組中持有該表分區(qū)的第一個數(shù)據(jù)庫分區(qū)。然后,在該數(shù)據(jù)庫分區(qū)上執(zhí)行 RUNSTATS 命令。 RUNSTATS 不是在分區(qū)的數(shù)據(jù)庫中并行運行的,但對一個分區(qū)確定信息,然后對所有分區(qū)推斷出合適的估計值。有一個隱式的假設:每個表中的行是均勻分布在每個多分區(qū)數(shù)據(jù)庫分區(qū)組中的所有分區(qū)上的。 下列 IBM 技術札記(technote)談到了加載一個表時運行 RUNSTATS 可能碰到的問題。其解決方案就是確保在加載表之前,為該表定義一個分區(qū)鍵(partitioning key)。 IBM Technote # 1153232(2004-02-12): “加載表之后,Runstats 將多分區(qū)實例上 syscat.tables 中的列 CARD 更新為零行。 摘要 如果加載某一給定表之后,其中一個分區(qū)的行數(shù)為零,并且將從該分區(qū)執(zhí)行 runstats,那么該命令將更新 syscat. 表中的列 CARD,顯示該表的行數(shù)為零。這只對多分區(qū)的實例有影響。 內(nèi)容 runstats 的行為使其將使用運行它的分區(qū)上的數(shù)據(jù)來推測該表中的行數(shù)。例如,如果加載之后所有數(shù)據(jù)都在一個分區(qū)上,并從另一分區(qū)執(zhí)行 runstats,那么該命令將更新 syscat.tables 來表示該表的行數(shù)為零。然而,如果是從保存所有數(shù)據(jù)的分區(qū)運行 runstats,那么它將更新 syscat.tables 來展示該表包含((該分區(qū)上的行數(shù))x(分區(qū)數(shù)目))行。 為了避免 runstats 的行為默認行為,需要在加載表之前,為該表定義分區(qū)鍵(partitioning key)。分區(qū)鍵需要位于高度惟一的一列或一組列上,從而確保數(shù)據(jù)均勻分布在該表所定義的所有分區(qū)上?!?
調(diào)整 STAT_HEAP_SZ 數(shù)據(jù)庫配置參數(shù) stat_heap_sz 或統(tǒng)計信息堆大小的數(shù)據(jù)庫配置參數(shù)指定了使用 RUNSTATS 命令收集統(tǒng)計信息中所用堆的最大尺寸。它是在啟動 RUNSTATS 實用程序時分配的,然后當它完成時釋放。stat_heap_sz 是代理私有內(nèi)存的一部分。因此,在收集分布統(tǒng)計信息時,最好增大 stat_heap_sz 參數(shù),以便能將更多的列放入這個堆中。處理較寬的表也需要更多的內(nèi)存。當執(zhí)行包含 SAMPLED DETAILED 選項的 RUNSTATS 時,必須額外分配 2 MB 內(nèi)存,以確保 RUNSTATS 能夠成功運行。
減小 RUNSTATS 對系統(tǒng)性能影響的策略 您可以使用下列策略來幫助減小 RUNSTATS 對于系統(tǒng)的性能影響: - 一次僅在少數(shù)表和索引上運行 RUNSTATS,在整組表中循環(huán)運行。
- 僅指定將收集其數(shù)據(jù)分布統(tǒng)計信息的那些列。僅指定那些謂詞中所使用的列。
- 對于不同的表,在不同的分區(qū)上實現(xiàn)多個并發(fā)的 RUNSTATS。
- 僅在那些影響當前工作負載的關鍵表上執(zhí)行 RUNSTATS。避免在不需要它的表上運行 RUNSTATS。
- 根據(jù)表中數(shù)據(jù)發(fā)生改變的速度,調(diào)整 RUNSTATS 的頻率。
- 根據(jù) RUNSTATS 在該表上完成運行的速度,調(diào)整 RUNSTATS 的頻率和細節(jié)。
- 僅在系統(tǒng)活動量少的時候,安排執(zhí)行 RUNSTATS。
- 調(diào)整(Throttle)RUNSTATS,以便最大程度地減少它對系統(tǒng)的需求。
僅在系統(tǒng)活動量少的時候安排執(zhí)行 RUNSTATS,這是最大程度地減少系統(tǒng)影響的一個好方法。然而,對于一個 24 x 7 的系統(tǒng),系統(tǒng)中可能沒有可用的窗口或活動量少的時候。處理該情形的一種方法就是使用 RUNSTATS 的 throttling 選項。 throttling 選項將根據(jù)當前的數(shù)據(jù)庫活動級別,來限制實用程序所占有的資源數(shù)量。UDB 中,在調(diào)整時,util_impact_lim 與 UTIL_IMPACT_PRIORITY 參數(shù)的交互確定了 RUNSTATS 的行為。UTIL_IMPACT_PRIORITY 關鍵字被用于諸如 RUNSTATS 的實用程序命令的子句中,而 util_impact_lim 則是一個實例配置參數(shù)。 util_impact_lim 參數(shù)是指允許所有已調(diào)整實用程序?qū)τ趯嵗墓ぷ髫撦d產(chǎn)生影響的百分比。如果 util_impact_lim 是 100(默認值),則不用調(diào)整諸如 RUNSTATS 之類的實用程序調(diào)用。例如,如果將 util_impact_lim 設置為 10,那么已調(diào)整的 RUNSTATS 調(diào)用就被限定在消耗 10% 以下的工作負載。 UTIL_IMPACT_PRIORITY 關鍵字可充當一個開關,它指定 RUNSTATS 是否訂閱調(diào)整策略。
示例 39:UTIL_IMPACT_PRIORITY 關鍵字的使用 RUNSTATS ON TABLE db2admin.department AND INDEXES ALL UTIL_IMPACT_PRIORITY 10 | 其中,10 是調(diào)整 RUNSTATS 的優(yōu)先權或級別。 當 util_impact_lim 不是 100,而且用 UTIL_IMPACT_PRIORITY 調(diào)用 RUNSTATS 時,將會對該值進行調(diào)整。如果沒有為 UTIL_IMPACT_PRIORITY 指定優(yōu)先權,且 util_impact_lim 不是 100,那么 RUNSTATS 將使用默認的優(yōu)先權 50,并將據(jù)此進行調(diào)整。如果在 RUNSTATS 命令中省略 UTIL_IMPACT_PRIORITY 關鍵字,那么可以不加調(diào)整地運行 RUNSTATS。如果指定了優(yōu)先權,但是將 util_impact_limit 設置為 100,也可以不加調(diào)整地運行 RUNSTATS。如果將優(yōu)先權設置為零,也能不加調(diào)整地運行 RUNSTATS。 當定義了 RUNSTATS 調(diào)整(throttling),并且該調(diào)整可操作時,RUNSTATS 實用程序預計將花費更長時間,但是對系統(tǒng)產(chǎn)生的影響會少一些。
RUNSTATS 的其他問題 已聲明的全局臨時表上的 RUNSTATS 可 以在已聲明的全局臨時表(DGTT)上發(fā)出 RUNSTATS 命令,但是結(jié)果的統(tǒng)計信息不存儲在系統(tǒng)目錄中,因為聲明的臨時表條目沒有目錄條目。這些統(tǒng)計信息存儲在表示聲明的臨時表的目錄信息的內(nèi)存結(jié)構(gòu)中。如果整個 查詢經(jīng)過時間中所節(jié)省的時間比完成 RUNSTATS 所增加的時間大得多,就建議發(fā)出 RUNSTATS。 可以在 SQL 例程(過程、UDF 和方法)中發(fā)出 RUNSTATS 命令嗎? 下列 IBM 技術札記(technote)討論了該問題: IBM Technote # 1153051 “既不能從 SQL 例程(過程、UDF、方法)、SQL 動態(tài)復合語句發(fā)出 RUNSTATS 命令,也不能使用從 SQL 例程中發(fā)出的操作系統(tǒng)調(diào)用來發(fā)出該命令。如果需要發(fā)出 RUNSTATS 命令,那么可以直接從命令行處理器(Command Line Processor,CLP)發(fā)出它,或者通過使用 db2Runstats() API 函數(shù)(DB2 8.1 開始)從客戶機應用程序或外部語言例程發(fā)出它,以及通過 LOAD 和 CREATE INDEX 語句發(fā)出該命令?!? 可以創(chuàng)建一個名為“runstats”的 C 存儲過程,調(diào)用 db2Runstats() API 函數(shù)。然后,可以使用 CALL 命令調(diào)用這個 C 存儲過程。 如何通過調(diào)用級接口(CLI)或 Java 執(zhí)行 RUNSTATS 來收集統(tǒng)計信息? 下列 IBM 技術札記回答了該問題: IBM Technote # 1023788: “DB2 管理 API(編程接口)sqlustat 可以用于從 DB2 應用程序發(fā)出 RUNSTATS,例如寫入調(diào)用級接口的應用程序。DB2 Administrative API Reference 手冊中描述了 sqlustat?!?
DB2 自動統(tǒng)計信息收集 DB2 自動統(tǒng)計信息收集是在 DB2 UDB Version 8.2 中引入的。自動統(tǒng)計信息收集是完全自動表維護解決方案的一部分。其目標是允許 DB2 確定工作負載需要哪些統(tǒng)計信息,并定期在后臺自動運行 RUNSTATS 實用程序,以便按需更新統(tǒng)計信息。 為了設置 SAMPLE 數(shù)據(jù)庫自動進行統(tǒng)計信息收集,需要為自動維護開關設置數(shù)據(jù)庫配置參數(shù),如下所示: db2 update db cfg for SAMPLE using AUTO_MAINT ON db2 update db cfg for SAMPLE using AUTO_TBL_MAINT ON db2 update db cfg for SAMPLE using AUTO_RUNSTATS ON | 下圖(只顯示統(tǒng)計信息收集和配置選項)展示了統(tǒng)計信息收集和配置的自動維護命令的層次結(jié)構(gòu)和相關性。在該結(jié)構(gòu)中,可以在最高層次快速關閉自動維護參數(shù) AUTO_MAINT,而不丟失較低層的配置設置,比如 AUTO_RUNSTATS。
圖 1. 自動維護設置 如 果需要自動統(tǒng)計信息配置,那么可以打開參數(shù) AUTO_STATS_PROF 和 AUTO_PROF_UPD。自動統(tǒng)計信息配置則通過確定何時和如何收集統(tǒng)計信息更進了一步。統(tǒng)計信息配置文件是自動生成的,自動統(tǒng)計信息收集過程將用它 來調(diào)度 RUNSTATS??梢杂脙?nèi)部算法來比較新收集的統(tǒng)計信息與已保存的一組統(tǒng)計信息,并基于某些觸發(fā)條件發(fā)出包含抽樣的 RUNSTATS。 當啟用自動統(tǒng)計信息配置時,數(shù)據(jù)庫活動的有關信息被收集并存儲在查詢反饋倉庫中。然后,基于查詢反饋倉庫中的數(shù)據(jù)生成統(tǒng)計配置文件。 為了允許自動生成統(tǒng)計信息配置文件,需要設置兩個數(shù)據(jù)庫配置參數(shù): - db2 update db cfg for SAMPLE using AUTO_STATS_PROF ON
打開該參數(shù)將啟動查詢反饋數(shù)據(jù)的收集。 - db2 update db cfg for SAMPLE using AUTO_PROF_UPD ON
打開該參數(shù),指定使用分析查詢反饋數(shù)據(jù)的 DB2 中的建議來更新 RUNSTATS 配置文件。 在觸發(fā)自動統(tǒng)計信息配置之前,必須通過運行 SYSINSTALLOBJECTS 存儲過程創(chuàng)建查詢反饋倉庫。 按照下列方式調(diào)用該存儲過程: call SYSINSTALLOBJECTS ( toolname , action , tablespacename , schemaname ) | 其中,toolname 是“ASP”或“AUTO STATS PROFILING”,對于 action,“C”表示創(chuàng)建,“D”表示刪除。 目前,不使用參數(shù) schemaname。 例如,要創(chuàng)建反饋倉庫,需要運行下列存儲過程: call SYSINSTALLOBJECTS (‘ASP‘, ‘C‘, ‘USERSPACE1‘, ‘‘) | 該過程將創(chuàng)建下列表、存儲建議以及與查詢執(zhí)行過程中碰到的謂詞有關的信息: - SYSTOOLS.OPT_FEEDBACK_QUERY
- SYSTOOLS.OPT_FEEDBACK_PREDICATE
- SYSTOOLS.OPT_FEEDBACK_PREDICATE_COLUMN
- SYSTOOLS.OPT_FEEDBACK_RANKING
- SYSTOOLS.OPT_FEEDBACK_RANKING_COLUMN
當禁用 AUTO_PROF_UPD 參數(shù)時,可以將建議存儲在 SYSTOOLS.OPT_FEEDBACK_RANKING 表中。然后,當手動更新 RUNSTATS 配置文件時,就可以查看該表中所存儲的建議。 DB2 自動統(tǒng)計信息收集和配置生成只能在 DB2 串行模式下啟用;它們在聯(lián)邦的、SMP 和 MPP 環(huán)境中是不可用的。
結(jié)束語 理 解并正確使用 RUNSTATS 是維護高性能數(shù)據(jù)庫的關鍵之一。本文討論了 RUNSTATS 的重要性,并解釋了許多使 RUNSTATS 更有用的可用選項,其中包括 V8.2 中的一些新選項,通過允許建立指定需要為每個表收集哪些統(tǒng)計信息的配置文件,這些新選項簡化了管理。我所展示的示例將使您易于使用 RUNSTATS 獲得最佳的數(shù)據(jù)庫性能。
參考資料
|