探究SQL Server 資料頁緩衝區的記憶體瓶頸

才智咖 人氣:1.6W

SQL Server會把經常使用到的資料快取在記憶體裡(就是資料頁快取),用以提高資料訪問速度。因為磁碟訪問速度遠遠低於記憶體,所以減少磁碟訪問量同樣是資料庫優化的重要方面。

探究SQL Server 資料頁緩衝區的記憶體瓶頸

當資料頁快取區出現記憶體不足,則會出現查詢慢,磁碟忙等等問題。

分析方法:主要是用到效能計數器。

檢視如下效能計數器:

1. SQL SERVER:Buffer Manager-Lazy Writes/sec:記憶體不足則會頻繁呼叫Lazy Writer把數資料寫入磁碟,此值會經常不為0.

2. SQL SERVER:Buffer Manager-Page life expectancy:記憶體不足時,此計數器表現為下降趨勢或者一直停留在較低值。

3. SQL SERVER:Buffer Manager-Page reads/sec:記憶體不足時,則查詢那些經常使用但又沒有快取在記憶體裡的資料時,就不需要讀取磁碟,這此值表現為持續上升或者停留在較高值。

4. SQL SERVER:Buffer Manager-Stolen pages:Stolen pages通常用於快取執行計劃,以備重用。記憶體不足時,SQL Server本身機制會優先清除執行計劃快取,則此值表現為下降或者較低水平。

查詢當前使用者任務等待:

複製程式碼 程式碼如下:

select * from rocesses

如果記憶體不足則,會看到較多的ASYNC_IO_COMPLETION等待型別。這是因為記憶體不足時:a.記憶體和磁碟間會頻繁進行互動,磁碟負載增加 b.需要讀取磁碟上的資料完成查詢,磁碟負載增加。

也就是說這時候磁碟也出現了效能瓶頸,但是這只是“表面”的,我們要結合多個性能指標來認清根本原因是“記憶體不足”。

確定壓力來源及解決辦法:

通過前的分析,確定了資料頁快取相關的記憶體瓶頸。就要分析為什麼會這樣及解決辦法。主要分為如下5個方面:

1. 外部壓力

如果OS層面或者其它應用服務需要更多的記憶體,windows會壓縮Database Pages的記憶體量。這時記憶體壓力來自外部。可以檢視如下效能計數器確定是否是外部壓力:

1. SQL Server:Memory Manager-Total Server Memory:此計數器值會下降。

2. Memory:Available Mbytes:此值會下降到較低水平。

3. 在沒有使用AWE或者Lock page in memory前提下,檢視Process:Private Bytes-SqlServer和Process:Working Set-SqlServer,兩者值會有顯著下降。

解決方法:如果非DB專用伺服器,則要權衡各個應用服務之間重要性來分配記憶體或者加大記憶體。儘量讓伺服器只執行SQL Server,成為DB專用伺服器。

2. SQL Server自身對Database Page的使用壓力

當Total Server Memory已經達到設定的Max Server Memory或者無法從OS獲得更多記憶體,但是經常訪問的資料量又遠大於實體記憶體用於資料快取的容量時,SQL Server被迫將記憶體的資料移入又移出,用於完成當前查詢。

觀察如下效能計數器:

1. SQL Server:Memory Manager-Total Server Memory 和 SQL Server:Memory Manager-Target Server Memory兩者值將會相等。但是前者不會大於後者。

2. 將會出現“分析方法”所述之情況。

解決方法:既然SQL Server沒有足夠記憶體存放Database Page,那就要麼增加SQL Server使用的記憶體量或者減少其使用的記憶體裡。

增加:可以通增加實體記憶體,啟用AWE等方法。

減少:可以通過橫向擴充套件,有兩臺或者多臺伺服器分別載部分庫;優化相關讀取量較大的語句等。

3. Buffer Pool中的Stolen Memory壓力

正常情況下Buffer Pool中的Stolen Memory不會給Database Pages造成壓力。因為Database Pages有壓力,會觸發Lazy Writes,同時SQL Server 會清理Stolen Memory中的執行計劃快取。

但是,如果使用者申明瞭過多的物件,而沒有登出,並且佔用記憶體過多,就會壓縮Database Pages.如:遊標,自定義引用的`執行計劃等。

解決方法:通常是會表現為a)使用者提交的請求因記憶體不足無法完成,701錯誤;b)需要壓縮某些clerk的記憶體量,來完成使用者請求,造成響應延時和緩慢。

通過查詢_os_memory_clerks的欄位Single_pages_kb,找出是哪個clerk使用了過多記憶體並分析其原因,然後解決之。

4. Multi-Page的壓力

multi-page跟Buffer Pool共享OS的虛擬地址空間,如果multi-page使用過多記憶體,就會壓縮Datbase pages。multi-page記憶體用量一般較小且相對固定,可能發生的情況有:

a. 未開啟AWE的32位SQL Server只有2G地址空間,且用-g啟動引數擴充套件的MemToLeave的上限。

b. 64位SQL Server調了記憶體洩露的第三方程式碼。

c. 使用帶有大量引數或者較長的”IN”語句

d. 調高了Network Packet Size,大於或等於8KB,並且較多這種連線。

e. 大量複雜XML查詢,或者第三程式碼。

解決方法: 通過查詢_os_memory_clerks的欄位multi_pages_kb,找出是哪個clerk使用了過多記憶體並分析其原因,然後解決之。