用 Sql Server Profiler 來跟蹤頁面訪問的時 SQL 的執(zhí)行情況,因為應用程序很簡單,頁面加載的時候,跟蹤檢測到三個 SQL 執(zhí)行,看了下也沒什么問題(兩個獲取數(shù)量,一個獲取列表),數(shù)量獲取的 SQL,這個應該執(zhí)行會很快,所以把分析焦點放在了那個獲取列表的 SQL 上,因為 SQL 沒什么問題,那應該是關于這條 SQL 建的索引有問題。注:上面所說項目中大概有 100 萬的數(shù)據(jù)。
關于數(shù)據(jù)庫中的索引概念,記得在很早之前整理了一篇博文《T-Sql(八)字段索引和數(shù)據(jù)加密》,現(xiàn)在來看,寫的真是一坨屎,概念講的再多沒個毛用,關鍵在于對實際應用中產(chǎn)生問題的分析。在研究這個問題之前,搜了一些相關資料,主要來自園中的幾位 SQL Server 大神(CareySon、樺仔、聽風吹雨等),稍微看了下,關于索引,主要是一些數(shù)據(jù)庫專業(yè)術語,看的不是很明白,作為程序員,我們知道索引分為聚集性索引和非聚集性索引,聚集性索引一般為主鍵(也可以不是),在創(chuàng)建表的時候會自動創(chuàng)建,針對上面我那個應用查詢問題,查詢條件是一些非主鍵字段,所以這邊探討下非聚集性索引。
我不會說一些數(shù)據(jù)庫概念,所以只能用做一些實踐來理解概念的意義,以下應用場景中的用例是虛擬出來的,只是作為個人研究使用。
程序員應該有刨根問底的怪癖,雖然這是個數(shù)據(jù)庫問題。
應用場景
有一個 Product 表,字段如下:
數(shù)據(jù)添加腳本:
begin tran
declare @index int
set @index=0
while(@index<1000000)
begin
insert into [dbo].[Product]([Name],Remarks,ProviderID,[Time],[State])
values('我是測試標題1','我是測試備注1我是測試備注1我是測試備注1我是測試備注1我是測試備注1我是測試備注1',1,GETDATE(),0)
insert into [dbo].[Product]([Name],Remarks,ProviderID,[Time],[State])
values('我是測試標題2','我是測試備注2我是測試備注2我是測試備注2我是測試備注2我是測試備注2我是測試備注2',1,GETDATE(),1)
insert into [dbo].[Product]([Name],Remarks,ProviderID,[Time],[State])
values('我是測試標題3','我是測試備注3',3,GETDATE(),1)
insert into [dbo].[Product]([Name],Remarks,ProviderID,[Time],[State])
values('我是測試標題4','我是測試備注4我是測試備注4我是測試備注4我是測試備注4我是測試備注4我是測試備注4',4,GETDATE(),1)
set @index=@index+1
end
commit
Product 表中插入了四百萬的數(shù)據(jù),為了接近我們現(xiàn)實生產(chǎn)環(huán)境,所以對數(shù)據(jù)進行了不同插入。
一般應用環(huán)境查詢,有時候我們會針對一個字段進行 where 查詢,有時候也會 and 另一個字段進行查詢,這個時候,關于這兩個字段的索引怎么建?還是不需要建?是分別建兩個?還是建一個組合的?其實說真的,可能看到這的數(shù)據(jù)庫大神會莞爾一笑,但是作為程序員,這些我真不知道,搜索的資料中也并沒有對這些雞毛蒜皮進行的說明,沒辦法,只能自己瞎折騰下。我們下面要做是 ProviderID 和 State 的查詢操作,有分別查詢,也有組合查詢,然后我們再對 Product 表建立這兩個字段的索引,看看有什么不同之處?還有就是針對不同的索引方式,查詢又會有什么不同?我們睜大眼睛來看一下。
問題分析
我再對上面的分析進行說明下,首先,查詢主要為2種:
where ProviderID=?
where ProviderID=? and State=?
非聚集性索引的創(chuàng)建主要為3種:
不創(chuàng)建索引
ProviderID 字段索引
ProviderID 和 State 字段索引
針對這個應用場景和上面的分析,會得出 3*2 六種結果,其實我最想知道的是下面的第三種,即創(chuàng)建一個組合字段索引,對單個字段的查詢會不會有影響?還有就是反過來,單個字段的索引創(chuàng)建,對組合字段查詢會不會有影響?當然試過了才知道,看一下執(zhí)行結果。
執(zhí)行結果
測試腳本:
declare @begin_date datetime
declare @end_date datetime
select @begin_date = getdate()
select * from [dbo].[Product] where ...
select @end_date = getdate()
select datediff(ms,@begin_date,@end_date) as '用時/毫秒'
為了接近測試結果,每次語句執(zhí)行三次,然后再取平均值,截圖太麻煩了,這邊就直接貼下執(zhí)行結果。
不創(chuàng)建索引
where ProviderID=1(二百萬數(shù)據(jù))
執(zhí)行結果:13806毫秒,13380毫秒,12730毫秒
平均結果:13305毫秒
where ProviderID=1 and State=1(一百萬數(shù)據(jù))
執(zhí)行結果:6556毫秒,6613毫秒,6706毫秒
平均結果:6625毫秒
創(chuàng)建索引字段 ProviderID
where ProviderID=1
執(zhí)行結果:13840毫秒,14163毫秒,15853毫秒
平均結果:14618毫秒
where ProviderID=1 and State=1
執(zhí)行結果:7033毫秒,7220毫秒,7023毫秒
平均結果:7152毫秒
結果分析
雖然測試的有些不完整,但是看到結果,哥有些凌亂了(建了索引,性能反而會降低?),難道是我插入的數(shù)據(jù)有問題?還是創(chuàng)建索引有問題?還是我人品有問題???坐等數(shù)據(jù)庫大神指教。
更多信息請查看IT技術專欄