一、什么是WAL?
WAL的全稱是Write Ahead Logging,它是很多數(shù)據(jù)庫(kù)中用于實(shí)現(xiàn)原子事務(wù)的一種機(jī)制,SQLite在3.7.0版本引入了該特性。
二、WAL如何工作?
在引入WAL機(jī)制之前,SQLite使用rollback journal機(jī)制實(shí)現(xiàn)原子事務(wù)。
rollback journal機(jī)制的原理是:在修改數(shù)據(jù)庫(kù)文件中的數(shù)據(jù)之前,先將修改所在分頁(yè)中的數(shù)據(jù)備份在另外一個(gè)地方,然后才將修改寫(xiě)入到數(shù)據(jù)庫(kù)文件中;如果事務(wù)失敗,則將備份數(shù)據(jù)拷貝回來(lái),撤銷(xiāo)修改;如果事務(wù)成功,則刪除備份數(shù)據(jù),提交修改。
WAL機(jī)制的原理是:修改并不直接寫(xiě)入到數(shù)據(jù)庫(kù)文件中,而是寫(xiě)入到另外一個(gè)稱為WAL的文件中;如果事務(wù)失敗,WAL中的記錄會(huì)被忽略,撤銷(xiāo)修改;如果事務(wù)成功,它將在隨后的某個(gè)時(shí)間被寫(xiě)回到數(shù)據(jù)庫(kù)文件中,提交修改。
同步WAL文件和數(shù)據(jù)庫(kù)文件的行為被稱為checkpoint(檢查點(diǎn)),它由SQLite自動(dòng)執(zhí)行,默認(rèn)是在WAL文件積累到1000頁(yè)修改的時(shí)候;當(dāng)然,在適當(dāng)?shù)臅r(shí)候,也可以手動(dòng)執(zhí)行checkpoint,SQLite提供了相關(guān)的接口。執(zhí)行checkpoint之后,WAL文件會(huì)被清空。
在讀的時(shí)候,SQLite將在WAL文件中搜索,找到最后一個(gè)寫(xiě)入點(diǎn),記住它,并忽略在此之后的寫(xiě)入點(diǎn)(這保證了讀寫(xiě)和讀讀可以并行執(zhí)行);隨后,它確定所要讀的數(shù)據(jù)所在頁(yè)是否在WAL文件中,如果在,則讀WAL文件中的數(shù)據(jù),如果不在,則直接讀數(shù)據(jù)庫(kù)文件中的數(shù)據(jù)。
在寫(xiě)的時(shí)候,SQLite將之寫(xiě)入到WAL文件中即可,但是必須保證獨(dú)占寫(xiě)入,因此寫(xiě)寫(xiě)之間不能并行執(zhí)行。
WAL在實(shí)現(xiàn)的過(guò)程中,使用了共享內(nèi)存技術(shù),因此,所有的讀寫(xiě)進(jìn)程必須在同一個(gè)機(jī)器上,否則,無(wú)法保證數(shù)據(jù)一致性。
三、WAL的優(yōu)點(diǎn)與缺點(diǎn)
優(yōu)點(diǎn):
1.讀和寫(xiě)可以完全地并發(fā)執(zhí)行,不會(huì)互相阻塞(但是寫(xiě)之間仍然不能并發(fā))。
2.WAL在大多數(shù)情況下,擁有更好的性能(因?yàn)闊o(wú)需每次寫(xiě)入時(shí)都要寫(xiě)兩個(gè)文件)。
3.磁盤(pán)I/O行為更容易被預(yù)測(cè)。
缺點(diǎn):
1.訪問(wèn)數(shù)據(jù)庫(kù)的所有程序必須在同一主機(jī)上,且支持共享內(nèi)存技術(shù)。
2.每個(gè)數(shù)據(jù)庫(kù)現(xiàn)在對(duì)應(yīng)3個(gè)文件:<yourdb>.db,<yourdb>-wal,<yourdb>-shm。
3.當(dāng)寫(xiě)入數(shù)據(jù)達(dá)到GB級(jí)的時(shí)候,數(shù)據(jù)庫(kù)性能將下降。
4.3.7.0之前的SQLite無(wú)法識(shí)別啟用了WAL機(jī)制的數(shù)據(jù)庫(kù)文件。
四、WAL引入的兼容性問(wèn)題
在啟用了WAL之后,數(shù)據(jù)庫(kù)文件格式的版本號(hào)由1升級(jí)到了2,因此,3.7.0之前的SQLite無(wú)法識(shí)別啟用了WAL機(jī)制的數(shù)據(jù)庫(kù)文件。
禁用WAL會(huì)使數(shù)據(jù)庫(kù)文件格式的版本號(hào)恢復(fù)到1,從而可以被SQLite 3.7.0之前的版本識(shí)別。
五、WAL引入的性能問(wèn)題
在一般情況下,WAL會(huì)提高SQLite的事務(wù)性能;但是在某些極端情況下,卻會(huì)導(dǎo)致SQLite事務(wù)性能的下降。
1.在事務(wù)執(zhí)行時(shí)間較長(zhǎng)或者要修改的數(shù)據(jù)量達(dá)到GB級(jí)的時(shí)候,WAL文件會(huì)被占用,它會(huì)暫時(shí)阻止checkpoint的執(zhí)行(checkpoint會(huì)清空WAL文件),這將導(dǎo)致WAL文件變得很大,增加尋址時(shí)間,最終導(dǎo)致讀寫(xiě)性能的下降。
2.當(dāng)checkpoint執(zhí)行的時(shí)候,會(huì)降低當(dāng)時(shí)的讀寫(xiě)性能,因此,WAL可能會(huì)導(dǎo)致周期性的性能下降。
六、與WAL相關(guān)的PRAGMA和接口
代碼如下:
PRAGMA journal_mode
PRAGMA wal_checkpoint
PRAGMA wal_autocheckpoint
sqlite3_wal_checkpoint
sqlite3_wal_autocheckpoint
sqlite3_wal_hook
更多信息請(qǐng)查看IT技術(shù)專(zhuān)欄