小伙伴們大家好,今天許立勇講的文章是淘寶成立于哪一年哪一天,講解淘寶優惠最大的節日,以及淘寶成立于哪一年等等相關的各種干貨,希望你們能通過這篇文章很好的掌握其中的技巧,下面我就來為大家全部一一解析!
面對性能和成本的雙重壓力,阿里數據庫內核團隊如何應對?
01
淘寶交易訂單系統介紹
天貓和淘寶每天發生的實物和虛擬商品的交易達到億級別。一次成功交易的整個鏈路會涉及到會員信息驗證,商品庫信息查詢,訂單創建,庫存扣減,優惠扣減,訂單支付,物流信息更新,確認支付等。
鏈路中的每一環都涉及到數據庫中記錄的創建和狀態的更新,一次成功的交易可能對應到后臺信息系統上數百次數據庫事務操作,支撐交易系統的整個數據庫集群則會承擔每日高達數百億的事務讀寫。這除了給數據庫系統帶來巨大的性能挑戰之外,每日遞增的海量數據也帶來巨大的存儲成本壓力。
交易訂單作為其中最為關鍵的信息,由于可能涉及交易糾紛處理,需要隨時提供用戶查詢,必須永久的記錄在數據庫中。淘寶成立至今近17年,所有與訂單相關的數據庫記錄總量達到了萬億級別,其所占用的磁盤空間也早已超過PB級。
在一個這樣大體量的數據集上,需要能夠滿足用戶隨時查詢的低延時需求,同時需要達到極低的存儲成本,在技術上是一個非常大的挑戰。
用戶的歷史訂單記錄數據量巨大且不能丟失
02
淘寶交易訂單庫的架構演進歷史
淘寶從2003年成立至今近17年的時間,隨著流量不斷上漲,交易訂單數據庫的架構也經歷過數次演進。
第一階段,開始由于流量較小,使用了一套Oracle數據存儲了所有的訂單信息,新訂單創建和歷史訂單查詢都在同一套數據庫進行。
第二階段,由于歷史訂單量數據量越來越大,單一一套庫已經不能滿足同時滿足性能和容量的問題,于是對交易訂單庫進行了拆分,單獨建立了一個Oracle歷史庫,將三個月以前的訂單遷移進歷史庫,同時由于數據量巨大,查詢性能不能滿足需求,因此當時的歷史訂單不提供查詢功能。用戶只能查詢三個月之內的訂單信息。
第三個階段,為了解決擴展性和存儲成本問題,交易歷史庫整體遷移到了HBase方案,這套方案在當時很好了解決了存儲成本和業務查詢需求這2個訴求。整體方案是使用主表結合索引表,查詢訂單詳細信息通過主表完成,通過買家或者賣家ID查詢訂單,則需要借助索引表先得到訂單號。
但這個方案遺留一個問題:訂單并不是嚴格按照90天進行遷移的,有很多類型的訂單并不遷移到歷史庫,導致已買到–訂單列表的排序是亂序的,已買到的訂單列表不是嚴格按照時間由近到遠排序的,用戶如果按照訂單列表一頁一頁往下翻,會發現自己最近的訂單”突然丟了”(實際上沒有丟的,只是亂序了,再往后翻就有了)。
第四個階段,歷史庫采用基于X-Engine引擎的PolarDB-X集群,在滿足存儲成本的同事,提供與在線庫一樣的索引能力,解決亂序問題。
03
淘寶交易訂單庫的業務痛點
回顧淘寶交易庫的演進歷史,自拆分出獨立的交易歷史庫之后,在持續十年時間里,業務團隊和數據庫團隊一直在應對幾個核心的挑戰:
存儲成本,每日寫入量巨大且數據永不刪除,必須要保證極低的成本。
節省存儲成本的前提下,保證豐富的查詢特性,例如按時間維度排序等。因此底層數據庫需要支持二級索引,且二級索引需要保證一致性和性能。
保證較低的查詢延時,不影響用戶使用體驗。雖然90天前的歷史訂單的查詢量比90天內要少很多,但這依然是直接面對用戶的,需要保證長尾延時在一定限度內。
在2018年,因為數據庫存儲的原因導致的訂單排序錯亂的問題,受到越來越多的投訴,給用戶帶來非常大的困擾,業務上決定根治這個問題。從前面的分析總結看,理想中的交易歷史庫方案需要同時滿足三個條件: 低成本,低延時,特性豐富。使用和在線庫一樣的InnoDB引擎則滿足不了存儲成本的要求,而使用HBase則滿足不了一致性二級索引等要求。
04
基于X-Engine引擎的歷史庫方案
2018年,阿里自研的X-Engine引擎逐步在集團內部落地,其針對阿里巴巴交易業務的流水型特征設計了原生的冷熱分離的架構,X-Engine引擎中的冷數據記錄在數據頁中緊湊排列并默認對所有數據塊進行壓縮,這套架構兼顧了性能和成本,很快在內部非常多的業務中落地,例如:X-Engine如何支撐釘釘數據量激增。
在考察交易歷史庫的方案時,一個思路是合并在線庫和歷史庫,依賴X-Engine自身的冷熱分離能力, 實現對90天內交易訂單的高性能訪問和90天以前交易訂單記錄的低成本存儲。同時一套統一的交易訂單庫,可以提供諸如二級索引等功能,用戶訂單不能按時間排序的問題也隨之解決,業務層的代碼將非常簡單。
但交易訂單系統在在線庫/歷史庫分離的架構下迭代了十年的時間,很多業務系統的代碼對這套分離架構做了兼容,考慮到對業務代碼改造以及遷移的風險,我們在初期繼承了之前在線和歷史分離的架構。只是將原有的HBase集群替換成了PolarDB-X集群(基于X-Engine引擎的版本):
在線庫依然沿用之前的MySQL InnoDB集群,但是只保存90天的數據量,90天之前的訂單會被刪除,數據量少,可以保證較高的緩存命中率,確保讀寫延時。
通過數據同步將在線庫中超過90天的訂單遷移到歷史庫中,遷移之后該部分訂單從在線庫刪除。
歷史庫切換為X-Engine,保存全量的交易訂單數據,90之前的訂單讀寫,直接操作歷史庫, 同時歷史庫承接在線庫的所有遷移寫入負載。
(點擊查看大圖)
這套架構上線之后,交易歷史庫的存儲成本相比較于使用HBase沒有上升,同時由于歷史庫和在線庫能力相同,可以創建完全一樣的索引,歷史訂單恢復了對訂單按時間排序功能的支持,同時其讀取延時也得到了保證。
05
數據庫架構參考
在淘寶交易歷史庫的方案中,考慮到業務層面歷史代碼架構的延續性,采用了InnoDB引擎在線庫和X-Engine歷史庫分離的方案。在這套架構中,X-Engine歷史庫其實同時承擔了在線庫遷移過來的寫入以及90天以前記錄的讀寫流量。
實際上,考慮到淘寶交易訂單記錄流水型的訪問特征(最近寫入的記錄會被大量訪問,隨著時間推移,記錄訪問頻次急劇衰減),X-Engine引擎內部的冷熱分離機制就能很好的處理這種流水型業務,所以單一X-Engine數據庫集群完全解決需求。
對于新開業務或者有大量流水型記錄存儲需求的現有業務且業務層面還未做冷熱分離,我們建議直接使用一套X-Engine引擎,在存儲成本降低的同時,DB層的訪問代碼會更簡單。基于X-Engine引擎的PolarDB-X分布式數據庫可以同時解決scale out問題和成本問題。
目前X-Engine引擎已經上線阿里云, 經過阿里內部業務驗證,歡迎有成本和性能需求的用戶購買使用。
好了,今天就給大家分享到這里了,希望對朋友能起到一定的幫助,淘寶成立于哪一年哪一天「最新講解淘寶優惠最大的節日」這篇文章讓你學習到一些知識的話,那就幫忙分享給你朋友吧!
本文發布者:百事通,不代表巢座耶立場,轉載請注明出處:http://www.sdwldmy.com/p/4410.html
版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 jubao226688#126.com 舉報,一經查實,本站將立刻刪除。