<form id="tznrh"><form id="tznrh"><th id="tznrh"></th></form></form>

            Oracle 數據庫一體機的崛起

            發布時間:2020-09-03 | 信息來源: | 發布作者:



            本文作者——趙晨,沃趣科技產品專家

            數據庫一體機并不是一個新生的事物,它已經有了10年的歷史,經過了許多行業和應用場景的考驗,是非常成熟穩定的產品。它具有極高的性能,可量化的可用性,預先集成,開箱即用,更低的TCO,更高的ROI,適用場景廣泛,同時也符合數據中心的發展趨勢。




            傳統IOE架構的問題

            對于Oracle數據庫系統來說,IOE架構是一種非常經典的架構。過去的十幾年,它已經在許多行業中證明了自己存在的合法性。那為什么我們要用數據庫一體機這樣的新架構去取代它?是因為隨著互聯網業務的發展,IOE架構暴露出了許許多多的問題


            I/O性能


            這是最大的問題所在。在該架構中,通常只有一個集中式的存儲陣列,通過光纖網絡向計算節點提供存儲資源。早期的存儲陣列全部采用機械磁盤,其性能有非常明顯的瓶頸,即使發展到了今天,一塊高端的機械盤最多也只能提供300左右的IOPS,延遲也很高,通常在幾十毫秒。相對于SSD高達幾萬的IOPS,以及微秒級別的延遲而言,在OLTP的場景下,性能差距非常明顯。那你可能會有疑問,現在SSD已經非常普及,各大存儲廠商的AFA(全閃陣列)產品比比皆是,是否只需將原先架構中的集中式存儲替換成更新的型號就可以了?答案是否定的。在數據倉庫的場景下,通常數據量巨大,而且和時間是正相關的。此時整個系統所能提供的吞吐量就成為關鍵,而非IOPS和延遲,也就是說需要在可接受的時間內,從存儲系統向數據庫服務器傳輸足夠大量的數據。在這樣的場景下,集中式存儲所能提供的吞吐是非常有限的(因為網絡端口數量有限),并且無法進行水平擴展。因此即使使用了全閃陣列,也無法應對超大型的數據倉庫場景。


            可用性


            對于核心數據庫系統來說,可用性一定是最重要的。雖然集中式存儲陣列內部也有各種冗余的設計,但從整個架構來看,它依然是一個單點。一旦整個存儲陣列發生故障,數據庫也會隨之發生宕機,而且還存在設備無法恢復導致數據丟失的風險。這對于企業來說,幾乎就是一場災難,因為數據是無價的。


            開放式系統


            IOE架構其實是建立在80年代所提出的開放式系統概念之上的。為了構建一個數據庫系統,需要從多個不同的廠商采購不同的硬件、軟件,然后再將這些部件重新集成,這個過程成本很高,包括資金、人力和時間成本。因為企業需要面對各種問題:不同設備的到貨周期,產品穩定性、兼容性,各個廠商實施人員的技術水平,項目經理的協調能力等等。雖然提出開放式系統概念的初衷是因為原來的一體化產品過于封閉限制諸多,但其無形之中也在不同程度上增加了其他環節的成本。雖然各個廠商都提供了一些標準的軟件和接口,但兼容性的問題從來沒有消失過,而且這類問題通常都很難找到根本原因,各個廠商之間互相推諉,解決問題的效率低下。


            高昂的TCO


            這一點不僅僅體現在設備以及軟件本身的成本上。像IBM、Oracle、EMC這樣的國際廠商,針對各自產品收取的維保服務費用也已經成為企業很大的負擔,而且維保費用是和設備的使用年限成正比的。越老的設備費用越高,每年上百萬的維保服務費在許多大型企業中都很常見。


            數據庫一體機是新生事物嗎?

            一件事物既然有很多的問題,無法適應時代的發展,那被淘汰也是必然的。就像馬車被汽車取代,尋呼機被手機取代,唱片被數字音樂取代一樣。那取代IOE架構的會是什么呢?從目前的發展趨勢來看,數據庫一體機非常有可能成為它的替代者。但對于新生的事物,人們或多或少都會對它有一些排斥或者質疑,就像哥白尼提出的日心說,特斯拉發明的交流電。但如果我告訴你,一體機其實已經根本不算一個新生事物了,你對它的看法是否會有所改變呢?


            自2008年9月24日,Oracle公司發布第一代一體機:The HP Oracle Database Machine(Exadata v1)以來,今年已經是數據庫一體機這個產品走過的第10個年頭。經過10年的發展,這個細分領域的產品其實已經非常成熟??v觀現在市面上的Oracle數據庫一體機產品,架構基本相同,都采用了計算-存儲分離的三層架構(也有些產品采用了超融合的架構,不在本文討論范圍)。下面我們將一體機產品進行解剖,看看其中的幾個關鍵部分到底有沒有使用非常前沿的、不成熟的組件或者技術。


            x86服務器


            自從Intel在2005年發布x86架構的64位CPU以來,x86平臺已經有了13年的歷史。x86服務器也有著相同長度的歷史。以沃趣科技的一體機產品為例,與其緊密合作的國際知名廠商Dell,連續多年成為全球出貨量最高的x86服務器廠商,根據IDC的數據顯示,2016和2017的出貨量均在200萬臺左右,是被廣泛應用,非常成熟的產品。


            閃存介質


            閃存同樣也并非一項新的技術,早在1980年就已經被發明出來了。經過了接近27年的發展,閃存介質也已經非常成熟穩定。根據USENIX在2016年的調查報告顯示,閃存介質的替換率,以4年為一個間隔,大約為4% – 10%,而機械硬盤的替換率大約是每年2% – 9%。


            InfiniBand網絡

            IB網絡架構規格1.0版本早在2000年就已經發布了,至今也已經有18年的歷史了。IB網絡之前由于成本高昂,并沒有在數據中心普及,但在超算領域,比如石油、天然氣、氣象等,早已經廣泛使用。而如前所述,早在2008年,Oracle的第一代一體機Exadata v1就已經采用了InfiniBand作為其內部互聯網絡。


            RDMA技術:和InfiniBand技術一樣,RDMA同樣也是18年前的產物了。它是一種允許應用程序通過特殊的網卡直接讀寫遠端內存的技術,這種網卡可以是InfiniBand網卡,也可以是Ethernet網卡。RDMA具有零拷貝、內核旁路以及無需CPU參與等優勢,可以大幅度降低I/O的延遲和CPU的利用率。


            從以上幾點可以看出,數據庫一體機并非神秘的新事物,而是將幾種非常成熟的產品和技術有機地融合在了一起。


            數據庫一體機的優勢

            剛才提到,IOE架構很可能會被一體機所取代,顯然,它可以解決前者所面臨的問題。


            I/O性能


            閃存介質加上InfiniBand網絡,再加上RDMA技術,可以為一體機提供高達近百萬的IOPS以及小于1ms的延遲,可以輕松應對高壓力的OLTP系統。此外,由于存儲層從原來的集中式存儲變成分布式存儲,不僅擴展性得到極大的提升,而且能夠提供的吞吐量也有了質的飛躍,因為打破了網絡端口數量的限制,而且IB網絡的帶寬通常是IOE架構中常用的光纖網絡的7倍以上。Oracle的Exadata還提供了其特有的Smart Scan技術,用于降低存儲層需要傳輸到計算層的數據量。但該技術的使用門檻很高,只能在少數場景中才能發揮作用。在OLTP和DW的混合型系統中,該功能就徹底淪為雞肋,因為它很可能會影響其他查詢語句的性能。而沃趣科技即將發布的新一代一體機QData T5,將會直接支持100Gb/s的網絡作為內部互聯,至少能提供40GB/s的吞吐量,可以滿足PB量級的數據倉庫場景。

            可用性


            對于一些IOE用戶來說,可能對于一體機最大的疑慮在于它的可用性(穩定性)。IBM小型機和EMC的集中式存儲的確是非常優秀并且穩定的產品,如果單純比較可用性,x86服務器可能會處于下風,但一體機計算-存儲分離的三層架構,很好的規避了這個問題。我們來看一組數據:


            根據ITIC 2016年的數據顯示,Dell x86服務器的可用性如下:


            1、其中52%的服務器可用性達到了“5個9”,即99.999%,全年意外宕機時間約為5.26分鐘;

            2、其中41%的服務器可用性為“4個9”,即99.99%,全年意外宕機時間約為52.56分鐘;

            3、其中7%的服務器可用性為“3個9”,即99.9%,全年意外宕機時間約為8.76小時。


            通過計算加權平均數可以得出,Dell x86服務器的平均可用性大約為99.988%,全年意外宕機時間約為63分鐘。一套標準的QData Standard由2個計算節點和3個存儲節點組成,全冗余的架構設計可以達到極高的可用性,只有在兩個計算節點同時宕機或者兩個存儲節點同時宕機的情況下,才會導致整體數據庫服務不可用,通過基本的概率計算可以得出其可用性理論上可達“8個9” ,99.999999%,全年意外宕機時間僅為315.569毫秒。


            此外,以沃趣科技的QData Standard一體機為例,我們通過自身的監控管理平臺QData Control,對200多個客戶現場的7億多條數據進行了統計和分析,得出得結論是:


            一體機的可用性為“6個9”,即全年意外宕機時間31秒(只需要一個計算節點上的數據庫服務可用,即認為集群是可用的),其中:


            1、計算節點的可用性為“4個9”,99.99%,全年意外宕機時間約為48.56分鐘;

            2、存儲節點的可用性大約為“5個9”,99.999%,全年意外宕機時間約為5.18分鐘。

            一體化


            在數據中心的發展進化史當中,有幾個大的趨勢:更高的計算密度,更高的模塊化,更高的利用率,更少的定制化開發,更方便的使用。數據庫一體機這樣經過預先集成、測試、優化,開箱即用的產品,可以幫助用戶節省大量的資源,讓他們有更多的時間和精力去關注業務本身,畢竟對于企業來說如何發展業務,制造更多利潤才是核心,IT架構都是為了更好地支撐業務而服務的,不應該喧賓奪主。一體化帶來的另外一個好處就是后期的維保服務更簡單,出現問題時只需要找一個廠商就可以,不用在多個廠商的互相推諉中被當做皮球一樣踢來踢去。


            更低的TCO

            一體機的成本優勢一方面得益于近幾年的硬件紅利,InfiniBand網絡、閃存介質這些原本只會在高端超算場景中使用的硬件,現在的價格已經非常親民了,另一方面,一體機產品的出現,打破了國外產商對于一些專利產品的壟斷,相比于他們,國內廠商提供的軟件和維保服務價格更加合理。


            數據庫一體機的應用場景

            一體機經過近10年的發展,不僅產品成熟,還是成為了一個“多面手”,適用的場景和行業廣泛。


            首先是主要的應用場景:


            1.高并發核心OLTP系統:這類系統對于IO延遲非常敏感,對業務連續性的要求也很高;

            2. 海量數據倉庫系統:這類系統對于吞吐量要求很高,要在盡可能短的時間內返回更多的數據量;

            3. 混合型系統:上述兩種業務負載都有;

            4. 小庫整合:可以將原先利用率不平衡的小庫全部整合到一體機上,提高資源利用率,降低運維成本;

            5. 私有云:結合私有云軟件,比如沃趣科技的Cloud Manager、Oracle的EMCC,構建高性能的Oracle私有云平臺;

            6. 異地雙活:對于可用性有極致要求的金融行業客戶,還可以構建異地雙活的方案。


            其次是相關的行業:


            1. 金融行業:在銀行、證券、基金、保險等對系統穩定性和安全性要求最高的領域,一體機產品已經得到了廣泛的應用。

            2. 電力能源:電力行業雖然是傳統行業,但卻是最早嘗試一體機產品的行業之一,目前全國有超過一半省份的國網公司都已經將沃趣科技的QData Standard產品用于他們的財務、費控、計量等核心業務系統。

            3. 政企行業:隨著IT建設國產化的推進,也有不少政企客戶使用沃趣科技的一體機產品來取代原來的IOE架構或者建設新的業務系統。

            4. 其他行業:除此之外,在運營商、傳媒、教育、醫療、房地產等行業中。




            沃趣科技,讓客戶用上更好的數據庫技術!
            三分快3