阿里雲發佈新一代數據庫產品POLARDB,跑分超越AWS Aurora

【獵雲網(微信:ilieyun)北京】9月21日報道(文/都保傑)

今天下午,阿里雲升級發佈了旗下最新一代的數據庫產品POLARDB, 據悉,阿里雲數據庫產品目前覆蓋包括:關係型數據庫、混合分析數據庫、搜索與時序數據庫、NoSQL數據庫以及數據庫服務於工具等諸多領域,已成為全球數據庫產品線最齊全的雲計算廠商,今天整體數據庫產品再次升級,旨在為企業提供面向未來的能力。

據了解,POLARDB採用第三代分佈式共享存儲架構,將IO操作減少50%,100%向下兼容MySQL5.6,性能是MySQL的6倍。它把創建只讀副本進程從按小時計算縮減到現在幾分鐘就能完成,支持3分鐘創建全球範圍的容災實例,現場跑分測試,該產品寫性能實現13萬TPS,讀性能高達100萬QPS,超越國際競爭對手AWS Aurora。本數據庫產品會推出基礎版、高可用版和金融版等,全方面使能中小企業、獨角獸、金融企業和大型企業的數據庫建設需求。

插圖1

發佈會上,阿里雲數據庫產品負責人張雲楊、阿里雲數據庫總負責人余峰、阿里雲金融事業部總經理徐敏分別做了主題演講,對阿里雲數據庫產品的發展歷程、技術水平、應用前景進行了介紹。

以下是演講實錄,獵雲網(微信:ilieyun)整理節選:

 張雲楊:今天大家都是在期待最新一代的POLARDB的發佈,但在此之前我向大家先講述一下整個產品的設計理念以及我們的技術積累還有重大的更新。

毫無疑問,現在是一個全新的時代,業務在爆炸、數據在爆炸,因此對於後端的數據庫技術要求需求也在不斷的湧現出來。而對於這些需求,阿里雲數據庫團隊一直在耐心的聆聽,去總結用戶的痛點。這些在線上線下都出現的痛點,在今年發佈會之後大家都會有一個全新的認識,將會幫大家省去非常多的時間,這些問題都一併被我們解決了。

阿里雲數據庫團隊已經有七年歷史,從2011年開始我們一直不斷在努力進行非常快速的迭代。目前仍然處於快速增長期,我們從2011年開始每年都會發佈兩到三個非常重量級的產品,會發佈一到兩個非常大的功能更新。而實際上我們在連續五年時間裡面,每一年都有超過1000項以上功能優化,在2015年實際上發佈了1100項功能的優化,而在2016年這個數字是1800項,今年還沒有過完,相信應該會突破3000項。

我們支撐的業務也在越來越大越來越廣,不僅僅是集團內部的「雙11」,也包括外部的初創公司,非常龐大的物聯網公司。在2012年第一個產品RDS就已經開始接入阿里巴巴「雙11」活動,到了2014年所有「雙11」電商流量全部會經過RDS;而2013年我們推出的金融雲支撐了螞蟻餘額寶業務;2016年大家知道視頻直播業務爆發的非常迅速,一直播、映客上了我們阿里雲數據庫,在2017年O2O巨頭餓了么也接入阿里雲數據庫產品。

如今阿里雲數據庫產品已經覆蓋了所有數據庫領域流行的數據庫引擎,其中包括最常用的關係型數據庫,包括Mysql、Redis,還有一些場景化的產品搜索、時序,除此之外也通過數據遷移、數據管理的工具幫用戶打通所有的數據,阿里雲上已經有超過10萬個數據庫實例正在運行!

插圖2

阿里雲數據庫產品負責人張雲楊

我們在今年已經做的三個非常重大的升級,分別是可靠性、場景化、性價比。我們推出了第三代的可靠性方案,將會成為未來所有企業核心業務的首選方案;其實有很多的業務場景是全新出現的,不僅僅在一些新的行業,在老的行業也會有全新的業務和全新的場景出來。這些場景在雲上進行了很長時間的沉澱,我們在以下三個場景上面推出了數據庫產品。

第一個是OpenSearch,它能提供千億級數據查詢,十萬量級數據更新,支持智能查詢語義分析,可以廣泛應用到視頻搜索、新零售產品搜索,對客戶需求猜測上面,這個是經過了阿里巴巴、「雙11」多年認證的一個產品。

第二個是HITSDB,它是一個時序性的數據庫,可以支持非常大的寫入,每秒達到千萬級別,可以兼顧海量監控,以及LD行業,不管客戶終端有多少,終端設備有多少個,都可以完美的支持寫入,並且有非常高效的壓縮算法,能讓成本下降90%。

第三個是HybridDB,能夠幫助用戶決策過程,以前的分析基本從事情發生到決策需要一天的時間,HybridDB能夠解決的事情是這一天的時延,通過HybridDB海量數據是在線的,通過TBS的支持輸出各種分析報表,都能夠在企業決策者需要的時候及時提供。

然後是一個非常大的改進是數據庫版本,也是我們部署的形態,因為從初創企業到今年級的企業,甚至說一個企業從小到大它的生命周期過程中,對於數據庫的需求往往是不同的。對於初創企業他們可能更加關注的是一個最低的投入,這個投入包括硬件的投入,包括人力投入,以最低的投入發展它的業務,能讓它的業務變得高速增長,這是它最原始的訴求。

今年我們推出的數據庫基礎版本,能夠滿足初創企業以及大的企業測試環節要求,以服務器的價格來給用戶提供包含的幾十項功能的PaaS服務,這應該是雲計算廠商中最便宜的,而且最最適合初創企業的一個版本。

第二版本高可用版,這是在2011年第一次RDS發佈之後就已經上線的版本,這個版本在今年有了非常大的改進。首先補全了所有52項的管理功能;其次推出了免費的讀寫分離功能,以後用戶再也不需要買了一個數據庫之後,自己再去搭建分佈分表,再也不去搭建讀寫分離的中間環節,這個大大給用戶減少了付費成本。我們為所有的阿里雲客戶開放包年實例支持實時升降配置,這個費用能原封不動退還給客戶賬戶上,能讓客戶以非常低的成本來度過他預期的業務。

還有一個版本是金融版,它適用的場景不僅僅是金融,包括大企業的核心應用,其實應該使用金融版。金融版完全基於第三代可靠性方案,在保證可用性和可靠性平衡基礎上,我們還提供了一些增值服務。其中包括30天的SQL審計,包括秒級的高頻監控等。

今天主角是POLARDB,大家迫不及待想看一下我們最新一代的產品POLARDB到底是什麼樣子的產品?所以,我把大部分的內容留到10月11日的雲棲大會再發佈,到時候會公布我們技術紅利的升級,會有新開源的方案,會宣布已有老成員的巨大變化,請大家期待10月11日的雲棲大會。

插圖3

阿里雲數據庫總負責人余峰

余峰:POLARDB這個產品前面也介紹過了,歷經三年幾十名工程師的結晶,我們希望POLARDB產品能夠支撐未來發展。

它有什麼獨到的地方嗎?我們認為有三點非常重要,這三點可能是最樸素的,但是這三點是最難解決的,解決了這三點就解決了99%問題。

第一個問題是兼容性,大家知道MySQL是數據庫市場里占的數據最多,沒有之一。而且MySQL社區發展很多年,整個數據庫生態是非常完善,怎麼樣把傳統數據庫或者是生態遷移到雲上,很重要一點就是兼容性。今天我們看到很多的數據庫產品和MySQL數據庫產品都沒有做到100%兼容。我認為兼容性這一點,只有0跟1的區別,要麼全兼容要麼都不兼容。因為很多的遺留系統它的代碼可能已經不見了,維護人員已經不見了,它的系統在核心處在運行,今天再去做任何的修改,誰來做保證。如果我們做到100%兼容,那這些問題就不存在。我認為這是第一點,特別重要。我們在上面做了很多努力,目前向下兼容5.6,很快會支持5.7,5.8。

第二個問題是強大的計算節點,可以看到今天發佈的最高規格是64核/512GB,這個是所有雲廠商裡面目前可得到的最高規格,這麼大規格的計算能力,我相信大部分業務天花板是碰不到的,因為我們今天是叫下一代數據庫,希望未來幾年都碰不到這個天花板,留下時間給我們繼續努力。

第三個問題是極大的存儲容量。因為MySQL原來是單機板,所有的設計和架構都是圍繞單機去做的,在這種業務變化非常快的情況下,怎麼去保證容量是非常難的。不知道大家有沒有感覺,10TB可能是大部分業務遇到的天花板,我們已經提供的比10TB大一個數量級的存儲空間,所以基本也是很難被跨越的。

除了這三點還遠遠不夠,我們是做到了6倍的性能提升,但是沒有捨棄已有的功能跟特性。

首先,我認為硬件這個福利非常重要,我們的硬件是什麼樣的配置?像SkylakeCPU3G,我們今天已經在產品里裝了,我們的網絡是50Gbps,RDMA網卡,今天是一個數量級的提升。另外磁盤,我們不惜成本用的單盤就能達到32Gb/s吞吐能力。所以在打造下一代數據庫產品和硬件上面,我們是不遺餘力去做到最好。

單單硬件提升其實是不夠,如何把它熱起來這是最重要的事情,在這裡最重要的一個部件叫POLARSTORE,它把剛才的CPU還有IO能力還有最新操作系統的進步吸收過來,它擁有智慧系統。

除了硬件、存儲架構上的優化以外,我們在過去幾年裡面引擎層面有很大的積累。對於下一代的互聯網機構企業級的關係數據庫很核心的點,其中一個能不能高併發,我們在高併發上性能提升50%。在單表性能上做了大的改進,比如說在多核裡面性能最大的殺手是鎖,我們在鎖上進行了大量的優化,單表性能提升70%。我們會優化SQL,讀性能提升10%。

今天POLARDB整個引擎涉及到網絡存儲、虛擬化、數據路徑、引擎各種模塊的優化。其中,我覺得50萬到100萬的QPS實例非常考驗團隊和產品的能力,這是很大的分水嶺,我相信100萬單實例QPS時代會因此開啟,後面會有越來越多的人進來,未來會越來越多的更高的數據會被刷新,雖然我們暫時超過了國外廠商,但是我覺得我們還是要向它致敬的,因為它開啟了這樣一個時代。

插圖4

阿里雲金融事業部總經理徐敏

徐敏:今天我的分享是「數據庫的中國價值」,我不是想把它跟國外產品去比較,而是想看今天在當下中國行業正在發生的變化,這個過程中數據庫應該承擔什麼樣的角色?

給大家舉一個很熟悉的例子,餘額寶。其實餘額寶在幾個月之前它以過百億規模超越美國摩根大通成為全球第一大貨幣基金,在2013年剛上線時第一天用戶量只有18萬,是6月13日,到了6月30日用戶量250萬,兩周漲了14倍。當時最早是用IOE架構,這個架構從最初用到今天。上周我們在議論眾安保險要上市了750億市值,眾安保險從誕生第一天就在阿里雲之上,它是RDS的深度用戶。他們都是深入使用到互聯網優勢,是互聯網紅利的即得利益者,把互聯網用到極致,他們的IT都是輕裝上陣,自己做直觀性的業務,把複雜的業務交給我們做。

阿里雲數據庫一方面能夠滿足中小企業的需求,降低了初始採購成本,從第一天開始到成為獨角獸你的數據庫都能支撐,不需要太多的改變。同時,它能對大企業也可以使用,對大企業通過使用阿里雲數據庫,一方面獲得了像互聯網企業的爆發力,隨着他們更多業務和互聯網結合,會有更多的數據庫業務接入進來,這就是整個數據庫給整個行業帶來的價值,它是一個普惠的能力、普適的能力,誰都可以用。

拋開客戶去看行業本身,隨着互聯網的發展,包括4G、5G、移動互聯網、物聯網等發現,我們很多活動在線了,因此數據在線了。數據在線帶來的結果你的數據量暴漲,這是必然發生的事情。今天來看全世界數據量每9個月翻一番,但是計算能力每18個月翻一番,這兩者是不同步的。所以,這個裡面就要通過數據庫引擎來補。

今天我們歸納起來POLARDB能夠讓你的架構變得更簡單,另外讓你的效率變得更快。我們做數據庫最重要是叫大道至簡,希望提供給客戶最簡單的用戶體驗,最簡單的數據架構,最小的成本,把複雜性留給自己。


想在手機閱讀更多社交網絡資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems