Greptime是36氪報道過的一家公司。公司成立於2022年4月,目前的主要產品是時序數據庫GreptimeDB和格睿雲GreptimeCloud。
其中,GreptimeDB是一款用Rust寫的雲原生、分佈式、融合時序和分析的開源時序數據庫。GreptimeCloud則是基於 GreptimeDB的 Database as a Service 雲服務。
據介紹,對用戶來講,GreptimeDB的主要特點包括:
可用可靠的透明式、分佈式:在滿足分佈式的高可用高可靠之外,GreptimeDB在使用體驗上做到透明,也就是使用者從單機模式到集群模式,可以無縫切換。
第二個特點是針對時序領域的優化:這裡包括了對於時序領域生態的協議兼容,方便快速接入,以及針對時序數據的壓縮和存儲方案優化,讓用戶不再擔憂歷史數據的存儲成本問題。
最後也是最重要的一個特點是融合負載。除了存算分離架構保障不同計算資源靈活擴縮容以外,GreptimeDB 還原生支持 SQL/Python 來做複雜的庫內計算,提升分析的實時性。
據介紹,作為一個開源項目,GreptimeDB現在已有2700多個star,其中海外和國內的人數相當。
Greptime
談及本次更新,公司介紹,在 4 月中旬發佈的 v0.2 版本中,Greptime的主要目標集中在單機,PromQL兼容,寫入性能優化等。而如今的v0.3 版本,則主要聚焦在「分佈式」。
拆解開來,這次基於分佈式的重點優化在以下幾個方向:
查詢能力提升:包括支持分佈式查詢優化、重要SQL查詢的改善,如TopK場景的處理,增強PromQL的兼容性,以及優化數據壓縮策略來加快查詢速度。
穩定性增強:為了增加系統的健壯性和可靠性,引入了Procedure框架。同時提供了更細粒度的Hybrid-flush策略以提高寫入的穩定性,並對可觀測性進行了提升,增加了更多性能指標度量的埋點,支持如Tokio console等工具。
分佈式性能優化:實現了Region級別的高可用性,提供了快速的容災切換調度。同時也對分佈式寫入性能進行了優化。
整體來說,公司表示v0.3會是一個初步可以試用的分佈式版本。它具備了region粒度的服務高可用(數據高可靠還待後續版本完成),重點場景的分佈式查詢(重點是 PromQL 查詢方向)和寫入性能均達到或者略微超過主流同類數據庫性能的水位線。
在此前的採訪中,Greptime創始人庄曉丹曾告訴36氪,他認為雖然市面上已經存在不少時序數據庫,但時序數據庫領域至少在三個方面還需要迭代:首先,在以雲原生的方式持續實時地解決海量時序數據的寫入、查詢的工作任務時,時序數據庫的能力還有待提升。第二,對時序數據的挖掘和利用,也就是分析需求,目前還未能被很好地解決。第三,當前市面上的數據庫,在分佈式集群方案上的開源還有所保留。如今Greptimev0.3的升級,或許正是對分佈式優化的回應。