《大數據的衝擊》一書將大數據通俗定義為「用現有的一般技術難以管理的大量數據的集合」,並廣義地定義為「一個綜合性概念,它包括因具備3V(海量/高速/多樣,Volume / Variety/Velocity)特徵而難以進行管理的數據,對這些數據進行存儲、處理、分析的技術,以及能夠通過分析這些數據獲得實用意義和觀點的人才和組織。」
IDC預計到2020年全球數據量將達到35Zb(1Zb等於10000億Gb)的量級,90%北美企業將採用雲應用,同時新賽道包括人工智能、物聯網、新零售、無人駕駛(一輛無人駕駛汽車1.5小時將產生4TB的數據)等將推動數據的幾何爆發。
傳統的關係型數據庫,比如甲骨文、MySQL等因為速度慢、及時性、可擴展性差、存儲價格高昂,已經不適合大數據海量、高速、多樣的特點。新應用對數據的遷移、處理、儲存與安全等產生巨大的挑戰。新數據模型將帶動新的儲存與管理工具與技術。
所以我們看到,很多大公司隨着業務的發展推出了新型數據庫,存儲方式也由原來的軟硬件匹配發展成分佈式存儲。然而新型平台數據庫呈開源和多元發展,增加了使用者的管理難度,iManis Data 應運而生,通過技術手段幫助用戶降低數據管理難度。
iManis Data 成立於2013年,公司於2015年年底推出了第一代的產品Talena 1.0,為企業大數據提供保護和數據管理。產品以Hadoop為基礎,為企業應用數據提供無限延伸的Petabyte級別的數據保護。同時,公司採取最前沿的壓縮技術,跨平台(Mongo、Cassandra、HBASE等)的全球刪重(global de-duplication)與糾刪(Erasure Coding,用來確保備份數據的不丟失 )技術,比目前單一平台提供的複製備份節省了3-5倍的空間和提高了數據備份的可靠性,如果數據出錯也會被備份保留。無論是公有雲還是私有雲,產品都能提供相應的統一數據遷移與管理。
Asset Plus的何江浩告訴36氪,回到10年前VMware開始普及的時候,虛擬機的備份與管理也是比較困難的。傳統Vendor由於軟件架構不一樣,加上團隊比較龐大臃腫,對新技術的支持總是落後一步,Veeam就是在這樣的背景下突圍而出。這樣就給初創公司提供很好的發展機遇 。第三方大數據應用的數據存儲、安全和管理的工具市場將迎來爆髮式增長,雲存儲市場在2022年將達到974億美元,備份和回復市場在2022年達到41億美元。市場空間足夠大,而新型玩家並不多。
iManis Data 推出后曾獲得硅谷高創會2015年創新TOP 30,Gartner 2016年 Cool Vendor、CRN Bi, Data 100 Companies、CRN Emerging Vendor 2017、CRN 2017年TOP Technology Innovator Finalist等,此外為部分世界500強企業提供分佈型數據庫NoSQL平台 (包括Cassandra、Hadoop、Mongo、Vertica、Couchbase 等)的數據安全保護。目前每天為客戶提供上千個節點的保護。
大數據應用安全與管理賽道上玩家不多,除了 iManis Data 外,還有 Datos IO。Datos IO 成立於2014年,今年2月份被 Rubrik 收購。
John Mracek 畢業於麻省理工大學,在任職iManis Data以前,曾是NetSeer的CEO(一家位於硅谷專註提供機器學習型的廣告技術公司,每天為客戶處理大量的即時廣告數據),7年間把公司從零做到行業領導者並於2017年整體出售給上市公司。在這以前,John Mracek 在AdKnowledge, eBay, Yahoo!, Adobe, Apple和其他創業公司擔任高級管理人員。