【獵雲網(微信:ilieyun)北京】5月3日報道(文/都保傑)
作為國產AI芯片領域的代表性創業公司,寒武紀的雄「芯」壯志越來越明顯了。
有意思的是,寒武紀創始人兼CEO陳天石博士還發表了一封公開信,他在文中表示:「MLU100芯片是寒武紀發展歷程上全新的里程碑,標誌着寒武紀已成為中國第一家(也是世界上少數幾家)同時擁有終端和雲端智能處理器產品的商業公司。」
據了解,寒武紀1M處理器性能超越此前1A十倍有餘,使用TSMC 7nm工藝生產,其8位運算效能比達5Tops/watt(每瓦5萬億次運算),並且提供了三種尺寸的處理器內核(2Tops/4Tops/8Tops)以滿足不同場景下不同量級智能處理的需求,寒武紀稱,用戶還可以通過多核互聯進一步提高處理效能。
1M單個處理器核即可支持CNN、RNN、SOM等多樣化的深度學習模型,並更進一步支持SVM、k-NN、k-Means、決策樹等經典機器學習算法,支持本地訓練,為視覺、語音、自然語言處理以及各類經典的機器學習任務提供了靈活高效的計算平台,將廣泛應用於智能手機、智能音箱、智能攝像頭、智能駕駛等不同領域當中。
陳天石表示,1M芯片是全球第一款支持本地機器學習訓練的智能處理器產,支持幫助終端設備進行本地訓練,可為視覺、語音、自然語言處理等任務提供高效計算平台,這意味着使用1M的設備可以根據用戶行為對應用進行個性化定製,本地訓練同時也解決了用戶數據隱私的問題。
發佈會的焦點部分,是首次正式亮相的Cambricon MLU100雲端智能芯片,其實這款芯片去年11月6日寒武紀首次發佈會上有所透露。採用了最新的MLUv01架構和TSMC16nm的先進工藝,可工作在平衡模式(1GHz主頻)和高性能模式(1.3GHz主頻)下,平衡模式下的等效理論峰值速度達每秒128萬億次定點運算,高性能模式下的等效理論峰值速度更可達每秒166.4萬億次定點運算,典型板級功耗僅為80瓦,峰值功耗不超過110瓦。
與寒武紀系列終端處理器一樣,MLU100雲端芯片仍然延續了比較好的通用性,可支持各類深度學習和經典機器學習算法,充分滿足視覺、語音、自然語言處理、經典數據挖掘等領域複雜場景下(如大數據量、多任務、多模態、低延時、高通量)的雲端智能處理需求,支持服務器端的推理和訓練需求,尤其是側重推理,MLU100的板卡採用PCIe接口。
寒武紀終端和雲端芯片均原生支持寒武紀NeuWare軟件工具鏈,該平台支持 TensorFlow、Caffe、MXNet 等多種主流機器學習框架,可以方便地進行智能應用的開發,遷移和調優。此外,寒武紀還會以處理器IP授權的形式與同行共享最新的技術成果,使客戶能夠快速設計和生產具備人工智能處理能力的芯片產品,推進「端雲協作」的落地。
關於寒武紀的市場拓展,陳天石曾公開透露表示,寒武紀將力爭在3年之後佔有中國高性能智能芯片市場 30% 的份額,並使得全世界10億台以上的智能終端設備集成寒武紀終端智能處理器。如果這兩個目標能夠實現,寒武紀將「初步支撐起中國主導的國際智能產業生態」。
業內人士分析,GPU是目前主流的AI計算平台,但是其基本框架結構不是為AI所設計的,實際應用下還有很多限制。FPGA 雖然迭代快,可以在短期內滿足一定的計算需求,但從計算速度和能耗比來說,和專用的AI芯片仍有差距,這也是很多科技公司和高校投入研發深度學習專用ASIC的原因,所以催生出谷歌TPU這樣的計算平台,已成必然趨勢。
隨着寒武紀MLU100的發佈,國產力量將成為通用機器學習處理器領域重要的玩家之一,所以陳天石發佈會上稱MLU100的功耗僅為是英偉達同類產品的幾分之一,將會樹立新的行業標杆。但眾所周知,AI芯片領域只有廣闊的應用面才能在市場上爭取到更大的發言權,這是寒武紀不得不面對的現實問題。
所以很容易理解,寒武紀本次的芯片發佈會也在極力拉攏產業合作夥伴推進產品的落地,比如聯想集團推出基於寒武紀MLU100智能處理卡的ThinkSystem SR650服務器,中科曙光也同步亮相了基於MLU100智能處理卡的服務器產品系列「PHANERON」;科大訊飛也在發佈會上披露與寒武紀芯片的合作,說能耗效率領先競爭對手的雲端GPU方案達5倍以上,包括之前的案例,寒武紀研發的1A商用終端智能處理器IP產品,賦能華為麒麟970芯片等等,一個小規模的芯片生態目前已具雛形。
寒武紀的芯片是找台積電代工做偏通用的方案,而終端賣IP,雲端賣芯片的商業模式能否開闢出國產AI芯片的成功路徑,這種探索值得業界觀察和參考。