阿里雲發佈機器學習平台PAI v3.0

雷鋒網 AI 科技評論按:距機器學習平台 PAI 2.0 發佈兩年後,阿里巴巴於今早的阿里雲峰會上重磅發佈 PAI 3.0 版本。

阿里雲機器學習平台是構建在阿里雲 MaxCompute(原 ODPS)計算平台之上,集數據處理、建模、離線預測、在線預測為一體的機器學習平台。阿里雲機器學習封裝了阿里巴巴集團內成熟的算法,向機器學習用戶提供了更簡易的操作體驗。

今日發佈的 PAI 3.0 推出了全新的算法模型市場,涵蓋電商、社交、廣告、金融等多個行業,數十種場景的算法模型。同時還新增了流式算法組件、圖神經網絡、增強學習組件等平台工具。

作為機器學習平台的內核,PAI 的智能計算引擎進行了全面升級,通過編譯技術優化通用計算引擎,訓練性能提升 400%——PAI 團隊研發了深度學習編譯器 TAO(Tensor Accelerator and Optimizer),以通用化、平台化的方式有效解決上層 Workload 與底層硬件計算單元之間高效映射的問題。

此外,在深度學習優化分佈式引擎方面,PAI 3.0 可以實現單任務支持上千 worker 併發訓練,並支持 5k+ 超大規模異構計算集群。

PAI 希望實現「用更少的硬件,支持更多業務更快完成業務迭代」。為了完成這個目標,團隊有針對性地研發了 GPU 分時復用技術。整套技術實現遵循了數據驅動的思想,包括實時在線性能數據反饋通路、細粒度 GPU 資源復用、虛擬顯存以及基於歷史數據的資源預估策略這幾個關鍵模塊。

此外,PAI 3.0 還發佈了大規模圖神經網絡,緩存機制效率提升 40%,算子速度提升 12 倍,系統端建圖時間從數小時降至 5 分鐘。

據了解,從 PAI1.0 開始,該機器學習平台已經在阿里巴巴內部使用了 2 年。基於該平台,在淘寶搜索中,搜索結果會基於商品和用戶的特徵進行排序。通過使用參數服務器,淘寶可以把百億個特徵的模型,分散到數十個乃至於上百個參數服務器上,打破了規模的瓶頸。

雷鋒網 AI 科技評論 雷鋒網


想在手機閱讀更多中國內地資訊資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems