我們對於未來量子計算強大的處理能力寄予厚望,希望它有朝一日推動人工智能實現指數級發展。當用於訓練 AI 系統的機器學習算法獲得了大量數據來攝取、分類和分析時,AI 系統也隨之迎來了繁榮發展。根據特定特性或特徵進行的數據分類越精確,AI 的性能就越高。量子計算有望在機器學習中發揮關鍵的作用,包括訪問更多計算複雜的特徵空間等至關重要的部分——數據的細粒度方面的提高或許能夠為該領域帶來新思路。
在刊登於《自然》的一篇名為《使用量子強化特徵空間的監督學習》(「Supervised learning with quantum enhanced feature spaces」,論文閱讀地址:https://www.nature.com/articles/s41586-019-0980-2)的新研究論文中,IBM 提出並測試了一種量子算法,該算法有望在不遠的將來讓量子計算機實現機器學習。同時,他們也展示了,隨着量子計算機的性能在未來幾年日益增強以及其「量子體積」(Quantum Volume)日益增大,它們能夠在高度複雜的數據結構上,以即便是最強大的經典計算機也望塵莫及的規模執行特徵映射這一機器學習的關鍵操作。
同時,IBM 提出的這一方法還能夠使用短型系統電路(short-depth circuits)對數據進行分類,從而為處理退相干(decoherence)開闢出一條道路。同樣重要的是,該方法實現的特徵映射與所預期的一樣:即使 IBM Q 系統的處理器出現了退相干問題,它的工程數據也不會出現分類錯誤。
更大、更好的圖像
特徵映射是一種分解數據以訪問該數據的細粒度部分的方法。經典和量子機器學習算法都可以對圖像進行分解,例如,通過分解像素並根據每個像素的顏色值將這些像素放置在一個網格中的方式來分解圖像。同樣地,算法將單個數據點非線性地映射到高維空間,再根據其最基本的特徵進行數據分解。在更大多的量子狀態空間中,IBM 實現的這種特徵映射,在分離該數據的各部分和特徵上的表現要比經典機器學習算法創建的特徵映射更好。最終,根據特定特點或特徵進行的數據分類越精確,AI 的性能也就越好。
該方法的目標是使用量子計算機創建能夠生成更複雜的數據映射的新分類器。這樣的話,研究人員將能夠開發出更有效的 AI,例如,可以識別經典計算機無法識別的數據模式的 AI。
IBM 為新的量子數據分類算法和特徵映射制定了藍圖。這對於 AI 來說非常重要,因為數據集越大、越多樣化,將數據分成有意義的類以訓練機器學習算法就越困難。機器學習處理的分類結果如果不佳,就可能會造成最終結果也不理想:就比如說,會降低醫療設備根據乳腺 X 線攝影數據識別癌細胞的能力。
噪音問題
IBM 還表示,他們發現測試過程中即便存在噪音,他們也可以繼續對其工程數據進行分類。而現在的量子計算機即使在高度受控的實驗室環境中,將比特維持在量子狀態也很難超過幾百微秒。對於量子比特來說,這很重要,因為它要想執行計算,保持在量子狀態的時長就要足夠長。
IBM 的算法展示了量子糾纏(entanglement)如何提高 AI 分類的準確性,同時,該算法將作為 IBM Qiskit Aqua 的 一部分對外開放。Qiskit Aqua 是一個量子算法開源庫,開發者、研究人員以及行業專家都可以利用它,通過經典應用程序和常見的編碼語言(如 Python)訪問量子計算機。
Qiskit Aqua開源地址:
IBM 表示,現在他們距離實現機器學習的「量子優勢」(Quantum Advantage)項目還很遠,不過一旦該項目最終實現,量子計算機在執行 AI 算法上的性能將遠超經典計算機。同時,他們的研究還尚未對「量子優勢」實現論證,因為他們受限於當前的硬件能力將計算問題的範圍最小化了,同時也僅使用 2 個比特的量子計算容量——這樣才可以在經典計算機上進行模擬。不過,他們正在推進的特徵映射方法,不久后就能夠對比經典計算機能夠處理的更複雜得多的數據集進行分類。「我們開拓了一條前景光明的道路。」雷鋒網
via:https://www.ibm.com/blogs/research/2019/03/machine-learning-quantum-advantage/