AlphaTensor找到兩個矩陣相乘的最快方法,打破一個50多年來的數學問題。AlphaTensor將加速未來數以千計的日常運算任務,達到節能並降低成本的目標。相關研究已發表在《Nature》期刊上。
矩陣乘法Strassen 是代數運算中最簡單的方法之一,Strassen演算法自1969年發布以來,計算機科學就一直在尋求可超越其兩個矩陣相乘的速度。
矩陣乘法目前被用於處理智慧手機圖像、語音命令、數據壓縮等,如今有許多科技公司會使用昂貴的GPU硬體來提高矩陣乘法速度。「提高矩陣乘法速度」,已是許多科技公司在追求的目標。
DeepMind此次發表的AlphaTensor是基於AlphaZero來開發,AlphaZero能指導並搜索有效的矩陣乘法,DeepMind再透過結合強化學習(RL)和深度學習(DL)的單個深度強化學習,來分解各種大小的矩陣乘法張量(Tensors),以產生跨各種張量的學習分解技術(decomposition techniques)。
AlphaTensor從零開始,不僅發現許多結構化矩陣乘法的有效演算法,DeepMind還將AlphaTensor應用在如:Nvidia V100 GPU和Google TPU v2的特定晶片上,發現可比現有的矩陣乘法快20%,證明AlphaTensor的靈活性與廣泛的適用性。
DeepMind的人工智慧科學負責人Pushmeet Kohli 表示,AlphaTensor發現的演算法在許多矩陣大小上都比最先進的演算法更有效,並且優於人工設計的演算法。
Kohli 表示,他希望此論文研究能夠啟發其他進行AI競賽任務的開發者,發現新演算法,「這是讓AI發展的重要一步」他強調。
資料來源:
https://venturebeat.com/ai/deepmind-unveils-first-ai-to-discover-faster-matrix-multiplication-algorithms/
(整理編譯/彭梓涵)