DeepMind 使用 AI 加速矩陣乘法

發表於 2022年10 月6日星期四下午 9:29:16

DeepMind Lab 使用 AlphaZero AI 解決了計算機科學中的一個基本數學問題，並打破了 50 多年前的記錄。《技術評測》對此進行了報道。

這是關於矩陣乘法的。它是一種重要的計算類型，支持從在屏幕上顯示圖像到模擬複雜物理過程的應用程序。

儘管該方法被廣泛使用，但它仍然沒有被很好地理解。矩陣是可以表示任何事物的數字網格。將兩個這樣的對象相乘的基本技術是在高中教授的。

但是，當您嘗試找到解決問題的更快方法時，事情會變得更加複雜。根據科學家的說法，將兩個矩陣相乘的選擇可能比Cosmos中的Atom數量還要多。

「可能的操作數量幾乎是無限的，」DeepMind 工程師 Thomas Hubert 說。

研究人員的方法是將任務變成一種名為 TensorGame 的棋盤遊戲。棋盤是一個乘法問題，每一步都是為了解決它。因此，朝著最終目標採取的一系列行動就是一種演算法。

然後，科學家們訓練了一個名為 AlphaTensor 的新版本 AlphaZero 來玩這個遊戲。與國際象棋或圍棋類似，人工智慧在乘法矩陣時學會了最好的一系列動作。對於以最少步數獲勝的勝利，AlphaTensor 獲得了獎勵。

「我們把它變成了一個遊戲——我們最喜歡的一種框架，」休伯特說。

研究人員的主要成果是加速了這一問題的解決。例如，將矩陣四乘以四的基本學校方法由 64 個步驟組成。解決問題的最快方法是德國數學家沃爾克施特拉森在 1969 年發現的：它由 49 步組成。 AlphaTensor 分 47 步完成。

據研究人員稱，對於 70 多種不同的矩陣大小，DeepMind 系統的性能優於現有的最佳演算法。 AlphaTensor 為每個問題找到的不同正確演算法的數量給他們留下了深刻的印象。

「令人驚訝的是，至少有 14,000 種方法可以將 4×4 矩陣相乘，」DeepMind 的研究員 Hussein Fawzi 說。

在搜索了理論上最快的演算法後，該團隊使用 AlphaTensor 在 Nvidia V100 GPU 和 Google TPU 上搜索演算法。根據測試結果，該程序找到正確解決方案的速度比在類似晶元上使用標準方法快 10-20%。

研究人員說，這也是機器學習本身的基礎。加速計算可以對數以千計的日常計算任務、削減成本和節能產生重大影響。

未來，DeepMind 計劃使用 AlphaTensor 來尋找其他類型的演算法。

回想一下，在 7 月份，AI 實驗室表示，AlphaFold 系統預測了超過 2 億個蛋白質的結構。這些幾乎都是科學已知的在植物、細菌和動物中發現的所有Compound。

5 月，DeepMind 推出了具有 800 億個參數的視覺語言模型。

在 Telegram 上訂閱 ForkLog 新聞：ForkLog AI – 來自 AI 世界的所有新聞

在文本中發現錯誤？選擇它並按 CTRL+ENTER

資訊來源：由0x資訊編譯自FORKLOG。版權歸作者Богдан Каминский所有，未經許可，不得轉載