DeepMind 使用 AI 加速矩陣乘法

DeepMind Lab 使用 AlphaZero AI 解決了計算機科學中的一個基本數學問題,並打破了 50 多年前的記錄。 《技術評測》對此進行了報道。

這是關於矩陣乘法的。 它是一種重要的計算類型,支持從在屏幕上顯示圖像到模擬複雜物理過程的應用程序。

儘管該方法被廣泛使用,但它仍然沒有被很好地理解。 矩陣是可以表示任何事物的數字網格。 將兩個這樣的對象相乘的基本技術是在高中教授的。

但是,當您嘗試找到解決問題的更快方法時,事情會變得更加複雜。 根據科學家的說法,將兩個矩陣相乘的選擇可能比Cosmos中的Atom數量還要多。

「可能的操作數量幾乎是無限的,」DeepMind 工程師 Thomas Hubert 說。

研究人員的方法是將任務變成一種名為 TensorGame 的棋盤遊戲。 棋盤是一個乘法問題,每一步都是為了解決它。 因此,朝著最終目標採取的一系列行動就是一種演算法。

然後,科學家們訓練了一個名為 AlphaTensor 的新版本 AlphaZero 來玩這個遊戲。 與國際象棋或圍棋類似,人工智慧在乘法矩陣時學會了最好的一系列動作。 對於以最少步數獲勝的勝利,AlphaTensor 獲得了獎勵。

「我們把它變成了一個遊戲——我們最喜歡的一種框架,」休伯特說。

研究人員的主要成果是加速了這一問題的解決。 例如,將矩陣四乘以四的基本學校方法由 64 個步驟組成。 解決問題的最快方法是德國數學家沃爾克施特拉森在 1969 年發現的:它由 49 步組成。 AlphaTensor 分 47 步完成。

據研究人員稱,對於 70 多種不同的矩陣大小,DeepMind 系統的性能優於現有的最佳演算法。 AlphaTensor 為每個問題找到的不同正確演算法的數量給他們留下了深刻的印象。

「令人驚訝的是,至少有 14,000 種方法可以將 4×4 矩陣相乘,」DeepMind 的研究員 Hussein Fawzi 說。

在搜索了理論上最快的演算法後,該團隊使用 AlphaTensor 在 Nvidia V100 GPU 和 Google TPU 上搜索演算法。 根據測試結果,該程序找到正確解決方案的速度比在類似晶元上使用標準方法快 10-20%。

研究人員說,這也是機器學習本身的基礎。 加速計算可以對數以千計的日常計算任務、削減成本和節能產生重大影響。

未來,DeepMind 計劃使用 AlphaTensor 來尋找其他類型的演算法。

回想一下,在 7 月份,AI 實驗室表示,AlphaFold 系統預測了超過 2 億個蛋白質的結構。 這些幾乎都是科學已知的在植物、細菌和動物中發現的所有Compound。

5 月,DeepMind 推出了具有 800 億個參數的視覺語言模型。

在 Telegram 上訂閱 ForkLog 新聞:ForkLog AI – 來自 AI 世界的所有新聞

在文本中發現錯誤? 選擇它並按 CTRL+ENTER

資訊來源:由0x資訊編譯自FORKLOG。版權歸作者Богдан Каминский所有,未經許可,不得轉載
提示:投資有風險,入市需謹慎,本資訊不作為投資理財建議。請理性投資,切實提高風險防範意識;如有發現的違法犯罪線索,可積極向有關部門舉報反映。
你可能還喜歡