近日,信息科學(xué)與工程學(xué)院講師徐敬可在《IEEE TRANSACTIONS ON COMMUNICATIONS》在線發(fā)表了題為“Folded Polynomial Codes for Coded Distributed AA^T-Type Matrix Multiplication”的研究論文。徐敬可老師為該論文的第一作者。
得益于分布式計算平臺和分布式計算框架的優(yōu)良性能,以大規(guī)模矩陣乘積為核心的機器學(xué)習(xí)算法和大數(shù)據(jù)分析技術(shù)得到了快速發(fā)展。然而,由于網(wǎng)絡(luò)延遲、資源共享、系統(tǒng)維護(hù)和功率限制等因素,分布式計算系統(tǒng)的工作節(jié)點會出現(xiàn)暫時失效等未能完成計算任務(wù)的問題,我們稱之為稱為節(jié)點掉隊問題。
為了緩解節(jié)點掉隊的影響,針對矩陣與其轉(zhuǎn)置矩陣乘法,本研究利用折疊多項式設(shè)計了一類的新穎高效的分布式編碼算法。本文的關(guān)鍵技術(shù)是利用對稱性,將解碼問題轉(zhuǎn)化為折疊多項式的重構(gòu)問題,進(jìn)而利用無向圖的連通性確定了折疊多項式碼的恢復(fù)閾值。與現(xiàn)有算法相比,在保持原有節(jié)點計算復(fù)雜度的前提下,折疊多項式碼可以忍受更多的掉隊節(jié)點,有更小的通信代價、更低的譯碼復(fù)雜度等優(yōu)勢。在相同掉隊節(jié)點的情形下,由于具有抵抗更多掉隊節(jié)點的優(yōu)良性能,折疊多項式碼可以應(yīng)用于更經(jīng)濟(jì)的分布式計算平臺。因此,該研究具有更廣泛的應(yīng)用價值。

該研究得到了國家自然基金項目、國家重點研發(fā)計劃項目、山東省自然科學(xué)基金項目、山東省“青創(chuàng)團(tuán)隊計劃”項目、廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究基金項目的資助。
原文鏈接:DOI: 10.1109/TCOMM.2023.3286420
編 輯:萬 千
審 核:賈 波


