人民網(wǎng)北京7月4日電 (記者趙竹青)近日,北京大學集成電路學院楊玉超教授、人工智能研究院陶耀宇研究員領(lǐng)銜的科研團隊在智能計算硬件領(lǐng)域取得突破,首次實現(xiàn)了基于存算一體技術(shù)的高效排序硬件架構(gòu)。這一成果攻克了傳統(tǒng)計算架構(gòu)處理復雜非線性排序時效率低下的核心難題,為具身智能、大語言模型、智能駕駛、智慧交通與智慧城市等人工智能應用提供了全新的高效算力支持。相關(guān)研究發(fā)表于國際學術(shù)期刊《自然·電子》。
在人工智能系統(tǒng)中,排序通常作為數(shù)據(jù)預處理或決策中間環(huán)節(jié)存在,一旦執(zhí)行效率不高,將成為整個系統(tǒng)的主要瓶頸。存算一體技術(shù)雖在矩陣計算等規(guī)則運算中成效顯著,卻因排序操作邏輯復雜、非線性強、數(shù)據(jù)訪問不規(guī)則等特性,長期被視為該領(lǐng)域的核心難點。
北京大學團隊圍繞“讓數(shù)據(jù)就地排序”的目標展開攻關(guān),取得系列核心技術(shù)突破:開發(fā)了一套基于新型存內(nèi)陣列結(jié)構(gòu)的高速位讀取機制;開創(chuàng)性地引入了憶阻器陣列,實現(xiàn)了低延遲、多通路的硬件級并行排序電路設計;在算子層面,優(yōu)化了面向人工智能任務的算法-架構(gòu)協(xié)同路徑,同時兼容現(xiàn)有矩陣計算;完全自主設計的器件-電路-系統(tǒng)級技術(shù)棧整合。
“排序的核心在于復雜條件下的精準比較與數(shù)據(jù)搬移,傳統(tǒng)存算一體架構(gòu)難以支持此類運算?!闭撐牡谝蛔髡?、北京大學集成電路學院博士生余連風介紹,“團隊創(chuàng)新性地設計出‘無比較器’存算一體排序架構(gòu),成功解決了這一難題。”
實測結(jié)果顯示,該硬件方案在典型排序任務中提升速度超15倍,面積效率提升超過32倍,具備并行處理百萬級數(shù)據(jù)元素排序任務的潛力,功耗僅為傳統(tǒng)CPU或GPU處理器的1/10。在人工智能推理場景中,支持動態(tài)稀疏度下的推理響應速度可提升70%以上,特別適用于要求極高實時性的任務環(huán)境。
論文通訊作者、北京大學人工智能研究院陶耀宇研究員說,“正因為排序計算在人工智能中是高頻、通用、基礎(chǔ)且極難處理的一類操作,這一難題的突破意味著存算一體從‘適合特定應用’走向‘可支持更廣泛的通用計算’,為人工智能相關(guān)任務構(gòu)建了全鏈路的底層硬件架構(gòu)支持?!?/p>
陶耀宇介紹,該技術(shù)具有廣泛的應用前景,可用于智慧交通圖像排序系統(tǒng)、金融智能風控評分引擎、邊緣監(jiān)控設備的目標優(yōu)先識別模塊等場景。在測試中該技術(shù)展現(xiàn)出高速度與低功耗的顯著優(yōu)勢。例如,在智慧交通場景中,系統(tǒng)有望在毫秒級內(nèi)完成十萬級事件優(yōu)先級評估,為超大規(guī)模交通決策、應急響應調(diào)度等提供高效的實時算力支持。