使用片上網(wǎng)絡(luò)IP創(chuàng)建高性能SoC


包含一百萬(wàn)個(gè)晶體管的片上系統(tǒng)(SoC)在不遠(yuǎn)的過(guò)去被認(rèn)為是大型器件。如今,SoC 通常包含多達(dá)十億個(gè)晶體管。例如,考慮最近的案例研究 SiMa.ai 以及其名為MLSoC的新機(jī)器學(xué)習(xí)(ML)芯片;它在嵌入式邊緣提供輕松的機(jī)器學(xué)習(xí)。
該MLSoC在16納米技術(shù)節(jié)點(diǎn)上創(chuàng)建,由數(shù)十億個(gè)晶體管組成。與當(dāng)今 SoC 設(shè)計(jì)中幾乎總是如此一樣,MLSoC 由現(xiàn)成的第三方知識(shí)產(chǎn)權(quán) (IP) 模塊與內(nèi)部開發(fā)的機(jī)器學(xué)習(xí)加速器 (MLA) IP 的復(fù)雜組合組成。

圖1 MLSoC 芯片將主機(jī)處理器和 ML 加速器功能結(jié)合在一個(gè)設(shè)備中。源: SiMa.ai
第三方 IP 是眾所周知的標(biāo)準(zhǔn)功能,例如處理器和通信內(nèi)核(以太網(wǎng)、USB、I2C 和 SPI)以及外圍設(shè)備,這種過(guò)程不值得花時(shí)間和精力在內(nèi)部開發(fā)。將該SoC與其競(jìng)爭(zhēng)對(duì)手區(qū)分開來(lái)的“秘密武器”是MLA,它提供每秒50萬(wàn)億次操作(TOPS),同時(shí)消耗微不足道的5瓦功率。
組合來(lái)自不同供應(yīng)商的數(shù)百個(gè) IP 的一個(gè)問(wèn)題是,SoC 行業(yè)已經(jīng)定義和采用了多個(gè)互連協(xié)議(OCP、APB、AHB、AXI、STBus 和 DTL),并且每個(gè) IP 可能使用不同的協(xié)議。此外,每個(gè) IP 可能支持不同的數(shù)據(jù)寬度,并以單獨(dú)的時(shí)鐘頻率運(yùn)行??梢韵胂?,讓這些 IP 相互通信可能會(huì)令人生畏。
輸入編號(hào)
連接數(shù)百個(gè)不同 IP 的最佳解決方案是采用片上網(wǎng)絡(luò) (NoC)。NoC 使用緩沖區(qū)和交換機(jī)在發(fā)起方和目標(biāo) IP 塊之間傳遞數(shù)據(jù)包。每個(gè)數(shù)據(jù)包都包含一個(gè)標(biāo)頭,其中包括一個(gè)包含源地址和目標(biāo)地址的 ID,以及一個(gè)包含數(shù)據(jù)的正文??梢酝瑫r(shí)運(yùn)行大量數(shù)據(jù)包。
每個(gè) IP 都有一個(gè)或多個(gè)稱為套接字的接口。網(wǎng)絡(luò)接口單元 (NIU) 將 IP 套接字連接到 NoC,并對(duì)數(shù)據(jù)進(jìn)行序列化和分組,同時(shí)滿足每個(gè) IP 的數(shù)據(jù)寬度和時(shí)鐘頻率要求。
開發(fā)人員通常將IP設(shè)想為在硅芯片表面上具有方形或矩形封裝。許多開發(fā)人員沒(méi)有認(rèn)識(shí)到NoC是一個(gè)IP,盡管它跨越了整個(gè)芯片。
自產(chǎn)還是現(xiàn)成?
SoC 開發(fā)人員必須決定是內(nèi)部實(shí)施 NoC 更好還是從第三方供應(yīng)商處獲取它更好。對(duì)于許多團(tuán)隊(duì)來(lái)說(shuō),這不是問(wèn)題,因?yàn)樗麄內(nèi)狈念^開始開發(fā)全功能NoC所需的時(shí)間,資源和技能。
創(chuàng)建適合現(xiàn)代 SoC 的 NoC 很容易需要六名工程師工作兩年。然后是同時(shí)調(diào)試NoC和其余設(shè)計(jì)的問(wèn)題。降低風(fēng)險(xiǎn)、加快上市時(shí)間并等同于貨幣化時(shí)間的唯一現(xiàn)實(shí)解決方案是采用來(lái)自受信任供應(yīng)商的經(jīng)過(guò)驗(yàn)證的現(xiàn)成 NoC。
技術(shù)優(yōu)勢(shì)
實(shí)施 NoC 需要的不僅僅是將 NIU 連接到 IP 套接字并確定任何交換機(jī)的位置以及任何緩沖區(qū)的大小和位置。由于NoC跨越整個(gè)芯片,因此有必要為物理布局團(tuán)隊(duì)和工具引入流水線級(jí)(寄存器),以滿足SoC的性能和時(shí)序規(guī)范。
設(shè)計(jì)涉及迭代。在流程的前端設(shè)計(jì)部分執(zhí)行迭代比同時(shí)涉及前端和后端物理布局要快得多。如果前端設(shè)計(jì)工程師手動(dòng)插入這些流水線階段,并且未能在正確的位置使用足夠的管道,則后端物理實(shí)現(xiàn)團(tuán)隊(duì)將無(wú)法實(shí)現(xiàn)其目標(biāo),從而導(dǎo)致設(shè)計(jì)者返回并返工項(xiàng)目。
不幸的是,架構(gòu)師通常通過(guò)過(guò)度設(shè)計(jì)問(wèn)題并插入太多管道階段來(lái)解決這個(gè)問(wèn)題。盡管這將有助于物理設(shè)計(jì)團(tuán)隊(duì)滿足時(shí)序要求,但任何超出需求的管道階段都會(huì)消耗芯片面積、消耗功耗并增加延遲。
解決此問(wèn)題的一種方法是使用物理感知的NoC。這意味著,一旦物理布局團(tuán)隊(duì)提供了各種IP塊的建議位置,這些數(shù)據(jù)就可以用于自動(dòng)確定任何管道階段的最佳數(shù)量和位置。通過(guò)加快物理布局過(guò)程,實(shí)現(xiàn)時(shí)序收斂所需的耗時(shí)后端到前端迭代次數(shù)顯著減少。
一個(gè)這樣的 NoC 是 彈性諾克 5,具有物理意識(shí)并具有其他選項(xiàng)。對(duì)于具有數(shù)百個(gè)IP和1024+位寬連接的極端設(shè)計(jì),F(xiàn)lexNoc XL選項(xiàng)提供了大容量網(wǎng)狀NoC發(fā)生器功能。FlexNoC 5 高級(jí)存儲(chǔ)器選項(xiàng)可用于涉及復(fù)雜存儲(chǔ)器交錯(cuò)方案和非連續(xù)地址位的架構(gòu)。此選項(xiàng)使用多通道重新排序緩沖區(qū),避免排序規(guī)則塊和響應(yīng)序列化瓶頸,但允許并發(fā)內(nèi)存通道讀取。
圖2 物理感知的片上網(wǎng)絡(luò) IP 可提高工作效率。源: 動(dòng)脈
一些設(shè)計(jì)被認(rèn)為是安全關(guān)鍵的,這意味著故障或故障可能導(dǎo)致人員死亡或重傷,設(shè)備或財(cái)產(chǎn)損失或嚴(yán)重?fù)p壞,以及環(huán)境危害。在這種類型的設(shè)計(jì)中,F(xiàn)lexNoc 5結(jié)構(gòu)IP可以通過(guò)FlexNoC彈性選項(xiàng)進(jìn)行補(bǔ)充。該封裝可幫助設(shè)計(jì)人員實(shí)現(xiàn)符合汽車 ISO 26262 和 IEC 61508 標(biāo)準(zhǔn)所需的功能安全特性。它還提供硬件可靠性,以增強(qiáng)企業(yè)級(jí) SSD 耐用性。
為什么選擇現(xiàn)成的 NoC IP
管理復(fù)雜 SoC 設(shè)計(jì)的唯一方法是使用 NoC。與其花費(fèi)數(shù)年時(shí)間和消耗工程資源在內(nèi)部開發(fā) NoC,不如通過(guò)使用值得信賴且可靠的現(xiàn)成 NoC 來(lái)節(jié)省時(shí)間、降低風(fēng)險(xiǎn)并加快上市時(shí)間。

安迪·南丁格爾, Arteris產(chǎn)品營(yíng)銷副總裁在高科技行業(yè)擁有超過(guò)35年的經(jīng)驗(yàn),其中包括在Arm擔(dān)任各種工程和產(chǎn)品管理職位的23年。
責(zé)任編輯:David
【免責(zé)聲明】
1、本文內(nèi)容、數(shù)據(jù)、圖表等來(lái)源于網(wǎng)絡(luò)引用或其他公開資料,版權(quán)歸屬原作者、原發(fā)表出處。若版權(quán)所有方對(duì)本文的引用持有異議,請(qǐng)聯(lián)系拍明芯城(marketing@iczoom.com),本方將及時(shí)處理。
2、本文的引用僅供讀者交流學(xué)習(xí)使用,不涉及商業(yè)目的。
3、本文內(nèi)容僅代表作者觀點(diǎn),拍明芯城不對(duì)內(nèi)容的準(zhǔn)確性、可靠性或完整性提供明示或暗示的保證。讀者閱讀本文后做出的決定或行為,是基于自主意愿和獨(dú)立判斷做出的,請(qǐng)讀者明確相關(guān)結(jié)果。
4、如需轉(zhuǎn)載本方擁有版權(quán)的文章,請(qǐng)聯(lián)系拍明芯城(marketing@iczoom.com)注明“轉(zhuǎn)載原因”。未經(jīng)允許私自轉(zhuǎn)載拍明芯城將保留追究其法律責(zé)任的權(quán)利。
拍明芯城擁有對(duì)此聲明的最終解釋權(quán)。