在近的熱門芯片大會(Hot Chips conference)上,新創企業Tilera公司發布了其大規模并行通用嵌入式處理器Tile64。據稱,該芯片能突破性的使具有幾十個內核的CPU更易編程。
不少初創公司已經開始涉足多種大規模并行架構,試圖搶占傳統上由FPGA和DSP占據的高端市場,然而迄今為止幾乎還沒有誰已獲得了足夠的市場動力。但是,Tilera公司聲稱自己的設計已經在10多個主要的小型或中型網絡及視頻OEM廠商那里贏得了訂單,其中包括3Com公司。
Tilera公司首席技術專家Anant Agarwal長期在麻省理工學院(MIT)從事多內核研究工作,他承認,其公司的工具并非是解決大規模并行架構編程這個計算機科學大難題的靈丹妙藥。“多內核編程中不存在一勞永逸的方法。”他說。
不過,該公司似乎即將一矢中的。“很多顧客都采用了現成代碼,能在幾分鐘之內對其進行編譯和運行。”Agarwal透露,“我們的網格互連與軟件工具都極具震撼力,適用于所有的嵌入式應用。”
Tilera公司的做法非常簡單易懂。其單獨內核均是完整的通用處理器,每個都能運行對稱多處理(SMP)版Linux。每個內核還具有一個嵌入式交換器,可以連接到裸片上的任意其他內核,從而在一個網格網絡(mesh network)上進行互聯。
這樣一來,OEM廠商就能將其應用方便地連接到一個或幾個內核上。然后,他們可以利用該新創公司的優化工具,來確定程序及數據流通信庫中存在的瓶頸,以便增加更多內核來達到所需的內存或處理帶寬。Agarwal表示,在一些諸如數據包嗅探器以及數字視頻編碼等應用中,客戶已經可以使用裸片上的全部64個內核。
“我看到的每家新創公司都需要采用兩步走的軟件開發流程,但聽起來流程應該可以得到簡化。”市場調查公司Forward Concepts總裁Will Strauss言簡意賅地發表了對該款芯片的評價。
Strauss說,Tilera的方案很獨特,這部分在于其每個內核都擁有支持完整操作系統所需的中斷和緩存結構。其他公司則傾向于使用簡化的內核以及新的編程方法。
“他們的產品極具價值,因為它花了200美元,用五個TI的DSP來處理H.264的實時解碼。”他補充道。
Tilera基于Eclipse的開發環境目前支持Linux和標準C編譯器。未來的軟件版本將支持C++,以及其它語言和操作系統。
“這些大規模并行處理器的成功歸結為軟件工具的有效性。”The Linley Group總裁Linley Gwennap表示。
“你可以在一個裸片上放置數十甚至數百個內核。這些內核的互連存在一定難度,但真正的問題是開發一種方式,使軟件可以利用所有的處理器內核。”Gwennap指出,“很難找到一種能利用多個處理器的自動化軟件。”
的確,即使熱門芯片大會的一名組織者也表示,今年的活動關于多核芯片的論文特別多,但有關多核編程模型的創新性工作則太少了。
迄今為止,Tilera的客戶中僅有Top Layer公司愿意談論使用該芯片的經驗。該公司首席策略官Michael Paquette透露,Top Layer公司計劃在其下一代網絡安全設備中采用Tile64芯片。
“我們目前的架構非常適合Tilera方法,因為它是由ASIC和FPGA組成的,這在本質上來說就是一個多處理器系統。”Paquette表示,“在我們的下一代平臺中,我們打算把應用從這些處理器中的一部分轉移到多個Tilera內核。”
Top Layer公司的研發人員才剛開始采用Tilera工具,將其應用擴展到處理器中的全部64個內核。該公司之所以選擇Tile64,部分原因是Tilera公司計劃在2009年提供120個內核的產品,這為那些網絡設備年發貨量小于10,000部的OEM廠商們的下一代設計遠景增強了信心。
具有諷刺意味的是,去年熱門芯片大會上的主要論文也關注于大規模并行嵌入式處理器。與Tilera類似,初創的Ambric公司正在瞄準高端數字視頻與網絡處理,該公司明白,其成功的關鍵是自己的并行編程軟件。二者的目標雖然相似,但是實現方法卻有所不同。
Tilera 在網格上放置了64個完整的處理器內核,并采用較為傳統的軟件模型進行傳輸和優化。Ambric公司利用了一種新穎的寄存器設計,將其作為其360個簡化RISC內核與異步通信信道(在Kestrel芯片內連接RISC內核)的一個組成模塊,。
Ambric的編程模型要求開發者利用Java子集在固定層中創建一組定義嚴謹的對象,以及允許對象間相互通訊的消息機制。Ambric使用了一個Java子集,其中去掉了虛擬機、垃圾收集和浮點支持,同時增加了處理該公司獨特寄存器硬件的類庫。合成的軟件通過Ambric工具被映像到其芯片硬件上。
“我們認為,首先必須定義好適當的軟件編程模型,然后開發支持電路——這正是我們采取的方式。”Ambric公司研究員兼副總裁Mike Butts指出。Butts曾在去年的熱門芯片大會上進行論文演講。
一年過去了,該公司尚未公布任何用戶,但是聲稱已在諸如視頻、醫療成像、數據包處理以及國防等“數十個”領域贏得了設計定單,而其中一些公司將在今年年底之前發布其系統,Ambric公司協創人兼行銷和業務拓展副總裁Jay Eisenlohr透露。
“我們的做法是伸開雙臂來迎接,而且這樣做的確有效。”他說。
Eisenlohr透露,迄今為止,60人的Ambric公司已經籌集了將近2,000萬美元,并且至少還要進行一輪風險融資。
Ambric和Tilera只是從事新處理器開發的眾多新創公司中的兩家,這些公司采用新型并行或可配置設計來實現諸如H.264視頻編碼等應用。還有一家公司CSwitch,也是在2006年成立的。此外,初創的Stretch和Stream Processors公司正在將其CPU應用于數字視頻監控系統。
網格是內核連接的未來趨勢
其他公司,例如PicoChip公司、Azul Systems公司以及Raza Microelectronics公司等,使用多個內核,但一般將其處理器瞄準一系列更受關注的應用,通常包括專用于其領域的硬件加速器等。也有一些公司采用了新型編譯器和手寫軟件的組合,將其作為自己編程模型的一部分。在芯片級,他們采用一系列總線、多個片上網絡(或環)和網格來連接其內核。
“我相信多核處理器的未來將采用網格互連。”Tilera的Agarwal表示。
“在一個網格中,你用每片新的網塊(tile)來增加對分帶寬。在環技術中,增加內核并非個案。”他說,“對分帶寬是性能的關鍵性決定因素。”
Tile64中的每個內核實際上支持五個并行的32位信道,這些信道分別傳輸中斷、內存、I/O以及其它數據流。由于64個內核中的每個核之間有五個雙向連接,該芯片能支持32Tbps的總帶寬。
即使Agarwal曾開發過款多線程處理器架構,但Tile64是單線程的。“線程切換往往消耗大量功耗,且會占用緩存。”Agarwal認為。
Tile64芯片的不同版本運行速率從600MHz到1GHz,平均消耗17-30W的功耗。該芯片集成了四個DDR2內存控制器,高達兩個10Gbps的Xaui、兩個PCI Express、以及兩個Gb以太網路接口。芯片今年年底將達到量產,一萬顆時起價435美元。
在2004年10月創立的Tilera公司是 Agarwal先生在MIT多年從事網格多內核架構的產物,包括Raw芯片,這是一款由美國國防先進研究項目局提供部分經費的16內核CPU。 迄今為止,Tilera在兩輪風險投資中已獲得大約4,000萬美元的投資。
Tile64把64個通用內核放在一個網格互連上。每個內核有一個網格開關,且該內核上能夠運行一個完整的Linux操作系統。
熱門芯片大會,多核處理器瞄準網格互連
更新時間: 2007-11-05 15:44:36來源: 粵嵌教育瀏覽量:446