數(shù)十年來,Xilinx一直是FPGA的領(lǐng)導(dǎo)者,目前仍占有60%的市場份額。英特爾近三年前以167億美元收購了Xilinx的競爭對手Altera,占據(jù)了其余市場的大部分份額。盡管Xilinx多年來一直保持穩(wěn)定增長,2018財年收入達到創(chuàng)紀(jì)錄的25.4億美元,較上年增長8%,但是FPGA仍然剛剛開始在數(shù)據(jù)中心領(lǐng)域找到自己作為計算引擎的基礎(chǔ)。英特爾、AMD和IBM的CPU仍然是計算的主要驅(qū)動因素,在英偉達、AMD,以及前途無量的Arm的GPU加速器的輔助下,這些公司集體希望能夠參與由Cavium領(lǐng)導(dǎo)的運動。其他加速器也越來越多地被使用,如FPGA和定制ASIC,但現(xiàn)在的數(shù)據(jù)中心仍然由CPU主導(dǎo)。
盡管如此,在Xilinx工作了10年的資深員工Victor Peng(他從1月份開始擔(dān)任Xilinx的首席執(zhí)行官)看到了這種變化,并設(shè)想了可編程邏輯芯片走入大型數(shù)據(jù)中心用戶和云構(gòu)建者的HPC 中心、以及常規(guī)企業(yè)數(shù)據(jù)中心的時代。
計算領(lǐng)域正在發(fā)生變化,這推動了對更多異構(gòu)計算的需求,這些計算可以適應(yīng)現(xiàn)有的工作量,而無需更改任何底層基礎(chǔ)架構(gòu)。特別是,從核心到網(wǎng)絡(luò)邊緣再到云的更多端點正在連接起來,并通過傳感器、攝像頭和其他設(shè)備實現(xiàn)智能,而且它們正在創(chuàng)建大量非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)推動了對更強的計算和更大的存儲的需求,同時也推動了利用人工智能和機器學(xué)習(xí)等技術(shù)來實現(xiàn)更優(yōu)秀的洞察力和決策的需求。
正如我們在文章《下一代計算平臺》中談到的,F(xiàn)PGA對機器學(xué)習(xí)和深度學(xué)習(xí)的興趣。今年夏天,Xilinx收購了創(chuàng)業(yè)公司DeePhi(DeePhi主要從事神經(jīng)網(wǎng)絡(luò)和FPGA領(lǐng)域的業(yè)務(wù)),增加了自己的產(chǎn)品組合。
Peng在硅谷Hot Chips 2018會議的主題演講中說:“這種智能完全連成一體,這種技術(shù)的確正在出現(xiàn),而且真的是剛剛起步,特別是從今天的角度來看,智能不僅意味著某種級別的某種處理器(在許多情況下是SoC),而且因為所有這些應(yīng)用都具有某種形式的人工智能,通常是某種形式的機器學(xué)習(xí),所以它們同樣也被集成到一起。之所以如此令人興奮,是因為它不僅已經(jīng)對人們的日常生活產(chǎn)生影響,還因為它只是剛剛出現(xiàn),它將對人們的生活產(chǎn)生深遠的影響,因為變化正在以指數(shù)級的速度發(fā)生。”
Peng指出,一些預(yù)測說,在不久的將來,每年的數(shù)據(jù)量將超過10個ZB,“從中獲取價值通常意味著要處理數(shù)據(jù)并以某種形式從原始數(shù)據(jù)中提取信息,這推動了超大規(guī)模數(shù)據(jù)中心服務(wù)器數(shù)量的強勁增長。數(shù)據(jù)中心的擴展要比我們所見過的大得多,計算、存儲和內(nèi)存都在增加,如果你看看以指數(shù)級速度增加的數(shù)據(jù)處理和總存儲空間,你就會發(fā)現(xiàn)到目前為止數(shù)據(jù)中心的能力尚可以跟得上需求?!?/p>
然而,在這種情況下,有一個很大的“但是”,那就是摩爾定律,Peng稱之為“非常大的生存挑戰(zhàn)”。摩爾定律縮小了晶體管的尺寸,可以在給定的區(qū)域內(nèi)集成更多的晶體管,以實現(xiàn)更多的功能和更低的成本。在過去的50年里,摩爾定律一直很好地為行業(yè)服務(wù),而現(xiàn)在它已經(jīng)走到了窮途末路。
Peng表示:“這是我們所有人心中根深蒂固的想法,即便是科技行業(yè)以外的普通消費者,他們也希望更快、更便宜。每一年,對于所有的電子產(chǎn)品,我們都會期望在同樣的價格下,產(chǎn)品的性能會變得更好,這是物理定律。所以,當(dāng)摩爾定律不再為我們服務(wù)時,問題是非常嚴(yán)重的?!?/p>
多年來,芯片制造商已經(jīng)采取了很多措施來跟上摩爾定律的步伐,包括增加更多內(nèi)核、在內(nèi)核中驅(qū)動線程,以及利用加速器。但是Peng說,使系統(tǒng)更快更好不僅要通過處理器技術(shù)實現(xiàn),而且要通過架構(gòu)實現(xiàn)。架構(gòu)有其自身的挑戰(zhàn),特別是功率和密度,而這也限制了性能。
Peng說:“在過去的40年里,計算主要集中在CPU和微處理器上。從2000年開始,摩爾定律開始失效。從2010年開始,事情開始向異構(gòu)系統(tǒng)發(fā)展,計算被劃分為通用處理器和固定的硬件加速器。它可能是GPU或MPU,當(dāng)然還有ASIC的復(fù)興,特別是在機器學(xué)習(xí)方面?!?/p>
機器學(xué)習(xí)和其他新工作任務(wù),以及聯(lián)網(wǎng)智能設(shè)備的激增(數(shù)以百億計,正在向數(shù)千億計激增)正在推動對芯片技術(shù)的新一輪投資,以及對可配置和可修改的硬件平臺的需求。異構(gòu)架構(gòu)設(shè)計將是推動性能向前發(fā)展的關(guān)鍵。Peng表示:“對于機器學(xué)習(xí)和所有連網(wǎng)的設(shè)備和系統(tǒng),你無法讓它們固定不變,因為你無法預(yù)測在部署時需要滿足的所有需求,而且你不想通過改變物理器件來完成設(shè)備的功能。這種不僅能夠在軟件層面進行更改,而且能夠在硬件層面遠程更改大型智能設(shè)備的概念正在變得越來越強大,為了實現(xiàn)未來的構(gòu)想,這是絕對需要的?!?/p>
在Hot Chips會議上,Peng和Xilinx的其他人員在演講中談到了公司即將推出的產(chǎn)品,包括即將推出的自適應(yīng)計算加速平臺(ACAP)和7nm“Everest”SoC。Xilinx在3月份首次討論了ACAP,雖然在Hot Chips會議上沒有進行深入探討(很可能會在10月份的Xilinx開發(fā)者論壇上進行),但Peng確實花了一些時間論述。Xilinx表示,ACAP將為公司目前16nm FPGA的機器學(xué)習(xí)推理帶來20X的性能,為5G網(wǎng)絡(luò)帶來4X的性能。Everest SoC將于今年晚些時候在臺積電7nm工藝試產(chǎn)。
ACAP的關(guān)注點在于適應(yīng)性和可編程。該平臺的可編程引擎將首先處理機器學(xué)習(xí)推理和5G網(wǎng)絡(luò)的工作。架構(gòu)的核心是組塊陣列,每個組塊相互連接,有各自的本地存儲,而且可以擴展,以針對特定的應(yīng)用。Xilinx將提供一系列針對廣闊的新市場的SKU??删幊踢壿媽―SP、LUT、URAM和BRAM。根據(jù)Peng的設(shè)想,該架構(gòu)將允許用戶對架構(gòu)進行編程,以最好地滿足應(yīng)用的需求。這使得組織能夠?qū)⑾嗤男酒渴鸬讲煌墓ぷ髦小?/p>
Peng 表示:“這將使內(nèi)核和DSA進出的速度更快,同時減少設(shè)計限制。它適用于多個市場。關(guān)于數(shù)據(jù)中心和云有很多討論,但由于其靈活性和深度,它將服務(wù)于所有市場。該架構(gòu)是可擴展的,因此它將用于汽車應(yīng)用、云應(yīng)用,以及介于兩者之間的東西,例如通信、基礎(chǔ)設(shè)施。它不僅軟件可編程,硬件也可編程?!?/p>
它還將帶來更高的吞吐量、更低的延遲和更低的功耗,在談?wù)摤F(xiàn)代工作任務(wù)時,這些因素都與頻率一樣重要。
Peng 表示:“如今,尤其是由于人們對機器學(xué)習(xí)的關(guān)注,我們陷入了對于尖端技術(shù)的狂熱。這讓我想起了上世紀(jì)90年代的兆赫戰(zhàn)爭。這真的不重要,重要的是應(yīng)用的加速。我們運行這些東西通常是幾百兆赫或一千兆赫左右,并不會太高。原因在于,由于我們的架構(gòu)普遍具有適應(yīng)性,我們有很多分布式片上存儲器和連接性可以自定義,甚至端口的部分配置也可以自定義。你不僅可以優(yōu)化數(shù)據(jù)路徑和數(shù)據(jù)流,還可以優(yōu)化內(nèi)存層次和帶寬,以及大量的片上帶寬?!?/p>
來源:半導(dǎo)體行業(yè)觀察