我想要看毛片,噜噜吧噜吧噜吧噜噜网A,中文字幕无码专区一VA亚洲V专区在线

推動人工智能爆發(fā)的最主要原因之一，就是硬件算力的提升。而英偉達的股價當年之所以能夠三年漲10倍，就是因為GPU非常適用于深度神經(jīng)網(wǎng)絡的訓練。與傳統(tǒng)的CPU相比， GPU擁有數(shù)千個計算內(nèi)核，能夠在性能上取得上百倍的提升。因此AI就成為了GPU最主要的應用領域之一，也成就了英偉達的高速增長。

隨著AI的不斷發(fā)展，諸如微軟和谷歌這樣的巨頭公司開始考慮在數(shù)據(jù)中心里采用GPU作為AI加速芯片，這時問題就出現(xiàn)了。在大量部署時，芯片的性能并不是唯一需要考慮的因素。事實上，很多情況下它也并不是最重要的因素。

對于某種AI加速芯片，筆者將常見的評價因素總結(jié)為五點：性能、靈活性、同構性、成本和功耗。其中：

靈活性：指這種芯片對不同應用場景的適應程度。

同構性：指的是AI加速芯片能否重復利用數(shù)據(jù)中心現(xiàn)有的架構和資源。

成本：既包括對該硬件加速器的研發(fā)投入，也包含了它的采購、部署和運維開支。

功耗：就是指引入該方案后，對數(shù)據(jù)中心帶來的額外功耗負擔。

接下來，老石就對幾種常見的AI加速芯片，比如GPU、FPGA以及ASIC，采用上述評價因素做一個簡單的定性對比。

一、GPU

GPU最大的問題是，它基本上是個“功耗黑洞”：中等性能的GPU功耗都普遍超過200W，而高性能GPU的功耗會超過300W。相比于FPGA或ASIC的幾十瓦甚至幾瓦的功耗而言，這個數(shù)字顯得過于驚人。

高功耗對于GPU在數(shù)據(jù)中心里的大規(guī)模部署是致命的，因為這不僅代表著高昂的電費開支，還表示數(shù)據(jù)中心現(xiàn)有的供電、散熱等硬件架構需要進行重新修改，這對于同構性和低成本這兩項要求而言基本上是不可能的任務。

在靈活性方面，GPU通常只適用于計算密集型運算，對于通信密集型的應用，GPU需要與CPU和網(wǎng)卡組成一個完整的通信系統(tǒng)，因此對于這類應用，GPU的靈活性會受到較大限制。

二、ASIC

專用的AI加速芯片以谷歌的張量處理器TPU（Tensor Processing Unit）最為典型。TPU專為谷歌的深度學習框架TensorFlow設計，現(xiàn)在已有第二代，被用來加速神經(jīng)網(wǎng)絡的和決策。ASIC最主要的優(yōu)勢是它的超高性能和超低功耗。與GPU相比，TPU在某些AI應用的性能可以提高一個量級，而功耗會下降一到兩個量級。

不過，得到這樣高性能和低功耗需要付出的代價就是巨大的研發(fā)成本。放眼全球，有資金實力和技術儲備進行這類研發(fā)的公司，大概用一個手就能數(shù)的出來。ASIC的另外一個缺點是它的低靈活性，它通常針對某種特定的應用和算法框架而設計，因此很難直接用于其他的應用。

三、FPGA

相比GPU和ASIC，F(xiàn)PGA在各項評價指標中能夠達到比較理想的平衡。在絕對性能方面，雖然不如GPU或ASIC，但由于FPGA可以定制化硬件流水線，并且可以進行大規(guī)模并行運算，因此相比傳統(tǒng)的基于CPU的計算性能還是有著至少一到兩個量級的提升。由于FPGA具有硬件可編程的特點，使得它可以應對包括計算密集型和通信密集型在內(nèi)的各類應用。此外，F(xiàn)PGA獨有的動態(tài)可編程、部分可編程的特點，使其可以跨空間和時間兩個維度，同時處理多個應用，或在不同時刻處理不同應用，因此有很強的靈活性。

功耗和成本方面，F(xiàn)PGA的功耗通常為幾十瓦，采購與運維成本遠低于GPU。FPGA的開發(fā)成本主要涉及購買特定的FPGA設計和調(diào)試工具、采購FPGA芯片或加速卡，以及組建團隊進行或外包FPGA開發(fā)項目等投入。雖不及CPU或GPU等基于軟件的開發(fā)方式，但由于省去了FPGA芯片制造的相關環(huán)節(jié)，因此相比研發(fā)一款專用芯片而言還是低很多。

此外，F(xiàn)PGA目前通常以加速卡的形式配合現(xiàn)有的通用處理器進行大規(guī)模部署，對額外的供電和冷卻等環(huán)節(jié)沒有特殊要求，因此可以兼容數(shù)據(jù)中心的現(xiàn)有硬件體系結(jié)構。

AI芯片的最大風險

對于AI芯片的設計者而言，當前最大的風險就是AI本身。在這個群雄爭霸的時代，各種新算法、新模型層出不窮，因此在某種方法一統(tǒng)天下之前，很難將其中的任何一種方法固化在芯片上，否則就很可能再次重演以前的小甜甜變成今天的牛夫人這樣的悲劇。

比如，為了進一步提升性能功耗比，目前比較流行的方法是使用近似（approximation）算法，例如將雙精度浮點數(shù)換成低精度的定點數(shù)，或者對不同權重的網(wǎng)絡分支做剪枝、結(jié)構優(yōu)化和壓縮的操作。

筆者想說的是，這些不斷涌現(xiàn)的全新AI方法只有通過FPGA才能快速實現(xiàn)，這對于GPU或者ASIC都是不可能完成的任務。

結(jié)語

正如筆者在之前的文章里提到的，數(shù)據(jù)中心與AI已經(jīng)成為各家芯片公司的必爭之地。只不過，近期資本市場的表現(xiàn)在某種程度上展示了人們對不同方案的認可度。這也是筆者在本文中嘗試分析的。

然而，筆者并不想立flag斷言這些公司的未來，只是相信，技術會不斷給出自己的答案。

91视频免费?看_蜜芽MY188精品TV在线观看_国产免费无遮挡在线观看视频_深夜国产_亚洲精品欧洲精品_欧美黑人粗暴多交

近距離了解電子星球之星球頻道

電源網(wǎng)拍拍你，星球頻道已上線！

2020慕尼黑上海電子展專題報道

是德618年終狂歡大促

廠商專區(qū)

關于深度學習：GPU、FPGA、ASIC，你更看好誰？

熱門產(chǎn)品推薦

相關閱讀

頭條推薦

電子行業(yè)原創(chuàng)技術內(nèi)容推薦

微信關注

技術專題		更多>>