導讀:就在幾年前,計算領域還是通用計算的天下。此一時,彼一時,隨著計算密集型領域的快速崛起,面對移動互聯(lián)網(wǎng)、大數(shù)據(jù)和云計算需求的爆炸式增長,傳統(tǒng)的單一CPU方案越來越力不從心。 另一方面,半導體技術在縱向提速上也已經(jīng)達到了物理極限,處理器性能再也無法按照摩爾定律,以每18個月翻倍...
就在幾年前,計算領域還是通用計算的天下。此一時,彼一時,隨著計算密集型領域的快速崛起,面對移動互聯(lián)網(wǎng)、大數(shù)據(jù)和云計算需求的爆炸式增長,傳統(tǒng)的單一CPU方案越來越力不從心。
另一方面,半導體技術在縱向提速上也已經(jīng)達到了物理極限,處理器性能再也無法按照摩爾定律,以每18個月翻倍的速度持續(xù)增長。
1、
在這樣的背景下,異構計算“異軍突起”,成為支撐先進和更復雜的AI、AIoT等對計算量要求巨大應用的有力武器,在產(chǎn)業(yè)中迅速“上位”,使得異構計算和異構計算服務器市場迎來發(fā)展的黃金時期。
據(jù) IDC數(shù)據(jù)顯示,2019 年上半年,中國異構計算服務器市場中,GPU 加速器市場規(guī)模已達9.37 億美元,F(xiàn)PFA/ASIC/其他加速器市場發(fā)展較之稍緩,規(guī)模達到 1250 萬美元。但這些數(shù)字背后,隱藏著中國異構計算服務器市場的巨大潛力。
據(jù) IDC預測,2020 年,中國的 GPU 加速器市場將以 38.9% 的速度增長至25.75 億美元,2023 年將增長至 44.47 億美元,相比 2019 年增長近 5 倍。而在中國,GPU 服務器也已廣泛應用于各行各業(yè),包括互聯(lián)網(wǎng)、服務業(yè)、政務、教育、電信、制造業(yè)、金融業(yè),等等。
這些數(shù)字,彰顯著中國異構計算服務市場的黃金時期已然開啟。
2、浪潮商用機器FP5468G2
“時勢造英雄”,識時務者為俊杰,各大云計算和服務廠商相繼意識到異構計算是大勢所趨后,紛紛推出自己的異構計算產(chǎn)品和服務,其中就包括以自主研發(fā)技術實力專注于高端服務器的浪潮商用機器。
其實早在 2018 年 7 月,浪潮商用機器已經(jīng)推出了面向大規(guī)模數(shù)據(jù)中心的大數(shù)據(jù)分析應用設計的高端雙路主流機架式服務器FP5280G2.以性能、存儲及拓展等多方面的卓越表現(xiàn),助力企業(yè)應對數(shù)據(jù)海洋中多種IT應用帶來的挑戰(zhàn)。
但超算和AI的融合應用趨勢對計算性能提出了更高的要求,浪潮商用機器順應這一市場需求,于 2019 年 12 月推出了擁有全場景超強異構計算能力,能夠支持AI云平臺建設、深度學習訓練和推理等應用的FP5468G2.這款8/16 卡的服務器可以靈活調(diào)配,為HPC與AI的融合應用需求提供了更好的選擇,能夠幫助各行各業(yè)在異構計算領域作出創(chuàng)新。

而在這波浪潮中,嗅到商機的并非浪潮商用機器一家,其他廠商也推出過自己的異構計算服務器產(chǎn)品。相比之下,F(xiàn)P5468G2 在 CPU、硬盤等方面優(yōu)勢明顯。
把一臺 FP5468G2 服務器拆開,我們可以清晰地看到其獨特的布局設計,包括最高可支持24塊3.5英寸大容量硬盤的前置存儲,其中6個硬盤槽位可支持U.2 NVMe SSD,提供高效的數(shù)據(jù)讀取和落盤速度,極致的高效大容量本地存儲和高速IO拓展性能,為企業(yè)級用戶提供了海量數(shù)據(jù)存儲的優(yōu)選平臺;此外整機還支持2+2 冗余鉑金電源,后置支持4個標準PCIe x16插槽,可支持4個100Gb遠程直接內(nèi)存訪問(RDMA)高速網(wǎng)絡。
待深入了解 FP5468G2 的內(nèi)部架構之后,則會發(fā)現(xiàn)全新的架構,尤其其支持balance、common、cascade三種拓撲的靈活的異構拓撲配置,讓它成為一個計算力超群的“小渦輪”,以合理的設計和完善的配置支持著復雜、大量的計算,并且能夠根據(jù)應用場景/訓練模型,靈活進行拓撲切換。
FP5468G2 支持2顆POWER9 Sforza CPU,最多可支持 44 核及176線程超強調(diào)度能力,再加上8塊V100或者16塊T4 GPU,針對特定深度學習模型調(diào)優(yōu),性能相較同等X86平臺可提升多達20%,并全面兼容FPGA/AISC,提供特定應用加速。
3、賦能
智能視頻分析:成本更低
拋開技術和其他相關因素的考量,成本一直是阻礙企業(yè)采用異構計算服務器的重要因素之一。而與同類型產(chǎn)品相比,F(xiàn)P5468G2在成本上有著明顯的優(yōu)勢,尤其是在其三大應用場景之一——智能視頻分析領域。
FP5468G2可用于安防智能視頻分析,包括平安城市、智能交通、智慧社區(qū)、車輛識別、輿情分析等。在這些場景中,用戶最大的問題是獲得最優(yōu)性價比存儲空間,節(jié)省TCO。
相比之下,F(xiàn)P5468G2在智能視頻分析領域的成本優(yōu)勢主要體現(xiàn)在以下三方面:
1. 節(jié)省空間:平均單位GPU占用0.25U機柜空間,部署密度更高;
2. 降低采購成本:假設客戶需要16顆T4 GPU算力,一臺FP5468G2相比于4臺FP5280G2成本節(jié)省約24萬;
3. 降低運營成本:節(jié)約電力成本;假設工業(yè)用電計1元/kW·h,16卡GPU算力要求下,單臺FP5468G2三年可節(jié)省電費3.15萬元。
DL
隨著AI技術的進步,很多企業(yè)都選擇推出自己的AI產(chǎn)品和技術,隨之而來的是大量深度學習訓練的需求。然而,深度學習訓練需要超強的算力支持,極高的存儲IO,以及強大的數(shù)據(jù)交換能力,然而雖然市面上的產(chǎn)品和方案琳瑯滿目,但真正能同時具備這些能力的產(chǎn)品實際上是鳳毛麟角。
FP5468G2在深度學習訓練場景中則兼顧了這幾點,賦能AI企業(yè),進行圖像檢測、語音識別和自然語言處理等,使教育行業(yè)能夠更加高效地推進科學研究、高性能計算、人工智能算法研究等。
具體說來,F(xiàn)P5468G2在深度學習訓練場景中的優(yōu)勢體現(xiàn)在以下具體的數(shù)字之中:
超強算力
支持8 塊V100或16 塊T4 GPU卡,提供全場景超強異構計算能力
2顆POWER9處理器,具有多達44個核心、176線程超強調(diào)度能力;
支持4個標準 PCIe x16 插槽,支持4個100Gb高速網(wǎng)絡
靈活拓撲
支持balance、common、cascade三種拓撲,可根據(jù)應用場景/訓練模型,進行靈活拓撲切換;
合理設計、適配完善
GPU/CPU分離散熱,保障機器高效穩(wěn)定運行;
全面兼容FPGA/AISC, 提供特定應用加速。
值得一提的是,POWER9 采用增強的架構體系,可支持SMT4并發(fā)多線程,110MB片上L3緩存,能更好應對GPU數(shù)量增加帶來的數(shù)據(jù)調(diào)度負載的提升;獨特的高寬帶設計使得片內(nèi)寬帶可達7TB/s,外聯(lián)寬帶達25 GB/s。全新的微架構對稱數(shù)據(jù)處理引擎設計,更高效的指令流水線與單線程性能,海量的數(shù)據(jù)存儲能力,讓FP5468G2的實力不容小覷。
AI
FP5468G2的第三個應用場景是AI云/深度學習推理,在互聯(lián)網(wǎng)行業(yè),其可用于客戶行為分析、互動娛樂、輿情分析、精準營銷、內(nèi)容監(jiān)控等;在金融行業(yè),可用于智能客服、人臉識別、風險評估、智能投顧等;在電信行業(yè),可用于智能服務、智能網(wǎng)絡、智能客服等。
在這些場景中,動輒數(shù)億TB的數(shù)據(jù)流量往往需要海量的存儲空間,以應對每天的日常運營。
FP5468G2支持海量的數(shù)據(jù)存儲和高速IO擴展:
最大支持24塊3.5英寸大容量硬盤,其中可支持6塊U.2 NVMe SSD
支持4個標準 PCIe x16 插槽,支持4個100Gb高速網(wǎng)絡
FP5468G2可用于AI 公有云、企業(yè) AI 云、混合型 AI 計算應用,如數(shù)據(jù)源中心管理、智慧醫(yī)療一卡通、政務服務云、高性能計算等。
在人工智能領域,F(xiàn)P5468G2 可用于深度學習訓練和推理,是模型調(diào)優(yōu)的一把好手。
在視頻智能分析領域,F(xiàn)P5468G2 可在平安城市、智能交通、智慧社區(qū)的安防方面發(fā)揮巨大的作用,滿足視頻流海量存儲需求,進行信息實時檢索、音視頻轉碼/壓縮等。
展望未來,像 FP5468G2 這樣的異構服務器發(fā)展前景非??捎^。據(jù) IDC 數(shù)據(jù)顯示,2020 年之前,異構計算的應用場景和服務領域已經(jīng)十分廣泛,包括發(fā)展相對成熟的智能客服、語音識別、人臉識別、風險評估等領域。但在 2020 年之后,異構計算將拓展到智能機器人、智能服務、智能工廠、IT 自動化、智能導診,甚至語言能力等更加復雜的場景中;到 2025 年,異構計算在自適應學習、智能診斷等需要謹慎決策的場景中也將發(fā)揮更大的作用。