您現在的位置是:首頁 > 攝影首頁攝影

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

由 芯智訊 發表于 攝影2023-01-14
簡介透過內建加速器和軟體最佳化,英特爾至強可擴充套件處理器已經為真實使用場景中的目標工作負載提供了領先的每瓦效能

看電視怎麼弄小螢幕

1月11日下午,英特爾在北京召開了主題為“芯加速 行至遠”的第四代至強新品釋出會,正式推出代號為“Sapphire Rapids”的第四代英特爾至強可擴充套件處理器、英特爾至強CPU Max系列(代號“Sapphire Rapids HBM”)以及英特爾首個數據中心GPU Max系列(代號“Ponte Vecchio”),在實現資料中心效能、能效和安全性大幅躍升的同時,為AI、雲、網路、邊緣和全球領先的超級計算機帶來全新功能。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

英特爾表示,基於數十年來在資料中心、網路和智慧邊緣領域的創新和領導地位,全新第四代英特爾至強可擴充套件處理器透過豐富的內建加速器提供領先的效能,解決客戶在AI、分析、網路、安全、儲存和科學計算領域面臨的重大計算挑戰。

AI效能提升10倍,整體能效提升2.9倍

具體來說,第四代英特爾至強可擴充套件處理器採用了Chiplet設計,其能夠在一個封裝上整合多達4個採用Intel 7製程工藝製造的單元,這些區塊透過英特爾嵌入式多晶片互連橋接(EMIB)封裝技術連線。第四代英特爾至強可擴充套件處理器擁有最高60個CPU核心的同時,還具備新特性,包括透過DDR5增加了記憶體頻寬、透過PCIe5。0和Compute Express Link (CXL) 1。1互連增加了I/O頻寬。最高可以提供80個PCIe 5。0通道,支援1。5TB的DDR5-4800記憶體。

第四代英特爾至強的模組化架構讓英特爾能夠提供廣泛的處理器,針對客戶的使用場景或應用提供接近50個有針對性的SKU,其中包括從主流通用SKU到面向雲、資料庫和分析、網路、儲存和單插槽邊緣使用場景的專用SKU。第四代英特爾至強處理器家族支援英特爾On Demand,能夠針對不同使用場景和外形規格提供不同的核心數、頻率、加速器組合、功率和記憶體吞吐量,從而滿足客戶的實際應用需求。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

△英特爾市場營銷集團副總裁、中國區資料中心銷售總經理兼中國區運營商銷售總經理莊秉翰展示第四代英特爾至強可擴充套件處理器晶圓

根據英特爾官方公佈的資料顯示,與前一代處理器相比,第四代英特爾至強處理器的基礎算力提升了53%,人工智慧效能提升10倍,5G vRAN效能提升了2倍,網路&儲存效能提升了2倍,資料分析效能提升了3倍,科學計算效能提升了3。7倍。透過內建加速器還將目標工作負載的平均每瓦效能提升了2。9倍,在最佳化電源模式下每個CPU節能高達70瓦,效能並沒有太大的下降,使得企業的總體擁有成本降低52%到66%。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

而第四代英特爾至強處理器的效能及能效之所以能夠有如此之大的提升,除了Intel 7製程工藝的助力之外,還歸功於內建的多種加速引擎及自研技術。

內建多個加速引擎,重新定義效能

在英特爾看來,目前的處理器已經不單單需要傳統基礎算力效能,更需要專屬計算單元,以實現AI、深度學習等效能的成倍提升,同時還需要擁有出色的能效和成本。

因此,英特爾對其第四代至強可擴充套件處理器構建了以結果為導向、工作負載至上的策略,及針對特定工作負載高度最佳化的軟體,為不同工作負載和需求匹配對應的功耗和效能,並實現理想的總體擁有成本。

為此,第四代至強可擴充套件處理器內建了全新的英特爾AMX、DLB、DSA、IAA、QAT核心,並加強了英特爾安全、AVX-512等先進技術。

1、在AI方面,與前一代相比,第四代至強透過內建

英特爾高階矩陣擴充套件(英特爾AMX)加速器

,將PyTorch實時推理和訓練效能提升了10倍。第四代英特爾至強還將廣泛的AI工作負載的推理和訓練效能提升到新的高度。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

比如,英特爾至強CPU Max系列在這些功能的基礎上還針對自然語言處理進行了擴充套件,將大型語言模型的處理速度提升多達20倍。

藉助英特爾的AI軟體套件,開發者可以使用自己選擇的AI工具,提高生產力並加快AI開發速度。該套件可以從工作站進行移植,使其可以在雲中擴充套件,並一直擴充套件到邊緣。同時,該套件已經針對400多個機器學習和深度學習AI模型進行了驗證,涵蓋所有商業細分領域最常見的AI應用場景。

2、第四代至強還內建了

英特爾動態負載均衡器(DLB)

,可以根據系統負載的變化而動態地在多個CPU核心上分配網路資料,能提供高效的硬體負載均衡。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

3,第四代至強內建了

英特爾資料流加速器(DSA),

提高了儲存、網路和資料密集型工作負載的效能,讓資料密集型工作負載操作效能提升1。7倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

4、第四代至強還內建了

英特爾存內分析加速器(英特爾IAA),

可提高分析效能,能同時把任務從CPU 核心解除安裝,以加速資料庫查詢吞吐量和其它工作負載。藉助IAA加速器,第四代至強的資料分析工作負載最佳化記憶體佔用和吞吐量效能提升了3倍。

5、第四代至強內建了英特爾®資料保護與壓縮加速技術(英特爾QAT)可以透過解除安裝加密、解密和資料壓縮,將這些任務從處理器核心解除安裝,從而讓系統能夠實現降低能耗的目的。

6、第四代至強內建了

英特爾密碼操作硬體加速功能

,大大降低了實施普遍資料加密的影響,並提高了加密密集型工作負載的效能,例如,安全套接字層(SSL)web伺服器、5G基礎設施和VPN/防火牆。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

作為資料中心計算提供應用隔離的晶片廠商,英特爾還擁有自己的英特爾軟體防護擴充套件(英特爾SGX)技術,在私有云、公有云和從雲到端的環境中,為使用中的資料提供硬體加密,以實現當前機密計算領域更小的攻擊面。

此外,英特爾還帶來了全新的虛擬機器隔離技術,英特爾Trust Domain Extensions(英特爾TDX)也非常適合把現有應用移植到機密環境,該特性將在微軟Azure、阿里雲、谷歌雲和IBM雲中首發。

此外,第四代至強內建的面向vRAN的英特爾高階向量擴充套件512(英特爾AVX-512)能夠在相同的功率下把vRAN工作負載的密度提高至前一代的兩倍2。英特爾AVX-512還支援兩個融合乘加(FMA)單元和其他最佳化功能,可幫助提升要求嚴苛的計算工作負載效能。

需要指出的是,在第代至強的50多個SKU當中,此次新增的英特爾AMX、DLB、DSA、IAA、QAT核心,最高階的版本這四種核心各配備了4個核心,而對於其他的SKU來說,只有AMX核心是屬於標配的(核心數最低1個,最高4個),其他核心則有些有配備,有些則沒有。

關於英特爾至強CPU Max系列和英特爾資料中心GPU Max系列,可參看芯智訊此前文章:

首次整合HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

英特爾執行副總裁兼資料中心與人工智慧事業部總經理Sandra Rivera表示:“第四代英特爾至強可擴充套件處理器和Max系列產品的釋出,對於推動英特爾在資料中心領域闊步前行,增強資料中心領域的領導地位,以及進一步探索新領域的發展機會極具意義。第四代英特爾至強可擴充套件處理器和Max系列產品能夠滿足客戶真實所需,即在安全的環境中兼具領先的效能和可靠性,不僅能夠滿足客戶的實際應用需求,亦有助於其加速實現業務價值及創新。”

多家合作伙伴力挺

在今天的釋出會上,來自騰訊雲、天翼雲、京東雲、阿里雲、火山引擎、吉利汽車、浪潮資訊與亞信科技的夥伴亦分享了其如何基於第四代英特爾至強可擴充套件處理器推動產品、技術創新,及在諸多領域落地的成功實踐。

騰訊雲實驗室星星海研發總監曾欽杵表示:“第四代英特爾至強可擴充套件處理器AMX特性極大的助力了騰訊搜尋暨影片業務的效率提升。”比如,在騰訊太極機器學習平臺加速搜尋業務應用當中,相比上一代至強平臺,第四代至強的BERT-base BF16 Throughput效能提升到了3。02倍,BERT-base INT8 Throughput效能提升到了2。05倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

天翼雲科技有限公司雲網產品事業部總經理楊鑫表示,利用第四代英特爾至強可擴充套件處理器內建DLB加速技術可解決IPSec業務大象流問題。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

阿里雲智慧伺服器首席架構師劉禮寅表示,阿里雲基於第四代英特爾至強可擴充套件處理器的ECS例項的整機效能相比上代最大提升了60%,資料庫讀寫效能提升15%,加解密/壓縮解壓縮效能提升了4倍,AI效能提升了4倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

京東科技京東雲事業部硬體架構總監董可新表示,基於第四代英特爾至強可擴充套件處理器的新一代天樞伺服器平臺效能相比上一代實現了1。7倍的提升。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

位元組跳動旗下火山引擎雲基礎產品負責人羅浩稱:“第四代英特爾至強可擴充套件處理器助力火山引擎釋放了巨大算力和效能紅利。”據介紹,火山引擎基於四代至強的的第三代彈性計算例項相比上一代整機算力提升了70%,單核算力提升了18%,網路轉發效能提升了2倍,儲存IOPS效能提升了2。3倍,加解密效能提升了1倍,AI推理加速效能提升了2。2倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

吉利汽車研究院數字模擬技術開發部長廖慧紅表示,吉利新一代HPC平臺應用了第四代英特爾至強可擴充套件處理器助力了吉利的模擬,實現了低風阻、全域安全,加速了吉利汽車的概念開發、工程開發及產業化。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

浪潮資訊伺服器產品部總經理趙帥表示,搭載第四代英特爾可擴充套件處理器的浪潮資訊全新一代伺服器,在Open Cloud與英特爾QAT助力下,雲計算場景(虛擬化VM熱遷移)效能最高提升到了8。19倍;在英特爾AMX助力下,大資料場景效能最高提升到了9。26倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

亞信科技首席科學家葉曉舟表示,亞信科技正與英特爾基於其第四代至強可擴充套件處理器及其內建加速器開展聯合創新,算網效能得到的持續提升。對比上代產品,AntDB資料庫吞吐量提升了43%;AI(OCR)應用效能提升達3。38倍。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

此外,英特爾也在持續攜手中國的合作伙伴共同打造本土化的至強生態系統,促進產業鏈升級創新。

根據英特爾公佈的資料顯示,目前英特爾至強中國生態系統當中,已經擁有超過150家中國生態合作伙伴。

在本次的釋出會上,寶德、聞泰科技、浪潮、華擎、聯想、中興、金蝶、用友、銀河麒麟等英特爾至強中國生態當中諸多軟硬體合作伙伴代表登臺為第四代至強可擴充套件處理器助力。

英特爾第四代至強來襲:AI效能提升10倍!整體能效提升2.9倍!

英特爾最具可持續性的資料中心處理器

英特爾今天釋出的第四代至強也是英特爾迄今為止最具可持續性的資料中心處理器,在幫助企業實現可持續發展和減排目標方面邁出了重大一步。

英特爾表示,相比於增加CPU核心,內建加速器對於提高工作負載的效能而言是一種更為高效的方式。透過內建加速器和軟體最佳化,英特爾至強可擴充套件處理器已經為真實使用場景中的目標工作負載提供了領先的每瓦效能。這能夠大幅提高CPU的利用率、降低能耗、提高投資回報,同時幫助企業實現可持續發展和減排目標。

除了有助於為特定工作負載提高每瓦效能的內建加速器,第四代英特爾至強可擴充套件處理器還擁有一系列管理電源和效能的功能。新的最佳化電源模式可以為某些工作負載帶來高達20%的插槽節能,而對效能的影響僅有不到5%。風冷和液冷的創新進一步降低了資料中心的總能耗。並且第四代至強可擴充套件處理器在英特爾工廠製造時,運用了超過90%的可再生電力,並同時配備了一流的水資源回收設施。

值得一提的是,目前浸沒式液冷方案也已經成為了伺服器廠商節能減排的一大技術方向。此前,英特爾主導了第一版的浸沒式液冷液體規範。在今天的釋出會上,英特爾還宣佈針對英特爾第三及第四代至強可擴充套件處理器的浸沒式液冷方案設計提供一年的保修服務。這也是業界首家面向浸沒式液冷方案設計提供保修服務的伺服器晶片廠商。

編輯:芯智訊-浪客劍