近日起,Google Cloud 面向全球各地推出NVIDIA T4 GPU,為包括高性能計算(HPC)、機器學(xué)習(xí)訓(xùn)練及推理、數(shù)據(jù)分析和圖形處理等在內(nèi)的各類云工作負(fù)載提供加速。今年1月,Google Cloud宣布推出了NVIDIA T4 GPU公測版,幫助客戶以更快的速度和更低的成本運行推理工作負(fù)載。今年四月早些時候,在Google Next '19上,Google Cloud宣布在八個地區(qū)率先推出NVIDIA T4,使Google Cloud成為全球第一家基于NVIDIA T4提供服務(wù)的主要供應(yīng)商。
注重速度與成本效益
每個T4 GPU都擁有16 GB的GPU內(nèi)存,提供多精度(或數(shù)據(jù)類型)支持(FP32,F(xiàn)P16,INT8和INT4),具有可為訓(xùn)練提供加速的NVIDIA Tensor核心,以及可用于更快速的光線追蹤的RTX硬件加速平臺。用戶可以使用四個T4 GPU、96個vCPU、624 GB主機內(nèi)存和高達(dá)3 TB的服務(wù)器本地SSD,來搭建最能滿足其需求的自定義VM配置。
自發(fā)布之時,在搶占式VM實例上,T4實例的售價僅為每GPU每小時0.29美元。按需實例的售價為每GPU每小時0.95美元起,而且持續(xù)使用還可享受高達(dá)30%的折扣。
可用于訓(xùn)練和推理的Tensor 核心
憑借NVIDIA Turing架構(gòu),T4 GPU引入了第二代Tensor核心。Tensor 核心首次亮相于NVIDIA V100 GPU之上(Google Cloud平臺(GCP)也提供基于NVIDIA V100 GPU的服務(wù)),支持混合精度,可以為在機器學(xué)習(xí)工作負(fù)載中普遍采用的矩陣乘法運算提供加速。如果您的訓(xùn)練工作量還未達(dá)到需要使用功能更加強大的V100的程度,那么T4將能夠以更低的價格為您提供Tensor 核心的加速優(yōu)勢。T4非常適合應(yīng)用于大規(guī)模訓(xùn)練工作負(fù)載中,特別是當(dāng)您擴展更多資源來加快訓(xùn)練或訓(xùn)練更大的模型的時候。
Tensor核心也可以為推理提供加速,或運用機器學(xué)習(xí)模型加速生成預(yù)測,以實現(xiàn)低延遲或高吞吐量。當(dāng)以混合精度啟用Tensor核心時,與僅以FP32運行相比,借助于TensorRT, GCP上的T4 GPU可以將ResNet-50的推理速度提高10倍以上。受益于全球供貨和谷歌的高速網(wǎng)絡(luò),GCP上的NVIDIA T4能夠以高性價比,為那些需要高效運作的全球性服務(wù)供應(yīng)商提供服務(wù)。例如,Snap Inc. 就在使用NVIDIA T4為其全球用戶群創(chuàng)建更有效的算法的同時,保持了低成本。
“Snap的貨幣化算法對我們的廣告客戶和股東有著最顯著的影響。借助于GCP上由NVIDIA T4賦能的GPU,我們提高了我們的廣告效率,與僅使用CPU的方式相比,成本也得到了降低?!?/p>
— Nima Khajehnouri, Sr. Director, Monetization, Snap Inc.

GCP 的機器學(xué)習(xí)基礎(chǔ)設(shè)施讓Google與NVIDIA強強聯(lián)手。
借助于Google Cloud上的深度學(xué)習(xí)VM鏡像(Deep Learning VM images),可以在NVIDIA T4 GPU上快速啟動和運行機器學(xué)習(xí)模型的訓(xùn)練和服務(wù)推理工作負(fù)載。這些應(yīng)用包括了您需要的所有軟件:驅(qū)動程序,CUDA-X AI庫,以及主流AI框架,如TensorFlow和PyTorch。此外,Google Cloud會為您進(jìn)行軟件更新,使您不必再為了兼容性和性能優(yōu)化的問題額外費心。您只需創(chuàng)建一個新的Compute Engine實例,選擇您的鏡像,單擊Start,幾分鐘后,您就可以訪問和啟用您的由T4賦能的實例。您也可以在Google Cloud的AI平臺上啟動您的實例,這是一個端到端的開發(fā)環(huán)境,可幫助機器學(xué)習(xí)開發(fā)人員和數(shù)據(jù)科學(xué)家在任何地方構(gòu)建、共享和運行機器學(xué)習(xí)應(yīng)用程序。一旦準(zhǔn)備就緒,只需幾行代碼,您就可以借助于Tensor核心的自動混合精度實現(xiàn)加速。
規(guī)模效益
NVIDIA T4 GPU還能為HPC批量計算和渲染工作負(fù)載帶來卓越的性能和效率,將大規(guī)模部署的效用價值最大化。一位來自于普林斯頓大學(xué)(Princeton University)的神經(jīng)科學(xué)研究人員對T4的獨特價格和性能有著這樣的說法:
“我們很高興能夠與Google Cloud合作,為神經(jīng)科學(xué)帶來了一項里程碑式的成就:重建立方毫米新皮層的連接組。能夠使用數(shù)千個由Kubernetes Engine驅(qū)動的T4 GPU是件令人十分興奮的事情。憑借這些計算資源,我們能夠追蹤長達(dá)5公里的神經(jīng)元布線,并在微小體積范圍內(nèi)識別十億個突觸?!?/p>
— Sebastian Seung,普林斯頓大學(xué)
GCP上的Quadro虛擬工作站
T4 GPU也是運行虛擬工作站的絕佳選擇,能夠為工程師和專業(yè)創(chuàng)意人員提供支持。借助于GCP Marketplace中的NVIDIA Quadro虛擬工作站,用戶可以運行基于NVIDIA RTX平臺的應(yīng)用程序,能在任何地方體驗新一代計算機圖形技術(shù),包括實時光線追蹤和AI增強型圖形,以及視頻和圖像處理。
“通過Google Cloud訪問NVIDIA Quadro虛擬工作站,使得我們的客戶在任何地方都能快速部署并開始使用Autodesk軟件。對于某些工作流程,運用NVIDIA T4和RTX技術(shù)的客戶能在渲染場景、創(chuàng)建逼真的3D模型和仿真的時候看到很大的不同。我們很高興繼續(xù)與NVIDIA和Google合作,為藝術(shù)工作流程帶來更高的效率和速度?!?/p>
—Eric Bourque, Senior Software Development Manager, Autodesk
-
Google
+關(guān)注
關(guān)注
5文章
1816瀏覽量
60655 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8567瀏覽量
137264 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1523瀏覽量
36374
原文標(biāo)題:Google Cloud近日起全面推出NVIDIA T4 GPU,實現(xiàn)機器學(xué)習(xí)和其他計算工作負(fù)載的高效拓展
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展
NetApp與Google Cloud深化合作:重構(gòu)分布式云數(shù)據(jù)基礎(chǔ)設(shè)施的“安全主權(quán)”新范式
Cadence 與 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上擴展 AI 驅(qū)動的芯片設(shè)計
Cadence與Google合作,利用ChipStack AI Super Agent在Google Cloud上擴展AI驅(qū)動的芯片設(shè)計
NVIDIA與Google探討AI模型的演進(jìn)方向
NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序
昆侖天工Skywork與Google Cloud深度合作發(fā)布桌面級Agent
NVIDIA推出面向語言、機器人和生物學(xué)的全新開源AI技術(shù)
NVIDIA推出NVQLink高速互連架構(gòu)
vivo攜手Google Cloud推動智能手機邁入AI新時代
Google Cloud展示一系列前沿技術(shù)更新
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
Google Cloud面向全球各地推出NVIDIA T4 GPU
評論