完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動設(shè)備(如平板電腦、智能手機(jī)等)上圖像運(yùn)算工作的微處理器。
文章:5019個(gè) 瀏覽:136097次 帖子:309個(gè)
NuLink PHY技術(shù):突破計(jì)算芯片內(nèi)存瓶頸
NuLink PHY技術(shù)通過雙向傳輸功能和靈活的設(shè)計(jì),為構(gòu)建更優(yōu)越的計(jì)算引擎提供了新的途徑。相比傳統(tǒng)的硅中介層封裝技術(shù),NuLink PHY能夠提高計(jì)算...
2024-04-11 標(biāo)簽:gpu人工智能網(wǎng)絡(luò)傳輸 1.2k 0
計(jì)算機(jī)發(fā)展成為今天的機(jī)器有著悠久的歷史,今天看到的許多計(jì)算機(jī)都遵循類似的設(shè)計(jì)結(jié)構(gòu),至少包含CPU、GPU、內(nèi)存和存儲。迄今為止,我們對計(jì)算機(jī)設(shè)計(jì)的了解大...
探究GPGPU體系結(jié)構(gòu)優(yōu)化策略
GPU Warp內(nèi),32個(gè)線程(NVIDIA)鎖步lock step執(zhí)行時(shí),如果遇到每個(gè)分支走上了不同分支,比如20個(gè)線程if,12個(gè)執(zhí)行else,那么...
為什么GPU適用于AI?AI服務(wù)器產(chǎn)業(yè)鏈格局分析
GPT模型對比BERT模型、T5模型的參數(shù)量有明顯提升。GPT-3是目前最大的知名語言模型之一,包含了1750億(175B)個(gè)參數(shù)。在GPT-3發(fā)布之前...
基于B100雙Die架構(gòu),采用雙Socket板級3D擴(kuò)展可以實(shí)現(xiàn)與X100同等的算力。類似的方法也可以應(yīng)用到X100中進(jìn)一步擴(kuò)展算力。
PHY 是一種物理網(wǎng)絡(luò)傳輸設(shè)備,它將交換芯片、網(wǎng)絡(luò)接口或計(jì)算引擎上或內(nèi)部的任何數(shù)量的其他類型的接口鏈接到物理介質(zhì)(銅線、光纖、無線電信號),而物理介質(zhì)又...
X-Silicon發(fā)布RISC-V新架構(gòu) 實(shí)現(xiàn)CPU/GPU一體化
X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計(jì)將 CPU 和 GPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計(jì)不同,前者有獨(dú)立的 CP...
在Roofline模型可以直觀展示一張曲線圖,其中x軸表示AI(Arithmetic Intensity),即每個(gè)內(nèi)存操作對應(yīng)的浮點(diǎn)運(yùn)算次數(shù);y軸表示性...
同一主機(jī)內(nèi)GPU之間的通信:通過NVLink技術(shù),雙向帶寬達(dá)到600GB/s,單向帶寬達(dá)到300GB/s。
2024-04-07 標(biāo)簽:數(shù)據(jù)傳輸NVIDIAgpu 3.7k 0
大模型訓(xùn)練如何應(yīng)對GPU萬卡互聯(lián)難題
為了增強(qiáng)對訓(xùn)練穩(wěn)定性和性能的監(jiān)控,開發(fā)了一個(gè)精度達(dá)到毫秒級的監(jiān)控系統(tǒng)。采用不同級別的監(jiān)控來跟蹤各種指標(biāo)。
2024-04-07 標(biāo)簽:gpu數(shù)據(jù)中心人工智能 1.4k 0
機(jī)器學(xué)習(xí)(ML)推理主要計(jì)算之存內(nèi)計(jì)算芯片
機(jī)器學(xué)習(xí)(ML)應(yīng)用已經(jīng)在汽車、醫(yī)療保健、金融和技術(shù)等各個(gè)領(lǐng)域變得無處不在。這導(dǎo)致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
2024-04-07 標(biāo)簽:存儲器神經(jīng)網(wǎng)絡(luò)gpu 2.6k 2
RISC-V芯片新突破:CPU與GPU一體化核心設(shè)計(jì)
X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計(jì)將 CPU 和 GPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計(jì)不同,后者有獨(dú)立...
鴻蒙OS元服務(wù)開發(fā):【W(wǎng)ebGL網(wǎng)頁圖形庫開發(fā)概述】
WebGL的全稱為Web Graphic Library(網(wǎng)頁圖形庫),主要用于交互式渲染2D圖形和3D圖形。目前HarmonyOS中使用的WebGL是...
人工智能成為所有人類事業(yè)的數(shù)字助手,擁有著巨大的機(jī)遇。ChatGPT是人工智能如何使高性能計(jì)算的使用民主化、為社會中的每個(gè)人帶來好處的一個(gè)很好的例子。
B100將采用雙Die架構(gòu)。如果采用異構(gòu)Die合封方式,封裝基板面積將小于當(dāng)前先進(jìn)封裝4倍Reticle面積的約束。而如果采用計(jì)算Die和IO Die分...
2024-04-02 標(biāo)簽:gpu芯片設(shè)計(jì)AI 2.7k 0
字節(jié)跳動攻克GPU萬卡互聯(lián)技術(shù)突破與解決方案
在分布式訓(xùn)練中大規(guī)模使用默認(rèn)的DCQCN協(xié)議時(shí),all-to-all通信可能會導(dǎo)致?lián)砣蚉FC級別的提高。過度使用PFC可能會導(dǎo)致頭部阻塞(HoL),從...
2024-04-01 標(biāo)簽:gpu人工智能網(wǎng)絡(luò)拓?fù)?/a> 1.8k 0
以傳統(tǒng)三層架構(gòu)到葉脊架構(gòu)的轉(zhuǎn)變?yōu)槔~脊網(wǎng)絡(luò)架構(gòu)下,光模塊數(shù)量提升最高可達(dá)到數(shù)十倍。
傳統(tǒng)計(jì)算機(jī)視覺對比深度學(xué)習(xí)
深度學(xué)習(xí)是一種技術(shù),它使用一種稱為梯度反向傳播的優(yōu)化技術(shù)來生成“程序”(也稱為“神經(jīng)網(wǎng)絡(luò)”),就像上面故事中學(xué)者學(xué)生編寫的那些程序一樣。
2024-03-31 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpu人工智能 879 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |