完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > nvidia
NVIDIA是(NVIDIA Corporation,NASDAQ:NVDA,官方中文名稱(chēng)英偉達(dá))的簡(jiǎn)稱(chēng),是一家以設(shè)計(jì)智核芯片組為主的無(wú)晶圓(Fabless)IC半導(dǎo)體公司,公司創(chuàng)立于1993年1月,總部位于美國(guó)加利福尼亞州圣克拉拉市。
文章:4577個(gè) 瀏覽:110157次 帖子:220個(gè)
分割NVIDIA A30 GPU并征服多個(gè)工作負(fù)載
多實(shí)例 GPU ( MIG )是 NVIDIA H100 , A100 和 A30 張量核 GPU ,因?yàn)樗梢詫?GPU 劃分為多個(gè)實(shí)例。每個(gè)實(shí)例...
如何在NVIDIA CUDA Tile中編寫(xiě)高性能矩陣乘法
本博文是系列課程的一部分,旨在幫助開(kāi)發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型
上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務(wù),以及使用 Chatbox 作為前端調(diào)用...
為什么安裝Apollo3.0內(nèi)核之后無(wú)法安裝Nvidia驅(qū)動(dòng)
新手想問(wèn)一下,為什么安裝Apollo3.0內(nèi)核之后無(wú)法安裝Nvidia驅(qū)動(dòng),并出現(xiàn)這樣的報(bào)錯(cuò)?如果先安裝Nvidia驅(qū)動(dòng),再安裝Apollo內(nèi)核的話(huà),重...
LayerNorm/RMSNorm的重計(jì)算實(shí)現(xiàn)
我去實(shí)測(cè)了一下,單機(jī)8卡A100訓(xùn)練LLama7B,純數(shù)據(jù)并行的情況下打開(kāi)memory_efficient開(kāi)關(guān)相比于不打開(kāi)節(jié)省了大約2個(gè)G的顯存,如果模...
基于Omniverse的NVIDIA Isaac Sim現(xiàn)已發(fā)布公測(cè)版
Omniverse是NVIDIA模擬器的根本基礎(chǔ),包括加入了多項(xiàng)新功能的Isaac平臺(tái)。NVIDIA Isaac Sim目前已發(fā)布公測(cè)版,您可以通過(guò)該平...
用CUDA 11 . 2 C ++編譯器加速應(yīng)用程序性能
編譯器工具鏈將 LLVM 升級(jí)到 7 . 0 ,這將啟用新功能并有助于改進(jìn) NVIDIA GPU 的編譯器代碼生成。
虛擬 GPU通過(guò)將數(shù)據(jù)中心 GPU 進(jìn)行虛擬化,用戶(hù)可在多個(gè)虛擬機(jī)中共享該GPU。這大大提高了應(yīng)用程序和桌面的性能,并支持組織構(gòu)建虛擬桌面基礎(chǔ)架構(gòu) (V...
用鍵盤(pán)與搖桿控制Jetbot智能小車(chē)行動(dòng)
如果已經(jīng)將 Jetbot 智能小車(chē)組裝好的話(huà),現(xiàn)在就可以開(kāi)始執(zhí)行 Jetbot 智能小車(chē)實(shí)驗(yàn),接下來(lái)的操作都在以下環(huán)境中執(zhí)行:
視覺(jué)相機(jī)是機(jī)器智能/自動(dòng)化的關(guān)鍵,NVIDIA Jetson支持多個(gè)合作伙伴的Camera,這些相機(jī)包括USB、以太網(wǎng)、MIPI等接口的相機(jī)。
使用 NVIDIA Magnum IO NVSHMEM 和 GPUDirect Async 提高 HPC 系統(tǒng)的網(wǎng)絡(luò)性能
研究人員基于NVIDIA GPU創(chuàng)建了可預(yù)測(cè)的3D細(xì)胞模型
艾倫細(xì)胞科學(xué)研究所(Allen Institute for Cell Science)由微軟聯(lián)合創(chuàng)始人Paul Allen在西雅圖成立,其研究人員創(chuàng)建了...
在動(dòng)態(tài)環(huán)境中使用CUDA圖提高實(shí)際應(yīng)用程序性能
具有許多小 CUDA 內(nèi)核的應(yīng)用程序通??梢允褂?CUDA 圖進(jìn)行加速,即使內(nèi)核啟動(dòng)模式在整個(gè)應(yīng)用程序中發(fā)生變化。鑒于這種動(dòng)態(tài)環(huán)境,最佳方法取決于應(yīng)用程...
DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化
TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token P...
NVIDIA RTX 4000 SFF Ada 測(cè)試報(bào)告請(qǐng)查收!
SPECviewperf 2020 主要是用來(lái)評(píng)測(cè)顯卡專(zhuān)業(yè)圖形性能的軟件,其中包括了我們常見(jiàn)的 3ds Max、Maya、Catia、UG NX、Sol...
如何在NVIDIA Jetson Thor上提升機(jī)器人感知效率
構(gòu)建自主機(jī)器人需要具備可靠且低延遲的視覺(jué)感知能力,以實(shí)現(xiàn)在動(dòng)態(tài)環(huán)境中的深度估計(jì)、障礙物識(shí)別、定位與導(dǎo)航。這些功能對(duì)計(jì)算性能有較高要求。NVIDIA Je...
影馳GeForce RTX 4070 Ti SUPER詳細(xì)評(píng)測(cè)
在顯存部分,RTX 4070 Ti SUPER配置的是16GB/256bit/21Gbps規(guī)格的GDDR6X顯存,總帶寬約為672GB/s,相比RTX ...
基于GPU的深度學(xué)習(xí)算法對(duì)古代陶器小碎片進(jìn)行分類(lèi)
北亞利桑那大學(xué)的兩位研究人員使用基于GPU的深度學(xué)習(xí)算法對(duì)古代陶器小碎片進(jìn)行分類(lèi),分類(lèi)結(jié)果達(dá)到甚至超越了四位考古專(zhuān)家的水平。 Leszek Pawlow...
2021-08-13 標(biāo)簽:NVIDIAgpu深度學(xué)習(xí) 4.6k 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |