日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國內公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競品

硬件世界 ? 來源:硬件世界 ? 2023-07-17 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自稱為國內自主創(chuàng)新的通用GPU領軍企業(yè)的登臨科技獲得中國互聯(lián)網(wǎng)投資基金(簡稱“中網(wǎng)投”)獨家投資。

公司稱,這將為登臨新一代Goldwasser(高凜)規(guī)模化量產(chǎn)及商業(yè)化落地提供重要保障。

高凜是一款AI加速卡,首款產(chǎn)品2021年量產(chǎn)投入市場,2022年銷售過萬片。

第二代產(chǎn)品2022年流片,2023年實現(xiàn)量產(chǎn)。根據(jù)現(xiàn)有客戶測試結果,二代產(chǎn)品針對基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應用的硬件成本。

在官網(wǎng),登臨介紹自己是國內首家完全憑借自主創(chuàng)新,實現(xiàn)規(guī)?;虡I(yè)落地的通用GPU企業(yè),登臨科技核心IP完全自主研發(fā),其自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內異構計算架構),在兼容 CUDA/OpenCL 在內的編程模型和軟件生態(tài)的基礎上,通過架構創(chuàng)新,解決了客戶核心關注的通用性和高效率的雙重難題。

其表示,經(jīng)過大量客戶產(chǎn)品化驗證,針對AI計算,GPU+相比現(xiàn)有主流GPU在性能及能效上有顯著提升。

ba101482-23ef-11ee-962d-dac502259ad0.jpg

在AI市場上,NVIDIA現(xiàn)在是沒有對手的階段,AI顯卡份額估計在90%以上,AMD都很難競爭,現(xiàn)在Intel也加入這個市場了,而且找到了NVIDIA的一個痛點,那就是性價比。

NVIDIA目前受追捧的AI顯卡主要是A100、H100,國內有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應求,A800一周時間就從9萬元漲到11萬元以上,H100價格在25萬元以上,H800也要20萬出頭,而且不同經(jīng)銷商的價格差異很大。

Intel自然也不會放過這個市場,日前在國內舉行發(fā)布會,也推出了AI顯卡Habana Gaudi2,這是去年底發(fā)布的AI推理加速芯片,從第一代的16nm工藝升級到7nm工藝,Tensor 處理器核心數(shù)量增至 24 個,同時集成了多媒體處理引擎,內存升級至 96GB HBM2E。

國內版的Gaudi2主要是閹割了部分網(wǎng)絡接口,但也集成了21路100Gbps網(wǎng)絡接口,總體來說性能依然很可觀。

ba385da2-23ef-11ee-962d-dac502259ad0.jpg

Intel還公布了Gaudi2跟H100的AI性能對比,面對要求極為苛刻的、1750億參數(shù)的GPT-3模型,384個Gaudi2加速器上的訓練時間僅為311.9分鐘,而且從256個加速器到384個加速器,性能擴展幅度達95%。

NVIDIA這邊在512塊 H100 GPU上的訓練時間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會跟H100拼極限性能,而是強調性價比。

Habana Labs 首席運營官 Eitan Medina 表示,性價比是影響H100和Gaudi2相對價值的重要考量因素,Gaudi2 服務器的成本要比H100低得多。

更重要的是,目前Gaudi2還沒有支持AI常用的FP8運算格式,這種情況下Gaudi2 在性價比上也勝過了H100,今年3季度會升級支持FP8運算,Gaudi2的性能將有明顯飛躍,性價比要比H100更高了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5289

    瀏覽量

    136109
  • AI
    AI
    +關注

    關注

    91

    文章

    41370

    瀏覽量

    302743
  • ChatGPT
    +關注

    關注

    31

    文章

    1602

    瀏覽量

    10404

原文標題:國內公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競品

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    登臨科技GPU+架構助力鐵路檢測智能化升級

    科技股份有限公司自主研發(fā)GPU+架構 ,憑借其 卓越能比、高度生態(tài)兼容、強大算力與大內存支
    的頭像 發(fā)表于 04-29 15:53 ?665次閱讀

    登臨科技GPU+架構以硬核算力賦智慧種植

    傳統(tǒng)農(nóng)業(yè)種植模式的諸多痛點,正持續(xù)制約著農(nóng)業(yè)智能化升級進程,農(nóng)業(yè)現(xiàn)代化發(fā)展亟需一場 “算力革命”。登臨科技自主研發(fā)GPU + 架構,憑借兼具通用性與高效性的核心優(yōu)勢打破技術壁壘,以硬核算力賦
    的頭像 發(fā)表于 04-13 09:55 ?520次閱讀
    登臨科技<b class='flag-5'>GPU+</b>架構以硬核算力賦<b class='flag-5'>能</b>智慧種植

    登臨科技GPU+技術如何推動智慧礦業(yè)發(fā)展

    隨著人工智能技術的快速發(fā)展,傳統(tǒng)礦業(yè)正面臨從"經(jīng)驗驅動"向"智能決策"的深刻變革。在這一轉型過程中,GPU+技術憑借其強大的算力、高效的比和靈活的部署能力
    的頭像 發(fā)表于 04-07 14:20 ?402次閱讀
    登臨科技<b class='flag-5'>GPU+</b>技術如何推動智慧礦業(yè)發(fā)展

    登臨科技以創(chuàng)新GPU+架構深度賦華北區(qū)域智算中心

    蘇州登臨科技股份有限公司(以下簡稱“登臨科技”)近日宣布,其以創(chuàng)新GPU+架構為核心的創(chuàng)新算力產(chǎn)品,正深度賦華北區(qū)域智算中心,特別是石家莊地區(qū)的產(chǎn)業(yè)升級與數(shù)字經(jīng)濟發(fā)展。該項目突破了傳統(tǒng)算力中心單一
    的頭像 發(fā)表于 03-25 14:20 ?842次閱讀

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。
    的頭像 發(fā)表于 02-10 10:31 ?559次閱讀

    PT153S是方寸微電子自主研發(fā)的一款全國產(chǎn)化USB千兆網(wǎng)卡芯片

    PT153S是方寸微電子自主研發(fā)的一款全國產(chǎn)化USB千兆網(wǎng)卡芯片,該芯片具有功能豐富 、性能強勁、功耗低等特點,可廣泛應用于USB千兆網(wǎng)卡、擴展塢、PC、嵌入式工業(yè)主板等 眾多電子產(chǎn)品。 該芯片集成
    發(fā)表于 02-02 14:31

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學習 NVIDIA CUDA Tile 編程,掌握構建高性能 GPU 內核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?5336次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高<b class='flag-5'>性能</b>矩陣乘法

    中車永濟電機公司抽水蓄核心裝置實現(xiàn)自主化突破

    近日,由中車永濟電機公司自主研發(fā)的具有完全自主知識產(chǎn)權的抽水蓄能變速機組協(xié)調控制器樣機,完成了系統(tǒng)測試及功能驗證,實現(xiàn)了公司在該領域零的突破
    的頭像 發(fā)表于 01-05 11:50 ?775次閱讀

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GP
    的頭像 發(fā)表于 12-13 10:12 ?1482次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡化<b class='flag-5'>GPU</b>編程

    首款全國產(chǎn)訓推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    架構,在算力、比等核心指標上實現(xiàn)突破性進展。 ? HL100芯片F(xiàn)P16算力達256 TFLOPS,配備LPDDR5顯存,單芯支持128GB超大容量,顯存容量為國際同類產(chǎn)品的1.33倍,同時兼容
    的頭像 發(fā)表于 11-30 07:20 ?9831次閱讀
    首款全國產(chǎn)訓推一體AI芯片發(fā)布,<b class='flag-5'>兼容</b><b class='flag-5'>CUDA</b>生態(tài)

    深圳南柯電子|燈具EMC整改:低碳時代,兼容性的平衡之道

    深圳南柯電子|燈具EMC整改:低碳時代,兼容性的平衡之道
    的頭像 發(fā)表于 11-20 10:00 ?655次閱讀

    MPN12AD06-TSEVB非隔離型DC-DC電源模塊評估板現(xiàn)貨庫存

    研發(fā)周期 30%以上。l 降低設計風險 通過預置的保護功能及寬溫測試,提前發(fā)現(xiàn)潛在問題,減少后期修改成本。l 供應鏈自主可控 Cyntec 作為臺達旗下品牌,依托國內供應鏈體系,提供全
    發(fā)表于 11-12 09:41

    淘寶API實時監(jiān)控,市場策略快人一步!

    淘寶API構建高效的監(jiān)控系統(tǒng),讓您的決策“快人一步”。 1. 為什么需要實時監(jiān)控? 電商市場瞬息萬變,
    的頭像 發(fā)表于 08-06 14:38 ?941次閱讀

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    CSS6404L 在物聯(lián)網(wǎng)設備中的應用優(yōu)勢:低功耗高可靠的存儲革新與對比

    CSS6404L 通過 “高集成度 + 低功耗 + 寬適應” 的組合特性,在容量、功耗、性能及場景兼容性上全面超越同類,尤其在需要兼顧長續(xù)航、高速傳輸與緊湊設計的物聯(lián)網(wǎng)場景中,成為
    的頭像 發(fā)表于 06-06 15:35 ?812次閱讀
    CSS6404L 在物聯(lián)網(wǎng)設備中的應用優(yōu)勢:低功耗高可靠的存儲革新與<b class='flag-5'>競</b><b class='flag-5'>品</b>對比
    垫江县| 穆棱市| 池州市| 阜宁县| 沁水县| 康保县| 二连浩特市| 荔波县| 昭觉县| 韶关市| 宿州市| 酒泉市| 漳浦县| 宁明县| 潜江市| 旌德县| 镇雄县| 许昌县| 抚顺县| 招远市| 广元市| 锡林郭勒盟| 库车县| 南岸区| 和龙市| 绥芬河市| 体育| 河曲县| 板桥市| 崇义县| 彭山县| 剑河县| 神农架林区| 太仓市| 修水县| 嘉峪关市| 济阳县| 孟连| 海伦市| 武隆县| 宁蒗|