日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

不再焦慮GPU供應,8芯片挑戰(zhàn)5萬億參數大模型

E4Life ? 來源:電子發(fā)燒友網 ? 作者:周凱揚 ? 2023-09-27 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/周凱揚)隨著LLM與生成式AI熱度不減,不少AI芯片初創(chuàng)公司都找到了新的發(fā)力點,紛紛調整設計思路,專為這一爆款應用開發(fā)出了新款芯片。且不說這些芯片的實際性能如何,但這無疑是當下推動這些公司獲得投資,并在行業(yè)下行期存活下去的救命稻草。今天我們就來聊聊剛發(fā)布新品SN40L的AI芯片初創(chuàng)公司SambaNova。

SN40L背后的SambaNova

SambaNova成立于2017年,截至目前已經歷了共計6輪融資,參與融資的公司包括谷歌、英特爾和軟銀等,融資總額高達11億美元。只不過最近的D輪融資,距今已經有兩年多的時間,也難怪SambaNova急于推出SN40L這一芯片,畢竟此類初創(chuàng)公司的開發(fā)從來都是燒錢的。

其實在SN40L推出以前,SambaNova也并非默默無聞,比如美國阿貢國家實驗室早在第一代產品SN10推出時就在使用和測試SambaNova的系統(tǒng)了,只不過屆時基于SN10的SambaNova Dataflow系統(tǒng)還只是用于消除數據噪聲而已。

如果我們現在看阿貢國家實驗室的ALCF AI測試平臺,我們可以看到5大系統(tǒng),分別是Cerebras的CS2、SambaNova的Dataflow、Graphcore的Bow Pod64、Grop系統(tǒng)以及Habana的Gaudi。而目前用于ALCF AI測試平臺的SambaNova Dataflow就是基于SN40L的上一代產品SN30 RDU打造的,該芯片基于臺積電的7nm工藝打造。

目前SN30用在阿貢國家實驗室的這套系統(tǒng)主要用于一些科學研究領域的AI計算,比如中微子物理、癌癥預測、氣候建模以及下一代汽車引擎研發(fā)等。而我們真正關注的是剛發(fā)布的SN40L,以及它在LLM這一應用上能提供何種不同的優(yōu)勢。

英偉達GPU的替代方案

目前LLM的主流方案,即英偉達的A100、H100 GPU,存在一個很大的問題,那就是缺貨。對于任何互聯(lián)網廠商來說,在市面上找到足夠多的GPU都是一件費錢費力的事。而對于云服務廠商來說也是如此,他們也要考慮出租這類服務器時,GPU的算力與容量分配問題。

wKgaomUTgVGAKNovADO8XqFE2PU092.png
SN40L芯片和CEO Rodrigo Liang / SambaNova


為了解決“數量”的問題,SambaNova推出了SN40L。相較上一代的SN30,該芯片基于臺積電5nm工藝打造,每個芯片集成了1020億個晶體管和1040個核,算力高達638TFlops。更夸張的是,SambaNova稱單個SN40L系統(tǒng)節(jié)點(8塊SN40L芯片)就能支持到最高5萬億參數的大模型。

與其他AI芯片初創(chuàng)公司不一樣的是,他們并沒有選擇直接將芯片賣給其他公司這條路線,而是選擇了售賣訪問其定制AI技術棧的訪問權,包括其自研硬件和運行超大模型的軟件等。這種商業(yè)模式或許能吸引一部分互聯(lián)網公司,但在云服務廠商眼中,他們應該不會覺得這是一套可盈利的方案。

此外,SambaNova與其他競爭對手一樣,在AI芯片上引入了64GB HBM用于解決內存墻的問題,這也是SN40L與上一代芯片的差異之一。只不過SambaNova并沒有透露SN40L用的是何種HBM,以及帶寬性能如何。

寫在最后

雖然SambaNova展示了提高LLM擴展性的另一條道路,但在沒有經過實際驗證之前,市場還是會對其持觀望態(tài)度。此前也有不少AI芯片公司發(fā)表過同樣大膽的聲明,但事實證明這類芯片只適合用于運行那些預訓練完成的模型,而訓練過程仍需要靠GPU來完成。所以哪怕SambaNova的CEO Rodrigo Liang強調SN40L的訓練性能足夠優(yōu)秀,但是否能在這套商業(yè)模式下闖出一片天,就得交由市場去驗證了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5284

    瀏覽量

    136107
  • SambaNova
    +關注

    關注

    0

    文章

    8

    瀏覽量

    398
  • SN40L
    +關注

    關注

    0

    文章

    2

    瀏覽量

    146
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI Ceph 分布式存儲教程資料大模型學習資料2026

    在人工智能的浪潮中,算力、算法與數據被譽為三駕馬車。然而,隨著大模型(LLM)參數量突破萬億級別,數據集規(guī)模膨脹至 PB 乃至 EB 級別,傳統(tǒng)的存儲架構已難以支撐這場算力競賽的“糧草”需求
    發(fā)表于 05-01 17:35

    沐曦股份曦云C系列GPU產品Day 0適配智譜GLM-5.1旗艦模型

    4月8日,智譜新一代旗艦模型GLM-5.1實現開源。目前,沐曦股份曦云 C 系列 GPU已完成該系列模型Day 0 全量適配,再度以全棧自主技術實力,領跑國產
    的頭像 發(fā)表于 04-09 11:25 ?437次閱讀

    【瑞薩AI挑戰(zhàn)賽】手寫數字識別模型在RA8P1 Titan Board上的部署

    Lib組件。 配置完成后生成代碼,然后回到RT-Thread Studio,將生成的文件加入到工程中。 指定頭文件路徑 5.2 板端代碼關鍵參數修改 參考RA8P1開發(fā)板的示例工程,對模型代碼與嵌入式工程
    發(fā)表于 03-15 20:42

    今日看點:消息稱 AMD、高通考慮導入 SOCAMM 內存;曦望發(fā)布新一代推理GPU芯片啟望S3

    推理深度定制的GPGPU芯片。其單芯片推理性能提升5倍,支持從FP16到FP8、FP6、FP4等多精度靈活切換,釋放低精度推理效率,這種設計更貼合當前MoE和長上下文
    發(fā)表于 01-28 11:09 ?1365次閱讀

    蘋果AI革命:M5芯片10核GPU、AI處理速度翻倍,Apple Glass在路上

    三款核心設備。這一場蘋果圍繞M5芯片AI硬件的革新,也成為蘋果邁進AI時代以端側大模型和空間計算的又一成績。 ? ? 3nm+10核GPU革命,AI算力暴增4倍 蘋果官網介紹,M
    的頭像 發(fā)表于 10-19 01:13 ?1.1w次閱讀
    蘋果AI革命:M<b class='flag-5'>5</b><b class='flag-5'>芯片</b>10核<b class='flag-5'>GPU</b>、AI處理速度翻倍,Apple Glass在路上

    紫光國芯存儲芯片國產替代方案:打破DDR5/HBM芯片供應鏈瓶頸

    可控。市場需求與供應鏈現實:DDR5及HBM的技術價值與挑戰(zhàn)AI大模型、智能計算等應用場景的爆發(fā),對數據處理的通量和效率提出了極為苛刻的要求,這直接推動了存儲技術
    的頭像 發(fā)表于 10-10 16:41 ?2841次閱讀
    紫光國芯存儲<b class='flag-5'>芯片</b>國產替代方案:打破DDR<b class='flag-5'>5</b>/HBM<b class='flag-5'>芯片</b><b class='flag-5'>供應</b>鏈瓶頸

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI芯片這個真不知道,以為它是數字
    發(fā)表于 09-12 16:07

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點,面向萬億參數模型創(chuàng)新設計

    擴展支持64路本土GPU芯片。元腦SD200可實現單機內運行超萬億參數模型,并支持多個領先大模型
    的頭像 發(fā)表于 08-08 22:17 ?794次閱讀
    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點,面向<b class='flag-5'>萬億</b><b class='flag-5'>參數</b>大<b class='flag-5'>模型</b>創(chuàng)新設計

    ?Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技? 最近,Moonshot AI 的千億參數模型 ?Kimi K2? 在 ?GroqCl
    的頭像 發(fā)表于 08-07 10:01 ?1360次閱讀

    面向萬億參數模型,“超節(jié)點”涌現

    UniPoD系列超節(jié)點產品,旨在為萬億參數模型的訓練與推理提供更強勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列超節(jié)點產品基于領先的Scale-up南向互聯(lián)技術,可實現單機柜最高64卡
    的頭像 發(fā)表于 08-03 02:37 ?9196次閱讀
    面向<b class='flag-5'>萬億</b>級<b class='flag-5'>參數</b>大<b class='flag-5'>模型</b>,“超節(jié)點”涌現

    如何在Ray分布式計算框架下集成NVIDIA Nsight Systems進行GPU性能分析

    在大語言模型的強化學習訓練過程中,GPU 性能優(yōu)化至關重要。隨著模型規(guī)模不斷擴大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要挑戰(zhàn)
    的頭像 發(fā)表于 07-23 10:34 ?2602次閱讀
    如何在Ray分布式計算框架下集成NVIDIA Nsight Systems進行<b class='flag-5'>GPU</b>性能分析

    萬億參數!元腦企智一體機率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布元腦企智一體機已率先完成對Kimi K2 萬億參數模型的適配支持,并實現單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署
    的頭像 發(fā)表于 07-22 09:27 ?720次閱讀
    <b class='flag-5'>萬億</b><b class='flag-5'>參數</b>!元腦企智一體機率先支持Kimi K2大<b class='flag-5'>模型</b>

    模型推理顯存和計算量估計方法研究

    GPU、FPGA等硬件加速。通過分析硬件加速器的性能參數,可以估算模型在硬件加速下的計算量。 四、實驗與分析 為了驗證上述估計方法的有效性,我們選取了幾個具有代表性的深度學習模型,在多
    發(fā)表于 07-03 19:43

    為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的
    發(fā)表于 06-23 07:11

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知
    發(fā)表于 06-18 19:31
    新乡市| 静宁县| 股票| 嘉峪关市| 淮阳县| 德惠市| 仁怀市| 扶风县| 南岸区| 兴隆县| 上杭县| 宣威市| 二连浩特市| 佛山市| 伊宁县| 安仁县| 吴旗县| 广昌县| 绿春县| 克山县| 福贡县| 佛山市| 鸡东县| 务川| 和田县| 左贡县| 涿鹿县| 浙江省| 五河县| 濉溪县| 凯里市| 若尔盖县| 贵州省| 河池市| 离岛区| 北票市| 吉安县| 广水市| 呼伦贝尔市| 沙洋县| 海淀区|