日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

錯誤使用GPT-3:成本卻降低了40倍,速度提高了5倍

jf_WZTOguxH ? 來源:Buildt ? 2023-03-01 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Buildt 使用 OpenAI 基礎模型已經有一段時間了。這些模型非常強大,關于這一點,互聯(lián)網上已經有了大量的記錄,特別是隨著 ChatGPT 的出現(xiàn),它的關注度超過了之前 GPT-3 的 100 倍。然而,在應用這些模型解決相應問題(代碼庫搜索、理解和增強)的過程中,我們發(fā)現(xiàn)了一個明顯的障礙:延遲和成本。比較大的模型(特別是 davinci 家族)無疑能產生最高質量的輸出,但運行起來也最慢、最昂貴。

要獲得良好的搜索體驗,顯然速度就得快。你看谷歌,100 毫秒就可以索引數百萬個網頁,代碼庫搜索也是如此。我們發(fā)現(xiàn),在單個搜索中,其中一個最耗時的點就是生成輸出的 LLM 層(我們使用 LLM 來增強搜索,讓你可以搜索代碼是什么,而不是它做什么,例如“找出最慢的遞歸函數”)。Alex grave 是 Github Copilot 的創(chuàng)建者之一。據他說,每增加 10 毫秒的延遲,完成率就會下降 1%。這一邏輯也適用于搜索。所以,當務之急是從 davinci 這樣的大型模型轉向 ada 和 babbage 這樣的小型模型。

92440896-b1cb-11ed-bfe3-dac502259ad0.png

我們的解決方案很簡單,對于給定的任務,由 davinci 生成一個中等大小的語料庫,并精心優(yōu)化像 babbage 這樣的模型來完成相同的任務。如果操作得當,你可以以低 40 倍的成本、低 4-5 倍的延遲獲得幾乎相同的完成率(或至少 90% 的相似性)。

如果你愿意花點時間,則還可以在循環(huán)中加一個人:我們最近就做了這樣的事情來優(yōu)化 babbage 模型,以便能夠識別代碼的特征,所以我讓 ChatGPT 幫我創(chuàng)建了一個基本的 Web UI,讓我們可以輕松地審核和改進 davinci 所的識別結果;從根本上說,你永遠無法從一個更小的模型那里獲得類似的性能,所以讓完成率勝過你試圖模仿的模型,意味著你至少在訓練完成時就比較接近。

9264637a-b1cb-11ed-bfe3-dac502259ad0.jpg

關于這種技術,我想的最多的一個問題是:我需要多少樣本?答案恐怕是“視情況而定”。

根據經驗,如果你只是想標準化平淡無奇的輸出格式,那么你可以用幾百個樣本;如果你是在做邏輯推理,那么你至少需要 1000 個樣本;如果你在做 DSL 工作,那么你需要幾千個樣本。樣本大小通常會是一個障礙,但有了用更大的模型來生成合成數據集的方法,那突然變得比較容易處理了,特別是當這些模型變得越來越好時。

這種方法有很多應用場景;如果你有一個提示符,它可以重復做同樣的工作,那么你就可以使用這項技術來加快速度,降低成本。

有人問過我這種方法的維護問題,特別是如果想要更改輸出結構時會出現(xiàn)什么情況。我們內部構建了一個經過精心優(yōu)化的管道來自動化整個過程,其底層是 davinci-003 提示符,然后我們用它來生成 n 個合成樣本,格式化后傳遞給 OpenAI 調優(yōu) API,它會吐出一個調優(yōu)過的模型。這樣,如果你想更改提示符的輸出,只需一次單擊就可以更新一個調優(yōu)過的模型。

我總是很樂意談論這個話題,歡迎在 Twitter 上關注我(@AlistairPullen),我上面描述的所有內容都可以在我們的代碼搜索工具 Buildt 中找到。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3831

    瀏覽量

    52289
  • OpenAI
    +關注

    關注

    9

    文章

    1252

    瀏覽量

    10296

原文標題:錯誤使用 GPT-3:成本卻降低了40 倍,速度提高了5 倍

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    衛(wèi)星通信引爆增長神話:凈利暴增超40!射頻企業(yè)涌入押注

    分化。其中,臻鐳科技歸母凈利潤實現(xiàn)超過640%的增長、扣非凈利潤暴漲4332%成為市場關注焦點。 ? ? 臻鐳科技: 40 爆發(fā)式增長 ,衛(wèi)星通信賽道領跑者 臻鐳科技在2025年實現(xiàn)凈利潤暴漲40
    的頭像 發(fā)表于 01-29 09:15 ?7992次閱讀
    衛(wèi)星通信引爆增長神話:凈利暴增超<b class='flag-5'>40</b><b class='flag-5'>倍</b>!射頻企業(yè)涌入押注

    相變存儲器 (PCM) 技術介紹

    ,這種結合的優(yōu)勢顯著。它在提供更大存儲器容量和更高集成度的同時,提高了性能并降低了功耗。 穩(wěn)健可靠PCM技術經過開發(fā)和測試,可滿足高溫運行、抗輻射和數據保留要求。PCM的工作溫度高達+165C,可滿足
    發(fā)表于 04-29 15:58

    OpenAI戰(zhàn)略革新:Codex融入GPT-5.5開啟全能AI編程新紀元

    至新模型后,內存占用降低37%,推理速度提升22%,復雜代碼庫實驗周期從數周壓縮至“隔夜完成”。英偉達萬人內測數據顯示,工程師調試時間縮短80%,百萬token成本降低35
    的頭像 發(fā)表于 04-28 09:56 ?524次閱讀

    這個壓電路如何疊加電壓輸出的?

    輸出電壓多少? 2.正負半周期分別是如何疊加輸出壓的?疊加路徑? 3.正半周期時,電源給C1充電,會經C5→C4→D3返回N嗎? 4.負半周期時,電源給C
    發(fā)表于 04-10 09:24

    什么是變鏡頭?

    鏡頭是一種專門為精密檢測設計的工業(yè)光學元件,一般應用于機器視覺與工業(yè)自動化領域。它可以在工作距離不變的情況下,通過調節(jié)內部的光學組件來改變光學放大倍率,從而實現(xiàn)不同倍率的切換,而不用更換鏡頭
    的頭像 發(fā)表于 03-14 17:35 ?239次閱讀
    什么是變<b class='flag-5'>倍</b>鏡頭?

    力爭百萬 Tokens 推理成本降低:云天勵飛發(fā)布未來三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構創(chuàng)新,力爭實現(xiàn)百萬 Tokens 推理成本降低 100 以上的目標,推動 AI 從技術嘗鮮走向普惠生產力。產業(yè)變局:推理競速,從
    的頭像 發(fā)表于 02-03 20:25 ?3205次閱讀
    力爭百萬 Tokens 推理<b class='flag-5'>成本</b><b class='flag-5'>降低</b>百<b class='flag-5'>倍</b>:云天勵飛發(fā)布未來三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    如何使用EtherCAT總線網關與福TwinCAT3系列PLC通訊

    01 概述 EtherCAT (以太網控制自動化技術) 是由德國福公司開發(fā)的、基于以太網的開放現(xiàn)場總線系統(tǒng),EtherCAT為系統(tǒng)的實時性能和拓撲的靈活性樹立了新的標準,同時,它還符合甚至降低了
    的頭像 發(fā)表于 01-15 13:51 ?3157次閱讀
    如何使用EtherCAT總線網關與<b class='flag-5'>倍</b>福TwinCAT<b class='flag-5'>3</b>系列PLC通訊

    Neway微波產品的國產化替代方案

    的低損耗、高穩(wěn)定性性能。這種自主化生產方式不僅提高了產品的可靠性,還降低了生產成本。三、供應鏈本地化整合Neway通過整合本地供應鏈資源,實現(xiàn)了微波產品的快速交付和靈活定制。例如,在定制化服務中
    發(fā)表于 12-18 09:24

    什么是變鏡頭

    什么是變鏡頭變鏡頭是一種可以連續(xù)調節(jié)放大倍率或視場范圍的光學鏡頭。它通過內部光學組的相對移動,實現(xiàn)倍率/焦距的連續(xù)變化,而且需要保證在變過程中成像仍然清晰、畸變小。特點:適合需要多倍率觀察
    的頭像 發(fā)表于 12-01 15:31 ?823次閱讀
    什么是變<b class='flag-5'>倍</b>鏡頭

    AI算法開發(fā),SpeedDP打輔助!不止10效率

    往日的職場生存法則正在被AI一點一點改變,以前是人卷人,現(xiàn)在即使是再卷,也卷不過AI,24小時不間斷工作的AI,能夠為企業(yè)帶來巨大的成本節(jié)省。對于企業(yè)而言,誰能夠給自己帶來更多的利潤,誰就是首選
    的頭像 發(fā)表于 11-20 18:09 ?790次閱讀
    AI算法開發(fā),SpeedDP打輔助!不止10<b class='flag-5'>倍</b>效率

    為什么FPU在MCU中很重要呢?

    核心去處理其他任務(如控制邏輯、通信、中斷處理),提高了系統(tǒng)的整體響應能力和多任務處理能力。 降低功耗: 由于計算速度大大加快,完成相同計算任務所需的時間顯著縮短,CPU 可以更快地進入低功耗睡眠
    發(fā)表于 11-18 07:05

    西門子EDA AI System驅動芯片設計新紀元

    芯片設計是一項復雜的系統(tǒng)工程,尤其驗證和優(yōu)化環(huán)節(jié)極其耗費時間和精力。為了有效降低錯誤率、提升設計質量,EDA工具的自動化、智能化發(fā)展成為關鍵。近年來,隨著AI技術在EDA領域的應用逐漸成熟,為芯片設計領域帶來了革命性的變化。AI加持顯著
    的頭像 發(fā)表于 11-17 14:14 ?2586次閱讀
    西門子EDA AI System驅動芯片設計新紀元

    ?Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 提速背后的黑科技

    Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 提速背后的黑科技? 最近,Moonshot AI 的千億參數大模型 ?Kimi K2? 在 ?GroqCloud? 上
    的頭像 發(fā)表于 08-07 10:01 ?1359次閱讀

    AI 眼鏡銷量激增10 :帶動芯片需求,產業(yè)鏈迎來雙向爆發(fā)

    今年上半年,智能眼鏡市場迎來爆發(fā)式增長,品類成交量同比激增10,入駐品牌數量較去年增長超3。更值得關注的是,在國家補貼與產業(yè)鏈協(xié)同的雙重作用下,智能眼鏡的入手門檻不斷降低,產品均價
    的頭像 發(fā)表于 07-25 15:26 ?782次閱讀

    汽車導航系統(tǒng)EMC整改:工程師必看,成本降低40%的秘訣

    南柯電子|汽車導航系統(tǒng)EMC整改:工程師必看,成本降低40%的秘訣
    的頭像 發(fā)表于 07-22 11:07 ?820次閱讀
    靖安县| 孝昌县| 宣威市| 奉化市| 梅州市| 武冈市| 琼海市| 醴陵市| 鹤壁市| 孟津县| 双牌县| 碌曲县| 壶关县| 翼城县| 通河县| 清徐县| 武定县| 滦南县| 敦化市| 南溪县| 玉山县| 西和县| 茂名市| 勃利县| 皮山县| 荣成市| 武乡县| 石楼县| 嘉义市| 建平县| 井研县| 沙洋县| 承德市| 大丰市| 桃园县| 五峰| 无为县| 平山县| 威海市| 汽车| 固原市|