亚洲精品九九,中文字幕在线高清蜜臀

前段時(shí)間，Mistral AI 公布的 Mixtral 8x7B 模型爆火整個(gè)開源社區(qū)，其架構(gòu)與 GPT-4 非常相似，很多人將其形容為 GPT-4 的「縮小版」。

我們都知道，OpenAI 團(tuán)隊(duì)一直對(duì) GPT-4 的參數(shù)量和訓(xùn)練細(xì)節(jié)守口如瓶。Mistral 8x7B 的放出，無疑給廣大開發(fā)者提供了一種「非常接近 GPT-4」的開源選項(xiàng)。

在基準(zhǔn)測(cè)試中，Mistral 8x7B 的表現(xiàn)優(yōu)于 Llama 2 70B，在大多數(shù)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試上與 GPT-3.5 不相上下，甚至略勝一籌。

▲圖源 https://mistral.ai/news/mixtral-of-experts/

隨著這項(xiàng)研究的出現(xiàn)，很多人表示：「閉源大模型已經(jīng)走到了結(jié)局?！?/span>

短短幾周的時(shí)間，機(jī)器學(xué)習(xí)愛好者 Vaibhav (VB) Srivastav 表示：隨著 AutoAWQ（支持 Mixtral、LLaVa 等模型的量化）最新版本的發(fā)布，現(xiàn)在用戶可以將 Mixtral 8x7B Instruct 與 Flash Attention 2 結(jié)合使用，達(dá)到快速推理的目的，實(shí)現(xiàn)這一功能大約只需 24GB GPU VRAM、不到十行代碼。

▲圖源 https://twitter.com/reach_vb/status/1741175347821883502

AutoAWQ地址：

https://github.com/casper-hansen/AutoAWQ 操作過程是這樣的： 首先是安裝 AutoAWQ 以及 transformers：

pipinstallautoawqgit+https://github.com/huggingface/transformers.git

第二步是初始化 tokenizer 和模型：

?第三步是初始化 TextStreamer：

?第四步對(duì)輸入進(jìn)行 Token 化：

?第五步生成：

?當(dāng)你配置好項(xiàng)目后，就可以與 Mixtral 進(jìn)行對(duì)話，例如對(duì)于用戶要求「如何做出最好的美式咖啡？通過簡(jiǎn)單的步驟完成」，Mixtral 會(huì)按照 1、2、3 等步驟進(jìn)行回答。

項(xiàng)目中使用的代碼：

Srivastav 表示上述實(shí)現(xiàn)也意味著用戶可以使用 AWQ 運(yùn)行所有的 Mixtral 微調(diào)，并使用 Flash Attention 2 來提升它們。看到這項(xiàng)研究后，網(wǎng)友不禁表示：真的很酷。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴