日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌MIT最新研究證明:高質(zhì)量數(shù)據(jù)獲取不難,大模型就是歸途

CVer ? 來(lái)源:新智元 ? 2024-01-15 15:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】數(shù)據(jù)獲取最新解,便是從生成模型中學(xué)習(xí)。

獲取高質(zhì)量數(shù)據(jù),已經(jīng)成為當(dāng)前大模型訓(xùn)練的一大瓶頸。

前幾天,OpenAI被《紐約時(shí)報(bào)》起訴,并要求索賠數(shù)十億美元。訴狀中,列舉了GPT-4抄襲的多項(xiàng)罪證。

甚至,《紐約時(shí)報(bào)》還呼吁摧毀幾乎所有的GPT等大模型。

236ef1be-b365-11ee-8b88-92fbcf53809c.png

一直以來(lái),AI界多位大佬認(rèn)為「合成數(shù)據(jù)」或許是解決這個(gè)問(wèn)題的最優(yōu)解。

237c6ace-b365-11ee-8b88-92fbcf53809c.png

此前,谷歌團(tuán)隊(duì)還提出了用LLM代替人類標(biāo)記偏好的方法RLAIF,效果甚至不輸人類。

23821e7e-b365-11ee-8b88-92fbcf53809c.png

現(xiàn)如今,谷歌MIT的研究人員發(fā)現(xiàn),從大模型中學(xué)習(xí)可以得到使用真實(shí)數(shù)據(jù)訓(xùn)練的最佳模型的表征。

這一最新方法稱SynCLR,一種完全從合成圖像和合成描述學(xué)習(xí)虛擬表征的方法,無(wú)需任何真實(shí)數(shù)據(jù)。

23864198-b365-11ee-8b88-92fbcf53809c.png

論文地址:https://arxiv.org/abs/2312.17742

實(shí)驗(yàn)結(jié)果表明,通過(guò)SynCLR方法學(xué)習(xí)到的表征,能夠與OpenAI的CLIP在ImageNet 上的傳輸效果一樣好。

238a48a6-b365-11ee-8b88-92fbcf53809c.png

從生成模型中學(xué)習(xí)

目前表現(xiàn)最好的「視覺(jué)表征」學(xué)習(xí)方法依賴于大規(guī)模的實(shí)際數(shù)據(jù)集。然而,真實(shí)數(shù)據(jù)的收集卻有不少的困難。

為了降低收集數(shù)據(jù)的成本,研究人員本文中提出了一個(gè)問(wèn)題:

從現(xiàn)成的生成模型中采樣的合成數(shù)據(jù),是否是一條通往大規(guī)模策劃數(shù)據(jù)集的可行之路,從而訓(xùn)練出最先進(jìn)的視覺(jué)表征?

2394f6fc-b365-11ee-8b88-92fbcf53809c.png

與直接從數(shù)據(jù)中學(xué)習(xí)不同,谷歌研究人員稱這種模式為「從模型中學(xué)習(xí)」。作為建立大規(guī)模訓(xùn)練集的數(shù)據(jù)源,模型有幾個(gè)優(yōu)勢(shì):

- 通過(guò)其潛在變量、條件變量和超參數(shù),為數(shù)據(jù)管理提供了新的控制方法。

- 模型也更容易共享和存儲(chǔ)(因?yàn)槟P捅葦?shù)據(jù)更容易壓縮),并且可以產(chǎn)生無(wú)限數(shù)量的數(shù)據(jù)樣本。

越來(lái)越多的文獻(xiàn)研究了生成模型的這些特性和其他優(yōu)點(diǎn)和缺點(diǎn),并將其作為訓(xùn)練下游模型的數(shù)據(jù)源。

其中一些方法采用混合模式,即混合真實(shí)數(shù)據(jù)集和合成數(shù)據(jù)集,或需要一個(gè)真實(shí)數(shù)據(jù)集來(lái)生成另一個(gè)合成數(shù)據(jù)集。

其他方法試圖從純粹的「合成數(shù)據(jù)」中學(xué)習(xí)表征,但遠(yuǎn)遠(yuǎn)落后于表現(xiàn)最好的模型。

論文中,研究人員提出的最新方法,使用生成模型重新定義可視化類的粒度。

如圖2所示,使用2個(gè)提示生成了四張圖片「一只戴著墨鏡和沙灘帽的金毛獵犬騎著自行車」和「一只可愛(ài)的金毛獵犬坐在壽司做成的房子里」。

2398edf2-b365-11ee-8b88-92fbcf53809c.png

傳統(tǒng)的自監(jiān)督方法(如Sim-CLR)會(huì)將這些圖像視為不同的類,不同圖像的嵌入會(huì)被分開,而不會(huì)明確考慮圖像之間的共享語(yǔ)義。

另一個(gè)極端是,監(jiān)督學(xué)習(xí)方法(即SupCE)會(huì)將所有這些圖像視為單一類(如「金毛獵犬」)。這就忽略了這些圖像在語(yǔ)義上的細(xì)微差別,例如在一對(duì)圖像中狗在騎自行車,而在另一對(duì)圖像中狗坐在壽司屋內(nèi)。

相反,SynCLR方法將描述視為類,即每個(gè)描述一個(gè)可視化類。

這樣,我們就可以按照「騎自行車」和「坐在壽司店里」這兩個(gè)概念對(duì)圖片進(jìn)行分組。

這種粒度很難在真實(shí)數(shù)據(jù)中挖掘,因?yàn)槭占山o定描述的多張圖片并非易事,尤其是當(dāng)描述數(shù)量增加時(shí)。

然而,文本到圖像的擴(kuò)散模型從根本上就具備這種能力。

只需對(duì)相同的描述設(shè)定條件,并使用不同的噪聲輸入,文本到圖像的擴(kuò)散模型就能生成與相同描述相匹配的不同圖像。

具體來(lái)說(shuō),作者研究了在沒(méi)有真實(shí)圖像或文本數(shù)據(jù)的情況下,學(xué)習(xí)視覺(jué)編碼器的問(wèn)題。

最新方法依賴3個(gè)關(guān)鍵資源的利用:一個(gè)語(yǔ)言生成模型(g1),一個(gè)文本到圖像的生成模型(g2),以及一個(gè)經(jīng)過(guò)整理的視覺(jué)概念列表(c)。

前處理包括三個(gè)步驟:

(1)使用(g1)合成一組全面的圖像描述T,其中涵蓋了C中的各種視覺(jué)概念;

(2)對(duì)于T中的每個(gè)標(biāo)題,使用(g2)生成多個(gè)圖像,最終生成一個(gè)廣泛的合成圖像數(shù)據(jù)集X;

(3)在X上進(jìn)行訓(xùn)練,以獲得視覺(jué)表示編碼器f。

然后,分別使用llama-27b和Stable Diffusion 1.5作為(g1)和(g2),因?yàn)槠渫评硭俣群芸臁?/p>

合成描述

為了利用強(qiáng)大的文本到圖像模型的能力,來(lái)生成大量的訓(xùn)練圖像數(shù)據(jù)集,首先需要一個(gè)不僅精確描述圖像而且展示多樣性的描述集合,以包含廣泛的視覺(jué)概念。

對(duì)此,作者開發(fā)了一種可擴(kuò)展的方法來(lái)創(chuàng)建如此大量的描述集,利用大模型的上下文學(xué)習(xí)能力。

如下展示了三個(gè)合成模板的示例。

239dfde2-b365-11ee-8b88-92fbcf53809c.png

如下是使用Llama-2生成上下文描述,研究人員在每次推理運(yùn)行中隨機(jī)抽取三個(gè)上下文示例。

23a225c0-b365-11ee-8b88-92fbcf53809c.png

合成圖像

對(duì)于每個(gè)文本描述,研究人員都會(huì)用不同的隨機(jī)噪聲啟動(dòng)反向擴(kuò)散過(guò)程,從而生成各種圖像。

在此過(guò)程中,無(wú)分類器引導(dǎo)(CFG)比例是一個(gè)關(guān)鍵因素。

CFG標(biāo)度越高,樣本的質(zhì)量和文本與圖像之間的一致性就越好,而標(biāo)度越低,樣本的多樣性就越大,也就越符合基于給定文本的圖像原始條件分布。

23acdab0-b365-11ee-8b88-92fbcf53809c.png

表征學(xué)習(xí)

論文中,表征學(xué)習(xí)的方法建立在StableRep的基礎(chǔ)上。

作者提出的方法的關(guān)鍵組成部分是多正對(duì)比學(xué)習(xí)損失,它的工作原理是對(duì)齊(在嵌入空間)從同一描述生成的圖像。

另外,研究中還結(jié)合了其他自監(jiān)督學(xué)習(xí)方法的多種技術(shù)。

與OpenAI的CLIP相媲美

實(shí)驗(yàn)評(píng)估中,研究人員首先進(jìn)行消融研究,以評(píng)估管道內(nèi)各種設(shè)計(jì)和模塊的有效性,然后繼續(xù)擴(kuò)大合成數(shù)據(jù)的量。

下圖是不同描述合成策略的比較。

研究人員報(bào)告了9個(gè)細(xì)粒度數(shù)據(jù)集的ImageNet線性評(píng)估準(zhǔn)確性和平均準(zhǔn)確性。這里的每個(gè)項(xiàng)目包括1000萬(wàn)個(gè)描述和每個(gè)描述4張圖片。

23b2e8ec-b365-11ee-8b88-92fbcf53809c.png

下表是ImageNet線性評(píng)估與細(xì)粒度分類的比較。

盡管只使用了合成數(shù)據(jù),但SynCLR與OpenAI的CLIP和DINO v2模型取得了不相上下的結(jié)果。

23b6b3b4-b365-11ee-8b88-92fbcf53809c.png

下表是在相同的合成數(shù)據(jù)上比較SynCLR和CLIP,可以看出,SynCLR明顯優(yōu)于CLIP。

具體設(shè)置為,每個(gè)標(biāo)題生成4個(gè)圖像,SynCaps-150M為SynCLR和CLIP提供了更好的表示。

23bb41b8-b365-11ee-8b88-92fbcf53809c.png

PCA可視化如下。按照DINO v2,研究人員計(jì)算了同一組圖像的斑塊之間的PCA,并根據(jù)其前3個(gè)分量進(jìn)行著色。

與DINO v2相比,SynCLR對(duì)汽車和飛機(jī)的繪制的圖更為準(zhǔn)確,而對(duì)能繪制的圖則稍差一些。

23cc3496-b365-11ee-8b88-92fbcf53809c.png

圖6和圖7中,分別展示了不同訓(xùn)練規(guī)模下的ImageNet線性準(zhǔn)確率,以及不同訓(xùn)練參數(shù)規(guī)模下的精細(xì)分類。

23d0c47a-b365-11ee-8b88-92fbcf53809c.png

為什么要從生成模型中學(xué)習(xí)?

一個(gè)令人信服的原因是,生成模型可以像數(shù)百個(gè)數(shù)據(jù)集一樣同時(shí)運(yùn)作,能夠?yàn)椴邉澯?xùn)練數(shù)據(jù)提供了一種方便有效的方法。

總而言之,最新論文研究了視覺(jué)表征學(xué)習(xí)的新范式——從生成模型中學(xué)習(xí)。

在沒(méi)有使用任何實(shí)際數(shù)據(jù)的情況下,SynCLR學(xué)習(xí)到的視覺(jué)表征,與最先進(jìn)的通用視覺(jué)表征學(xué)習(xí)器學(xué)習(xí)到的視覺(jué)表征不相上下。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3833

    瀏覽量

    52289
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    374

    瀏覽量

    16988
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1253

    瀏覽量

    10296
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3802

    瀏覽量

    5280

原文標(biāo)題:谷歌MIT最新研究證明:高質(zhì)量數(shù)據(jù)獲取不難,大模型就是歸途

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高質(zhì)量RAG系統(tǒng)的五個(gè)核心設(shè)計(jì)要點(diǎn)

    檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)已成為構(gòu)建大模型應(yīng)用的標(biāo)準(zhǔn)架構(gòu)。然而,大多數(shù)RAG系統(tǒng)在設(shè)計(jì)初期會(huì)因?yàn)楹雎院诵脑O(shè)計(jì)原則而在實(shí)際部署中暴露嚴(yán)重問(wèn)題。本文從工程實(shí)踐角度出發(fā),梳理高質(zhì)量RAG系統(tǒng)的5個(gè)核心設(shè)計(jì)要點(diǎn)。
    的頭像 發(fā)表于 04-24 14:42 ?202次閱讀

    萬(wàn)里紅入選2025“鑄基計(jì)劃”高質(zhì)量數(shù)字化轉(zhuǎn)型典型案例集

    近日,由中國(guó)信通院評(píng)選的2025“鑄基計(jì)劃”《高質(zhì)量數(shù)字化轉(zhuǎn)型典型案例集》正式發(fā)布,北京萬(wàn)里紅科技有限公司(以下簡(jiǎn)稱:萬(wàn)里紅)自主研發(fā)的核心產(chǎn)品——數(shù)智密腦憑借在數(shù)據(jù)安全治理、智能保密管控、數(shù)智化協(xié)同賦能領(lǐng)域的創(chuàng)新突破與卓越實(shí)踐,從全國(guó)數(shù)千個(gè)申報(bào)案例中脫穎而出,成功入選!
    的頭像 發(fā)表于 04-22 10:09 ?345次閱讀

    萬(wàn)里紅入選信通院2025年高質(zhì)量數(shù)字化轉(zhuǎn)型解決方案集

    近日,中國(guó)信息通信研究院 “鑄基計(jì)劃” 重磅發(fā)布《高質(zhì)量數(shù)字化轉(zhuǎn)型技術(shù)解決方案集(2025 年)》。北京萬(wàn)里紅科技有限公司(以下簡(jiǎn)稱:萬(wàn)里紅)憑借在安全保密領(lǐng)域的深厚技術(shù)底蘊(yùn)與創(chuàng)新實(shí)踐,其“數(shù)智密腦
    的頭像 發(fā)表于 04-13 16:01 ?259次閱讀

    萬(wàn)里紅入選信通院2025高質(zhì)量數(shù)字化轉(zhuǎn)型全景圖三大核心領(lǐng)域

    3月26 日,北京萬(wàn)里紅科技有限公司(以下簡(jiǎn)稱:萬(wàn)里紅)受邀出席中國(guó)信息通信研究院“鑄基計(jì)劃2026 年度會(huì)議”。大會(huì)重磅發(fā)布《高質(zhì)量數(shù)字化轉(zhuǎn)型產(chǎn)品及服務(wù)全景圖(2025)》,萬(wàn)里紅憑借過(guò)硬的技術(shù)
    的頭像 發(fā)表于 04-08 09:48 ?538次閱讀

    聲智科技亮相2026海淀區(qū)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展大會(huì)

    近日,海淀區(qū)高質(zhì)量發(fā)展大會(huì)隆重召開。聲智科技作為深耕聲學(xué)AI模型技術(shù)創(chuàng)新及AI全棧產(chǎn)品商業(yè)化落地的AI應(yīng)用標(biāo)桿企業(yè)受邀出席大會(huì)。聲智科技不僅致力于突破物理AI技術(shù)的“天花板“,更通過(guò)硬核終端的規(guī)模化產(chǎn)出,將技術(shù)勢(shì)能轉(zhuǎn)化為高質(zhì)量發(fā)
    的頭像 發(fā)表于 03-04 17:42 ?1695次閱讀

    中科曙光入選信通院2025上半年度高質(zhì)量數(shù)字化轉(zhuǎn)型十大典型案例

    9月16日,中國(guó)信通院正式公布《高質(zhì)量數(shù)字化轉(zhuǎn)型產(chǎn)品及服務(wù)典型案例(2025上半年度)》評(píng)選成果。天翼云與中科曙光聯(lián)合打造的“智能政務(wù)應(yīng)用翼政通驅(qū)動(dòng)的混合云智算一體機(jī)”,成功入選中國(guó)信通院2025
    的頭像 發(fā)表于 09-17 11:42 ?1287次閱讀

    標(biāo)貝科技參編《人工智能高質(zhì)量數(shù)據(jù)集建設(shè)指南》

    在人工智能邁入“數(shù)據(jù)驅(qū)動(dòng)”的關(guān)鍵發(fā)展階段,高質(zhì)量數(shù)據(jù)集已成為突破技術(shù)瓶頸、推動(dòng)產(chǎn)業(yè)落地的核心引擎。日前,中國(guó)信息通信研究院人工智能研究所聯(lián)合清華大學(xué)計(jì)算社會(huì)科學(xué)與國(guó)家治理實(shí)驗(yàn)室、中國(guó)人
    的頭像 發(fā)表于 09-11 17:19 ?1049次閱讀

    易華錄入選國(guó)家首批高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作名單

    8月28日下午,在2025中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,國(guó)家數(shù)據(jù)局發(fā)布了首批高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作名單。經(jīng)中國(guó)電科推薦、國(guó)家數(shù)據(jù)局評(píng)審,易華錄申報(bào)的“文博行業(yè)
    的頭像 發(fā)表于 09-04 09:04 ?1226次閱讀

    索尼重載設(shè)備的高質(zhì)量遠(yuǎn)程制作方案和應(yīng)用(2)

    索尼的遠(yuǎn)程制作可以被稱之為制作級(jí)的高質(zhì)量遠(yuǎn)程制作,或重載設(shè)備的高質(zhì)量遠(yuǎn)程制作,遠(yuǎn)程設(shè)備結(jié)合常規(guī)系統(tǒng)設(shè)備,提供和本地制作類似的制作級(jí)高質(zhì)量圖像,延續(xù)電視臺(tái)/制作公司的設(shè)備特點(diǎn)和優(yōu)勢(shì)。
    的頭像 發(fā)表于 08-21 15:56 ?1448次閱讀
    索尼重載設(shè)備的<b class='flag-5'>高質(zhì)量</b>遠(yuǎn)程制作方案和應(yīng)用(2)

    索尼重載設(shè)備的高質(zhì)量遠(yuǎn)程制作方案和應(yīng)用(1)

    最近的各地體育活動(dòng)中,索尼提供了多種產(chǎn)品和系統(tǒng)方案進(jìn)行測(cè)試和使用,其中將攝像機(jī)用于轉(zhuǎn)播場(chǎng)地的集中式遠(yuǎn)程制作方式是常用方式。索尼專業(yè)解決方案突出制作級(jí)質(zhì)量的優(yōu)勢(shì),具有圖像高質(zhì)量,低碼率,低延時(shí)特點(diǎn),能提供不一樣的高質(zhì)量遠(yuǎn)程制作。
    的頭像 發(fā)表于 08-21 15:55 ?1110次閱讀
    索尼重載設(shè)備的<b class='flag-5'>高質(zhì)量</b>遠(yuǎn)程制作方案和應(yīng)用(1)

    模型時(shí)代,如何推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè)?

    高質(zhì)量數(shù)據(jù)集,即具備高價(jià)值、高密度、標(biāo)準(zhǔn)化特征的數(shù)據(jù)集合。 在AI領(lǐng)域,高質(zhì)量數(shù)據(jù)集地位舉足輕重,如同原油經(jīng)煉化成為汽油驅(qū)動(dòng)汽車,海量原始數(shù)據(jù)需轉(zhuǎn)化為
    的頭像 發(fā)表于 08-21 13:58 ?1026次閱讀

    從芯片到主板,科技創(chuàng)新實(shí)現(xiàn)高質(zhì)量發(fā)展

    數(shù)字化時(shí)代,科技的迅猛發(fā)展深刻影響著各個(gè)領(lǐng)域。從芯片到主板的集成,生動(dòng)展現(xiàn)了科技創(chuàng)新如何成為推動(dòng)高質(zhì)量發(fā)展的核心動(dòng)力。
    的頭像 發(fā)表于 07-26 16:26 ?1017次閱讀

    SCTF星通時(shí)頻參加2025高新技術(shù)企業(yè)高質(zhì)量發(fā)展論壇

    近日,由暨南大學(xué)主辦、泰克威創(chuàng)新發(fā)展研究院承辦的“高新技術(shù)企業(yè)高質(zhì)量發(fā)展論壇”在廣州成功舉辦。
    的頭像 發(fā)表于 07-08 17:47 ?1125次閱讀

    新能源變革之路,要建在“高質(zhì)量”的路基上

    高質(zhì)量”是能源革命的前提與基座
    的頭像 發(fā)表于 06-24 11:42 ?2666次閱讀
    新能源變革之路,要建在“<b class='flag-5'>高質(zhì)量</b>”的路基上

    淺析:數(shù)字經(jīng)濟(jì)時(shí)代,高質(zhì)量數(shù)據(jù)集對(duì)AI產(chǎn)業(yè)帶來(lái)哪些新的變化

    ?在數(shù)字經(jīng)濟(jì)與人工智能深度融合的今天,數(shù)據(jù)已超越傳統(tǒng)生產(chǎn)要素,成為驅(qū)動(dòng)AI技術(shù)突破與產(chǎn)業(yè)變革的核心動(dòng)力。高質(zhì)量數(shù)據(jù)集不僅是AI模型性能躍升的基石,更重塑了從技術(shù)研發(fā)到商業(yè)落地的全產(chǎn)業(yè)鏈條。 近年來(lái)
    的頭像 發(fā)表于 05-09 15:10 ?1233次閱讀
    江华| 武平县| 高州市| 白银市| 珲春市| 时尚| 吉安市| 元谋县| 岚皋县| 曲阜市| 东莞市| 樟树市| 嘉兴市| 贡嘎县| 舒城县| 横峰县| 广州市| 瑞昌市| 怀安县| 类乌齐县| 达拉特旗| 东山县| 印江| 藁城市| 定州市| 宁远县| 措勤县| 德令哈市| 大足县| 互助| 舟曲县| 衡山县| 泾源县| 安化县| 将乐县| 枣庄市| 镇宁| 蒙城县| 钦州市| 张家川| 康平县|